王兴一鸣惊人!美团首个开源大模型追平DeepSeek-V3.1

克雷西 明敏 发自 凹非寺量子位 | 公众号 QbitAI

没想到啊,最新SOTA的开源大模型……

来自一个送外卖(Waimai)的——有两个AI,确实不一样。

这个最新开源模型叫:Longcat-Flash-Chat,美团第一个开源大模型,发布即开源,已经在海内外的技术圈子里火爆热议了。

一方面是因为成绩亮眼:

它在部分benchmark上,比如Agent工具调用、指令遵循的表现超过DeepSeek-V3.1、Qwen3 MoE-2507,甚至比闭源的Claude4 Sonnet还要好。

编程能力也值得关注,在TerminalBench上,和公认的“编程之王”Claude4 Sonnet不相上下。

比如非常流行的小球氛围编程测试,LongCat编写的程序,运行起来效果是这样的:

另一方面是技术报告中透露出不少美团对于大模型的理解,包括DSMoE、MLA、动态计算、Infra等等。

暂无介绍....

延伸阅读:

HUDIMM DDR5内存性能初探,带宽性能腰斩近50%

IT之家 4 月 21 日消息,科技媒体 Wccftech 昨日(4 月 20 日)发布博文,测试 DDR5 HUDIM...

摸鱼小能手
2026年4月21日
瑞银评智谱–“中国版Anthropic”

一家清华系AI公司,正在走一条与全球头部AI实验室高度相似的路。4月20日,瑞银Wei Xiong等分析师发布了一份近4...

娱乐大事件
2026年4月21日
月之暗面发布K2.6,杨植麟真的需要一个郭达雅

月之暗面发布了Kimi K2.6,这也是杨植麟的第一个X.6版本。虽然版本号上只加了0.1,但这不是一次普通的版本更新。...

娱乐大事件
2026年4月21日
爱奇艺再回应AI艺人库

2026.04.21本文字数:576,阅读时长大约1分钟4月21日凌晨,@爱奇艺 再次发文重申在AIGC影视创作领域的坚...

娱乐早知道
2026年4月21日
爱奇艺急转弯要“去中心化”,做AI艺人库却被观众说“疯了”

(图源:视觉中国)蓝鲸新闻4月21日讯(记者 彭乐怡)"实拍剧不知道过多少年,会被命名为非物质文化遗产。"爱奇艺CEO龚...

娱乐大事件
2026年4月21日