王兴一鸣惊人!美团首个开源大模型追平DeepSeek-V3.1
克雷西 明敏 发自 凹非寺量子位 | 公众号 QbitAI
没想到啊,最新SOTA的开源大模型……
来自一个送外卖(Waimai)的——有两个AI,确实不一样。
这个最新开源模型叫:Longcat-Flash-Chat,美团第一个开源大模型,发布即开源,已经在海内外的技术圈子里火爆热议了。
一方面是因为成绩亮眼:
它在部分benchmark上,比如Agent工具调用、指令遵循的表现超过DeepSeek-V3.1、Qwen3 MoE-2507,甚至比闭源的Claude4 Sonnet还要好。
编程能力也值得关注,在TerminalBench上,和公认的“编程之王”Claude4 Sonnet不相上下。
比如非常流行的小球氛围编程测试,LongCat编写的程序,运行起来效果是这样的:
另一方面是技术报告中透露出不少美团对于大模型的理解,包括DSMoE、MLA、动态计算、Infra等等。
延伸阅读:
HUDIMM DDR5内存性能初探,带宽性能腰斩近50%
IT之家 4 月 21 日消息,科技媒体 Wccftech 昨日(4 月 20 日)发布博文,测试 DDR5 HUDIM...
瑞银评智谱–“中国版Anthropic”
一家清华系AI公司,正在走一条与全球头部AI实验室高度相似的路。4月20日,瑞银Wei Xiong等分析师发布了一份近4...
月之暗面发布K2.6,杨植麟真的需要一个郭达雅
月之暗面发布了Kimi K2.6,这也是杨植麟的第一个X.6版本。虽然版本号上只加了0.1,但这不是一次普通的版本更新。...
爱奇艺急转弯要“去中心化”,做AI艺人库却被观众说“疯了”
(图源:视觉中国)蓝鲸新闻4月21日讯(记者 彭乐怡)"实拍剧不知道过多少年,会被命名为非物质文化遗产。"爱奇艺CEO龚...

