王兴一鸣惊人!美团首个开源大模型追平DeepSeek-V3.1

克雷西 明敏 发自 凹非寺量子位 | 公众号 QbitAI

没想到啊,最新SOTA的开源大模型……

来自一个送外卖(Waimai)的——有两个AI,确实不一样。

这个最新开源模型叫:Longcat-Flash-Chat,美团第一个开源大模型,发布即开源,已经在海内外的技术圈子里火爆热议了。

一方面是因为成绩亮眼:

它在部分benchmark上,比如Agent工具调用、指令遵循的表现超过DeepSeek-V3.1、Qwen3 MoE-2507,甚至比闭源的Claude4 Sonnet还要好。

编程能力也值得关注,在TerminalBench上,和公认的“编程之王”Claude4 Sonnet不相上下。

比如非常流行的小球氛围编程测试,LongCat编写的程序,运行起来效果是这样的:

另一方面是技术报告中透露出不少美团对于大模型的理解,包括DSMoE、MLA、动态计算、Infra等等。

暂无介绍....

延伸阅读:

维立志博-B与Dianthus签订LBL-047全球独家许可协议

维立志博-B宣布与Dianthus Therapeutics, Inc.签订全球独家许可协议,共同推进新型抗BDCA2-...

八卦小灵通
2025年10月17日
维立志博-B与Dianthus签订LBL-047全球独家许可协议

维立志博-B宣布与Dianthus Therapeutics, Inc.签订全球独家许可协议,共同推进新型抗BDCA2-...

摸鱼小能手
2025年10月17日
机构:国产算力公司有望进入快速增长期

工业和信息化部办公厅发布关于开展城域“毫秒用算”专项行动的通知,其中提出,完善算力中心间互连网络架构,引导面向算力中心完...

八卦小灵通
2025年10月17日
四川:10 月 18 日起暂停实施汽车以旧换新补贴政策;百度入局AI短剧 | 早资道

四川:10 月 18 日起暂停实施汽车以旧换新补贴政策10 月 16 日晚间,四川省商务厅官微公告将优化调整 2025 ...

摸鱼小能手
2025年10月17日
新闻纵深·县域特色产业新力量|借力京津,机器人产业双链融合

阅读提示唐山市高新技术产业开发区在机器人新赛道上频频发力,已形成以工业机器人为引领、特种机器人为亮点、服务机器人为特色,...

娱乐大事件
2025年10月17日