王兴一鸣惊人!美团首个开源大模型追平DeepSeek-V3.1
克雷西 明敏 发自 凹非寺量子位 | 公众号 QbitAI
没想到啊,最新SOTA的开源大模型……
来自一个送外卖(Waimai)的——有两个AI,确实不一样。
这个最新开源模型叫:Longcat-Flash-Chat,美团第一个开源大模型,发布即开源,已经在海内外的技术圈子里火爆热议了。
一方面是因为成绩亮眼:
它在部分benchmark上,比如Agent工具调用、指令遵循的表现超过DeepSeek-V3.1、Qwen3 MoE-2507,甚至比闭源的Claude4 Sonnet还要好。
编程能力也值得关注,在TerminalBench上,和公认的“编程之王”Claude4 Sonnet不相上下。
比如非常流行的小球氛围编程测试,LongCat编写的程序,运行起来效果是这样的:
另一方面是技术报告中透露出不少美团对于大模型的理解,包括DSMoE、MLA、动态计算、Infra等等。
延伸阅读:
维立志博-B与Dianthus签订LBL-047全球独家许可协议
维立志博-B宣布与Dianthus Therapeutics, Inc.签订全球独家许可协议,共同推进新型抗BDCA2-...
维立志博-B与Dianthus签订LBL-047全球独家许可协议
维立志博-B宣布与Dianthus Therapeutics, Inc.签订全球独家许可协议,共同推进新型抗BDCA2-...
机构:国产算力公司有望进入快速增长期
工业和信息化部办公厅发布关于开展城域“毫秒用算”专项行动的通知,其中提出,完善算力中心间互连网络架构,引导面向算力中心完...
四川:10 月 18 日起暂停实施汽车以旧换新补贴政策;百度入局AI短剧 | 早资道
四川:10 月 18 日起暂停实施汽车以旧换新补贴政策10 月 16 日晚间,四川省商务厅官微公告将优化调整 2025 ...
新闻纵深·县域特色产业新力量|借力京津,机器人产业双链融合
阅读提示唐山市高新技术产业开发区在机器人新赛道上频频发力,已形成以工业机器人为引领、特种机器人为亮点、服务机器人为特色,...