王兴一鸣惊人!美团首个开源大模型追平DeepSeek-V3.1
克雷西 明敏 发自 凹非寺量子位 | 公众号 QbitAI
没想到啊,最新SOTA的开源大模型……
来自一个送外卖(Waimai)的——有两个AI,确实不一样。
这个最新开源模型叫:Longcat-Flash-Chat,美团第一个开源大模型,发布即开源,已经在海内外的技术圈子里火爆热议了。
一方面是因为成绩亮眼:
它在部分benchmark上,比如Agent工具调用、指令遵循的表现超过DeepSeek-V3.1、Qwen3 MoE-2507,甚至比闭源的Claude4 Sonnet还要好。
编程能力也值得关注,在TerminalBench上,和公认的“编程之王”Claude4 Sonnet不相上下。
比如非常流行的小球氛围编程测试,LongCat编写的程序,运行起来效果是这样的:
另一方面是技术报告中透露出不少美团对于大模型的理解,包括DSMoE、MLA、动态计算、Infra等等。
延伸阅读:
经纬早班车|欧盟多国考虑对美商品加关税;马斯克向OpenAI及微软索赔1340亿美元
【隔夜重磅】 欧盟多国考虑对930亿欧元输欧美国商品加征关税 欧盟多国正考虑对价值930亿欧元的输欧美国商品加征关税...
大数据揭示性别、年龄等因素如何影响性欲
·男性的性欲轨迹呈现出一个出人意料的模式:他们的性欲在40岁左右达到峰值,甚至超过了年轻时的水平,直到60岁以后才回落。...
停产至今已有5年,三菱暗示经典SUV帕杰罗今年“正式复活”
IT之家 1 月 19 日消息,今天早间,据外媒 Carscoops 报道,在今年的东京改装车展期间,三菱汽车社长加藤隆...

