# 推理
HLE首次突破60分!Eigen-1基于DeepSeek V3.1领先GPT-5
在HLE(“人类最后考试”)的专家校验子集上,首次有系统突破60分大关!就在最近,由耶鲁大学唐相儒、王昱婕,上海交通大学...
刚刚,GPT-5首次通过「哥德尔测试」!破解三大数学猜想
【新智元导读】GPT-5首次通过「哥德尔测试」,连破三大组合优化猜想!甚至,它能自主推翻原有猜想,给出全新有效解法,当场...
DeepSeek-R1 论文登上《自然》封面,通讯作者为梁文锋
IT之家 9 月 18 日消息,由 DeepSeek 团队共同完成、梁文锋担任通讯作者的 DeepSeek-R1 推理模...
阿里开源「深度研究」王炸Agent,登顶开源Agent模型榜首
▲头图由AI生成智东西作者 王涵编辑 漠影智东西9月17日报道,今天凌晨,阿里巴巴开源了其首个深度研究Agent模型:通...
阿里巴巴(09988)开源新架构Qwen3-Next 训练成本大幅下降 引入混合注意力机制
智通财经APP获悉,9月12日,阿里巴巴(09988)通义发布下一代基础模型架构Qwen3-Next,并开源了基于该架构...
阿里开源新架构Qwen3-Next,模型训练成本降9成,长文本推理吞吐提升10倍
每经杭州9月12日电(记者叶晓丹)9月12日,阿里通义发布下一代基础模型架构Qwen3-Next。Qwen3-Next针...
沉寂一个月,openPangu性能飙升8%!华为1B开源模型来了
机器之心发布机器之心编辑部在端侧 AI 这个热门赛道,华为盘古大模型扔下了一颗 “重磅炸弹” 。如今,云端大模型已经能侃...
全面升级!书生·万象3.5发布,多模态感知能力超越GPT-5
新民晚报记者获悉,近日,上海人工智能实验室(上海AI实验室)开源通用多模态大模型书生·万象3.5(InternVL3.5...
DeepSeek、GPT-5都在尝试的快慢思考切换,有了更智能版本
本研究由中科院自动化所和腾讯混元联合研发,团队成员包括 Qi Yang, Bolin Ni, Shiming Xiang...
KAIST韩国科技院的新发现:AI能看懂越南考试题吗?答案让人意外
这项由韩国科技院(KAIST)的邓维祥、沃安等研究员合作完成的研究发表于2025年8月,研究成果以论文形式呈现,感兴趣的...