AI训练新视角:CMU揭示RL在推理模型中的真正价值

机器之心报道机器之心编辑部近期,强化学习(RL)技术在提升语言模型的推理能力方面取得了显著成效。然而,后训练究竟是真正扩...

八卦小灵通
2025年12月15日
阿里深夜干了件大事,成本暴降90%!

智东西作者 程茜编辑 心缘智东西9月12日报道,今天凌晨,阿里通义实验室正式发布下一代基础模型架构Qwen3-Next,...

八卦小灵通
2025年9月12日
临近机器人GPT-3时刻,具身智能开源模型的加速演进

(点击收听本期音频)采访|泓君图文|王梓沁、孙泽平编辑|朱婕作为人工智能和机器人交叉的前沿领域,具身智能是当今科技领域最...

娱乐早知道
2025年9月12日