中金:2026年大模型在强化学习、模型记忆、上下文工程等方面将取得更多突破

人民财讯2月5日电,中金指出,回顾2025年,全球大模型技术能力向前演进,逐步攻克生产力场景,在推理、编程、Agenti...

娱乐早知道
2026年2月5日
Thinking Machine新研究刷屏!结合RL微调,小模型训练更具性价比

Thinking Machine最新研究正在被热议!创始人、OpenAI前CTO Mira Murati亲自转发后,一众...

摸鱼小能手
2025年10月28日
Meta一天内痛失两员大将

8月26日,Meta宣布两位资深研究者离职。强化学习专家Rishabh Agarwal在Meta领导Llama团队的强化...

摸鱼小能手
2025年8月27日