字节Seed挖来千问大将

AI行业的竞争与聚变也体现在人才的流动上。

3月12日，继原阿里巴巴通义实验室千问（Qwen）大模型技术负责人林俊旸离职之后，其团队另一位核心骨干的去向也终于浮出水面。

行业消息称，原千问后训练（Post-training）负责人郁博文已正式加入字节跳动，担任Seed团队视觉模型与多模态交互团队后训练负责人。

有接近字节的人士向华尔街见闻证实了上述人事变动。

这一人事变动发生在阿里千问团队刚刚完成组织架构调整、多位核心技术人才密集出走的时间节点，引发业界对国内大模型领域人才流动与技术路线竞争的广泛关注。

郁博文的学术与技术履历在业内堪称扎实。公开资料显示，他本科毕业于中南大学，后考入中国科学院信息工程研究所攻读研究生，2022年获得中国科学院大学博士学位。

读博期间，他专注于自然语言处理与信息抽取领域研究，曾在ACL、EMNLP等国际顶级学术会议上发表多篇论文，并创新性地提出将信息抽取任务转化为图结构问题的思路，有效解决了实体重叠、嵌套等复杂场景下的识别难题，凭借突出的学术表现荣获中国科学院院长奖。

2022年博士毕业后，郁博文以阿里集团最高级别的校招项目 “阿里星”身份加入阿里巴巴达摩院，担任算法专家（P7）。入职初期，他便深度参与通义千问大模型的早期训练与研发工作，迅速成长为千问团队核心骨干，并最终担任后训练负责人。

郁博文的离职与阿里通义实验室近期的组织架构调整紧密相关。

3月，阿里通义实验室启动组织架构调整，计划将原本垂直整合的Qwen团队拆分为预训练、后训练、文本、多模态等多个平行的水平分工模块。这一调整直接导致郁博文的管理范围大幅缩小，且与其一直坚持的“预训练与后训练必须深度耦合”的技术理念产生了明显冲突。

此外，阿里高层对千问团队施加的商业化考核压力，也在一定程度上加剧了团队内部的分歧。

3月3日，郁博文提交辞职申请，次日正式离职，他的工作随后由前Google DeepMind高级资深研究员周浩接任。

郁博文的下一站选择，同样反映出当前大模型竞争的新焦点。

字节跳动的Seed团队近年来在大模型和多模态领域持续投入资源，此次郁博文加入后担任视觉模型与多模态交互团队后训练负责人，意味着字节跳动正在强化其在多模态方向上的“后训练”能力。

后训练作为大模型从通用底座走向产品化、场景化的关键环节，直接决定了模型在实际交互中的表现。

郁博文在千问期间积累的对话模型优化、多模态对齐、知识蒸馏等经验，与Seed团队当前的技术布局高度契合。尤其是在视觉与多模态交互领域，如何通过高效的后期微调和强化学习让模型更“懂”用户，已成为各大厂商差异化竞争的关键。

郁博文从阿里流向字节，是本轮AI竞争中核心人才流动的案例之一。1月，Qwen Code负责人惠彬原已离开阿里加入Meta 。更早之前，OpenAI、xAI、Meta等国际巨头内部同样经历着核心人才的流动。

这一轮人才流动背后，反映出大模型行业发展的几个深层变化。

一方面，技术强人时代正在重塑人才与平台的关系。当前大模型技术仍处于快速演进阶段，顶尖技术人才的个人判断和愿景对技术路径的影响远超以往。

另外，算力资源与组织协同成为人才去留的关键变量。单纯的薪酬激励已难以锁定顶尖人才，企业能否提供充足的支持、能否构建与人才技术理念相匹配的组织架构，正在成为留住核心骨干的更重要因素。

同时，多模态与后训练正成为下一阶段的人才争夺主战场。随着基础大模型的能力逐渐趋同，如何通过后训练技术实现差异化、如何将视觉与语言能力深度融合，已成为头部厂商竞相布局的方向。郁博文此番加入字节多模态团队，正是这一趋势的缩影。

对于行业而言，核心人才的流动既是挑战也是催化剂。它倒逼企业重新思考与顶尖人才的协同方式，也加速了技术理念的跨平台传播与碰撞。

在大模型仍未抵达终局的当下，人才的流向，某种程度上正绘制着未来技术竞争的版图。

声明：包含AI生成内容

#seed #千问大将 #大模型 #字节 #模态

暂无介绍....

医械网	工业品资讯
广告位	广告位