微软加速打造自研AI模型,目标明年具备最先进图文、音频处理能力
IT之家 4 月 3 日消息,据彭博社报道,微软正加速推进自研模型,目标是在未来几年内打造可与 OpenAI 和 Anthropic 竞争的前沿 AI 系统。
微软 AI 负责人穆斯塔法 · 苏莱曼表示:“我们必须打造最前沿的模型。到 2027 年,目标是在文本、图像和音频能力上达到行业最先进水平。”
作为阶段性成果,当地时间 4 月 2 日,微软发布了一款语音转录模型。在 25 种主流语言中,该模型在其中 11 种语言的测试中表现优于竞品。不过,该模型仍属于专用工具,强调效率与轻量化,与 Claude 3 Opus 或 GPT-4 这类通用大模型存在明显差异。
在基础设施方面,微软正在加大投入。苏莱曼表示,公司已开始部署英伟达 GB200 芯片集群,并计划在未来 12 至 18 个月内将算力提升至前沿规模。
过去,微软在开发通用大模型方面受到与 OpenAI 合作协议的限制,不过在去年协议调整之后,微软获得“松绑”,为推进自研模型扫清障碍。
与此同时,微软内部也进行了调整。苏莱曼目前专注于模型研发,而 Copilot 业务则由前 Snap 高管雅各布 · 安德鲁负责。
据IT之家了解,微软首席执行官萨提亚 · 纳德拉在本周的内部会议中强调,未来三到五年内实现 AI 能力自主化是核心目标。同时,微软仍将继续支持外部模型生态。
苏莱曼表示,新发布的语音转录模型具备在复杂环境中过滤背景噪音的能力,未来将逐步应用于 Teams 等产品。
延伸阅读:
大众美国CEO格鲁纳称轿车和掀背车仍有未来:这是品牌的“心跳”
IT之家 4 月 3 日消息,在 SUV 主导市场的背景下,大众很容易被视为“只做 SUV”的品牌。2025 年,大众在...
奔驰电动旗舰EQS二次改款在即,将改用线控转向、异形方向盘
IT之家 4 月 3 日消息,奔驰纯电旗舰轿车 EQS 自推出以来市场反响平淡,销量表现未达预期,促使奔驰在 2024 ...
北京信息光电子芯片平台预计今年6月产线贯通
IT之家 4 月 3 日消息,据“北京亦庄”公众号,3 月 31 日,北京信息光电子芯片平台设备搬入仪式在北京经济技术开...
谷歌发布Gemma 4开源大模型,31B参数性能达头部水准
IT之家 4 月 3 日消息,今日,谷歌正式推出 Gemma 4 大模型,据称是迄今为止谷歌最智能的开源模型。Gemma...
