OpenAI 又出大动作:实时语音API全面开放,声音和真人几乎无差别

OpenAI 正式开放 Realtime API,集成了其最先进的语音对话模型 gpt-realtime,并带来了一系列新功能,用于打造可直接投入生产的语音智能体

新版 gpt-realtime 模型(gpt-realtime-2025-08-28) 在理解复杂指令、精准调用工具、生成更自然和富有表现力的语音方面都有显著提升。定价为:每百万音频输入 token 收费 32 美元,每百万音频输出 token 收费 64 美元,比上一代便宜 20%

Realtime API 现在支持 远程 MCP 服务器、图像输入,以及通过会话发起协议(SIP)的电话功能,让语音智能体能使用更多工具与上下文,功能更强大

OpenAI 推出了两种全新声音 Cedar 和 Marin,仅在 Realtime API 中可用,并且对原有的八种声音也进行了更新

在 Big Bench Audio 推理能力评测中,gpt-realtime 的准确率达 82.8%,相比 2024 年 12 月发布的前一代模型(65.6%)有明显提升

OpenAI 还发布了 gpt-audio(gpt-audio-2025-08-28),这是首个面向 Chat Completions REST API 全面开放的音频模型,定价为:每百万音频输入 token 收费 40 美元,每百万音频输出 token 收费 80 美元

暂无介绍....

延伸阅读:

SpaceX星舰V3完成全时长静态点火测试,首次试飞临近

IT之家 4 月 16 日消息,在得克萨斯州星舰基地完成全时长静态点火测试后,SpaceX 距离发射下一代星舰又近了一大...

娱乐大事件
2026年4月16日
科大讯飞AI智能鼠标AM50 pro发布,498元

IT之家 4 月 16 日消息,科大讯飞现已在京东上架一款 AI 智能鼠标 AM50pro,其内置 AI 功能、支持星闪...

娱乐大事件
2026年4月16日
荣耀MagicBook 14/16 2026款笔记本发布,国补价5949.15元起

IT之家 4 月 16 日消息,荣耀今日发布了 MagicBook 14/16 2026 款笔记本新品,国补价 5949...

娱乐大事件
2026年4月16日
数据中心绿电直连落地难在成本高,需从新型电力系统构建出发

“绿电直连”以负荷主体为中心,由可再生能源通过直连线路,向单一电力用户供给绿电,用于满足其负荷需求,当前备受关注。据国家...

娱乐大事件
2026年4月16日
腾讯混元3D世界模型2.0发布 一句话生成3D资产

快科技4月16日消息,今日,腾讯正式发布并开源混元3D世界模型2.0(HY-World 2.0)。官方表示,该模型一句话...

八卦小灵通
2026年4月16日