OpenAI 又出大动作:实时语音API全面开放,声音和真人几乎无差别

OpenAI 正式开放 Realtime API,集成了其最先进的语音对话模型 gpt-realtime,并带来了一系列新功能,用于打造可直接投入生产的语音智能体

新版 gpt-realtime 模型(gpt-realtime-2025-08-28) 在理解复杂指令、精准调用工具、生成更自然和富有表现力的语音方面都有显著提升。定价为:每百万音频输入 token 收费 32 美元,每百万音频输出 token 收费 64 美元,比上一代便宜 20%

Realtime API 现在支持 远程 MCP 服务器、图像输入,以及通过会话发起协议(SIP)的电话功能,让语音智能体能使用更多工具与上下文,功能更强大

OpenAI 推出了两种全新声音 Cedar 和 Marin,仅在 Realtime API 中可用,并且对原有的八种声音也进行了更新

在 Big Bench Audio 推理能力评测中,gpt-realtime 的准确率达 82.8%,相比 2024 年 12 月发布的前一代模型(65.6%)有明显提升

OpenAI 还发布了 gpt-audio(gpt-audio-2025-08-28),这是首个面向 Chat Completions REST API 全面开放的音频模型,定价为:每百万音频输入 token 收费 40 美元,每百万音频输出 token 收费 80 美元

暂无介绍....

延伸阅读:

微言 |AI 仿冒明星直播带货?网信部门重拳整治,乱象当止!

有网络账号用 AI 冒充公众人物直播带货,本尊上线竟被拉黑。近期,网信部门重拳出击,从严整治此类利用AI仿冒公众人物开展...

摸鱼小能手
2025年11月14日
新能源汽车5年狂飙路:年均增长率超75%,智能化“下半场”如何继续领跑?

本文来源:时代周报 作者:刘学小区停车场里的绿牌车,已随处可见;商场地库的快充桩,成了新的“黄金车位”;买车首先要考虑的...

娱乐大事件
2025年11月14日
朱江明悄悄成了造车圈的大赢家

文|壹度Pro今年是零跑创立的第十年,终于在上半年盈利了。目前,零跑已经连续八个月稳坐新势力销量冠军宝座,更在10月份突...

摸鱼小能手
2025年11月14日
这届双11,哪些新品牌爆发了?

文|沥金这届双11,哪些新品牌爆发了?这两天,天猫发布了双11大促的阶段性榜单,302个新品牌拿下了趋势品类的第一名,其...

摸鱼小能手
2025年11月14日
登顶iOS游戏畅销榜,《崩坏:星穹铁道》新角色引争议

Sensor Tower数据显示,11月14日,米哈游推出的RPG手游《崩坏:星穹铁道》位居10月中国出海手游收入榜第1...

八卦小灵通
2025年11月14日
🧟 AI 助手