OpenAI 又出大动作:实时语音API全面开放,声音和真人几乎无差别

OpenAI 正式开放 Realtime API,集成了其最先进的语音对话模型 gpt-realtime,并带来了一系列新功能,用于打造可直接投入生产的语音智能体

新版 gpt-realtime 模型(gpt-realtime-2025-08-28) 在理解复杂指令、精准调用工具、生成更自然和富有表现力的语音方面都有显著提升。定价为:每百万音频输入 token 收费 32 美元,每百万音频输出 token 收费 64 美元,比上一代便宜 20%

Realtime API 现在支持 远程 MCP 服务器、图像输入,以及通过会话发起协议(SIP)的电话功能,让语音智能体能使用更多工具与上下文,功能更强大

OpenAI 推出了两种全新声音 Cedar 和 Marin,仅在 Realtime API 中可用,并且对原有的八种声音也进行了更新

在 Big Bench Audio 推理能力评测中,gpt-realtime 的准确率达 82.8%,相比 2024 年 12 月发布的前一代模型(65.6%)有明显提升

OpenAI 还发布了 gpt-audio(gpt-audio-2025-08-28),这是首个面向 Chat Completions REST API 全面开放的音频模型,定价为:每百万音频输入 token 收费 40 美元,每百万音频输出 token 收费 80 美元

暂无介绍....

延伸阅读:

标普将软银的信用展望调至负面

标普将软银的信用展望调至负面,理由是持续的AI巨额投入增加了财务压力,维持“BB+”评级但存在下调风险。软银计划年内分三...

摸鱼小能手
2026年3月4日
阿里桌面Agent“QoderWork”全面开放

3月3日,阿里桌面Agent(智能体、代理)“QoderWork”全面开放,提供Mac和Windows两个版本,所有用户...

娱乐大事件
2026年3月4日
OpenAI发布GPT-5.3 Instant模型

OpenAI于美东时间3月3日正式发布了GPT-5.3 Instant模型及其编程版本GPT-5.3-Codex,旨在通...

八卦小灵通
2026年3月4日
阿里Qwen深夜地震,核心团队或集体出走丨邦早报

【阿里Qwen深夜地震,林俊旸官宣离职】深夜,Qwen负责人林俊旸突然发布推文,宣布自己将离开Qwen团队。几乎在同一时...

娱乐大事件
2026年3月4日
世界互联网大会在西班牙举办具身智能专题论坛

据网信中国消息,3月3日,世界互联网大会人工智能专业委员会在西班牙巴塞罗那2026年世界移动通信大会期间举办具身智能专题...

摸鱼小能手
2026年3月4日