OpenAI 又出大动作:实时语音API全面开放,声音和真人几乎无差别
OpenAI 正式开放 Realtime API,集成了其最先进的语音对话模型 gpt-realtime,并带来了一系列新功能,用于打造可直接投入生产的语音智能体
新版 gpt-realtime 模型(gpt-realtime-2025-08-28) 在理解复杂指令、精准调用工具、生成更自然和富有表现力的语音方面都有显著提升。定价为:每百万音频输入 token 收费 32 美元,每百万音频输出 token 收费 64 美元,比上一代便宜 20%
Realtime API 现在支持 远程 MCP 服务器、图像输入,以及通过会话发起协议(SIP)的电话功能,让语音智能体能使用更多工具与上下文,功能更强大
OpenAI 推出了两种全新声音 Cedar 和 Marin,仅在 Realtime API 中可用,并且对原有的八种声音也进行了更新
在 Big Bench Audio 推理能力评测中,gpt-realtime 的准确率达 82.8%,相比 2024 年 12 月发布的前一代模型(65.6%)有明显提升
OpenAI 还发布了 gpt-audio(gpt-audio-2025-08-28),这是首个面向 Chat Completions REST API 全面开放的音频模型,定价为:每百万音频输入 token 收费 40 美元,每百万音频输出 token 收费 80 美元
延伸阅读:
星光小贷总经理更换,前任关联微米信息因马甲App高利贷矩阵被曝光
近日,广州市地方金融监管局发布了关于广州星光互联网小额贷款有限公司(下称"星光小贷")变更高级管理人员的批复。官方信息显...
交199元抵2000元,盲订长安启源全新Q05享“追光膨胀礼”
作为一款凝聚全球研发智慧、基于天枢架构纯电专属平台打造的全新车型,长安启源全新Q05以“高颜值、大空间、超舒适、真续航、...
2025阅文创作大会:加码漫剧、共创潮玩、升级AI,以“IP+AI+消费”挖掘增长新曲线
北京商报讯(记者 卢扬 实习记者 华卓玛)10月16日,2025阅文创作大会上,阅文集团CEO兼总裁侯晓楠宣布多项业务升...
应急部:将大力推动“久安”大模型应用,加速应急管理现代化
“我们认为人工智能是未来应急管理信息化的主战场,我们将大力推动‘久安’大模型应用,加速构建应急管理新质战斗力,促进应急管...
天猫双11预售首小时 35个品牌成交破亿
本文来源:时代财经10月15日晚8点,2025天猫双11预售开启。首小时35个品牌成交破亿,1802个品牌成交翻倍,破亿...