云知声(09678)山海·知音2.0重磅发布 重塑人机交互新范式
智通财经APP获悉,伴随智能体时代浪潮奔涌,云知声(09678)正加速完成其“一基两翼”技术战略的能力拼图。继年前升级“山海·知医”5.0医疗大模型后,公司于近日重磅发布“山海·知音”大模型2.0。
据悉,“山海·知音”大模型2.0依托“山海·Atlas”的多模态、跨语言基座能力,核心聚焦三大能力进化——听懂专业与乡音、聊出亲情与温度、极致机敏反应。
在“听懂”的维度,此次模型ASR能力在公开测试集和自有全场景测试集中,均显现了领先的语音识别能力,评测中实现了从通用到极端全面的领先水平,超过了国内主流的开源和闭源语音大模型,达到业界最高水平。
在“表达”层面,山海·知音-TTS以“高度拟人+创意多元”为核心,目前支持12种方言(粤语、四川话、上海话全拿下)+ 10种外语,甚至能切换12种普通话风格。
更重要的是,山海·知音2.0基于端到端交互大脑,攻克了流畅全双工交互的挑战,支持随时打断、即时接话与连贯追问,使人机对话如挚友交谈般行云流水。
这一切能力的背后,是云知声独创的 “山海·Atlas”智算一体基座,将通用多模态大模型底座与Atlas基础架构深度整合,既是专业智能体的基础,也是感知AI中枢的根基。
延伸阅读:
昨晚,谷歌悄悄发了“新模型”,为多模态智能应用铺平了道路
文 | 霞光AI实验室,作者|渡川就在昨晚,谷歌发了首个原生多模态嵌入模型Gemini Embedding 2。跟以往的...
OpenClaw刚装上,Token焦虑就来了?
文 | 霞光AI实验室,作者|刘宇最近,全球AI圈都在被一个词震撼——OpenClaw(龙虾)。OpenClaw有多热?...
“偷数据”“删文件”“泄隐私”……一文看清“龙虾”热潮背后的隐患
当前,以龙虾为图标的开源AI智能体OpenClaw(俗称“龙虾”)火得一塌糊涂。据称,它拥有整合大模型的能力,可以接管鼠...
