智谱上线并开源GLM-4.6V系列多模态大模型
12月8日,智谱正式上线并开源GLM-4.6V系列多模态大模型,包括面向云端与高性能集群场景的基础版GLM-4.6V(106B-A12B)和面向本地部署与低延迟应用的轻量版GLM-4.6V-Flash(9B)。
据介绍,GLM-4.6V将训练时上下文窗口提升到128k tokens,在视觉理解精度上达到同参数规模SOTA,首次在模型架构中将Function Call(工具调用)能力原生融入视觉模型,打通从“视觉感知”到“可执行行动(Action)”的链路,为真实业务场景中的多模态Agent(智能体)提供统一的技术底座。
该系列模型较GLM-4.5V降价50%,API(应用程序编程接口)调用价格为输入1元/百万tokens,输出3元/百万tokens,其中GLM-4.6V-Flash免费供用户使用。GLM-4.6V融入GLM Coding Plan,针对用户8类场景定向开发了专用MCP(大模型上下文协议)工具。
延伸阅读:
昨晚,谷歌悄悄发了“新模型”,为多模态智能应用铺平了道路
文 | 霞光AI实验室,作者|渡川就在昨晚,谷歌发了首个原生多模态嵌入模型Gemini Embedding 2。跟以往的...
OpenClaw刚装上,Token焦虑就来了?
文 | 霞光AI实验室,作者|刘宇最近,全球AI圈都在被一个词震撼——OpenClaw(龙虾)。OpenClaw有多热?...
“偷数据”“删文件”“泄隐私”……一文看清“龙虾”热潮背后的隐患
当前,以龙虾为图标的开源AI智能体OpenClaw(俗称“龙虾”)火得一塌糊涂。据称,它拥有整合大模型的能力,可以接管鼠...
