智谱开源GLM-OCR模型:多个领域性能接近Gemini-3-Pro,主打“小尺寸、高精度”
2月3日,智谱(02513.HK)官微宣布正式发布并开源GLM-OCR。
据介绍,作为一款轻量的专业级OCR模型,该模型仅0.9B参数规模,支持vLLM、SGLang和Ollama部署。
公司表示,尽管GLM-OCR参数量仅0.9B,但在权威文档解析榜单OmniDocBench V1.5中以94.6分取得SOTA性能。在文本、公式、表格识别及信息抽取四大细分领域的表现优于多款OCR专项模型,性能接近Gemini-3-Pro。
延伸阅读:
谷歌为Chrome浏览器发布安全更新,修复8项高危安全漏洞问题
IT之家 3 月 25 日消息,Google 谷歌当地时间本周一宣布向 Chrome 网络浏览器桌面版稳定频道推送安全更...
三星Galaxy Z Fold8折叠手机渲染图曝光:外6.5/内8英寸屏幕
IT之家 3 月 25 日消息,科技媒体 Android Headline 昨日(3 月 24 日)发布博文,分享了一组...
1元买软件、5元买服务 配音演员声音是如何被批量“偷走”的?
“臣妾做不到啊”——这句话,你可能听过无数次,却未必知道,说这话的声音,正在被AI批量贩卖。从《甄嬛传》里的甄嬛,到《无...
