苹果 FastVLM 模型开放试用:Mac 用户秒享“闪电级”视频字幕

IT之家 9 月 2 日消息,科技媒体 9to5Mac 昨日(9 月 1 日)发布博文,报道称苹果公司在 Hugging Face 平台上,推出了 FastVLM 视觉语言模型的浏览器试用版。

IT之家注:FastVLM 以其“闪电般”的视频字幕生成速度著称,只要用户拥有搭载 Apple Silicon 芯片的 Mac 设备,即可轻松上手体验这一前沿技术。

FastVLM 模型的核心优势在于其卓越的速度和效率。该模型利用苹果自研的开源机器学习框架 MLX 进行优化,专为 Apple Silicon 芯片设计。与同类模型相比,FastVLM 模型体积仅为三分之一左右,不过在视频字幕生成速度上却能提升 85 倍。

苹果此次发布的 FastVLM-0.5B 轻量版,可在浏览器内直接加载运行。根据该媒体实测,在 16GB M2 Pro MacBook Pro 上,首次加载模型需数分钟,不过在启动后,便能精准描述画面中的人物、环境、表情及各种物体。

值得一提的是,该模型支持本地运行,所有数据均在设备端处理,无需上传至云端,从而保障了用户的数据隐私。

FastVLM 的本地运行能力及其低延迟特性,让其在可穿戴设备和辅助技术领域展现出巨大潜力。例如,在虚拟摄像头应用中,该工具能即时详细描述多场景内容,FastVLM 未来有望成为这些设备的核心技术,为用户提供更智能、更便捷的交互体验。

参考

暂无介绍....

延伸阅读:

昨晚,谷歌悄悄发了“新模型”,为多模态智能应用铺平了道路

文 | 霞光AI实验室,作者|渡川就在昨晚,谷歌发了首个原生多模态嵌入模型Gemini Embedding 2。跟以往的...

八卦小灵通
2026年3月12日
OpenClaw刚装上,Token焦虑就来了?

文 | 霞光AI实验室,作者|刘宇最近,全球AI圈都在被一个词震撼——OpenClaw(龙虾)。OpenClaw有多热?...

八卦小灵通
2026年3月12日
蔚来赢了一次,但李斌完全没有麻

文 | 时间线Timelines,作者 | 赵明,编辑 | 周易「蔚来终于硬气了一把」。3 月 10 日,当蔚来发布 2...

摸鱼小能手
2026年3月12日
字节Seed挖来千问大将

AI行业的竞争与聚变也体现在人才的流动上。3月12日,继原阿里巴巴通义实验室千问(Qwen)大模型技术负责人林俊旸离职之...

摸鱼小能手
2026年3月12日
“偷数据”“删文件”“泄隐私”……一文看清“龙虾”热潮背后的隐患

当前,以龙虾为图标的开源AI智能体OpenClaw(俗称“龙虾”)火得一塌糊涂。据称,它拥有整合大模型的能力,可以接管鼠...

娱乐大事件
2026年3月12日