苹果探索自研多模态AI模型Manzano
据悉,苹果正在研发名为Manzano的新图像模型,旨在兼具图像理解和图像生成能力。目前Manzano尚未发布,仅有一篇预印本论文和部分低分辨率图像样例。苹果表示,大多数开源模型在图像处理上存在取舍,而Manzano采用混合图像分词器,其共享编码器可输出连续标记和离散标记,减少任务冲突。Manzano整体架构包括混合分词器、统一语言模型和独立图像解码器,解码器有三个版本,支持不同分辨率。训练使用大量图像文本样本,内部测试显示其在文字密集型任务中表现优异,性能随规模提升而改善。苹果认为Manzano是有力替代方案,但目前其基础模型仍落后于行业领先者,未来版本需进一步验证。
延伸阅读:
大众美国CEO格鲁纳称轿车和掀背车仍有未来:这是品牌的“心跳”
IT之家 4 月 3 日消息,在 SUV 主导市场的背景下,大众很容易被视为“只做 SUV”的品牌。2025 年,大众在...
奔驰电动旗舰EQS二次改款在即,将改用线控转向、异形方向盘
IT之家 4 月 3 日消息,奔驰纯电旗舰轿车 EQS 自推出以来市场反响平淡,销量表现未达预期,促使奔驰在 2024 ...
北京信息光电子芯片平台预计今年6月产线贯通
IT之家 4 月 3 日消息,据“北京亦庄”公众号,3 月 31 日,北京信息光电子芯片平台设备搬入仪式在北京经济技术开...
谷歌发布Gemma 4开源大模型,31B参数性能达头部水准
IT之家 4 月 3 日消息,今日,谷歌正式推出 Gemma 4 大模型,据称是迄今为止谷歌最智能的开源模型。Gemma...
