苹果探索自研多模态AI模型Manzano
据悉,苹果正在研发名为Manzano的新图像模型,旨在兼具图像理解和图像生成能力。目前Manzano尚未发布,仅有一篇预印本论文和部分低分辨率图像样例。苹果表示,大多数开源模型在图像处理上存在取舍,而Manzano采用混合图像分词器,其共享编码器可输出连续标记和离散标记,减少任务冲突。Manzano整体架构包括混合分词器、统一语言模型和独立图像解码器,解码器有三个版本,支持不同分辨率。训练使用大量图像文本样本,内部测试显示其在文字密集型任务中表现优异,性能随规模提升而改善。苹果认为Manzano是有力替代方案,但目前其基础模型仍落后于行业领先者,未来版本需进一步验证。
延伸阅读:
荣耀Power2震撼登场:万元级续航怪兽携三色美学亮相
IT之家 12 月 29 日消息,荣耀开启新一代荣耀 Power2 手机预热,宣布荣耀 Power2 手机将于 1 月 ...
七鲜小厨全国扩张在即:品质快餐新模式加速落地
IT之家 12 月 29 日消息,据京东黑板报今日消息,京东旗下餐饮平台七鲜小厨面向全国招募经营合伙人,七鲜小厨要走向全...
华为发布高性能长寿命SSD:eKitStor Xtreme 201重塑消费级存储标准
IT之家 12 月 29 日消息,华为坤灵 (HUAWEI eKit) 近期推出了 HUAWEI eKitStor Xt...
格科微电子突破影像边界:双款50MP传感器引领手机摄影新纪元
IT之家 12 月 29 日消息,国产 CMOS 厂商格科微电子今日官宣推出两款全新规格的单芯片 5000 万像素图像传...
