苹果探索自研多模态AI模型Manzano
据悉,苹果正在研发名为Manzano的新图像模型,旨在兼具图像理解和图像生成能力。目前Manzano尚未发布,仅有一篇预印本论文和部分低分辨率图像样例。苹果表示,大多数开源模型在图像处理上存在取舍,而Manzano采用混合图像分词器,其共享编码器可输出连续标记和离散标记,减少任务冲突。Manzano整体架构包括混合分词器、统一语言模型和独立图像解码器,解码器有三个版本,支持不同分辨率。训练使用大量图像文本样本,内部测试显示其在文字密集型任务中表现优异,性能随规模提升而改善。苹果认为Manzano是有力替代方案,但目前其基础模型仍落后于行业领先者,未来版本需进一步验证。
延伸阅读:
微言 |AI 仿冒明星直播带货?网信部门重拳整治,乱象当止!
有网络账号用 AI 冒充公众人物直播带货,本尊上线竟被拉黑。近期,网信部门重拳出击,从严整治此类利用AI仿冒公众人物开展...
新能源汽车5年狂飙路:年均增长率超75%,智能化“下半场”如何继续领跑?
本文来源:时代周报 作者:刘学小区停车场里的绿牌车,已随处可见;商场地库的快充桩,成了新的“黄金车位”;买车首先要考虑的...
登顶iOS游戏畅销榜,《崩坏:星穹铁道》新角色引争议
Sensor Tower数据显示,11月14日,米哈游推出的RPG手游《崩坏:星穹铁道》位居10月中国出海手游收入榜第1...
