苹果探索自研多模态AI模型Manzano
据悉,苹果正在研发名为Manzano的新图像模型,旨在兼具图像理解和图像生成能力。目前Manzano尚未发布,仅有一篇预印本论文和部分低分辨率图像样例。苹果表示,大多数开源模型在图像处理上存在取舍,而Manzano采用混合图像分词器,其共享编码器可输出连续标记和离散标记,减少任务冲突。Manzano整体架构包括混合分词器、统一语言模型和独立图像解码器,解码器有三个版本,支持不同分辨率。训练使用大量图像文本样本,内部测试显示其在文字密集型任务中表现优异,性能随规模提升而改善。苹果认为Manzano是有力替代方案,但目前其基础模型仍落后于行业领先者,未来版本需进一步验证。
延伸阅读:
吉利旗下首艘自营汽车运输船 “JISU FORTUNE”轮在欧洲发生事故
IT之家 9 月 28 日消息,据外媒 Flows.be 报道,利比里亚籍汽车运输船“JISU FORTUNE(吉速财富...
消息称追觅汽车获超150亿元订单,中东及中亚经销商反馈热烈
IT之家 9 月 28 日消息,据新浪科技报道,在追觅汽车近期举办的首届战略合作伙伴大会上,追觅汽车获超 150 亿元订...
雷军:2025年第100次健身房打卡,提前3个月完成目标
9月28日,雷军发文:健身房打卡,2025年第100次,提前3个月完成全年目标。此前,在2024年的最后一晚,雷军在他的...