苹果探索自研多模态AI模型Manzano
据悉,苹果正在研发名为Manzano的新图像模型,旨在兼具图像理解和图像生成能力。目前Manzano尚未发布,仅有一篇预印本论文和部分低分辨率图像样例。苹果表示,大多数开源模型在图像处理上存在取舍,而Manzano采用混合图像分词器,其共享编码器可输出连续标记和离散标记,减少任务冲突。Manzano整体架构包括混合分词器、统一语言模型和独立图像解码器,解码器有三个版本,支持不同分辨率。训练使用大量图像文本样本,内部测试显示其在文字密集型任务中表现优异,性能随规模提升而改善。苹果认为Manzano是有力替代方案,但目前其基础模型仍落后于行业领先者,未来版本需进一步验证。
延伸阅读:
高速惊魂!特斯拉续航剩72公里突然断电,售后:续航剩100公里就该充电;欣旺达电池翻车!极氪召回超3.8万辆车;高德打车被约谈整改
要闻提示1.高速惊魂!特斯拉续航剩72公里突然断电,售后回应:续航剩100公里就该充电2.欣旺达电池翻车!东风奕派碰撞5...
和夏科技递表港交所 金联资本为独家保荐人
和夏科技向港交所创业板递交上市申请,金联资本为其独家保荐人。根据弗若斯特沙利文报告,公司已发展成为浙江省领先的汽车测试解...
河南“信号升格”成绩单出炉:7.9万场所信号升级 5G-A基站达1.45万个
原标题:河南“信号升格”成绩单出炉:7.9万场所信号升级 5G-A基站达1.45万个2月10日,记者从河南省通信管理局获...
