# 图像生成基础模型
DeepSeek新模型被硅谷疯夸!用二维视觉压缩一维文字,单GPU能跑
DeepSeek最新开源的模型,已经被硅谷夸疯了!因为实在太DeepSeek了。3B规模、指数级效能变革、大道至简,甚至...
苹果探索自研多模态AI模型Manzano
据悉,苹果正在研发名为Manzano的新图像模型,旨在兼具图像理解和图像生成能力。目前Manzano尚未发布,仅有一篇预...
Qwen重磅发布:首个端到端全模态AI模型Qwen3-Omni登场
阿里杀疯了,Qwen团队刚刚接连发布了两款重要模型:Qwen3-Omni,业界首个原生端到端全模态AI模型;以及Qwen...
赛道Hyper | 可灵AI角逐首尾帧生成战场
作者:周源/华尔街见闻8月下旬,快手宣布可灵AI上线2.1模型的“首尾帧”功能,相较1.6版本,生成效果提升235%。这...
OpenAI杀入语音模型大战!祭出最强GPT-RealTime,加量还降价
智东西编译 程茜编辑 李水青智东西8月29日消息,今天凌晨,OpenAI发布为开发人员打造的语音转语音模型GPT-Rea...
告别「面瘫」配音,InfiniteTalk开启从口型同步到全身表达新范式
传统 video dubbing 技术长期受限于其固有的 “口型僵局”,即仅能编辑嘴部区域,导致配音所传递的情感与人物的...
DeepSeek V3.1出现“极”字Bug,影响编码流程
日前,DeepSeek最新版V3.1被发现存在严重Bug,会在代码生成中随机插入“极/極/extreme”等token,...
港大与可灵联合推出新视频世界模型,记忆力媲美Genie3
要让视频生成模型真正成为模拟真实物理世界的「世界模型」,必须具备长时间生成并保留场景记忆的能力。然而,交互式长视频生成一...