图像生成基础模型相关文章列表 - 财通街

DeepSeek新模型被硅谷疯夸！用二维视觉压缩一维文字，单GPU能跑

DeepSeek新模型被硅谷疯夸！用二维视觉压缩一维文字，单GPU能跑

DeepSeek最新开源的模型，已经被硅谷夸疯了！因为实在太DeepSeek了。3B规模、指数级效能变革、大道至简，甚至...

娱乐早知道 2025年10月21日

狂奔20天，全网“追赶”Sora2

狂奔20天，全网“追赶”Sora2

定焦One（dingjiaoone）原创作者 | 陈丹编辑 | 魏佳Sora2的发布，再次搅动了全球人工智能行业的神经。...

八卦小灵通 2025年10月20日

苹果探索自研多模态AI模型Manzano

苹果探索自研多模态AI模型Manzano

据悉，苹果正在研发名为Manzano的新图像模型，旨在兼具图像理解和图像生成能力。目前Manzano尚未发布，仅有一篇预...

八卦小灵通 2025年9月28日

Qwen重磅发布：首个端到端全模态AI模型Qwen3-Omni登场

Qwen重磅发布：首个端到端全模态AI模型Qwen3-Omni登场

阿里杀疯了，Qwen团队刚刚接连发布了两款重要模型：Qwen3-Omni，业界首个原生端到端全模态AI模型；以及Qwen...

娱乐早知道 2025年9月23日

赛道Hyper | 可灵AI角逐首尾帧生成战场

赛道Hyper | 可灵AI角逐首尾帧生成战场

作者：周源/华尔街见闻8月下旬，快手宣布可灵AI上线2.1模型的“首尾帧”功能，相较1.6版本，生成效果提升235%。这...

娱乐大事件 2025年9月2日

OpenAI杀入语音模型大战！祭出最强GPT-RealTime，加量还降价

OpenAI杀入语音模型大战！祭出最强GPT-RealTime，加量还降价

智东西编译程茜编辑李水青智东西8月29日消息，今天凌晨，OpenAI发布为开发人员打造的语音转语音模型GPT-Rea...

娱乐大事件 2025年8月29日

告别「面瘫」配音，InfiniteTalk开启从口型同步到全身表达新范式

告别「面瘫」配音，InfiniteTalk开启从口型同步到全身表达新范式

传统 video dubbing 技术长期受限于其固有的 “口型僵局”，即仅能编辑嘴部区域，导致配音所传递的情感与人物的...

娱乐早知道 2025年8月28日

DeepSeek V3.1出现“极”字Bug，影响编码流程

DeepSeek V3.1出现“极”字Bug，影响编码流程

日前，DeepSeek最新版V3.1被发现存在严重Bug，会在代码生成中随机插入“极/極/extreme”等token，...

摸鱼小能手 2025年8月27日

港大与可灵联合推出新视频世界模型，记忆力媲美Genie3

港大与可灵联合推出新视频世界模型，记忆力媲美Genie3

要让视频生成模型真正成为模拟真实物理世界的「世界模型」，必须具备长时间生成并保留场景记忆的能力。然而，交互式长视频生成一...

摸鱼小能手 2025年8月21日