# 上下文
Meta开源史上最强语音“基座模型”:一口气支持1600+种语言
刚刚,Meta AI FAIR团队发布了其在自动语音识别(ASR)领域的最新成果:Omnilingual ASR这是一个...
谷歌发布“嵌套学习”范式:让 AI 像人脑一样温故知新
IT之家 11 月 10 日消息,谷歌研究院于 11 月 7 日发布博文,为攻克 AI 模型在持续学习新知识时遇到“灾难...
在失败中进化?UIUC联合斯坦福、AMD实现智能体「从错误中成长」
人工智能(AI)正经历从「会做」到「做得可靠」的关键转变。随着大语言模型(LLM)推动的智能体(Agent)广泛应用于自...
精读DeepSeek OCR论文,我远远看到了「世界模型」的轮廓
文 | X研究媛DeepSeek OCR是一个不错的OCR小模型,但过誉了。知乎网友指出,即使横向对比OCR最优秀的几个...
DeepSeek新模型被硅谷疯夸!用二维视觉压缩一维文字,单GPU能跑
DeepSeek最新开源的模型,已经被硅谷夸疯了!因为实在太DeepSeek了。3B规模、指数级效能变革、大道至简,甚至...
Gemini再进化:Chrome泄露“上下文任务”功能,对标微软Edge
IT之家 10 月 11 日消息,科技媒体 Windows Latest 昨日(10 月 10 日)发布博文,报道称在 ...
阿里开源新架构Qwen3-Next,模型训练成本降9成,长文本推理吞吐提升10倍
每经杭州9月12日电(记者叶晓丹)9月12日,阿里通义发布下一代基础模型架构Qwen3-Next。Qwen3-Next针...
告别「面瘫」配音,InfiniteTalk开启从口型同步到全身表达新范式
传统 video dubbing 技术长期受限于其固有的 “口型僵局”,即仅能编辑嘴部区域,导致配音所传递的情感与人物的...