Meta开源史上最强语音“基座模型”:一口气支持1600+种语言

刚刚,Meta AI FAIR团队发布了其在自动语音识别(ASR)领域的最新成果:Omnilingual ASR这是一个...

娱乐早知道
2025年11月11日
谷歌发布“嵌套学习”范式:让 AI 像人脑一样温故知新

IT之家 11 月 10 日消息,谷歌研究院于 11 月 7 日发布博文,为攻克 AI 模型在持续学习新知识时遇到“灾难...

娱乐大事件
2025年11月10日
在失败中进化?UIUC联合斯坦福、AMD实现智能体「从错误中成长」

人工智能(AI)正经历从「会做」到「做得可靠」的关键转变。随着大语言模型(LLM)推动的智能体(Agent)广泛应用于自...

娱乐大事件
2025年11月7日
精读DeepSeek OCR论文,我远远看到了「世界模型」的轮廓

文 | X研究媛DeepSeek OCR是一个不错的OCR小模型,但过誉了。知乎网友指出,即使横向对比OCR最优秀的几个...

娱乐早知道
2025年10月27日
DeepSeek新模型被硅谷疯夸!用二维视觉压缩一维文字,单GPU能跑

DeepSeek最新开源的模型,已经被硅谷夸疯了!因为实在太DeepSeek了。3B规模、指数级效能变革、大道至简,甚至...

娱乐早知道
2025年10月21日
Gemini再进化:Chrome泄露“上下文任务”功能,对标微软Edge

IT之家 10 月 11 日消息,科技媒体 Windows Latest 昨日(10 月 10 日)发布博文,报道称在 ...

摸鱼小能手
2025年10月11日
阿里深夜干了件大事,成本暴降90%!

智东西作者 程茜编辑 心缘智东西9月12日报道,今天凌晨,阿里通义实验室正式发布下一代基础模型架构Qwen3-Next,...

八卦小灵通
2025年9月12日
阿里开源新架构Qwen3-Next,模型训练成本降9成,长文本推理吞吐提升10倍

每经杭州9月12日电(记者叶晓丹)9月12日,阿里通义发布下一代基础模型架构Qwen3-Next。Qwen3-Next针...

娱乐早知道
2025年9月12日
告别「面瘫」配音,InfiniteTalk开启从口型同步到全身表达新范式

传统 video dubbing 技术长期受限于其固有的 “口型僵局”,即仅能编辑嘴部区域,导致配音所传递的情感与人物的...

娱乐早知道
2025年8月28日
硅星人寻找人类AI分析师

硅星人需要人类 AI 分析师若干名,负责硅星人日常与AI 创业公司、AI 头部企业、AI 产业人物的日常沟通、交流、访谈...

娱乐大事件
2025年8月28日