# 模态
MiniMax M2:所有坑都踩过,才能做出所有人都能用上的Agent
作者 | 王兆洋邮箱 | wangzhaoyang@pingwest.com18%!最近一个月,基础模型似乎又有点多起来...
MiniMax M2:所有坑都踩过,才能做出所有人都能用上的Agent
作者 | 王兆洋邮箱 | wangzhaoyang@pingwest.com18%!最近一个月,基础模型似乎又有点多起来...
精读DeepSeek OCR论文,我远远看到了「世界模型」的轮廓
文 | X研究媛DeepSeek OCR是一个不错的OCR小模型,但过誉了。知乎网友指出,即使横向对比OCR最优秀的几个...
豆包大模型家族更新!豆包每日Token调用量达30万亿,大涨523倍
智东西作者 程茜编辑 李水青智东西10月16日报道,今天,在FORCE LINK AI创新巡展·武汉站上,火山引擎升级了...
自变量获近10亿元A+轮融资,阿里云首次出手具身智能
雷峰网AI科技评论获悉,自变量机器人于近日完成近10亿元A+轮融资。本轮由阿里云、国科投资领投,国开金融、红杉中国、渶策...
开放全栈!超越π0,具身智能基础大模型迎来真·开源,开发者狂喜
衡宇 鹭羽 发自 凹非寺量子位 | 公众号 QbitAI继π0后,具身智能基座模型在中国也终于迎来了真正的开源——刚刚,...
基于3DGS场景理解和视觉语言预训练,让3D高斯「听懂人话」的一跃
开放词汇识别与分类对于全面理解现实世界的 3D 场景至关重要。目前,所有现有方法在训练或推理过程中都依赖于 2D 或文本...
多模态大模型持续学习,综述+Benchmark+方法+Codebase一网打尽
本系列工作核心作者: 郭海洋(自动化所博士生)、 朱飞 (中科院香港院AI中心AP)、 曾繁虎 (自动化所硕士生)、 刘...
AI边刷视频边思考!快手最新多模态大模型开源,80亿参数,实测推理超快
智东西作者 李水青编辑 心缘智东西9月4日报道,9月3日,快手开源最新多模态大模型Keye-VL-1.5。该模型拥有80...
全面升级!书生·万象3.5发布,多模态感知能力超越GPT-5
新民晚报记者获悉,近日,上海人工智能实验室(上海AI实验室)开源通用多模态大模型书生·万象3.5(InternVL3.5...