# 模态
豆包大模型家族更新!豆包每日Token调用量达30万亿,大涨523倍
智东西作者 程茜编辑 李水青智东西10月16日报道,今天,在FORCE LINK AI创新巡展·武汉站上,火山引擎升级了...
自变量获近10亿元A+轮融资,阿里云首次出手具身智能
雷峰网AI科技评论获悉,自变量机器人于近日完成近10亿元A+轮融资。本轮由阿里云、国科投资领投,国开金融、红杉中国、渶策...
开放全栈!超越π0,具身智能基础大模型迎来真·开源,开发者狂喜
衡宇 鹭羽 发自 凹非寺量子位 | 公众号 QbitAI继π0后,具身智能基座模型在中国也终于迎来了真正的开源——刚刚,...
基于3DGS场景理解和视觉语言预训练,让3D高斯「听懂人话」的一跃
开放词汇识别与分类对于全面理解现实世界的 3D 场景至关重要。目前,所有现有方法在训练或推理过程中都依赖于 2D 或文本...
多模态大模型持续学习,综述+Benchmark+方法+Codebase一网打尽
本系列工作核心作者: 郭海洋(自动化所博士生)、 朱飞 (中科院香港院AI中心AP)、 曾繁虎 (自动化所硕士生)、 刘...
AI边刷视频边思考!快手最新多模态大模型开源,80亿参数,实测推理超快
智东西作者 李水青编辑 心缘智东西9月4日报道,9月3日,快手开源最新多模态大模型Keye-VL-1.5。该模型拥有80...
全面升级!书生·万象3.5发布,多模态感知能力超越GPT-5
新民晚报记者获悉,近日,上海人工智能实验室(上海AI实验室)开源通用多模态大模型书生·万象3.5(InternVL3.5...
DeepSeek、GPT-5都在尝试的快慢思考切换,有了更智能版本
本研究由中科院自动化所和腾讯混元联合研发,团队成员包括 Qi Yang, Bolin Ni, Shiming Xiang...
AI巨头重兵布局,深度解析AI智能体:为什么说它才是AI的终极形态?
文 | 新芒X今天看到这么一个观点,说很少有新兴技术能够比代理人工智能 (Agentic AI)为组织提供更多机会来加速...
当AI成”视觉神探“,准确性如何?隐私暴露风险如何抵御?
21世纪经济报道 见习记者 叶红梅对图片内的信息抽丝剥茧,像侦探一样确定拍摄地点,这对如今的人工智能来说已非难事。8月1...