Gemini 3.0还在预热,中国AI抢先!30秒造APP全网首测
【新智元导读】Gemini 3.0还未杀到,一系列惊艳实测就已宣告:AI「生成涌现」时代,真的来了!几乎同一时间,国内一款新生AI神器,竟将这股超能力塞进手机,30秒手搓一个APP。
2025年终AI压轴大戏,本周强势来袭!
这几天,谷歌下一代AI模型预热引爆全网,Gemini 3.0「全家桶」多款模型蓄势待发。
此时此刻,全网都在坐等这场王炸发布。
毕竟,OpenAI GPT-5.1小修小补,并未触发所有人的G点。如今,Gemini 3.0几乎成为「全村人」的希望。
社交媒体上,更多的惊艳实测demo曝光:一句话即生前端UI、操作系统界面,以及复杂的SVG动画等等。
左右滑动查看
在这热闹喧嚣之中,我们看到了——AI的下一个未来,是「生成涌现」。
当前,AI正经历一场深刻的范式转变,从单一模态如文本/图像的生成,逐步演进至「生成涌现」的新阶段。
在这一全新范式下,Gemini 3.0正作为引领者,驱动着无限概念的生成与实现。
恰在今天,蚂蚁灵光正式上线,一款集闪应用、对话、开眼于一体的全模态通用AI助手。
它的诞生,打开了「生成涌现」的另一种方式。
AI进入「生成涌现」时代
生成涌现,本质上是AI生成能力的「爆炸式扩展」。
提到「涌现」一词,我们并不陌生。2022年,谷歌DeepMind斯坦福等在一篇论文中验证了:
随着模型的参数规模扩大,性能也会随之提升,还能解锁不可预测的全新能力。
他们将其称之为,「大模型涌现」。它从新的维度,再次印证了Scaling Law不死。
论文地址:https://arxiv.org/pdf/2206.07682
而这里的「生成涌现」,不在于内容本身,而在于前端与系统设计更高层次的应用重塑。
ChatGPT诞生后很长一段时间,传统生成式AI更擅长「线性输出」:prompt输入,文本/图片等单一模态输出。
这种以单一模态的输出,在2025年迎来一个新的拐点。
这一年,我们已见证了太多标志性大事件——
原生多模态模型:Gemini 2.5、GPT-5、Grok 4等最具代表性
图像模型:GPT-4o掀起吉卜力热狂潮;Nano Banana引爆AI图像编辑的热潮
视频模型:Veo 3首次实现音画同步;Sora 2坐享创意领域的ChatGPT时刻
世界模型:李飞飞Marble一句话即生3D世界;谷歌Genie 3直出可交互环境
左右滑动查看
前沿模型的每一次进化,都在向着原生多模态方向演进,最终导向了「涌现式生成」。
也就是说,AI会像生态系统般,逐渐具备自主扩展能力,并融合多模态、实时编码、动态应用的生成。
当参数超越更大的阈值时,模型不再局限于线性预测,而会涌现出「系统级」的能力。
这种趋势,在尚未真正露面的Gemini 3.0身上,愈发明显。
一句指令,它便能一次性构建可用的Windows、macOS操作系统,一键克隆YouTube网站视频可看、可交互小游戏……
Karpathy调侃道,Gemini 3.0在你没开口就能读懂人类心思,甚至,还能和你的猫聊天
Gemini 3.0还把AI编码上限推到一个全新高度,语言一键迁移,复杂的前端UI交互。
这种生成涌现的爆发力,就连「股神」巴菲特也为之动容。
可以笃定的是,未来AI的发展方向,或说下一个趋势,便是朝着「生成涌现」这一范式演进。
要说生成,其能力边界可以大到所有人无法想象,但最终落地时会是怎样的一种形态?
同一时间点上,蚂蚁灵光的登场,给业界提供了一条可行的路径。
从模型层面上看,Gemini 3.0可以验证系统、前端设计无限生成。但从产品层面看,灵光正开启「生成涌现」普惠化的探索。
一个人人皆可在移动端,短短30秒内,一键创建日常小应用的神器。
灵光真正实现了「人人手搓AI」的梦想,完美诠释了「生成涌现」的落地。
灵光一闪,人人进入生成时代
在这个人人皆可生成的时代,最不缺的就是「半成品」。
尤其在当下,氛围编程、生成式音乐、生成式网页、生成式视频…似乎一切皆可由AI完成。
所有人都在疯狂地「玩面粉」,但很多AI生成的内容都是半成品,或者压根不可用。
可人们真正想要的,从来不是面粉、面团等,而是可以直接端上桌的馒头、包子,甚至是要「好看又好吃」的那种。
这正是,灵光诞生的契机。
不管是打工人,还是学生,不管是老板,还是普通人,皆需要一个既能生成「最终好用产品」的AI工具,而且生成的内容还要「好看」。
左右滑动查看
你需要什么,就去造
灵光里最强大的一个功能就是闪应用。
在对比了众多国内外的通用AI产品后,灵光称得上国内通用AI助手里的一股清流,甚至可以说是独特的一种存在。
灵光使用下来,给人一种,这是通用AI产品中的「iPhone」。
iPhone好用在于它开创了「AppStore」,定义了「下载应用」的时代,将手机从「通信工具」变成了「万能掌上电脑」。
而灵光正在用「灵光闪应用」开启下一个时代:从下载海量应用进化为即时生成专属应用。
iPhone App Store:你需要什么,就去找。
灵光闪应用:你需要什么,就去造。
这是一种范式革命,它用30秒的「即时生成」取代了「搜索、筛选、下载、安装」的漫长链路,把创作权交给了普通人。
这个30秒的应用生成速度,体验真香。
比如制作一个能够分享,能够解释清楚最近网络热梗「哈基米南北绿豆」的来龙去脉。
可以看到,闪应用不止于「静态展示」,更拥有强大的「动态交互」能力。
这是因为,每个轻量级应用都可直接调用大模型等后端能力,不仅能展示结果,更能实时与外部进行交互。
这些应用真的就和APP一样,在你的闪应用列表中,随时可以调用。
不管是运动健⾝、旅⾏规划,还是健康⻝谱、理财规划,或者购物决策,这里全靠发挥你的想象力!
当Cursor为首的编程IDE让普通人离AI越来越远时,当氛围编程只属于部分懂技术的「特权」时。
其实从这次Gemini 3的「路透」就能看出来,未来所有的产品都能「AI生成」,而且也必将AI生成。
AI会不断吞噬掉所有工作内容。
于是,灵光也做了一次「减法」。
他们用「信息美学」的方式,让灵光的界面做到了极简。
它不再让你从纷繁的多模态工具中进行选择,而是一次性「生成」一切。
用「信息美学」融合全模态
简单来说,信息美学就是让信息变得既「好看」又「好懂」的艺术!
在AI时代,我们被卷入信息的洪流。
从社交媒体,到新闻、报告充斥着冗余的内容,其中大量还是AI生成的同质化、低价值的,让获取真实价值的信息变得愈发困难。
所以AI时代最大问题并不是获取知识,而是如何更好的组织知识,从繁杂的信息海洋中捞到真正的珍珠。
一个有用的信息不应该是深藏不露的或者长篇大论的,而应当是「恰到好处」。
比如虽然ChatGPT、Gemini等目前基础功能都很强大,但是每次问题都要输出一篇千字长文,让关键信息淹没在长上下文里。
或许,在底层模型卷无可卷的当下,我们需要一种新的AI产品形态。
全模态通⽤AI助⼿灵光,就是一个能把信息变成艺术品的AI工具。
它不仅仅是把知识内容和信息结构做得非常漂亮,而是提供了一种设计哲学,认为「美」本身就是一种功能。
它通过视觉、听觉甚至触觉(如3D交互)来组织信息,让你在接收信息的过程中感到愉悦、高效,并且能「秒懂」。
接触信息,感到愉悦,是的,这就是想象中,通用智能的那种感觉。
你没有看错,你甚至可以在灵光中创造3D模型,这已经脱离了一个对话AI的层面。
这一能力的实现,是因为灵光构建了「多智能体协作的Agentic架构」,让生成不再是单一工具的线性操作。
在生成可视化内容时,它会调度图像、3D、动画等不同领域的专业AI智能体,让其实时协作,提供更完整、更丰富、更沉浸的视图体验。
更值得一提的是,这一切皆可在移动端就能实现,在业界实属罕见。
总结来说,灵光带了一次内容生成的革新:它是首个实现了基于全代码生成的多模态内容输出。
当提出一个问题,它不只是「回答」,它会自动理解真实意图,并立即以代码为核心,实时构建出结构化、个性化,且高度美观可交互的可视化内容。
开眼:探索未来AI的产品形态
更令人欣喜的是,灵光这次探索了一种新的AI形态,摄像头+AI。
灵光开眼,这次让AI睁眼看世界。
虽然手机摄像头的参数已经卷到天际,但它还是一个死物,只负责记录。
而在AI加持下,未来的摄像头,可以说是「具身智能」史前时代的最佳载体。
灵光开眼的识别成功率和速度很难让人相信。
灵光开眼能够准确识别生活中的几乎任何物体。
甚至你还可以用灵光开眼来「找不同」,识别中容易被混淆的对象。
甚至可以用灵光总结了2025年9月份的阿里财报,还顺便算出了同比(有点东西)。
再让它解读一篇论文,看看能否胜任?
打开Transformer经典之作,灵光一眼识别出这篇论文,并在接下来回答中,关于论文主旨、架构性能,全部给出了正确的解析。
让普通人提前进入未来世界
如今,生成式AI发展的问题已经不是「生成」,而是AI的天花板到底有多高?
未来是不是,任何作品、任何工作内容、任何创作都可以由AI生成?
AI在发生大的变化,生成式也在发生大的变化,谷歌的Gemini 3预示着未来一种全新的趋势。
很多提前体验到Gemini 3的用户都认为,新模型在美学与信息量之间找到了前所未有的平衡。
文字更有审美密度,结构更清晰,内容更饱满,同时生成失误率大幅降低。这种一致性,正与灵光的方向不谋而合。
灵光的核心不是炫技,而是把高级能力包装成人人都能用的体验。
当模型本身的审美能力、稳定性和知识密度提升后,灵光就能把这些底层优势转译成更可靠的场景输出:
可以说,Gemini 3的出现,让灵光一直坚持的方向被再次证明。
灵光要做的,就是把「好」变得可感,把「稳」变得可依赖,让每一个普通用户都能享受到这场升级,而不需要成为提示词专家。
这里再次引用大神卡帕西对于Gemini 3的评价。
当一个AI在你提问前就猜到了你的想法,并且还给你答案,相信我们离真正的AGI世界不会太远。
灵光不追求一口气摸到天花板,而是先把地板垫高。
把复杂性藏起来,把确定性交给用户,让第一次用AI的普通人也能稳稳落地。
让更多人走进来,提前感受到未来的AI世界。
在这一点上,最近刚刚上线的千问APP也印证了这个趋势。
千问APP携带阿里「公司级」战略的雷霆之势转向C端。
意味着AI从「技术展示」走向「结果交付」:普通人也能随手可得。
灵光想做的,就是让这个复杂的AI时代,变得更简单一些~
秒追ASI⭐点赞、转发、在看一键三连⭐点亮星标,锁定新智元极速推送!
延伸阅读:
Gemini 3.0还在预热,中国AI抢先!30秒造APP全网首测
【新智元导读】Gemini 3.0还未杀到,一系列惊艳实测就已宣告:AI「生成涌现」时代,真的来了!几乎同一时间,国内一...
库克15年苹果掌舵生涯迎来倒计时,继任计划浮出水面
来源:环球网【环球网科技综合报道】11月18日消息,据《金融时报》援引路透社报道,苹果公司正密集推进CEO任规划,现任C...
微软Azure遭遇史上最大云DDoS攻击,50万IP狂轰
来源:环球网【环球网科技综合报道】11月18日消息,据外媒The Register报道,微软官方披露,其Azure 云服...
晚点独家丨字节 Seed 又有核心成员离职,今年陆续走了 7 位
比邪典动画更可怕!AI拼接的怪异形象,为何让孩子集体“着迷”?
来源:法治日报“通通通通撒呼啦”“哩哩哩辣力辣”……天津市河东区某小学生家长李女士发现,自己的孩子最近总是念叨着这些宛如...





