Information Shapes Koopman Representation:信息如何决定模拟
英国University College London (UCL) 博士程小远、新加坡Nanyang Technological University (NTU) 博士元文瑄(master project),为本文共同第一作者;法国Institut Polytechnique De Paris 程思博教授、美国Santa Fe Institute 施密特学者章元肇等,为本文合作者,上海财经大学助理教授孙卓,为本文通讯作者。
图1:软体机器人的模拟以及控制
大多数世界模型工作默认:只要学到一个好的 latent dynamics,问题就解决了。 但这个假设本身是可疑的——什么样的信息,才足以支撑一个可预测、可传播的动力学?本文从信息论出发,重新审视这一前提。
一个自然的思路是:如果非线性动力学难以建模,能否把它转化为线性问题?Koopman 算子正是这样一种诱人的框架,它试图将复杂系统嵌入潜空间,使其演化近似线性。这一思路在物理表示、天气预测和流体控制中具有极强吸引力。 然而,这种线性化并不是免费的,它依赖于一个精心构造的表示空间,而这个空间本身才是最难学习的部分。
因此,真正的核心问题不是如何学习一个隐变量表征,而是:在有限维表示中,究竟哪些信息必须被保留,才能支撑稳定的动力学传播与长期预测?
为此,UCL、ICL、Santa Fe Institute、Institut Polytechnique De Paris、上海财经大学最新联合提出Information Shapes Koopman Representation。这项工作从动态信息瓶颈的角度重新审视 Koopman 表征学习,明确 Koopman learning 真正所需要的信息,并据此构造出一个可优化的目标。
论文地址:https://openreview.net/forum?id=Szh0ELyQxL代码地址:https://github.com/Wenxuan52/InformationKoopman
目前,该成果已被 ICLR 2026 Oral 接收。
动机:
世界模型在Koopman表征下难的,不只是「学一个 latent」
Koopman表征学习问题在于,Koopman 表征并不只是像传统潜空间学习方法,比如Autoencoder、Variational Autoencoder,一样「学一个能重建输入的 latent」。相比较而言,它还需要同时满足三个更强的性质:
Temporal Coherence:潜空间表示要能稳定地随时间传播;Structural Consistency:潜空间中的演化要尽量符合 Koopman 的线性结构;Predictive Sufficiency:表征里要保留足够多、足够关键的动力学模式,才能支撑长期预测。
这就带来了两个需要权衡的问题:
1、如果 latent 保留的信息太多,表征会更丰富,但很难维持简单稳定的线性结构;
2、如果压缩得太狠,又容易丢掉长期预测真正需要的关键模态。
所以,该论文真正想回答的问题不是 “再加一个模块”,而是顺着这个Trade-off:
在有限容量下,一个好的 Koopman 表征,到底该保留什么信息?
图2:信息论 Koopman 框架。(a) 带有 Information-shaped 优化目标的 Koopman 表征学习结构总览;(b) Koopman 模态与互信息项对应关系;(c) 互信息(MI)和冯·诺依曼熵(VNE)对模态中信息分配的水填充效应。
关键视角:
从信息瓶颈角度看待学习动力学的问题
这篇论文的切入点,是把这个问题重新放回到信息瓶颈(Information Bottleneck, IB)框架下理解。
延伸阅读:
2026北京车展今日开幕:规模跃居全球首位,首发车181台
IT之家 4 月 24 日消息,2026 北京国际汽车展览会将于 2026 年 4 月 24 日-5 月 3 日在中国国...
俞浩为什么喜欢王传福?
北京车展今日开幕,1451款车参展,大型SUV风头正劲,各路势力火拼“智驾”
本文来源:时代财经 作者:贺晴 林心林4月24日,2026北京国际汽车展览会(以下简称北京车展)正式开幕。本届车展首次采...
AI漫剧与微短剧版权如何保护?这场研讨会达成这些共识
4月20日,爱奇艺宣布百余位明星入驻旗下平台“纳逗Pro”的AI艺人库,引爆全网。次日上午,爱奇艺创始人兼CEO龚宇连发...
