新智元报道
新智元报道
【新智元导读】从Shannon的信息熵到控制系统的状态熵,一脉相承却创新无限。清华大学从自治系统的演化动力学出发,对状态熵变化率与系统聚合度关系进行了分析,为系统智能性度量提供新视角。
一图看透全球大模型!新智元十周年钜献,2025 ASI前沿趋势报告37页首发
控制系统作为现代工程与科学的核心技术之一,广泛应用于自动驾驶、机器人、航空航天、电力系统等多个领域。
自上世纪60年代兴起的现代控制理论,使用状态空间方程作为描述工具,对系统的可控性、可观性、稳定性等基本属性进行分析:
可控性描述了系统是否能在有限时间内从任意初始状态转移到目标状态;
可观性则衡量系统内部状态是否能通过输出信号唯一重构;
稳定性则确保系统在受到扰动后仍能保持在平衡状态附近。
这些性质为控制器设计提供了理论依据,并在实际工程中得到了广泛应用。
现有理论大多聚焦于单一初始状态对应的单条轨迹行为。然而,系统的演化过程是整体性的,且极大受到初始分布的影响,尤其是在非线性系统中。
如何描述控制系统的整体行为,是一个待解决的重要问题。
一种可行的思路:通过随机变量来描述系统状态的概率分布,用随机变量的分布变化描述系统内在的聚集或扩散趋势。
基于这一思路,清华大学科研团队首次提出状态熵(state entropy)的概念,用于分析控制系统的聚集程度(degree of aggregation),即聚合性,并将其作为描述系统演化过程的基本属性之一。
熵的概念最早源于19世纪的热力学。1865年,克劳修斯(Clausius)提出了热力学熵的定义,用于描述系统趋向热力学平衡的过程。
随后,玻尔兹曼(Boltzmann)从微观角度对熵进行了统计解释,揭示了系统趋向最大熵状态的统计本质。
20世纪中叶,香农(Claude Shannon)将熵的概念引入信息论,提出了信息熵的定义,用于衡量随机变量的不确定性。
信息熵具有连续性、单调性和可加性等重要性质,能够定量描述信息的不确定程度。
对于控制系统,考虑其初始状态为一个给定概率密度函数的随机变量。
定义该随机变量的信息熵为系统的「状态熵」(state entropy),用于量化系统状态的不确定性,其演化过程可用于表征系统内在的聚集或扩散趋势。
图1 动力学系统状态熵的演化示意图
论文首先分析了不含控制输入的自治系统。对于连续时间自治系统,状态方程为,其中初始状态X_0为随机变量,具有概率密度函数
,系统在t时刻的状态熵为:
该定义将状态熵的变化与系统状态转移的局部变形程度(即雅可比矩阵的行列式)联系起来。
无需知道状态轨迹的显式表达式,只需计算雅可比矩阵的行列式,现在即可获得状态熵的演化信息。
状态熵的变化率反映了系统的聚集程度,这一性质被称为「聚合性」,是控制系统的一个全新特性。
聚集程度由下述公式进行度量:
由该定义可知,系统的聚集程度,即状态熵的变化率由控制系统的向量场散度(即雅可比矩阵的迹)在初始状态分布上的加权平均决定。
换句话说,系统状态是趋于分散还是聚集,取决于向量场的局部「膨胀」或「收缩」特性:
若雅可比矩阵的迹为正,状态熵增加,系统趋于发散(dissipation);
若为负,状态熵减小,系统趋于集中(aggregation)。
特别地,对于时不变线性系统,控制策略为
。此时,雅可比矩阵的迹为常数
,因此状态熵的变化率也为常数,且与初始状态分布无关。
这一性质不仅适用于线性系统,也适用于向量场散度为常数的非线性系统。此类系统的状态熵演化可以完全由系统参数决定。
为直观显示动力学系统的熵及其变化,在LQR线性系统、非线性阻尼振荡器和洛伦兹系统上,研究团队进行了仿真实验,考察其状态熵的演化规律。
选取了三种不同的初始状态分布:标准正态分布、方差放大的正态分布、均匀分布,利用蒙特卡洛方法进行数值模拟,并与理论计算值对比。
实验结果如图所示:
图2 三类典型动力学系统
如图所示,研究人员选取了三类典型动力学系统并分析其状态聚集程度:
第一类系统:线性、稳定且状态聚合的;
第二类系统:非线性、具有唯一稳定点且状态聚合的;
第三类系统:非线性、具有多个稳定点且状态聚合的。
从如上系统中可以观察到,稳定性和聚合性是描述动力学系统的两个不同性质。
稳定性要求系统从给定初始点附近出发,经过足够长时间内仍然可以停留在初始点附近,则该点处的状态必然具有聚合性。
然而,当系统具有多个稳定点时(如第三个例子),即使系统可能是全局趋于状态聚合的,但在部分点处的微小扰动可能引起最终状态的极大变化。
众所周知,孤立系统的熵增或熵减,与生命的进化密切相关。
对于控制系统而言,状态熵的分析可以为系统的智能性提供一条全新的度量视角。
控制策略通过影响状态转移过程,改变系统的局部聚合性质。
状态熵作为状态分布不确定性的度量,其演化方向与速率由控制策略及环境耦合共同决定,而智能性的本质在于:
通过闭环反馈机制,系统将状态不确定性以稳定速率持续压缩。
当控制策略使系统状态熵的变化率始终为负,且对扰动参数的偏导数范数有界时,可以认为:
系统具备 内在能力 将未来状态分布的不确定性限制在给定区间。
而这种能力可以作为智能度的高低的度量。
熵演化曲线的斜率稳定性与可积性共同构成可观测的智能判据,斜率越稳定且积分值越小,系统对未来观测序列的预测误差越小,从而在非平稳条件下保持状态分布的渐近收敛性。
因此,状态熵的演化规律量化了系统当前的不确定性水平,而其导数的性质更是揭示了系统把外部随机输入持续转化为可估计分量的内在能力。
这可以作为智能性度量的一种可行视角。
综上所述,研究首次考虑了控制系统初始状态的不确定性,引入状态熵的概念描述控制系统的状态分布,给出了适用于连续时间、离散时间、线性与非线性控制系统的统一定义,并推导出其随时间演化的解析表达式。
论文证明了
状态熵的变化率由控制向量场的散度决定;
对于散度为常数的系统,熵呈线性演化且与初始分布无关;
离散系统的熵差可直接由状态转移映射的雅可比行列式计算。
理论分析进一步揭示了状态熵与系统矩阵、控制增益之间的关系,使得无需轨迹仿真即可预测信息不确定性演化。在三种典型动力学系统上(LQR、非线性阻尼振荡器、Lorenz系统)分析了状态演化规律和系统属性。
该研究首次将系统的聚合性考虑为控制系统的一项基本属性,使用状态熵作为这一基本属性的度量,并提供了可计算的熵演化规律。
该研究有望促进对系统智能性的解释,进一步理解策略学习的智能涌现过程。
<br>
<a class="media_tool_meta meta_primary" href="http://mp.weixin.qq.com/s?__biz=MzI3MTA0MTk1MA==&mid=2652630319&idx=3&sn=2584afa225626ed225358cb2b65547f9&chksm=f0062e520b88efb9565f6dbbbfcf375946b63ab7607980b36af1e8553a6ed3054e526bfcc259&scene=0#rd" target="_blank">文章原文</a>
<br>
<img alt="" class="" height="1px" src="https://images.weserv.nl/?url=http://www.jintiankansha.me/rss_static/5418/r4DwVmdKLr&maxage=1y" width="1px"></div></div></body></html>