原创 让你更懂AI的 2025-09-23 18:12 北京
让深度因子看见“情绪”
在刚刚结束的第 31 届 ACM SIGKDD 知识发现与数据挖掘国际会议(KDD2025)上,北京航空航天大学计算机学院 BIGSCITY 实验室发布了名为 UMI(Universal multi-level Market Irrationality)的股票收益预测模型。提出了一种通用的多层次市场非理性因子模型。
本文第一作者为北京航空航天大学计算机学院博士生杨晨,本文的通讯作者为北京航空航天大学计算机学院教授王静远。
论文题目:
Learning Universal Multi-level Market Irrationality Factors to Improve Stock Return Forecasting
论文作者:
博士生杨晨,王静远教授(通讯作者),博士生蒋笑寒,教授吴俊杰
指导教师:
王静远教授(https://www.bigscity.com/jingyuan-wang/)
作者单位:
北京航空航天大学
论文地址:
https://dl.acm.org/doi/10.1145/3690624.3709328
研究背景
近年来,深度学习与量化交易的深度融合在股票投资领域取得了显著成功。大量基于深度学习的模型被开发用于预测股票收益,这些模型利用神经网络强大的表征能力,识别影响股价的模式与因子。
此类深度学习模型能够有效捕捉市场中的普遍规律,例如股价趋势、量价关系以及时序变化等。然而,诸如市场情绪、投机行为、市场操纵和心理偏差等特殊的非理性因素,由于其本身较为抽象,且缺乏明确的标签和数据描述,在现有的深度股票预测模型中尚未得到充分考虑。
为弥补这一不足,本文提出 UMI(Universal multi-level Market Irrationality)——一种通用的多层次市场非理性因子模型,用于提升股票收益预测的准确性。UMI 模型能够从个股和整体市场两个层面学习反映市场非理性行为的因子。
研究动机
与能够通过明确标签和辅助信息直接描述的普遍模式相比,非理性因素更为抽象,因此难以被显式地融入模型之中。目前大多数深度学习预测模型均未充分考虑这些非理性因素,导致模型性能未能达到理想水平。
在 UMI 模型中,本文将市场中的非理性行为分为两类:个股层面的非理性事件和市场层面的非理性事件。个股层面的非理性事件被定义为股票价格暂时偏离其基本面价值(即理性价格)。
协整关系是一种能有效识别此类事件的传统方法,若两支股票的价格序列通过协整检验,说明它们在长期中存在稳定的均衡关系,可互为理性价格的参照;当其中某只股票的价格突然显著偏离这一长期关系时,便可视为发生了股票层面的非理性事件。
非另一方面,本文将市场层面的非理性事件定义为市场中所有股票出现异常的同步波动,因为在有效且理性的市场中,不同股票的价格变动通常由各自的基本面因素驱动,广泛而高度的同步波动并不常见。
在相关知识中,这类现象往往难以用基本面变化解释,更多反映出投资者群体情绪、市场心理或社会文化等非理性因素的影响。正如 2013 年诺贝尔经济学奖得主罗伯特·J·希勒在其著作《非理性繁荣》中所指出的,市场的整体性高涨或恐慌常源于人群的集体心理和行为偏差。
模型方法
在 UMI 模型中,为了利用股票层面的非理性事件,本文提出了一种具有平稳正则化的协整注意力机制,为每个股票构建了一个估计的理性价格。
尽管利用协整来构建配对交易策略可以利用股票市场的不合理性来获利,但其有效性仍然有限。股市中的自然协整关系非常稀少。传统的配对交易策略需要筛选所有潜在的股票对以识别出协整的股票对,这种方法效率低下。此外,该策略只能投资于有限数量的协整股票,导致投资风险较高且策略稳定性较低。
为了克服这一局限性,本文提出了一种基于注意力机制的方法来为每个股票构建一个协整序列,作为估计的理性价格。然后,使用这个估计的理性价格作为指示因子,以提高股票收益预测的性能。
这个理性价格与实际价格具有协整性(实际价格与理性价格之差形成一个平稳序列),但更为稳定,因为它是通过结合多支股票的价格得出的。实际价格与估计的理性价格之间的差异被用作一个因子,以指示股票层面的非理性因素。
正如罗伯特·J·希勒所强调的,市场非理性行为的原因与市场结构、文化乃至投资者心理等多种因素相互关联。仅仅将市场层面的非理性事件认为是市场的同步涨跌,并不能充分捕捉这些潜在因素。因此,本文采用了一种表征学习方法来学习市场层面非理性的综合表征。
该表征学习包含两个部分,第一个是市场层面表征提取模块,用于构建能够准确反映整个市场行为的表征。第二个两个自监督任务,即子市场对比学习和市场同步性预测,将市场层面的非理性因子融入市场表征中,作为市场层面的非理性因子。
最后,股票层面和市场层面的非理性因子都被用作深度学习模型预测股票收益的输入。基于非理性因子,本文提出了一个基于 Transformer 的预测模型,并采用均方误差(Mean Square Error, MSE)和RankIC(Rank Information Coefficient)损失混合训练。
实验验证
在美国和中国股票市场上进行了实验,在此基准上:
i)UMI 的表现显著优于最新的自监督、非自监督股票收益预测方法。
ii)UMI 的表现同样优于通用的自监督、非自监督时序预测方法。
iii)将 UMI 提取的非理性因子与其它方法相结合,也可以提升对应方法的表现。
总结和展望
本文提出了 UMI 方法,旨在利用股票市场中的非理性事件来提升收益预测效果。通过识别实际价格与估计理性价格之间的偏差,UMI 揭示了个股层面的非理性现象;同时,通过刻画股票间异常的同步波动,捕捉市场层面的非理性行为。在美国和中国市场的大量实验验证了该模型出色的预测性能和广泛的适用性。
实验室介绍
BIGSCity 实验室是北京航空航天大学大学计算机学院下属的智慧城市兴趣组,其负责人为北京航空航天大学计算机学院王静远教授。BIGSCity 小组致力于研究机器学习与数据挖掘在城市科学、社会科学等领域的交叉应用技术,包括城市计算,时空数据挖掘,机器学习可解释性,以及 AI 在交通、健康、金融等领域的应用等。详细情况参见研究组主页:https://www.bigscity.com/。实验室长期招聘青年教师、博士后,招收博士研究生以及实习生。有意者请联系 jywang@buaa.edu.cn
更多阅读
#投 稿 通 道#
让你的文字被更多人看到
如何才能让更多的优质内容以更短路径到达读者群体,缩短读者寻找优质内容的成本呢?答案就是:你不认识的人。
总有一些你不认识的人,知道你想知道的东西。PaperWeekly 或许可以成为一座桥梁,促使不同背景、不同方向的学者和学术灵感相互碰撞,迸发出更多的可能性。
PaperWeekly 鼓励高校实验室或个人,在我们的平台上分享各类优质内容,可以是最新论文解读,也可以是学术热点剖析、科研心得或竞赛经验讲解等。我们的目的只有一个,让知识真正流动起来。
📝 稿件基本要求:
• 文章确系个人原创作品,未曾在公开渠道发表,如为其他平台已发表或待发表的文章,请明确标注
• 稿件建议以 markdown 格式撰写,文中配图以附件形式发送,要求图片清晰,无版权问题
• PaperWeekly 尊重原作者署名权,并将为每篇被采纳的原创首发稿件,提供业内具有竞争力稿酬,具体依据文章阅读量和文章质量阶梯制结算
📬 投稿通道:
• 投稿邮箱:hr@paperweekly.site
• 来稿请备注即时联系方式(微信),以便我们在稿件选用的第一时间联系作者
• 您也可以直接添加小编微信(pwbot02)快速投稿,备注:姓名-投稿
△长按添加PaperWeekly小编
🔍
现在,在「知乎」也能找到我们了
进入知乎首页搜索「PaperWeekly」
点击「关注」订阅我们的专栏吧
·