基于深度强化学习的城市公共交通票价优化模型 |
| |
引用本文: | 李雪岩,张汉坤,李静,邱荷婷.基于深度强化学习的城市公共交通票价优化模型[J].管理工程学报,2022(6):144-155. |
| |
作者姓名: | 李雪岩 张汉坤 李静 邱荷婷 |
| |
作者单位: | 1. 北京联合大学管理学院;2. 北京工商大学电商与物流学院;3. 北京交通大学经济管理学院;4. 首都经济贸易大学管理工程学院 |
| |
基金项目: | 国家自然科学基金资助青年项目(72103019);;教育部人文社会科学研究青年基金资助项目(20YJC630069); |
| |
摘 要: | 本文针对出行需求演化复杂性,首先将票价的优化过程视为智能体在复杂环境中经过不断探索获得最优价格的学习过程;其次引入深度强化学习算法,采用价值函数神经网络拟合出行需求(环境)对票价制定(动作)的反应函数,在不同运输方式间的博弈过程中通过对票价调节动作的奖惩训练其达到决策目标;然后在群体出行决策复杂性刻画方面,基于Logit模型、累积前景理论及Bush Mosteller模型,设计了3种由简单到复杂的出行需求演化场景;最后以现实场景下地铁和公交之间的票价博弈为例,通过数值模拟考察方法的有效性。研究发现:(1)深度强化学习算法在感知出行需求演化复杂性过程中具有良好的票价弹性刻画能力;(2)深度强化学习算法能够针对复杂出行需求给出合理稳定的价格方案,优化地铁(公交)票价后,使不同出行需求模型下地铁(公交)的利润及各出行方式的总体利润均得到显著增长。
|
关 键 词: | 深度强化学习 公共交通 票价制定 群体决策 |
|
|