首页 | 本学科首页   官方微博 | 高级检索  
     

强化学习算法在供应链环境下的库存控制中的应用
引用本文:汤大为,王红卫. 强化学习算法在供应链环境下的库存控制中的应用[J]. 管理学报, 2005, 2(3): 358-361
作者姓名:汤大为  王红卫
作者单位:华中科技大学系统工程研究所;华中科技大学系统工程研究所
摘    要:
以两级库存为例,提出了一种优化库存管理的方法.该方法包含3种技术马尔可夫决策过程、马尔可夫博弈和一种用于求解马尔可夫博弈的强化学习算法.具体操作过程是,将一个两级的库存系统通过马尔可夫博弈建模,再用马尔可夫博弈和强化学习的知识求解该模型,并得出该系统的优化解.

关 键 词:多级库存  马尔可夫决策过程  强化学习  马尔可夫博弈
文章编号:1672-884X(2005)03-0358-04
修稿时间:2004-09-17

Application of Intensive Learning Algorithm to Inventory Control in Supply Chains
Tang Dawei,Wang Hongwei. Application of Intensive Learning Algorithm to Inventory Control in Supply Chains[J]. Chinese JOurnal of Management, 2005, 2(3): 358-361
Authors:Tang Dawei  Wang Hongwei
Abstract:
Keywords:
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号