首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
考虑具有成本学习的垄断企业在两阶段内销售一种新体验品,消费者通过在线评论学习产品质量信息.为研究企业定价与消费者策略互动,以及社会学习和成本学习的相互作用关系,构建了一个两阶段生产销售模型,运用理性预期均衡理论,对承诺定价和动态定价两种策略进行分析和比较.研究表明,仅当消费者策略性强且成本学习率较低时,承诺定价占优.更显著的社会学习和成本学习虽加剧了消费者的策略性等待,但仍然导致更高的企业利润.此外,对于企业盈利能力,两种学习效应之间的关系取决于评论活跃度、成本学习率和消费者策略性水平:替代关系仅发生在评论活跃度和成本学习率较低且消费者策略性较强时,否则二者表现互补关系.  相似文献   

2.
本文针对出行需求演化复杂性,首先将票价的优化过程视为智能体在复杂环境中经过不断探索获得最优价格的学习过程;其次引入深度强化学习算法,采用价值函数神经网络拟合出行需求(环境)对票价制定(动作)的反应函数,在不同运输方式间的博弈过程中通过对票价调节动作的奖惩训练其达到决策目标;然后在群体出行决策复杂性刻画方面,基于Logit模型、累积前景理论及Bush Mosteller模型,设计了3种由简单到复杂的出行需求演化场景;最后以现实场景下地铁和公交之间的票价博弈为例,通过数值模拟考察方法的有效性。研究发现:(1)深度强化学习算法在感知出行需求演化复杂性过程中具有良好的票价弹性刻画能力;(2)深度强化学习算法能够针对复杂出行需求给出合理稳定的价格方案,优化地铁(公交)票价后,使不同出行需求模型下地铁(公交)的利润及各出行方式的总体利润均得到显著增长。  相似文献   

3.
电子商务在线自动定价指的是WEB营销系统根据过去的价格和销售,自动设置销售价格至最佳价格的一种方法体系.基于实现自动定价是为了使在线营销网站的利润最大化的假设,本文介绍二种用于B2C电子商务数字产品的"自动定价"的新方案,并给出了该方案的实现过程和具体算法.  相似文献   

4.
本文研究的是存在战略消费者行为风险的动态定价问题,垄断厂商在需求不确定的有限时间内销售定量易逝商品,追求既定风险下的期望收益最大化;战略消费者在动态定价下基于参考价格安排购买时机.研究表明,厂商和消费者的行为策略间存在完美博弈均衡;在均衡价格范围内,战略购买行为改变了各交易主体的收益或支付,扩大了厂商收益不确定性风险;风险敏感的厂商定价趋于保守;交易信息透明是厂商实现预定目标的引导条件.  相似文献   

5.
集装箱班轮二维收益管理在线动态定价策略   总被引:2,自引:0,他引:2  
为了在现实约束条件下最大化班轮公司收益,研究了集装箱海运二维收益管理多航段多箱型在线动态定价模型,提出了其最优在线动态定价策略,并且证明了模型价值函数的单调性及其上界.基于降维的思想提出了更为实际的启发式算法.在算例中分析了单航段单箱型、单航段多箱型和多航段多箱型3种情况下的最优动态定价策略,分析结果表明:在单航段单箱型的情况下,最优价格具有单调性;在单航段多箱型和多航段多箱型的情况下,最优价格不一定具有单调性.  相似文献   

6.
网络环境下考虑动态定价的渠道协调问题研究   总被引:15,自引:0,他引:15  
在一个制造商和一个在线零售商构成的供应链中,制造商委托在线零售商销售产品,确定价格和生产数量,零售商确定收益分享比例.本文假定制造商动态定价,研究了上述供应链的协调问题,研究发现:动态定价不能影响收益分享比例,但会提高供应链整体的利润;收益分享合同不能达到供应链协调;收益分享合同与返利合同的组合能够实现供应链协调.最后用算例说明了动态定价对供应链的影响.  相似文献   

7.
传统的投资组合管理方法往往依赖于经验规则或数学模型,难以充分利用市场信息和动态调整投资策略。为了解决这一问题,文章提出一种基于强化学习PPO(Proximal Policy Optimization)算法的新方法。使用上市公司的历史数据进行训练和测试,与传统投资策略和其他强化学习算法进行比较,实验结果表明,基于强化学习PPO算法的投资组合管理方法在投资回报率和风险控制方面取得了显著的改进。  相似文献   

8.
电子商务中基于Q学习的动态交叉销售方法   总被引:1,自引:0,他引:1  
动态交叉销售是电子商务中的一种新型营销手段.在已知关联规则和商品库存水平的情况下,要研究两个决策问题:(1)如何选择交叉销售的商品组合(2)如何为商品组合确定合理的价格,从而使经销商获得最大收益.首先将动态交叉销售映射为事件驱动的马氏决策过程模型,其次结合关联规则理论提出了知识驱动的 Q-学习算法,K-Q-learning,用该算法来求解动态交叉销售问题具有较高的效率和效用.  相似文献   

9.
救护车是挽救患者生命的重要医疗资源,合理调配有限的救护车资源可以降低呼叫响应时间,提高医疗服务水平.本文面向救护车动态重定位调度问题,提出了一种基于强化学习的调度策略结构.为解决传统强化学习所面临的高维状态空间的挑战,本文基于深度Q值网络(DQN)方法,提出了一种考虑多种调度交互因子的算法RedCon-DQN,以在给定环境状态下得到最优的重定位调度策略.在此基础上,本文还提出了急救网络弹性概念,以评估各站点对全局救护优化目标的影响力.最后,基于南京市2016年~2017年的实际救护车呼叫及响应数据,构造了环境交互模拟器.在模拟器中通过大规模数据实验,验证了模型得到的调度策略相比已有方法的优越性,并分析了不同时段下调度策略的有效性及其特点.  相似文献   

10.
林徐勋  王海燕 《管理科学》2020,23(11):23-46
在线健康信息服务逐渐成为健康管理的有效手段,正在受到各界人士的广泛关注. 为了解决在线健康信息服务的动态定价和推广策略问题,以同时提供免费公共健康信息服务和收费定制化健康信息服务的在线健康信息服务提供商为研究对象,以其利润最大化为目标,基于微分动力学理论,分析免费公共健康信息服务和定制化健康信息服务两类消费者之间的动态转换特征,构建在线健康信息服务动态定价最优控制模型. 结果表明: 服务期较长的在线健康信息服务,对消费者实行收费服务前给予一定时长的“免费体验期”能够增加在线信息服务提供商的利润; 而服务期较短的在线健康信息服务,没有必要设置“免费体验期”. 在线健康信息服务提供商的潜在消费者数量增长率和在线健康信息服务时间长度对免费公共健康信息投放程度有显著的影响. 在线健康信息服务上线初期,针对高收入消费群体适当延长“免费体验期”能够使服务提供商获得更大的利润. 这些结论对健康信息服务提供商制订服务定价和推广策略具有参考价值.  相似文献   

11.
基于股指成分股基本面和技术面数据构建了时序股票关联网络,然后利用深度图神经网络学习股票关联网络层次化表征,以端到端的方式获得候选预测信号.在此基础上,提出了一种考虑动作评估反馈的深度强化学习方法(Action Evaluation Feedback based Deep Q-Learning, AEF-DQN),旨在将不同的候选预测信号融入智能体的动作空间,并基于股票关联网络层次化表征、股票市场整体运行状态和历史动作评估反馈学习环境状态;借鉴前景理论中的参照依赖特性估计奖励值函数,从而建立状态、动作与奖励值之间的映射关系.最后,采用沪深300指数、标普500指数、英国富时100指数和日经225指数的成分股历史数据,构造了股指期货交易模拟器,在投资胜率、最大回撤率、阿尔法比率和夏普比率4个回测指标上对股指预测模型展开实证分析.研究结果表明:1)通过层次化聚合股票关联网络的节点属性信息可以动态捕捉不同行业对股指价格波动的影响,进而可提升预测方法的准确率;2)考虑动作评估反馈的深度强化学习结构可智能化选择适用于当前股票市场环境的最优模型结构,进而可提升预测方法的鲁棒性.  相似文献   

12.
在线信息产品定价策略综述   总被引:12,自引:0,他引:12  
张宇  唐小我 《管理学报》2006,3(2):239-246,252
由于信息产品主要通过网络销售,其技术经济特性使得传统的定价方法难以适用。在线信息产品定价研究有两大主要方向,就是将在线信息产品区分为在线信息服务和在线信息商品分类进行的,在此基础上总结了在线信息产品的技术经济特征和定价的总原则,综述了网络拥挤定价法、优先定价法、捆绑定价法、信息共享定价法和价格歧视定价法的定价机制及其主要结论,并对当前在线信息产品定价方法的最新进展进行了总结,最后对在线信息产品定价方法在实践中应用的局限进行了分析。  相似文献   

13.
在两期销售环境下,研究了面向策略型消费者的在线零售商库存信息披露及联合定价、库存决策问题。考虑在线零售商库存信息共享和隐藏两种库存披露策略,构建了在线零售商两期销售利润模型。通过分析消费者的购买行为,讨论了在具有策略型消费者的市场中,在线零售商应如何选择库存信息披露策略,以及如何制定最优定价和库存决策。在此基础上,分析了相关参数对在线零售商决策及利润的影响。研究结果表明,在线零售商的最优定价及库存决策受消费者估值折扣系数和第二期定价策略的影响。特别地,当在线零售商选择第一期缺货时,更倾向于共享其库存水平信息;当在线零售商选择第二期缺货或者两期均不缺货时,消费者估值折扣系数存在一个阈值,当低于该阈值时,在线零售商会选择隐藏库存水平信息,当高于该阈值时,在线零售商会选择共享库存水平信息。  相似文献   

14.
在线产品定价是平台经济的重要研究领域,两阶段混合预售是线上销售的一种主流模式。顾客在线上购买过程中,支付方式和预售模式对消费者行为和产品定价具有重要的影响。基于两阶段混合预售模式,本文考虑支付痛苦钝化效应对消费者购买心理的影响,建立相应的产品定价模型,得到了在线产品的最优预售价格、最优销量和最优利润,分析了支付痛苦钝化对消费者行为和在线产品最优定价的影响机制。理论和数值分析表明,两阶段混合预售策略更有利于卖方收益最大化;受支付痛苦钝化效应影响,折扣预售并非一定是产品最优选择策略,痛苦钝化因子是影响产品预售策略的重要因素。本文成果将进一步丰富平台经济下的顾客行为和产品定价研究,为平台企业和商家制定预售和产品定价策略提供决策依据。  相似文献   

15.
随着知识进步信息增长,现实决策环境日趋复杂.因决策人的有限理性所导致的决策不确定问题亟需解决.知识发现是解决不确定性问题的有效方法.基于案例推理和粗糙集是从数据中挖掘知识的良好工具.因此将粗糙集应用于基于案例推理,提出基于粗糙案例推理的在线自我学习决策方法.文中设计了决策模型和算法,并以应用实例对该方法的合理性和有效性予以说明.  相似文献   

16.
姜富伟 《管理科学》2021,24(1):109-126
我国股票市场存在高风险股票反而伴随较低收益的低风险定价异象,这有悖于传统资产定价理论.本文使用宏观经济和微观企业特征构建了六百多个变量的宏微观混合大数据集,并结合多种经典机器学习算法开发了基于大数据和机器学习的智能动态CAPM模型,检验了时变系统性风险对我国股市收益解释能力.实证结果表明:本文的智能动态CAPM定价模型能够显著解释我国股市低风险定价异象;随机森林等非线性机器学习算法表现最佳;影响股票时变系统风险的主要因素是市场类因子,基本面因子居次.本文对于我国股市系统性风险测度、动态资产定价模型构建和金融与大数据和人工智能融合创新有重要理论与实践指导意义.  相似文献   

17.
在考虑客户同时表现出参照依赖和策略行为的场景下,本文构建了一个垄断厂商两阶段的多产品动态定价模型。该模型将易逝品的销售分为正常价格阶段和促销价格阶段,每个阶段又分为多期。客户分为短视型和策略型,其中策略型客户会根据两个阶段价格的差异和获得商品的概率,决定是在第一阶段和等到第二阶段购买商品。基于随机动态规划的结构属性和超模理论,得到了两个阶段稳态价格的解析解,并且证明最优价格路径是单调且随着初始参照价格变化而变化。最后,通过对两种产品的数值实验,分析了各种参数对最优稳态价格的影响。结果显示,零售商可以采取多产品联合定价策略,即基于商店水平的定价策略,并通过调整核心产品的比重来获得更高的利润。  相似文献   

18.
在零售商-消费者两级供应链中, 零售商垄断销售市场, 研究基于消费者锚定效应的动态定价与库存问题。将消费者的锚定效应纳入决策模型中, 探讨消费者锚定的参考价格与产品的市场需求、价格的动态变化关系;利用动态规划理论建立了消费者锚定效应的动态定价与库存模型;在此基础上考虑利润折现和库存积压问题, 并分别构建了相应模型。数值分析表明, 消费者会根据市场价格的变化决定最佳的购买时机, 零售商的期望收益随着销售时间的延长而增加。  相似文献   

19.
目标跟踪是计算机视觉领域的一个基本问题,具有广泛的研究与应用价值。该文根据算法理论的不同,将目标跟踪算法分成目标表观建模和跟踪策略两部分,又将目标表观建模分成生成式跟踪和判别式跟踪分别进行介绍;从基于均值漂移和滤波理论两方面介绍跟踪策略;并重点介绍了基于深度学习的相关算法,总结了深度学习算法的优缺点。  相似文献   

20.
随着大数据技术和应用的普及,数据驱动的决策优化已成为企业科学管理的发展趋势。本文提出了一种基于深度增强学习的策略框架,整合企业领域知识解决收益管理中复杂的动态促销问题。基于一家在线生鲜零售商随机抽取的2012名匿名消费者自注册开始的长期消费行为(共计363946条消费记录),以及该零售商的历史收益管理策略数据,结合仿真方法,本文构建了增强学习环境下的个性化动态促销模型并进行检验。结果发现,本研究提出的新策略可以有效地提升企业面向市场的收益管理能力,提高企业约18%的长期收益。数据驱动的个性化促销实现了长短期促销策略的动态平衡,从而帮助企业以更低的投入和对顾客更少的干预实现更高的回报。研究结论对数智技术应用于企业收益管理优化和混合智能方法具有显著的理论和实践意义。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号