首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
为模拟人类玩家在二打一打牌过程中的拆牌规律,提出了基于深度神经网络的拆牌训练,采用基于深度学习的序列标注方法,使用大量经过标注的实战数据,采用BILSTM-CRF网络构建手牌拆牌识别网络,实现了对二打一初始手牌的拆牌目标。实验结果表明:该模型在原始数据中产生了良好的训练效果,在测试集上的准确率达到89.16%,在与传统的手牌拆分方法进行比较后印证了该方法的可靠性,为进一步对二打一初始手牌的难度评估提供了保障,也为其他非完全信息牌类博弈的手牌拆分方法提供了借鉴。  相似文献   

2.
针对麻将博弈中状态空间巨大和隐藏信息过多等难点,提出利用局面信息缩减未知状态空间,并通过动态划分游戏状态提升牌型预测准确率的方法。根据麻将领域知识将对手玩家的弃牌信息转换为可利用信息,预测对手玩家持有某一牌型的概率,使用这一概率约束蒙特卡洛模拟的范围,得到对手手牌及需求牌的概率分布。通过对比试验表明:局面信息利用方法和动态游戏划分方法是有效的,不仅可以降低出牌的点炮风险,还可以获得更高的得分,实现了通过缩减未知状态空间提升麻将博弈水平的目的。  相似文献   

3.
本文评述了1994年度诺贝尔经济学奖获得者豪尔绍尼的博弈论。作者认为,豪尔绍尼在合作博弈理论上最突出的贡献是合作博弈的通解与合作理论的非合作博弈模型。豪尔绍尼对稳定集概念的重建为考察联盟形成的非合作模型提供了方法上的突破。豪尔绍尼对不完全信息博弈也提出了独到的见解,他对混成策略的重新解释是一个具有重大意义的概念创新。  相似文献   

4.
竞争与合作相互依存,互利共生。纯粹的竞争或合作均不利于保险市场的健康发展。竞争抑或合作的最大困扰乃收益分配问题。通过构建博弈模型对我国保险公司之间竞争与合作的关系进行博弈分析,可以看到在完全信息静态博弈、非完全信息静态博弈和完全信息动态博弈三种情况下保险公司竞争与合作的难点,因此需要采取相应的对策。  相似文献   

5.
文章基于博弈理论,阐述寡头垄断条件下环境污染税收的不完全信息静态博弈Cournot模型和不完全信息动态博弈Stackelberg模型,得出了一些新的结论.  相似文献   

6.
垄断竞争市场业态是介于完全竞争和完全垄断的一种市场常态,以往的垄断竞争市场理论没有将供求博弈、信息收集等问题纳入研究范围。文章基于信息不完全和商品的持久效用,通过加入需求博弈的交易方式建立模型,分析参与者收集信息、供应商定价策略与市场均衡,其模型本身和所得出的一系列技术结论将会为参与者和市场管理者寻求最优策略提供理论支持。  相似文献   

7.
本文首先对金融领域洗钱犯罪进行定义,并对金融洗钱的过程以及表现出来的特征进行了分析,在此基础上构建一个洗钱者与商业银行、商业银行与监管机构之间的博弈模型,讨论了在完全信息情形下和不完全信息情形下的博弈均衡,并对博弈模型的参数变化进行了分析,为我国金融机构的反洗钱监管提供了理论支撑。最后针对金融机构反洗钱监管机制研究提出合理化的政策建议。  相似文献   

8.
针对大众麻将AI训练时经验回放机制中样本均匀采样导致训练缓慢的问题,提出了一种多重优先经验回放算法,即从时序差分误差、局面复杂程度、动作即时奖励3个维度对经验样本进行优先级标记,每次采样时优先级高的样本高概率被抽取来更新神经网络。为了验证算法的有效性,构建了大众麻将自博弈平台进行相应的实验验证。实验结果表明:相比随机经验回放方法,新方法将麻将AI的训练速度提升了22.5%。  相似文献   

9.
重复博弈,是指在一个动态博弈中同样结构的博弈重复多次,其中的每次博弈被称为"阶段博弈".它分为完全信息重复博弈和非完全信息重复博弈.完全信息的重复博弈论与人们之间相互作用的基本形式的演化相关,其目的是为了证明在现实生活中为何会出现合作、利他主义、报复、威胁等现象.而非完全信息重复博弈的研究更接近实际,其重点在于在博弈过程中对信息的使用.  相似文献   

10.
保险市场基于保费信号的信号传递博弈模型分析   总被引:2,自引:0,他引:2  
信号传递博弈是不完全信息动态博弈模型中一类简单、重要的博弈模型,它在经济管理领域内有很多应用。用保费作为信号,建立不完全信息动态的信号博弈模型,分析保险双方的博弈策略选择及其可能达到的均衡,研究表明,博弈模型存在某种形式的精练贝叶斯纳什均衡。  相似文献   

11.
运用动态博弈理论,通过构建动态博弈模型,分别从完全且完美信息动态博弈和完全但不完美信息动态博弈两个方面,分析了农村信用社与地方政府在支农贷款上的决策互动关系,并在分析的基础上得出了一些有益的启示。  相似文献   

12.
征收环境污染税是为治理环境污染而筹集资金,利用税收杠杆来促进生态环境的良性循环。通过构建企业进入博弈模型和政府税率与企业产量博弈的完全信息动态博弈模型,导出政府、企业双方局中人在开征环境污染税后所达到的子博弈完美纳什均衡,可分析我国开征环境污染税的可行性以及所能达到的效果,从而为环境污染税的开征提供理论依据。  相似文献   

13.
基于博弈论理论,对“家电下乡”主要的利益相关主体——政府、家电企业、乡镇经销商、农民的行为进行了分析,构建了政府与家电企业的完全信息动态博弈模型、中标家电企业与农民的无限次重复博弈模型、中标家电企业与乡镇经销商之间的合作博弈模型。政府与家电企业的博弈均衡结果表明,政府非常有必要对竞标家电企业进行资信预查;中标家电企业与农民的博弈均衡结果表明,企业提供低质量的下乡家电会造成双输的局面,从长远利益看,企业只有提供高质量的下乡家电才能实现双赢;中标家电企业与乡镇经销商的博弈均衡表明,合作才是双方的最优的选择。因此,政府应对竞标企业实行资信预查,对中标家电企业加强监管,取消最高限价鼓励乡镇经销商积极销售下乡家电;中标家电企业应提供高质量的下乡家电,创新经营方式,把乡镇经销商作为一级代理商,这样才能实现“家电下乡”各利益相关主体间的多赢。  相似文献   

14.
本文以两企业的产量决策模型为例,运用博弈论基本理论,定量讨论了二个问题:一是完全信息无限重复博弈条件下企业结盟的可能性;二是由于非理性因素的存在,不完全信息有限重复博弈条件下企业在一定时期联盟的可能性,从而说明在一定的条件下,企业可能从纯粹竞争走向战略联盟。最后,文章通过企业经理决策实验对合作期限进行了实证分析。  相似文献   

15.
在实际应用中,少数类样本往往包含重要信息,而传统机器学习方法通常对少数类样本的分类准确率低,且误分类代价较高。针对不平衡文本数据的情感分类问题,以三支采样(three-way sampling, 3WS)与过采样为基础,提出了三支过采样算法(three-way SMOTE,3WOS)和三支边缘过采样算法(three-way borderline-SMOTE,3WOBS),3WOS能够更好地识别边界区域上的数据,3WOBS可以增强边界区域所蕴含的信息。首先,将文本数据构建为超球,获得超球边缘的支持向量。其次,3WOS对边缘上的支持向量直接进行过采样以生成合成新样本并更新样本集,3WOBS则在生成合成新样本后根据给定条件判断是否获得该新样本并更新样本集。最后,将更新的样本集放在不同的基分类器上进行对比实验。实验采用了3个不平衡数据集,并保证了不同的不平衡比。同时,在数据集训练过程中引入粒计算思想,确保模型的鲁棒性。实验结果表明,3WOS-ITSC与3WOBS-ITSC准确率较高且代价低于其他模型,为不平衡文本分类问题提供了新思路。  相似文献   

16.
利用一个改进的全局博弈模型,研究央行的信息披露问题,可以为信息披露政策的制定提供理论基础。通过求解博弈模型中信息波动与信息披露度的关系,结合我国的通胀预测信息特征,研究发现:只有在合作关系非常强,而私人信息精确度又较高时,货币当局才有理由使得信息不完全被披露;当信息不必完全公开时,合作关系越弱,则对私人信息精确度的要求也越高;在中国目前私人信息波动较大的前提下,我国央行仍有必要加大信息披露力度。  相似文献   

17.
介绍了二样本问题的一种新假设检验方法(SR检验),SR检验用来探讨如何利用由两连续且相互独立的样本总体中随机抽取的两组独立样本来做假设检验.原理是将二样本差的符号值乘上二样本差加上绝对值后排列的序值(即秩),取其和为检验统计量,这样就考虑了二样本差的权重以便充分利用收集到的样本所提供的信息比较二样本中位置的关系,并且比较由不同分布的样本总体抽出的样本做出的统计量,用Matlab做模拟比较,提供使用者在非参数统计方法中的另一个选择。  相似文献   

18.
在我国现行个人所得税制下,扣缴人、纳税人、征税人之间的博弈形成了不完全信息动态博弈。将博弈引入税收征管,结合我国的个人所得税以源泉扣缴为主的特点,建立博弈模型求解博弈均衡路径,不但可以检验我国个人所得税制是否达到立法者的预期,而且可以提供优化个人所得税征管机制的各项政策建议。  相似文献   

19.
提出了一种利用人工神经网络模型并以房屋普查数据为震害影响因子的震害预测方法.以建筑物的结构类型、层数、高度、建设年代、用途、现状质量等几个简单参数对城市、建筑物进行分类,并在此基础上进行建筑物的震害预测工作.根据震害因子的选取及网络对样本的训练效果建立一个人工神经网络模型,通过此模型对震害实例的预测结果进行分析,证明了此模型的实用性.利用房屋普查数据进行震害预测工作为研究快速震害预测方法提供了一个新的思路.  相似文献   

20.
对国家助学贷款中银行与学生博弈的分析   总被引:1,自引:0,他引:1  
笔者用完全信息动态博弈的方法描述了国家助学贷款中银行与学生的博弈模型,分析了他们的决策行为,提出子博弈精炼纳什均衡为(0,0)、(贷,还),最后指出使博弈双方收益最大化的均衡结果为(贷,还)。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号