首页 | 本学科首页   官方微博 | 高级检索  
文章检索
  按 检索   检索词:      
出版年份:   被引次数:   他引次数: 提示:输入*表示无穷大
  收费全文   1篇
  免费   0篇
综合类   1篇
  2022年   1篇
排序方式: 共有1条查询结果,搜索用时 15 毫秒
1
1.
针对现有的“拱猪”卷积模型计算复杂且高度依赖专家知识的问题,提出一种应用于“拱猪”博弈游戏的深度神经网络和蒙特卡洛方法相结合的深度蒙特卡洛算法。采用自对弈的方式进行模拟和评估,使用深度Q网络代替Q表完成Q值的更新,高效地对“拱猪”策略进行探索和利用;采用分布式并行计算的方法提高训练效率,较于传统的蒙特卡洛方法可有效地解决高方差问题。在具有一个GPU的单台服务器上训练24 h后,所构建的智能代理与“拱猪”卷积模型对弈了10 000局。实验结果表明:智能代理胜率可达78.3%,平均每局可获得67分,对具体示例进行分析,进一步验证了该算法的有效性以及智能代理的良好性能。  相似文献   
1
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号