首页 | 本学科首页   官方微博 | 高级检索  
     

基于Dirichlet过程无限混合模型的基因表达数据聚类算法
作者姓名:张林  刘辉
作者单位:中国矿业大学信息与电气工程学院,江苏徐州,221116
基金项目:中央高校基本科研业务费专项资金资助项目,霍英东基金会青年教师基金资助项目
摘    要:Dirichlet过程作为一种典型的变参数贝叶斯模型,基于该过程进行的聚类分析无需预先确定聚类数,聚类数作为模型中的参数由模型和数据自主计算得出,因而成为机器学习研究领域中的一个研究热点,可用于海量数据的聚类分析。文章建立Dirichlet过程无限混合模型对DNA基因表达数据展开了聚类分析。模拟测试数据集和急性白血病的DNA基因表达测试数据集的实验结果表明,Dirichlet过程无限混合模型能够准确地估计出数据中的聚类数。

关 键 词:聚类  Dirichlet过程  混合模型  马尔科夫-蒙特卡罗
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号