共查询到10条相似文献,搜索用时 234 毫秒
1.
FP-Gfowlth是频繁模式挖掘的经典算法,能够在不产生候选集的情况下生成所有的频繁模式,效率与Apri-ori算法相比有巨大提高,然而FP-Growth算法在挖掘频繁模式过程中需要递归构建大量的条件FP-tree,并分别针对这些条件FP-tree进行挖掘,时间及空间效率不高,在实际应用中存在很大局限性.计算机集群是由多台普通计算机设备通过特定方式结合在一起构成的并行处理系统,属于分布式计算环境,具有计算能力强大、性价比高、灵活等优势.本文提出一种面向计算机集群的并行挖掘算法Gridify FP-Growth,该算法以FP-Growth为基础,通过任务划分的形式.将计算任务分配到计算机集群中各个计算节点上执行,充分利用各个节点的计算资源,最后汇总各节点的计算结果.实验证明Gridify FP-Growth算法不会牺牲计算的准确性,并可以大幅度缩短计算时间,有效缓解计算大规模数据库时的内存压力. 相似文献
2.
3.
利用上凸函数对决策树算法的改进 总被引:1,自引:0,他引:1
针对决策树分类方法的计算效率进行深入研究,根据信息增益计算的特点,引入了上凸函数的概念,用于提高决策树分类过程中信息增益的计算效率。利用我们所提出的“一致性定理”和“特殊一致性定理”,从理论上证明了利用上凸函数对信息增益计算进行改进后,构造的决策树与原决策树具有相同的分类准确率。同时我们通过对大数据集的实验,发现在相同规模的数据集下,改进后的决策树算法比原算法有更高的计算效率,并且这种计算效率的提高有随着数据集规模的增加而增加的趋势。 相似文献
4.
本文研究了一类典型并行系统的效率评价问题:(1)决策单元由两个并行的子单元组成;(2)在整个系统中,某一子单元居于主导地位,另一子单元居于从属地位;(3)两个子单元之间存在部分共享的投入资源,且无法明显区别该资源在不同子单元之间的分配比例。在分析决策单元整体效率及内部子单元效率的基础上,基于主从博弈思想,提出一种能同时确定系统整体效率及内部子单元效率的评价方法,该方法能够在评价系统效率的同时,实现共享资源的有效分配。最后,采用一个实例分析说明了所提方法的合理性和有效性。 相似文献
5.
6.
7.
证据理论是处理不确定性问题的有力工具,它处理的证据来源于专家.专家的知识经验是有限的,获取较困难,且可能存在一定的主观性.针对上述问题,提出了一种基于粗糙集理论的证据获取的新方法,并对证据合成和应用进行了研究.首先研究了大型决策表分解问题.利用粗糙集理论分析条件属性间的依赖关系,对条件属性集进行聚类,形成多个条件属性集相对独立的子决策表;其次对各子决策表进行分析,利用粗糙集的分类思想和隶属度概念,计算证据的基本可信度分配;最后文章对证据的合成及其在决策分析中的应用进行了研究,提出了相应的解决方法. 相似文献
8.
本文针对DBSCAN算法在计算速度方面的瓶颈,提出了一种新的基于内存的并行DBSCAN算法:合理划分数据库,各个处理器并行聚类,之后合并聚类结果,可以达到很好的聚类结果效果和计算效率。通过对一台双核计算机的实验,发现实验速度可以提高50%左右。 相似文献
9.
CPM网络节点时差的特性与应用 总被引:1,自引:0,他引:1
节点时差是CPM网络中一个重要的机动时间概念,在各种机动时间中最为直观,计算和应用起来最为简便。本文从机动时间与路长关系的角度研究了节点时差的三个特性,提出了机动时间定理和特征路线定理。在此基础上提出了运用节点时差快速求解次关键路线的方法,以及在时间-费用优化问题中构造等效子网络以简化运算的方法,并进行了理论证明。 相似文献