共查询到20条相似文献,搜索用时 328 毫秒
1.
文章针对频繁项集挖掘中传统串行Eclat算法面对海量数据时挖掘效率不高的问题,提出一种海量数据下的并行频繁项集挖掘算法,即I-SPEclat算法。首先,对Eclat算法存在的缺陷进行改进,引入图的邻接矩阵作为数据的存储结构,避免了大量的交集运算;其次,利用先验性质对候选项集进行预剪枝和后剪枝,减少无用候选项集的数量,节约存储空间;再次,根据项集的前缀对数据进行划分,平衡每个计算节点的工作负载;最后,将改进的Eclat算法在Spark分布式计算框架上实现并行化。实验结果表明,I-SPEclat算法较已有的改进Eclat算法在时间消耗和内存消耗方面均有减少,且面对不同规模的数据集也有着良好的扩展性。 相似文献
2.
3.
对随机森林做修剪的目的就是要把随机森林中重要的分类器找到,使得修剪后得到的子森林不仅具有可解释性,而且能充分利用数据的信息量.文章提出一种新的修剪随机森林方法,基于样本的边缘函数,采用逐步向后算法,得到嵌套子森林,采用1-se法则挑选最优子森林.在两份实际数据中和已有随机森林的修剪方法做了对比,结果表明,所提出的方法,在修剪后子森林预测率的分布和子森林中分类器个数的分布,以及选出的解释变量三个指标上均具有优势. 相似文献
4.
数据库故障修复的若干方法(二)●汕头市统计局鄞腾杰●故障类型四:打开数据库后,发现记录个数比建立数据库时减少了一部分。通常,这是由于对数据库进行读写时非正常退出所造成的,而且数据库的记录个数在大多数情况下实际上并没有减少,只有部分记录不能显示出来而已... 相似文献
5.
使用数据库可以带来许多好处: 如减少了数据的冗余度,从而大大地 节省了数据的存储空间;实现数据资 源的充分共享等等。通俗地讲数据库 是“按照数据结构”组织、存储和管理 数据的仓库”。在科学研究、经济管理、 生产控制等许多工作中,常常需要把 某些相关的数据放进这样“仓库”,进 行相应的处理,并得到需要的结果。对 数据库的基本定义是:“数据库是存储 相似文献
6.
一、技术进步与经济效益经济效益一般表述为投入与产出之间的对比关系,其实质是经济活动中社会必要劳动时间的节约,具体而言,投入量不变而产出量增加;或者投入量减少而产出量不变;或者在投入量减少的同时产出量增加;或者两者都增加但产出量的增加速度和幅度大于投入量的增加速度和幅度,都可认为是经济效益的提高。工业技术进步是技术在实现工业生产经营目标方面所取得的进展过程,它包括生产要素质量的变化,知识进展和经营管理水平的提高。具体地说,是在工业领域推行全面科学管理,提高人员素质,研究、开发、采用和推广新技术、新… 相似文献
7.
注册表是 WINDOWS98中非常重要的系统文件,记录了计算机硬件设备的配置与软件的设置情况。在计算机的启动过程中,系统将从注册表中读取有关硬件与软件的信息,来完成系统的初始化工作。启动时,点击“开始”菜单的“运行”命令,在弹出的“运行”对话框中键入“ Regedit”之后 [确定 ],即可启动 Windows的注册表编辑器,再依次展开注册表数据库的各分支,进行修改。 一、优化系统配置 1、提高软驱读写速度。 在机器所配置的驱动器中,恐怕软驱的读写速度最慢,可以通过修改注册表来优化软驱的性能。 进入主键“ HKEY_… 相似文献
8.
9.
为适应现代社会市场经济的迅猛发展对人才的需要,人员流动的市场化速度也日益加快。从大环境上看,人员的高速流动确实满足了企业对人才的需求,而求职人员在经过反复地流动之后也找到了适合自己发展的工作。但从小环境上来看.频繁的人员流失增大了企业的人力资源管理成本,使人员流失岗位的工作停滞不前,降低了企业的工作效率,也导致了企业人员储备严重不足。人员流动的根本原因在于员工对企业的满意度较低.因此降低员工的流失率、稳定职工队伍的根本途径在于提高员工对企业的满意度。 相似文献
10.
建国以来,我国一直采用不变价总产值计算工业发展速度,改革开放后,在多种价格形式并存,产品价格变动频繁,产品更新换代加快,以及非国有工业特别是以小型、简单加工为主的乡镇企业大量涌现的情况下,给正确计算工业发展速度带来了困难。为消除工厂法工业总产值造成的越来越多的重复计算因素,克服利用总产值指标攀比速度、片面追求产值的弊端,改按工业增加值计算工业发展速度的方法是十分可取的。 相似文献
11.
河南省城市社会经济调查队 《中国统计》2004,(4):46-47
国家统计局决定自2004年起在全国范围内正式采用价格指数缩减法计算工业发展速度。为确保全国工业发展速度计算方案能在河南省顺利实施,我们认真总结了两年试算期间的工业品价格调查改革工作的经验,明确了进一步完善工业品价格调查的重点。改革取得的成效根据河南的实际,按照国家统计局的要求,我们把工业品价格调查改革的重点目标确定为:改革价格采集方法,提高工业品价格指数的时效性;增加样本企业、调查产品及规格品数量,提高调查中类行业覆盖面及工业品出厂价格总指数和中类指数的代表性;改进调查统计组织工作,减少人为调查误差、保证原始… 相似文献
12.
13.
随着信息技术、互联网、人工智能、云计算的迅速发展,数据呈爆炸式增长,已逐渐成为一种极具价值的资产,世界主要国家纷纷出台扶持数据产业发展战略。国民经济核算国际标准《国民账户体系(2008)》明确建议将数据库作为知识产权产品包括在固定资产中。但目前包括中国在内的大部分国家还未对数据库资产建立完善的统计调查制度。本文梳理了目前发达国家有关数据库统计的经验,结合中国实际,对中国数据库调查方法和数据库资本化核算方法进行了研究,从生产法、收入法、支出法三个角度探讨了数据库资本化核算对GDP产生的影响,讨论了数据库类型转化与数据库资产价值未来调整方向,辅之以案例分析,旨在为中国数据库调查和资本化核算工作提供有益参考。 相似文献
14.
15.
长期以来,我国一直用不变价总产值计算工业发展速度,如果今后仍采用这一方法,那么就必须赶快编制新的不变价格,因为1980年编制的不变价格已延用至今历时7年,在工业品价格频繁变动,新产品不断问世的今天,1980年不变价格的代表性已日益减退。如果要采用其他方法,则必须及早定案,以准确反映我国工业发展速度。 相似文献
16.
统计数据库总少不了有汉字数据项,如:企业名称、单位地址等。我们经营需要根据这些数据项对数据库进行查询,一种方法是用一些简单的代码来对应这些汉字,如企业代码,邮政编码等。这需要事先作出规范,依据规范来查询。而有些时候则没有现成规范可遵循,若直接输入汉字串进行查找,由于汉字录入量大,使用户觉得很不方便,由此,作者提出了拼音模糊查询法,该查询法避免了汉字输入,使查询变得方便,改善了用户界面,提高了管理速度。 相似文献
17.
一、农业劳动力转移速度减缓是近年农民收入增长缓慢的重要原因 农业劳动力转移对我国农民收入增长的影响主要表现在两个方面 :一是转移劳动力获得的较高收入 ,提高了农村劳动力的平均收入水平 ,直接推动了农民收入的增长 ;二是农业劳动力的转移 ,降低了农业劳动力总量的增长速度 ,甚至直接减少了农业劳动力的总量 ,提高了农业劳动生产率 ,间接地推动了农民收入的增长。(一 )农业劳动力转移在农民收入增长中的重要地位农民收入按收入来源的性质分 ,可分成生产性收入和非生产性纯收入。生产性收入进一步又可划分成第一产业收入和二、三产… 相似文献
18.
一、现行劳动工资统计制度中存在的问题 (一)经济结构、产业结构的调整.使企业经济结构发主了变化.国有经济数量逐年减少,非国有经济有了较大发展.非公有制经济快速增长。 (二)企业新建、重组、转制、破产、停产和半停产的现象十分普遍,变动频繁,对这些单位调查起来比较困难,有时存在着漏统现象。 (三)目前单位用人形式多种多样.职工性质多元化.一些行业从业人员变动频繁。 (四)劳动工资统计报表填报单位多,报表渠道不畅,上表难度较大,加上基层统计人员稳定性差.大部分劳动工资统计人员均为兼职人员,工作头绪多,难从有必要的时间和精力来填报劳动统计报表,只是处于应付状态,不能保证报表质量。 相似文献
19.
数据库故障修复的若干方法汕头市统计局鄞腾杰统计资料数据库已越来越成为统计服务和监督的必不可少的工具之一。但是在应用计算机对数据库进行建立和管理的过程中,由于种种原因,造成数据文件被破坏的现象屡见不鲜。诚然,损坏了的数据库,通过重建库结构和重新录入原始... 相似文献