首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
数据库应用新技术—知识发现(KDD)   总被引:2,自引:0,他引:2  
郑泽芝 《山西统计》2000,(10):40-41
引言随着信息时代的到来 ,社会、政治、经济等等方面的信息量急剧增长 ,这些信息是一种宝贵的信息资源 ,其背后隐藏着许多重要的信息 ,可以很好地支持人们的决策。目前的数据库系统 (DBMS)提供的查询手段一般只限于一些基本的数据库操作和聚集函数 ,例如OLAP所提供的决策用数据就是这样产生的。因此通过DBMS只能对数据“粗加工” ,并从中获得一些初级的综合信息。数据库中常常蕴涵着规则 (rules)、规律 (regurlarities)、论断 (inference)之类的高层次信息或知识 ,这些信息在决策生成的过程中具有重…  相似文献   

2.
数据挖掘及其对统计学的挑战   总被引:10,自引:0,他引:10       下载免费PDF全文
韩明 《统计研究》2001,18(8):55-57
一、引言随着科学技术的发展 ,利用数据库技术来存储管理数据 ,利用机器学习的方法来分析数据 ,从而挖掘出大量的隐藏在数据背后的知识 ,这种思想的结合形成了现在深受人们关注的非常热门的研究领域 :数据库中的知识发现———KDD(KnowledgeDiscov eryinDatabases) ,其中 ,数据挖掘技术便是KDD中的一个最为关键的环节。1995年 ,在加拿大的蒙特利尔召开了第一届“知识发现和数据挖掘”国际学术会议 ,数据挖掘一词被很快流传开来。数据挖掘———DM(DataMining)就是从大量的、不完全的、有噪…  相似文献   

3.
一种新的风险度量工具:PaV及其计算框架   总被引:4,自引:0,他引:4       下载免费PDF全文
VaR方法是市场风险度量最流行的方法。在BIS(BankofInternationalSettlement) (BIS 1994,1995 ,1996)向银行强烈推荐此方法后 ,VaR方法得到强有力地推进。文献中有关VaR的计算基本上是围绕估计与模拟资产组合的损失分布函的某些特征展开的。如 2 0世纪 90年代J P 摩根发展起来的VaR(风险值 ,风险额 )技术 ,其核心是预测投资组合的方差 ,并将组合的方差分解为各个单个资产收益及其方差和协方差。但是金融市场中不少数据 ,往往是厚尾分布 ,它们的方差是不存在的 ,有时可能连期望都不存在 ,…  相似文献   

4.
李政 《广西统计》2001,(5):40-41
在微软的Office家庭成员中,人们对于Access2000的了解,往往中局限在它的操作界面中,对于数据库管理的功能仍只是停留在建立表、数据输入、使用本向导、数据访问页面导、报表向导、数据访问页向导等一些简单的应用上,实际上Access2000的功能十分强大,且超科一般人的想象。它是微软自公布Access后与internet结合最紧密的数据库管理软件,是一个功能非常强大,而且简单易用的数据库管理系统(DBMS),即对数据库进行存储、处理和管理的系统。  相似文献   

5.
统计年报数据是一个地区、一个系统一年的宝贵资料,如何管理和有效开发这些资料,从不同角度对其进行全面、综合、高效地查询、分析,进而再加工,方便用户,服务社会,为此,上海市统计局工业交通统计处吴仁保同志专门研究开发了统计年报查询软件.该软件从用户的需求出发,操作方便,能随意选定查询范围,自动生成用户所需的复合查询条件,得到查询对象结果数据库,提供显示、打印或图形输出.通过较长一段时间运行,该软件从实用性、可靠性来讲,都比较成功.此软件也适用于其他各种类型的数据据查询.  相似文献   

6.
房宇 《广西统计》2001,(5):41-42
在ASP中,ActiveX Data Object(ADO)是一项容易使用并且可扩展的将数据库访问添加到Web页的技术。可以用SDO来编写紧凑简明的脚本以便连接到Open Database Connesctivity(ODBC)兼容的数据库和OLE DB兼容的数据源,ADO提供先进的与评议无关性和查询处理功能。下面以Microsoft Access和Microsoft SQL Server两种数据库为例,介绍ADO通过ODBC和DB两种方式连接数据库的使用方法。  相似文献   

7.
李光 《统计研究》2001,(8):63-64
改革开放以来 ,山西的国内生产总值由 1978年的 88亿元增加到 1998年的 16 0 1亿元 ,增加了 17 19倍 ,扣除物价因素年平均实际增长 8 2 6 %。本文将简要分析山西经济增长的主要因素。  一、方法和数据本文运用索洛生产函数法进行分析求证。本文利用山西省改革开放 2 0年来资本形成、从业人数、国内生产总值等资料回归求出。其回归方程是 :LnGDP =- 7.4 0 7 0 .4 13LnK 1.5 31LnL    (- 2 5 73)  (3 5 86 )  (3 2 5 6 ) R2 =0 .95 3 F =183.191 VIF =8.0 8式中 ,GDP代表国内生产总值 ,K代表资本形成 ,L代…  相似文献   

8.
作为基层统计局,担负着大量数据调查任务,管好、用好这些繁杂统计数据成为基层统计局的一项重要任务,特别是在当今网络环境下尤其显得更为突出,而MySQL数据库具有功能强、使用简便、管理方便、运行速度快、安全可靠性强、软件价格合理等优点,并可以利用许多语言编写访问MySQL数据库的程序,必将成为网络时代基层统计局数据库建设的首选.  相似文献   

9.
企业失败判别模型实证研究   总被引:52,自引:1,他引:51  
高培业  张道奎 《统计研究》2000,17(10):46-51
一、问题的提出企业失败是一个世界性的问题。根据Dun&Bradstreet的记录 ,美国 1991年失败企业有 872 66家。报纸“ToVima”1997年 6月 8日报道 ,1996年部分欧洲国家失败企业的数目如下 :法国有 5990 0家 ,德国有 310 0 0家 ,英国有 4 2 90 0家 ,意大利有1560 0家 ,瑞典有 12 2 0 0家 ,瑞士有 10 2 0 0家。美国和部分欧洲国家失败企业的数量是庞大的。由于企业失败问题的极端重要性 ,一直以来就有很多专家学者希望采用定量分析建立模型等方法抓住失败企业的本质特征。 1968年美国专家Ed ward .I .Altman首…  相似文献   

10.
杨旭  李建中 《统计与决策》2005,(22):112-113
目前操作风险研究模型化发展遇到的最大问题就是缺乏数据.本文认为系统有效地收集损失数据是量化分析的基础和前提,也是识别、管理和控制操作风险的重要手段.同时探讨了损失数据库的结构以及建构过程中要注意的问题.  相似文献   

11.
DEA方法的统计性质及机会约束DEA模型   总被引:1,自引:0,他引:1       下载免费PDF全文
韩松 《统计研究》2002,19(6):28-31
一、引言数据包络分析 (DataEnvelopmentAnalysis ,DEA) ,是由Charnes等人 (1978,1981,[1])提出 (CCR) ,并由Banker等人 (1984 ,[2 ])发展起来的 (BCC)。它是非参数的数学规划方法 ,用来估计多输入多输出经济系统的生产前沿面及评价决策单元 (DMUs)的相对有效性 ,是反应输入输出关系的“真正的”极值方法。DEA方法的优点是 ,不需要给出代表决策者偏好的权 ,也不需要给出输入输出的函数关系。但是 ,传统的DEA方法具有两个不足 :一是不允许输入输出数据是随机变量 ,例如存在测量误差 …  相似文献   

12.
一、统一数据模式数据模式是对数据库中数据内容及其相互关系的描述.数据模式的统一化是数据库的一项重要功能,它保证了数据库中的数据不是孤立地按某类用户需要组织,而是根据数据库所面向的全部用户的各种需要来组织库中的数据.对统计数据库而言,数据模式的统一这一功能,能将统计系统所服务的各类用户所需的各种统计指标体系与分类体系集合起来,对其进行统一的组织管理.  相似文献   

13.
针对数据库中存在缺失值的问题,文章建立了统计相关分析与机器学习相结合的缺失数据处理方法.首先利用统计相关性对原始数据进行分析,找出与缺失值属性相关度较大的属性,提取这些属性的已知值作为训练数据建立模型,再利用建立起来的模型估算缺失值.以UCI数据库真实的数据为例进行仿真,并对比分析了支持向量机、神经网络和决策树三种机器学习算法,实验结果表明利用相关度较大的已知属性值来训练学习,其估算值精度明显提高.  相似文献   

14.
一、引言XML作为表示和存储数据手段技术自开发推介以来,发展非常迅速,在许多领域内得到广泛的支持,显示出广阔的应用前景。因此,对XML用于数据库应用的研究越来越引起人们的关注。本文对XML在数据库应用中的性能问题作初步的探讨。二、XML简介可扩展标记语言,ExtensibleMarkupLanguage缩写为XML,描述了一类称为“XML文件”的数据对象,同时也部分地描述了处理这些数据对象的计算机程序的动作。XML是SGML(标准通用标记语言犤ISO8879犦)针对特定应用领域的一个子集,或者说是SGML的一种受限形式。根据定义,XML文件是合乎规范的…  相似文献   

15.
一、引言 灰色系统理论把社会系统、经济系统、生态系统这些抽象系统称为本征性灰色系统,通常用一系列时间序列、指标序列或空间分布序列来代表这些系统的行为特征数据,如某地区某年的社会人口增长指数、国民经济生产总值、某年某月的地区降水量等等,其中每一个序列中的数据元实际上就是某一个坐标轴上的数据点,多个序列构成了多维空间.对于非本征灰色系统,如受噪音干扰的技术系统、人体系统、电力系统等等,同样其行为特征数据也可以用一系列的数据序列来表示,每个序列中的数据元也都是某一数轴上的一些点.随着灰色系统理论的发展,其应用领域得到了不断的拓宽,尤其是在工程领域中的应用.但其应用仍然是围绕着某个或多个数据序列,数据序列中的数据元素依然还是一维数轴上的一些点.  相似文献   

16.
Excel在统计工作中的应用   总被引:2,自引:0,他引:2  
一项完整的统计工作,通常包括搜集资料、统计整理、绘制图形、处理数据,最终写出高质量的统计分析报告。我们在实际工作中常常用计算机来代替手工操作,但由于某些制图软件、数据库软件以及一些统计分析软件所具备的功能都是单方面的,对于一项完整的统计工作来说,分别使用这些软件,既不统一又不联贯。这里我们介绍一种“表格”式的数据综合管理与分析系统,即Excel,它集文字、数据、图形、图表以及其他多媒体对象于一体,以电子表格形式来进行各种计算、分析和管理工作。文章试从统计表的建立、统计制图、数据处理及统计分析这四个方面加以举例说明  相似文献   

17.
我国R&D状况的区域比较分析   总被引:21,自引:0,他引:21       下载免费PDF全文
一、引言科学研究与试验发展 (R&D)活动是指在科学技术领域 ,为增加知识总量、以及运用这些知识去创造新的应用而进行的系统的、创造性的活动 ,包括基础研究、应用研究、试验发展三类活动。科学研究与试验发展 (R&D)活动在社会经济空间结构的演变中起着重要作用 ,已为我国及世界各国社会经济发展的史实所证明。然而 ,我国R&D活动的总体水平不高 ,R&D活动在研究领域、活动地域上发展不平衡 ,阻滞并影响了我国经济发展质量的提高和区域经济协调发展。鉴于此 ,本文通过将R&D活动置于区域经济协调发展这一大系统中 ,对 2 0 0 0年…  相似文献   

18.
一、关联规则挖掘原理与方法若两个或多个数据项的取值重复出现且概率很高时,它就存在着某种关联,可以建立起这些数据项的关联规则。关联规则挖掘的主要研究对象是交易数据库,其主要目标就是发现交易数据库中交易项目之间是否存在某些关联关系。  相似文献   

19.
数据库营销——统计的新领域上海大学国际商学院张梅琳随着我国改革开放和社会主义市场经济体制的建立和发展,各企业为占领市场而进行激烈竞争。特别是营销领域,更是短兵相接、硝烟弥漫,营销手段、营销方法不断创新,其中数据库(DataBase)营销是营销领域中值...  相似文献   

20.
张瑾 《统计与决策》2005,(15):136-137
在大型的数据集中,通常包含一些数据对象,它们与数据的一般行为或既定模型表现不相一致,这些数据对象被称为异常数据.大部分数据挖掘方法将异常数据视为噪声或异常而丢弃;然而在一些数据探索中,如保险欺诈、信用卡欺诈、违规交易等检验中,罕见的事件可能比正常出现的事件更有意义.因此,在利用原始数据进行挖掘之前,有必要对其进行异常数据的查找和检验.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号