首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 31 毫秒
1.
汪克夷  齐丽云 《管理学报》2007,4(3):273-278,311
基于文本聚类技术在移动通信行业客户服务文本记录分类中的应用研究,构建了文本分类处理的概念模型。采用集合式表示方法对客户知识进行定义,通过向量空间模型进行文本转化和数据矩阵的构建,提出了TF-MI函数进行特征词的权重计算,利用层次聚类进行数据处理,并通过类别判断的4条准则进行了聚类结论分析和讨论,从而进一步强调了文本聚类技术在移动通信行业客户服务系统知识获取工作中的实用价值。  相似文献   

2.
本文基于关键词集的中文文本特征表示方法,将本体和词共现的思想引入到中文文本的特征表示中,能够更加准确地表达中文文本特征,进而提高中文文本聚类的质量.  相似文献   

3.
该文提出了一种针对中文专利文本的聚类方法.使用自组织特征映射算法获得初始的聚类中心,并以此作为K-means算法的初始输入,从而得到最终的聚类结果.这样的组合可以在提高聚类准确率的同时,降低运行时间.在聚类之前还对文本进行LSI降维操作,降低了特征向量的维数,使得SOM和K-means两个对维数敏感的算法可以更加有效和快捷.  相似文献   

4.
本文运用文本挖掘技术,对2008-2018年1297家上市公司年报的管理层讨论与分析(MD&A)进行文本分析。从文本质量特征、文本词汇特征和文本语调特征等角度量化计算文本相似度、文本情感值、文本可读性三个维度文本披露指标,采用Logistic模型、决策树模型、支持向量机和神经网络模型四种方法构建上市公司信用风险预警模型,实证检验加入MD&A文本信息披露指标后信用风险预警模型的预测能力。实证结果表明:(1)在加入文本信息披露指标后,信用风险预警模型的预测准确度得到显著提升,多维度文本信息披露指标比单维度文本信息披露指标对信用风险预警模型预测准确度提升效果更优;(2)Logistic回归模型的预测准确度在样本数量较低时要优于决策树、支持向量机与神经网络,随着样本数量的增加,支持向量机和神经网络的预测准确度会明显提升;(3)不同特征的文本信息内容与企业是否发生信用风险均显著相关。本文的研究结论为提高信用风险预警的预测准确性提供了方法和经验证据,对于投资者与相关学者研究市场有效性提供新的研究视角。  相似文献   

5.
石勇  安文录  曲艺 《管理评论》2022,(6):143-152
“智慧检务”建设近些年取得了巨大的进展,但是大部分集中于检察信息化和数据基础设施领域,对检务工作决策支持的关注程度和相关研究成果都很有限。针对这一弱项,围绕检察工作中“对刑事犯罪提起公诉”的核心任务,结合检察官“根据案情基本信息决定以何种罪名起诉”的决策过程,本文运用文本挖掘技术建立起一套检察起诉决策支持系统。该系统主要由文本预处理、特征提取、分类等流程组成,输入是案情描述的文本,输出是对应的起诉罪名。实验结果显示,该系统在多种分类模型下、不同的特征数量下、不同的文本向量表示方法下均能取得较高的准确率,不仅实现了有效的、高精度的起诉决策支持,也提升了案卷分类管理的效率。本文成果是大数据挖掘辅助检务决策领域的率先尝试,是提高检务工作智能化水平的具体实践,丰富了领域研究的同时,相关数据和结论亦可作为该领域应用和实践的基线,供未来参考和借鉴。  相似文献   

6.
本文针对待聚类对象的多层次聚类指标权重配置问题进行了研究。首先运用向量空间模型将聚类对象表征为包含多个层次聚类属性指标的特征空间向量并基于余弦距离测算底层属性指标的相似程度,然后根据聚类指标的层次结构以及相应各层指标的权重系数综合测算对象之间的相似程度,最后根据历史聚类案例中相同类别对象之间相似度较大,不同类别对象之间相似度较小等特点,构建了基于案例学习的多层次聚类指标客观权重极大熵挖掘模型。通过案例分析以及与其他方法的比较研究,证明了本模型的可行性与有效性,为多层次聚类指标客观赋权问题提供了一种新的研究思路。  相似文献   

7.
本文应用半正定规划支持向量机模型,将核函数特征子空间的组合作为核映射矩阵,提出一种新的将特征选择整合在数据分类过程中的学习算法。首先,将样本按其特征进行分组,计算每组样本子集的核矩阵;然后将这些核矩阵线性组合后加入基于半正定规划的支持向量机模型中,利用半正定规划支持向量机学习器求解得到各子特征空间的权重系数,其次,根据特征权重系数建立特征贡献度和支持度用于特征选择并控制分类准确率、特征数量和对不同类别样本的分类能力;最后根据最优分类准确率、最少特征数量、最佳泛化能力三项不同目标计算所对应的特征数量和分类结果。实证中采用医学、植物学、文本识别和信用等领域数据以及人工数据集比较该方法和SFS、Relief-F以及SBS算法的特征选择效果。结果表明,在实际数据中,本文提出的方法不但能够保持较好的分类学习效果,而且可以比SFS、Relief-F以及SBS特征选择算法的特征子集数目大幅减少;在人工数据中,该方法可以正确地选出真正的特征,去除噪声特征。  相似文献   

8.
基于空间聚类挖掘的城市应急救援机构选址研究   总被引:3,自引:0,他引:3  
以城市突发事件的应急管理为应用背景,研究使用空间聚类技术解决应急服务机构的选址问题.首先提出实施聚类分析的数据模型,然后改进既有空间聚类算法的基础上,提出了以.k-means聚类算法缩减解空间的搜索范围、以模拟退火算法为解搜索策略.基于GIS系统,充分考虑空间障碍物因素和空间环境因素等限制条件,提出(COD-MEANS-CLASA)的空间聚类算法以实现应急救援机构的科学选址.实验结果表明,提出的算法在执行效率和解质量两方面具有更好的表现.  相似文献   

9.
面向多极值质量特性的过程参数全局优化研究   总被引:1,自引:0,他引:1  
崔庆安 《管理科学学报》2012,15(9):46-57,73
对于作用关系复杂,而且质量特性拥有多个极值的制造过程,现有质量改进方法只能实现参数的局部优化,产品质量仍有较大改进空间.本文采用支持向量机(SVM)作为复杂作用关系过程的近似模型,提出基于支持向量聚类(SV)与序列二次规划(SQP)的参数全局性优化方法.首先建立了复杂过程的SVM近似模型;而后根据ε管道理论,通过对聚类过程谱系图的分析,确定了聚类的最小相似度水平及合适的聚类数目,将过程各极值点邻域内的支持向量分别聚为一类;最后由各聚类中心出发,并行进行SQP寻优以发现过程的多个极值.仿真研究表明,所提方法能够全面反映过程的极值分布,实现参数的全局性优化;寻优结果与实际极值的绝对偏差及相对偏差的平均值分别为0.15和1.28%,并且偏差的大小与过程极值的数目无关,说明方法具有较高的精确度和稳定性;此外,通过支持向量聚类,不仅保证了SQP寻优结果对于过程全部极值的遍历性,而且将寻优的次数降低了50%以上,提高了寻优效率.  相似文献   

10.
通过技术跟踪,可以了解某一技术领域的现状和发展态势,为技术战略的制定提供决策信息支持.当前,基于共引聚类分析的技术跟踪研究获得了长足的发展,但仍然存在一些问题,主要表现在数据关联的计算和聚类效率的提升上.基于此,文章从构建共引关联模型,改进系统聚类算法二个方面对共引聚类进行改进,并根据改进的共引聚类方法设计了基于多维标度模型的技术跟踪二维可视化工具.在此基础上,以公路工程领域为例,从个人、机构层面进行可视化实验,并着重对中国在此领域的技术情况进行详细的分析,以此判别技术领域的深层次结构,为技术跟踪的相关研究做一些支撑性工作.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号