首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 93 毫秒
1.
提出了一种网络信息文本分类模型的建立方法,根据网络报文的特点,抽取其中关键词作为分类特征词条,并以报文关键词进行词频统计分析建立文本分模型,分别进行了基于最近邻决策和K-近邻决策的分类效果试验研究,结果显示,K-近邻决策的分类效果要优于最近邻决策的分类效果。  相似文献   

2.
对于接收到的邮件,基于向量空间模型的邮件过滤系统能够将其转换为向量表示,通过计算向量的相似度对其分类并做相应处理.  相似文献   

3.
一种基于特征聚合理论和LSI的文本分类新方法   总被引:2,自引:0,他引:2  
根据特征聚合理论和隐含语义索引理论(LSI)提出了一种文本分类新方法,该方法应用特征聚合理论和LSI理论来构造向量空间模型,大大削减了特征向量的维数,同时增强了稀有词的作用,并在特征向量中引入了语义成分,从而提高了分类的速度和精度。  相似文献   

4.
重视文本研究是当前深化毛泽东研究的基础,从文本学的意义上对毛泽东研究的文本资源群进行必要的细化分类是不可或缺的基础性工作。毛泽东研究中的文本大致可分为两大类:一是直入性文本,即可直接入手研究的毛泽东本人所写的一手文献,根据其文本结构并借鉴文本学的相关理论范式,可以将其细分为正式文本、生成性文本与拟文本三大类;二是旁引性文本,即可间接利用的旁征博引性文本,包括毛泽东传记、年谱以及中共党史和同时期党内重要领导人物的著作、回忆录等二手文献,它为毛泽东研究的深入推进提供了重要参考。只有实现上述两类文本的综合利用,并在研究中更加自觉、规范地将多元文本有所区别、有所选择,才能准确地勾画出毛泽东真实而丰满的思想肖像。  相似文献   

5.
文本分类经过多年的发展,已经产生了很多成熟高效的算法。将隐马尔科夫模型用于文本分类,对每个文本类构建一个隐马尔科夫模型,χ2检验获得类别特征词集,其状态转移表示按照一指定顺序对类别特征词集进行遍历,状态输出符号为特征词的词频,隐马尔科夫模型的状态转移过程隐含的表示了属于该类的文本的形成过程。具有最大概率的HMM分类器就是所属的类别。该算法不仅将特征词考虑进去,而且还将词频信息融入隐马尔科夫模型中,实验结果表明该方法分类效率较高。  相似文献   

6.
支持向量机(SVM)算法可用来确定非线性可分文本的待分类文本类别。支持向量机的原始问题可以归纳为一个二次规划问题。当规模较大时,标准的SVM算法训练效率较低。本文在分析SVM算法的二次规划问题及利用可行性方向法求解二次规划问题的基础上,将效率较高的可行性方向法应用于求解SVM算法中的二次规划问题,给出了非线性可分文本的SVM算法的改进算法,改进后的SVM算法在时间复杂度上有着明显的提高,从而有效提高了SVM算法的训练效率。  相似文献   

7.
研究了一种基于向量空间模型的文档聚类方法.提出了一个新的聚类模型,即在传统聚类模型的基础上增加一个文档特征向量调整模块;给出了一个特征评价函数用以进行特征提取;对一种基于相似度的平面划分聚类算法做了一些改进.实验结果表明本文提出的聚类模型是可行的.  相似文献   

8.
提出了一种基于汉字结构关系的手写汉字识到粗分类的新方法。该方法以抽取手写汉字基本笔划为基础,利用汉字的结构特征进行粗分类。它不仅算法简单、分类速度快、分类能力强、分类稳定、可靠,而且在分类的同时又能把组成汉字的部件及其笔划随之而分离出来,为用句法结构方法识别手写汉字奠定了基础。这种方法成功地用于在PC/AT机上实现的成页手写体(楷书)汉字识别系统中,效果满意。  相似文献   

9.
面对海量数据带来的冲击,传统的单机版贝叶斯分类程序存在处理的数据集有限、内存瓶颈和耗时较长等问题.本文通过对朴素贝叶斯模型进行研究,设计并实现了一种基于Map Reduce的朴素贝叶斯文本分类算法.实验表明,该算法具有较好的扩展性和加速比,可适用于海量密集文本分类.  相似文献   

10.
通过引入位图映射以及元组空间的概念,提出了一个数据包分类算法,该算法可以满足高性能网络对骨干路由器的要求,能够以线速完成对输入数据包的分类处理。算法在时间及空间复杂度上性能较好,并具有很好的扩展性。  相似文献   

11.
潘正高  张磊 《宿州学院学报》2013,28(1):66-68,81
摘要:为了提高Web评论文本情感分类的性能,通过分析评论文本中词语之间的搭配关系,提出了一种基于模式匹配和统计学习相结合的文本情感分类方法,即将N—gram方法与情感词语搭配模式相结合,从评论文本提取特征,再利用机器学*-2方法实现文本情感分类。实验结果表明,与传统机器学习方法相比,该方法能显著提高文本情感分类的性能。  相似文献   

12.
文章介绍了语篇结构的几种有代表性的认知修辞分析方法,认为语篇模型主要由语篇单位和语篇关系构成,但是在描述过程之中还牵涉到若干关键细节。对这些细节的剖析由静态向动态的转移,意味着研究的细化以及研究工具的多元性发展趋势,这为语篇研究的人工智能化奠定了基础。   相似文献   

13.
在英语教学中,篇章教学是不可缺少的一个重要内容,它可以使学生提高学习兴趣,从而达到增强分析能力、理解能力、概括能力,以及英语学习的综合能力的目的。  相似文献   

14.
语篇理解是一个以人类认知的关联性取向为基础的动态认知过程。语篇理解过程中 ,作者、语篇、读者几种因素基于认知关联性相互作用 ,形成一种“制约平衡” ,制约着语篇理解 ;读者的认知推理对语篇理解有突出的作用。为此 ,对语篇理解的描写 ,可在关联理论的框架内 ,采用一种作者、语篇、读者以其相依相离的“制约平衡”制约语篇理解的交互模式。  相似文献   

15.
针对XML网页特点,重点研究了XML文档结构和内容特征的提取方法,提出了一种基于频繁结构层次空间模型的联合特征提取策略,并给出了结构特征权重和关键词出现的位置及频度权重的计算公式,并根据计算结果提取XML网页特征矩阵,分别就结构、内容联合提取三种情况进行分类测试,通过ROSSETA系统,利用粗糙集优越的属性约简构造文本分类系统,实现XML文档分类。实验表明,该方法分类准确度较高,计算量较小。  相似文献   

16.
讨论了含有极小单侧理想的本原加法范畴,得到了这类范畴的一个局部结构定理  相似文献   

17.
通过引入“熵权”概念,运用属性相关分析方法剔除与选择期望不相关或弱相关的特征属性(即评价指标),建立一套动态供应商评价指标体系。运用熵权值法根据各评价指标的差异性对指标权重进行客观赋值,综合专家评价意见进行修正得到综合权重,提出了供应商选择多层次熵权综合评价法并结合案例进行了实证研究。  相似文献   

18.
通过引入“熵权”概念,运用属性相关分析方法剔除与选择期望不相关或弱相关的特征属性(即评价指标),建立一套动态供应商评价指标体系。运用熵权值法根据各评价指标的差异性对指标权重进行客观赋值,综合专家评价意见进行修正得到综合权重,提出了供应商选择多层次熵权综合评价法并结合案例进行了实证研究。  相似文献   

19.
选取31个省级地方政府层面的73份社区生活垃圾分类政策文本,从政策工具的视角,采用扎根理论分析方法,研究社区生活垃圾分类政策系统的时空结构、政策工具与政策目标的适配以及政策工具之间的协同状况。结果发现,社区生活垃圾分类政策工具、政策目标和政策主体行动之间存在着适配性、协同性问题:在一级政策工具的选择与使用上以权威性工具为主,其次是社会性工具,再次是经济性工具;在次级政策工具的选择与使用方面,各有侧重,政策系统内部结构呈现出不均衡态势;地区间在政策工具使用的时间和空间序列上存在不协同、变化差异较大、波动性显著的特性。因此,优化社区生活垃圾分类政策工具的选择,需要充分发挥政策工具的整体性功能,保持政策工具的内部结构平衡,拓展与创新地方政策工具内涵。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号