首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 46 毫秒
1.
网站提供的站内查询系统存在着系统不能自动采集网络信息,以及模糊查询结果准确率低等缺点.因此,应用搜索引擎的工作原理,设计了一种基于Lucene的站内搜索引擎系统,实现了站内信息的增量采集、自动分词和建立倒排索引功能.该系统的建立,提高了用户站内搜索的准确率和查全率,使站内信息资源能得到充分利用.  相似文献   

2.
基于中文文本主题提取的分词方法研究   总被引:8,自引:0,他引:8  
中文文本主题提取有助于用户对海量信息进行浓缩和提炼。而主题提取是以中文分词作为第一步,分词质量直接影响到文献主题提取的质量。本文提出了一种基于中文文本主题提取的分词方法,该方法以概念语义网络为分词词典,采用改进的最大匹配算法对文本进行切词,并同步完成主题词的规范工作。  相似文献   

3.
"语文"一词反映先语后文的次序.中文应该反映汉语词的多音节特性.分词连写配合心理语言学的大脑同时处理7个信息单元的特性.现代语言普遍采用词串捆绑方法来处理较复杂的概念.意义完整的语文标签应采用连写式.中文全分写等于全连写,缺乏词的信息.语文现代化是国家全面现代化的必要而非充分条件.今天,面对洋语洋文的挑战,我们需要提出新的指导方针--"科哲为体,中西兼用".  相似文献   

4.
实行中文分词连写确实具有必要性。但仅此是不够的,我们还应当注意是否具有可行性。笔者从三个方面就可行性问题进行了深入考察。考察结果表明,实行中文分词连写不仅具有必要性,而且具有可行性。  相似文献   

5.
文章通过质疑和答疑表述了以下看法:(1)就日常交际来说,西文需要分词连写而中文则未必,因为后者可以借助汉字特征辨识词界;(2)现在越来越多的人赞成实行中文分词连写,主要因为这有助于中文信息处理;(3)实行中文分词连写有利有弊,最大弊端是它给书写增添了负担;而开发推广中文词式书写编辑软件,不失为化解矛盾的可行办法。  相似文献   

6.
汉语分词在汉语文本处理过程中是一个十分特殊而重要的组成部分。传统的基于词典的分词算法存在着很大的缺陷,它们无法对未登陆词进行很好的处理。而基于概率的算法只考虑了训练集语料的概率模型,对于不同领域的文本的处理效果不尽人意。本文提出了一种基于上下文信息提取的概率分词算法,它能够将预切分文本的上下文信息加入分词概率模型中,以上下文信息指导文本的切分。这种切分算法结合经典n元模型以及EM算法,在开放测试环境中取得了比较好的效果。  相似文献   

7.
-ing分词和-ed分词在英语学习中经常出现,也经常用到,而且在实际应用中会碰到许多棘手的问题。笔者从-ing分词和-ed分词的性质和功能-、ing分词/-ed分词和定语从句之间的转换以及-ing分词被动式和-ed分词的比较三个方面入手对-ing分词和-ed分词进行归纳比较。  相似文献   

8.
首先阐述了文本分类的现状和定义,概述了文本分类的基本流程,然后对文本预处理过程中的分词和去停用词作了简要介绍。在简述文本表示的概念和常用模型之后,重点讨论了信息增益、文档频率、期望交叉熵、互信息和chi统计五种用于特征降维的特征选择方法,而后描述了Rocchio、朴素贝叶斯(NB)、支持向量机(SVM)、K最近邻(kNN)和决策树分类算法的基本指导思想,并从分类性能及其各自复杂度等方面分析比较了这几种算法的优缺点,最后评述了查全率、查准率和F-Measure三种常用的分类器性能评价指标。  相似文献   

9.
根据Verschueren的顺应论,以中文旅游文本及其英译本为研究对象,论述了在不同社会文化背景下,中西方的语言习惯和文化规约不同,提出要做好旅游文本的翻译,译者应动态顺应目标语读者的物理世界、心理世界及社交世界。  相似文献   

10.
语句相似度体现的是两个句子之间的相似程度。语句相似度计算是FAQ和信息检索等方面核心技术之一。针对基于分词的相似度计算过于依赖实际的分词效果,在原相似度计算模型中增加了两个句子不分词时的词形相似度计算,以缓解因为句子分词不准确而导致相似度计算结果偏低的情况。结合“数据结构”课程问答系统的实验,结果表明,改进的方法比原方法有较高的准确率。  相似文献   

11.
本文对《中国期刊全文数据库》和《报刊资料索引》中收录的1980—2005年国内美籍华裔文学研究论文从年代分布、期刊分布、作者分布和主题分布等方面进行了统计分析。文章从论文的数量、质量、形式、主题、研究队伍等方面讨论美籍华裔文学研究的发展态势,指出,美籍华裔文学研究从80年代起经历了一个较为缓慢的过程,到本世纪走向成熟。研究者队伍、论文的内容、层次呈多样化,但目前还存在诸多空白需要填补。  相似文献   

12.
汉字的“字”与汉语的“词”单位不一致,给人脑和电脑的理解都带来困难。汉语另外有三种可能的文本:“汉字词式书写”文本、“纯拼音词式书写”文本、“拼音夹用汉字”文本。“拼音夹用汉字”文本最有可能成为走出汉语自动理解困境的最佳路径。  相似文献   

13.
语文素养体现了语言的积累、习惯的培养、思维的开启以及语文基本技能的培养和潜在能力与创新能力的开发.作为一个时代舞台的关键词,个性化的言说能力、创造性的思维品质和民族化的智慧、情感、意志构成为语文素养的奠基性内容和终极性价值.支撑语文素养背后的乃是语文教育价值与意义的当下探询与追问,以"立言"而"立人"的语文教育理想再次凸现并迅速生展和推进.使人的生存、生活得以陶冶、净化和升华,使人更具有灵气与悟性,更具有诗意与人性,这历史而又现实地表达为语文素养的话语祈望与精神诉求.  相似文献   

14.
本文试图从个体生态、种群生态、群落学与生物地理学以及生态系统与资源的合理开发利用等方面对我国古代的生态学知识作一初步总结,并对我国古代生态学思想的发展加以探讨.  相似文献   

15.
略论中国古代喜剧中的崇生主义   总被引:1,自引:0,他引:1  
源于原始巫文化的崇生主义精神是中国传统喜剧的深层底蕴。这种精神先得到先秦儒家的理性认可,而同为原始巫术发展起来的道教则与崇生意识有更直接的联系;至于中国化的佛教禅宗之成为“人间佛教”也是顺应这股生命潜流的结果。这一切,都汇成了中国古代社会生活中普遍蒙泛喜剧因素:戏剧中喜剧成为最先成熟的样式,男女情爱题材、大团圆结局也缘此而多。  相似文献   

16.
本文提出了一种单板机控制的,用电感测微仪检测离焦信息的显微镜自动调焦装置。文中介绍了自动调焦装置的工作原理,并给出了技术指标,这种装置能解决中倍数生物显微镜的自动调焦问题。  相似文献   

17.
剖析了汉语散文翻译过程中容易涉及的若干文化问题,指出在散文翻译中要成功实现跨文化交际。必须熟知译出和译入语的文化背景。  相似文献   

18.
中国诗学审美命题是表达诗学范畴之间意义关系的理论命题。本文运用理论与作品相结合的研究方法,分析了涉及审美发生学、作品构成论和接受美学的六大审美命题,对于深入把握中国诗学审美理论精髓具有重要的意义。  相似文献   

19.
3 .2 滋阴生血、养血调血 中兽医学认为精血是畜禽正常生理功能活动的基本物质 ,由脾胃水谷精微气化而成。精血充盈 ,则体壮神旺 ,肌肉发达 ,四肢强劲有力 ,皮毛光泽滋润 ,母鸡则“日日生蛋不绝”。刘深廷等[17] (1995 )以增蛋灵 (陈皮、黄芪、白芍、川芎、当归、补骨脂、益母草、麦芽、罗勒 )按 1.5 %比例混料饲喂 2 0 0 0只罗曼蛋鸡 90d ,能使产蛋率提高 5 .2 1% ,饲料利用率提高 7.2 7%。血红蛋白增加 2 .8g % (P <0 .0 1) ;血清总蛋白增加 0 .85g % (P <0 .0 5 ) ;血清白蛋白增加 0 .73g % (P <0 .0 5 ) ;血清胆固醇增加 37.0 …  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号