首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
基于统计的主题词提取会产生信息冗余或数据稀疏等情况 ;而基于句法规则的主题词提取技术 ,又因为大量不规范语句而无法析出正确的主题词。目前普遍采取的统计与规则互补办法 ,虽然发挥了两种体系的优势 ,但仍未能有效解决 :( 1 )主题词在文本中的分布 ;( 2 )低频或隐性主题词的提取 ;( 3)主题词信息的权重与排序等问题。根据我们的直觉与语料库检验 ,文本主题词的分布是不平均的。如果我们能通过对文本标注 ,从而提取出富含主题词的语句 ,那么 ,根据现有的自然语言处理技术 ,建构一套主题词规则化提取的数学模型和算法是可能的 ,这将为文本主题词统计结果提供可靠的预见和补充  相似文献   

2.
主题词分析是语料库技术中研究文本和文本语言特征的重要手段,该方法以词汇的分布和概率为基础,对文本层面的词语运用进行统计,在一定程度上为文本分析提供了量化的标准和客观的依据。本文以航空航天专业英语教材建设为例,从四个方面探索主题词分析技术在专门用途英语教材建设中的应用:1)ESP材料筛选,2)ESP材料分类,3)ESP材料难易度区分及排序,4)ESP词汇注释和词汇练习设计。目前,主题词分析已经广泛地运用到语域、文体风格以及中介语对比研究中,更加广阔的前景有待进一步拓展。  相似文献   

3.
通过对2011—2020年河南省各级政府发布的761份支持企业创新发展政策文本的梳理,采用政策文本量化分析方法,从政策文本年度频数分布、主体发文数量、类型分布和主题词关联分析等4个方面进行统计和分析。在此基础上,概括了地方政府支持企业创新政策的特征。分析结果表明:地方政府支持企业创新的方式呈现多元化特征,重视基础性支持和市场性支持,并积极发挥制度和市场等机制提升政府支持企业创新发展的政策绩效,具体支持方式上以财政转移和税收补贴为主。据此提出优化政府支持企业创新发展政策绩效的政策建议。  相似文献   

4.
基于中文文本主题提取的分词方法研究   总被引:8,自引:0,他引:8  
中文文本主题提取有助于用户对海量信息进行浓缩和提炼。而主题提取是以中文分词作为第一步,分词质量直接影响到文献主题提取的质量。本文提出了一种基于中文文本主题提取的分词方法,该方法以概念语义网络为分词词典,采用改进的最大匹配算法对文本进行切词,并同步完成主题词的规范工作。  相似文献   

5.
本研究基于以健康为主题的小型自建写作语料库,旨在考察两个问题:(1)非英语专业学生就健康为主题的101篇议论文中,主题词、关键主题词以及联想词的运用特征。(2)非英语专业学生在英语写作中,如何用目标语来构建特定话题的词汇语义网络。研究表明:非英语专业大学生写作中能够运用具有语用特征和意义联系的词语群。关键主题词与联想词相互关联,形成严密的词汇网络。但主题词多为常用词,用词较笼统不准确。  相似文献   

6.
采用基于语料库的方法对BEC主题词及分类主题词进行分析,可以发现,商务英语主题词呈现较强的语体特征;分类主题词构成特殊的语义网络,包含更丰富的内容信息与体现高度的主题性.主题词分析在商务英语词汇研究、词汇教学及商务英语教材编写方面具有一定的理论及实践意义.  相似文献   

7.
结合数据挖掘、主题建模、网络分析等多源融合的大数据分析法,针对网络空间治理政策及部门协同进行研究,对政策提升与机制优化具有重要意义。基于深度挖掘的网络空间政策文本,采用概率主题模型(LDA)从文本中发现并提取低维主题集合,分析主题分布;结合社会网络分析(SNA),对出台政策涉及联合发文的部门开展合作网络分析;提取六项分类主题为指标,评估治理政策的布局特征;从部门合作网络整体结构和网络中心性两个维度,评估组织间协同合作效果,为政府政策优化和协同合作提供理论依据与决策建议。  相似文献   

8.
主题词组配标引   总被引:2,自引:0,他引:2  
文章主要阐述了文献主题标引中的组配规则 ,介绍了概念交叉组配、概念限定组配和连接关系组配等三种主题词组配标引形式及标引实践中应注意的一些问题  相似文献   

9.
以韩礼德一项相关研究中的实例为语料进行个案研究,对比分析无灵句和无灵主语句在书面与口头语篇中的分布状况和语用特征。研究发现:(1)无灵句在书面和口头语篇中分布均衡,而无灵主语句则主要存在于书面语篇中;(2)无灵句在书面语篇中以被动结构占绝对优势,在口头语篇中则以主系表结构最具代表性,而无灵主语句则无论在书面还是口头语篇中都以主谓宾结构为主;(3)无灵主语句既大量存在于书面语篇中,也少量出现在口头语篇里,但各自语用特征不同:书面语篇中的无灵主语句生命性较强、隐喻性明显,具有生动形象的特征,而口头语篇中的无灵主语句生命性较弱、隐喻性不明显,具有通俗易懂的特征。  相似文献   

10.
城市形象表述词与城市旅游地形象主题词是两个不同的概念,二者之间虽然存在着密切的联系,但更有着明显的区别。区别主要表现为出现时期不一样、定位角度不一样、价值取向不一样、定位目标不一样、表述艺术不一样。根据这些区别原则,在广州城市形象表述词已经确定后,可以构建广州旅游地形象主题词为“岭南古韵,千年商都,关食天堂,潮流广州”。  相似文献   

11.
标题和主题词都是公文格式的组成部分,它们都与公文主题有着密切联系,在公文中都起着十分重要的作用.标题和主题词在公文中使用的历史都不长,但在现行公文中都有着不可缺少的重要性,它们出现在公文的不同部位,分别起着部分相同而又各自独立的作用.  相似文献   

12.
浅议档案主题词的设置革新与利用   总被引:1,自引:0,他引:1  
档案主题词具有代表某类档案的功用,通过档案主题词查询可将某类档案全部查询出来,档案主题词对档案的查询利用有很大帮助。但人们对档案主题词却很少录入,档案主题词的功用几乎得不到发挥。要提高人们对主题词的录入积极性,必须对主题词的拟写设置和录入做法进行革新,减少主题词录入的工作量,提高可用性,充分发挥其查询档案的功用,促进档案管理。  相似文献   

13.
文本分析是公共政策研究的重要方法。在筛选建立我国游戏产业政策文本数据库的基础上,从权威部门政策文本数量、文本主体、文本主题词与主体交互关系、文本文种、文本说明五个方面对我国游戏产业政策(1990年~2016年)进行量化统计,分析我国游戏产业政策在文本发布上具有高权威性、多权威性和相对集中性,在政策文本内容上体现一定的广泛性、约束规范与谨慎扶持的交织性,在文本发展过程上显示阶段性、渐进性和探索性,在文本发布数量上保持总体上升态势,在文本法律性质上呈现规范性文件多而法律法规少等特性。  相似文献   

14.
本研究针对大学一年级新生实施主题模式教学,通过在教学过程中自建的主题口语语料库统计分析主题词及其主题图式。研究结果包括以下三方面:通过统计两个主题口语语料库所使用的词汇发现学生的口语中表现出较强的书面语倾向。另外两库主题词比对表明不同主题的心理词库不同,在口语交际中引发的主题词及其主题图式也不同。而且主题的具体程度与主题图式的复杂程度呈负相关。  相似文献   

15.
针对褶皱中文笔迹身份鉴别的问题,提出了一种基于散射变换系数统计特性的识别方法,主要利用散射变换的局部平移不变性和弹性形变稳定性等特性,先将文本图像进行散射变换,再采用伽玛模型,对其各子带的散射系数提取分布特征作为全局特征,然后在全局特征上建立Copula模型,最后使用Copula模型之间的KL距离计算相似性,用于身份鉴别。理论分析和对比实验结果表明,对于不同褶皱的文本图像,基于散射变换统计特性的识别方法优于现有的方法。  相似文献   

16.
语言的性别差异是社会语言学研究的热点.通过自建的女性与男性小说家作品语料库间的对比,可以揭示女性小说家词汇的使用特点.研究发现:在词汇丰富度和词汇密度方面,女性小说家均低于男性小说家,说明女性作品中传递的文本信息量少,阅读难度相应较低.通过主题词分析发现,在名词使用方面,女性小说家与男性小说家存在显著差异,女性偏爱使用与娱乐、学习等相关的名词,少用表人际关系及事业的名词和粗俗语;在人称代词和语气词使用方面,女性小说中的频数显著高于男性小说;在指示代词和形容词使用方面,女性小说中的频数显著低于男性小说.  相似文献   

17.
自问自答句是讲话人提出问题但不需要听话人回答,而由讲话人自己提供答语的问句。根据讲话人提供答语的方式,这种问句可以分为提供显性答语的自问自答句(简称显性答语句)和提供隐性答语的自问自答句(简称隐性答语句)。隐性答语句在英语政治演讲语篇中的存在是自身特点与这类语篇的特点相互作用,进而相互适应的结果。它在语篇中位置比较灵活,甚至可以出现在这类语篇的篇尾。作为一种非常规的用法,篇尾自问自答句具有独特的语篇组织功能:当它的隐含答语可以从上文语篇推知时,它具有总结-延续功能;当它的隐含答语可以根据常识推知时,则具有总结-突显功能。   相似文献   

18.
论大学校训及其主题词的提炼   总被引:1,自引:0,他引:1  
校训是学校为树立优良校风而制定的体现一所学校精神风貌、办学理念或办学传统、办学目标、办学特色的训词,是全校师生员工的座右铭.承载厚重文化传统、蕴涵深邃办学理念的校训是学校精神追求的鲜明体现,是学校实施育人的重要手段.中国当代大学校训产生的模式基本可以分为引经据典型、名人倡导型、自我总结型、大众流行型,但在主题词的概括上雷同现象极其严重.提炼校训主题词必须在内容上注重校训内涵的丰富性和精神、理念特色;在文字上注重文化品位;在时效性上注重校训的稳定性和长久性;在概括提炼过程中引导广大师生员工共同参与.还要纠正将校训等同于校规校纪、标语口号等的认识偏差.  相似文献   

19.
如何确定文章中的主题词句呢?本文认为,正确地理解和划分“装饰语”是一个途径。其最主要的是按“装饰语”的功能,梳理出逻辑顺序;根据“装饰语”之间的关系来掌握内容和主题词。  相似文献   

20.
悖论的构成与我们对某些语句可以自我指称的认定密切相关。认为某个语句可以自指,这是一回事,但事实上这个语句是否可能自指,则是另一回事;而语句自指事实上是不可能的。由此,便会获得对悖论的一种根本不同的理解。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号