首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
基于中文文本主题提取的分词方法研究   总被引:8,自引:0,他引:8  
中文文本主题提取有助于用户对海量信息进行浓缩和提炼。而主题提取是以中文分词作为第一步,分词质量直接影响到文献主题提取的质量。本文提出了一种基于中文文本主题提取的分词方法,该方法以概念语义网络为分词词典,采用改进的最大匹配算法对文本进行切词,并同步完成主题词的规范工作。  相似文献   

2.
计算机识别“有”与其他动词构成的述宾短语,仅利用语法信息词典提供的静态规则是难以采用规则方法来处理大规模真实文本的.“有+V”述宾短语的组合,不但要受到静态规则的制约,而且也会被动态组合过程中产生的新条件所管制.为提高计算机对“有+V”述宾短语的识别率,以CCL语料库为语料调查源,参照《现代汉语语法信息词典》分析“有”跟一般动词构成述宾短语的动态条件.研究这些一般规则的突破条件,或许是提高大规模真实文本自动句法分析准确率的切入点.  相似文献   

3.
上市公司年报中披露的文本风险信息分类多样,影响机制复杂。基于LDA主题模型,文章从上市公司风险文本中提取出15个主题风险,研究其披露程度对市场风险的影响。研究发现,风险披露程度的提升会在整体上显著提高市场风险,且不同主题的风险信息披露对市场风险的影响不同:宏观系统性风险和流动性风险的披露程度越高,市场风险越大;公司自愿披露的生产安全等风险的披露程度提高会显著降低市场风险;以“模板式”方式披露的风险披露程度对市场风险没有影响。监管部门在制定年报风险信息披露分类标准时,应更多考虑上市公司的实际情况,不断完善相关措施。  相似文献   

4.
基于框架理论,利用内容分析方法,以"北京微博微信发布厅"为例,展示了政务微信的框架建构特征与策略.政务微信最倾向于发布政治、通告服务类主题文本,最注重建构政府-公众、公共利益实现框架,不同主题的框架建构倾向与偏好存在差异.回归分析发现强调与凸显公共利益实现框架、流行语框架能够积极影响政务微信的传播效果与评价,图文推送形式与标题新颖性也会起到改善作用.政务微信内容传播可尝试调整政治话语结构,丰富文本主题,重视公共性框架与流行性框架的融合,以更好发挥传播与治理作用.  相似文献   

5.
针对传统的用户兴趣主题模型存在非动态、噪声性、计算复杂度高和兴趣演化分析维度单一等问题,基于滑动窗口技术,引入兴趣主题遗传因子保持主题连续性,并定义用于捕获通用语义和噪声干扰词的兴趣通用主题.提出了SGC-LDA(sliding-window,genetic factor and common topic-latent dirichlet allocation)用户兴趣主题模型,并根据该模型对数据集进行主题演化分析,从兴趣主题强度、兴趣主题状态和兴趣主题路径三个维度分析用户的兴趣偏好及演化规律.运用新浪微博语料文本进行实证分析,结果表明,SGC-LDA用户兴趣主题模型优于传统的LDA主题模型,可以准确描述用户兴趣演化规律,漏报率、误报率以及归一化开销均低于未进行主题关联过滤的基准(Baseline)方法,从而证明了模型的有效性.  相似文献   

6.
语料库语言学的视角对研究作家作品的语言特点和主题表达提供了可靠的量化依据。通过语料库语言学的研究方法,主要运用Wordsmith工具来提取爱伦坡的短篇小说《厄舍古屋的倒塌》文本的基本信息,并结合文本索引行观察文本主题词特征,进而探析爱伦坡小说词汇的哥特式特征。  相似文献   

7.
对比研究是发现教材优势、不足,改善教材编写一种途径.本研究以中美3套小学科学教材文本为研究对象,以图通过文本挖掘的方式,揭示中美小学科学教材编写的特点和差异.为使研究结果更加具体化,我们以"天气"知识主题为例,抽取了3套教材的正文文本,构建了知识点标记语料库和数据库,采用数据驱动和知识图谱相结合的方式,直观展示了不同教材知识组织的静态层级结构和动态序列安排,揭示了中美小学科学教材的知识选择和组织的特点.本研究从结构、分布、数量3个方面,揭示了国内版小学科学教材陈述性知识内容提供不足,以及在知识选择和组织安排上存在的问题.  相似文献   

8.
文本挖掘及其在知识管理中的应用   总被引:7,自引:0,他引:7  
文本挖掘是指利用数据挖掘技术,从大量的、无结构的文本信息中发现潜在的、可能的数据模式、内在联系、规律、发展趋势等,抽取有效、新颖、有用、可理解的、散布在文本文件中的有价值知识,并且利用这些知识更好地组织信息的过程.本文详细阐述了文本挖掘的过程、文本挖掘的功能以及文本挖掘在企业知识管理方面的应用.  相似文献   

9.
随着信息技术的快速发展,互联网成为主要社会信息传播方式,网络舆情的影响力不断扩大。网络舆情具有内容丰富、信息量大且相关话题种类繁多等特点,虽然聚类技术可以用来发现网民关注的话题,但是传统聚类算法还无法直接应用于海量动态网络舆情监控。本文根据网络舆情动态演化特点,研究高效的增量文本聚类算法,选取经典的增量聚类算法Single-Pass进行了改进,解决了该算法输入数据顺序敏感问题及求解效率问题。实验结果表明,在海量舆情文本聚类过程中,该方法可以大大提升舆情文本聚类效率,同时聚类精度未受到影响。  相似文献   

10.
高等教育国际化背景下,建设与国际接轨的大学英文网页是加强国际招生宣传、吸引外国留学生的重要途径.本研究采用语步分析的研究方法,对中美大学英文网页介绍文本的语步内容构建进行对比研究.研究发现,中美大学英文网页介绍文本语步结构大致相同,但文本信息的切入点存在较多差异.构建国内大学英文网页介绍文本时不应机械地翻译,而应充分考虑目标受众的思维习惯、价值取向和需求期待,对文本内容加以整合,提高文本语篇层面的可读性和有效度.  相似文献   

11.
随着网络舆情对整个社会的舆论影响力越来越大,为了有效的防控恶性事件,实时监控网络舆情也越来越尤为重要.本文针对舆情短文本信息的特点,提出基于组合神经网络自动聚类方法来构建舆情短文本的表示模型,通过特征词语义相似度构建词簇.实验结果表明:在海量文本分析和舆情发现的过程中,该方法可以有效提高舆情短文本构建表示模型的精度,提升舆情发现效率.  相似文献   

12.
<洛神赋>从表层看是爱其不得所爱、又不能忘其所爱的人神恋爱悲剧故事.借助格雷马斯结构语义学理论,从人物之间的关系入手,用矩阵方式解读,发现"余"的周围没有一位支持者,且难以找到具体的对手;从深层挖掘,发现文本折射了曹植的人生追求和人生意义.<洛神赋>的深层主题是存在主义.从艺术上看,引进了元叙事的方法,利用作者直接参与其中的写作手法,对读者情感进行撞击,以便有效传达文本深层的意蕴.  相似文献   

13.
接受美学认为,读者的解释对文本意义的生成有着重大作用.不同读者对同一个文本会有不同的解释,译者对文本的不同解释在翻译中得以体现.汉语丰富的文化意象使得卷帙浩繁的各式文学作品都有着丰富的互文信息,根据西方文论中陌生化理论,译本读者对外来文化信息是有所期待的,因为这种对他们而言具有陌生化新奇感的知识,是人类普遍的一种渴盼.从译者作为读者的主体性行为分析可以发现,译者在翻译互文性强的文化信息时,采用注释方法将这些对异国读者来说陌生的信息进行解释,是对原文的一种忠实的改写.  相似文献   

14.
聚焦不同时期辽宁自贸区发展建设的政策,通过LDA大数据模型对自贸区建设的阶段性政策文本进行低维主题集合,能够识别大规模文档集中潜藏的主题信息、主题强度及结构特征。在此基础上,对比中央对辽宁自贸区的发展要求,能够准确发掘地方政策实施的侧重点与发展差距,进而识别自贸区建设发展的不足。研究发现:在主题强度上,主题间相似度较低且强度差距不明显;在主题领域上,政策颁布更侧重于行政审批、监管创新、项目建设等领域,而在投资、贸易、外汇管理、金融服务、科技创新、人才政策等领域较薄弱;在主题结构上,行政审批、绩效考核政策主题针对行政体制机制改革,监管创新、政府信息公开、电子信息化服务主题体现“服务型政府”的政策供给重点。基于此,需加强金融贸易、法治营商环境建设、人才引进、企业扶持等领域的政策供给。LDA主题模型;辽宁自贸区;政策文本;聚类分析  相似文献   

15.
比较阅读是学习大学语文的一种非常有实用价值的阅读方法.比较阅读包括对文本的文体比较、手法比较、人物形象比较、主题比较、语言比较、观点比较等等.通过比较,读者(大学生)能充分把握文学文本,解读文本.  相似文献   

16.
迥异于以生平与思想发展为主的传统作家研究,罗兰.巴尔特的《米什莱》开创了一种新的探索方法,试图寻找文本的深在的作者。他主要利用主题批评方法对米什莱的全部著作进行解读。通过寻找米什莱著作中的主题,并利用结构概念,构建米什莱著作的主题结构网络,恢复一个蕴藏在文本中的真正的米什莱。  相似文献   

17.
韩礼德系统功能语法中语言的三大纯理功能对文本分析具有重要的理论指导意义.功能文体学是运用系统功能语法进行文本分析的文体学派.从功能文体学的角度出发,对英国著名诗人华兹华斯代表作之一《咏水仙》从及物性、语气与情态、主位结构与衔接手段三方面入手进行分析,探讨诗人如何运用语言表达诗歌的主题意义.研究发现,无论是从经验功能、人际功能还是语篇功能来看,诗人对语言系统的选择和使用都确切地表达了诗歌的主题.  相似文献   

18.
让-皮埃尔·里夏尔是法国当代一位充满活力的文学批评家,其批评的理论基础是胡塞尔的现象学哲学,强调对文本的"直观"和"体验",着重探讨个别现象,而不是普遍的范畴.他还继承了加斯东·巴什拉的主题批评,从文本的表层"现象"(主题)分析入手,努力寻找文本深层的主题网络.读者(批评家)在文本这个客体中与作者相遇,在感觉和意识世界中进行两个主体间的互动和交流,由此把握作者的意识或想象世界的结构.  相似文献   

19.
文本世界理论是认知诗学研究的一个重要理论。文本世界理论中的话语世界、文本世界和亚文本世界三层次将作者、文本和读者密切结合起来,以文本为分析对象,在兼顾作者的基础上,读者根据文本信息和已有的文本经验形成心理表征,构建不同的认知世界,对文本进行解读。运用文本世界理论对《断章》主题多样性成因进行统一阐释,验证了文本世界理论对语篇意义构建的强大阐释力,并揭示了文学文本的解读不是封闭性的。  相似文献   

20.
以江南古镇旅游外宣的部分英译文本作为研究语料,基于赖斯的文本类型理论,发现江南古镇旅游外宣文本英译存在错误频现、错译和死译现象以及文化信息传递不具体等问题。对此,提出针对性的翻译策略,即必须提高译者的职业素养和责任心意识,归化和异化策略的灵活运用,对于文化信息缺省采用增译+注释的方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号