多粒度关系融合的微博信念网络检索模型 |
| |
作者姓名: | 张雄涛 甘明鑫 李硕 |
| |
作者单位: | 北京科技大学经济管理学院 |
| |
基金项目: | 国家自然科学基金(72271024,71871019)~~; |
| |
摘 要: | 微博检索系统是微博平台实现个性化信息过滤的重要工具,建立合理的微博检索模型不仅有利于满足用户的个性化信息需求,而且有利于提升微博平台的信息服务水平。与传统文本检索相比,微博检索面临两方面挑战,一是较短的微博查询语句难以准确表达用户的检索需求,二是较短的微博文档难以充分表现微博的语义特征。这使查询语句与文档之间难以准确进行匹配计算,致使微博检索性能受限。结合微博术语和文档的特点,将术语关系和文档关系融入信念网络检索模型,提出多粒度关系融合的微博信念网络检索模型。首先,基于混合语义信息和时间信息对微博术语关系进行量化,以更准确地建立微博术语之间的相关性;其次,基于混合语义信息和作者信息对微博文档关系进行量化,以更准确地建立微博文档之间的相关性;最后,结合量化的术语关系和文档关系,在基本信念网络检索模型的基础上,给出微博信念网络检索模型的概率推导过程。采用网络爬虫工具,从新浪微博平台获取真实的微博数据,对微博信念网络检索模型的有效性和合理性进行验证。研究结果表明,微博术语之间存在语义相关性和时间相关性;微博文档之间不仅存在语义相关性,还存在作者信息相关性;与主流的微博检索模型相比,微博信念网...
|
关 键 词: | 多粒度关系融合 微博检索 信念网络检索模型 术语关系 文档关系 |
|
|