首页 | 本学科首页   官方微博 | 高级检索  
     

LSA和MD5算法在垃圾邮件过滤系统的应用研究
引用本文:张秋余,孙晶涛,闫晓文,黄文汉. LSA和MD5算法在垃圾邮件过滤系统的应用研究[J]. 电子科技大学学报(社会科学版), 2007, 0(6)
作者姓名:张秋余  孙晶涛  闫晓文  黄文汉
作者单位:兰州理工大学计算机与通信学院 兰州730050(张秋余,孙晶涛),陕西西禹高速公路有限公司 陕西韩城715400(闫晓文),陕西理工学院计算机系 陕西汉中723003(黄文汉)
基金项目:“十一五”国家科技支撑计划(2006BAF01A21)
摘    要:随着对垃圾邮件问题的普遍关注,针对目前邮件过滤方法中存在着的语义缺失现象和处理群发型垃圾邮件低效问题,提出一种基于潜在语义分析(LSA)和信息-摘要算法5(MD5)的垃圾邮件过滤模型。利用潜在语义分析标注垃圾邮件中潜在特征词,从而在过滤技术中引入语义分析;利用MD5在LSA分析基础上,对群发型垃圾邮件生成"邮件指纹",解决过滤技术在处理群发型垃圾邮件中低效的问题。结合该模型设计了一个垃圾邮件过滤系统。采用自选数据集对文中设计的系统进行测试评估,经与Nave Bayes算法过滤器进行比较,证明该方法在垃圾邮件过滤上优于Nave Bayes方法,实验结果达到了预期的效果,验证了该方法的可行性、优越性。

关 键 词:邮件指纹  特征提取  潜在语义分析  MD5算法  滑动窗口  垃圾邮件过滤

Research of Spam Filtering System Based on Latent Semantic Analysis and MD5
ZHANG Qiu-yu,SUN Jing-tao,YAN Xiao-wen,HUANG Wen-han. Research of Spam Filtering System Based on Latent Semantic Analysis and MD5[J]. Journal of University of Electronic Science and Technology of China(Social Sciences Edition), 2007, 0(6)
Authors:ZHANG Qiu-yu  SUN Jing-tao  YAN Xiao-wen  HUANG Wen-han
Affiliation:ZHANG Qiu-yu1,SUN Jing-tao1,YAN Xiao-wen2,HUANG Wen-han3
Abstract:
Keywords:e-mail fingerprint  feature selection  latent semantic analysis  message-digest algorithm 5  slipping windows  spam filtering
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号