首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
网络爬虫一般从一个起始网页开始,读取网页的内容和网页中的链接,依次循环下去,直到找到此网页所有的链接网页为止;当要爬取的数据量比较大时,传统的技术存在一定弊端,而Hadoop开源云计算框架在数据采集方面会有一定的优势。在介绍Hadoop云计算框架的基础上,本文阐述网络爬虫的原理,并实现基于Hadoop的网络爬虫。  相似文献   

2.
个性化推荐系统能产生针对性的、个性化的信息来满足不同用户需求,但也很容易受到用户描述文件注入恶意攻击,影响正常的推荐结果。针对该问题,分析和研究了描述文件的形式化模型、描述文件的属性及分类方法,应用粗糙集理论,设计了数据预处理离散化、决策表约简和个性化推荐处理相应算法,提出了一种用户描述文件分类学习和攻击检测的方法;为降低攻击对推荐结果的影响,完善了推荐系统的安全,设计出一种动态交互的个性化推荐模型框架。实例证明,用户描述文件的属性分类及检测方法是有效的,准确率高,能够有效地改善个性化推荐系统模型的安全。  相似文献   

3.
为了解决协同过滤推荐系统的数据稀疏与冷启动问题,通常利用辅助信息来提高推荐系统的整体性能。当前大多数社交媒体网站和电子商务系统都允许用户发表文本评论,以及对项目(如商户、电影、商品等)进行评分。为了更加有效地融合多种数据信息,解决数据稀疏的问题,提高推荐算法的准确性,构建了一个基于用户-项目历史交互数据源融合知识图谱的模型,提出了基于用户-项目历史评论的深度学习算法,将2种算法动态融合,利用随机梯度下降方法进行模型求解,为用户提供更精准的个性化推荐服务。实验结果表明:相比于已有典型推荐算法,所提模型取得更好的推荐效果,并且可以有效地解决数据稀疏带来的推荐准确性降低的问题。  相似文献   

4.
随着Intemet的发展,用户面对网络上太多的信息难以及时消化、吸收,而且还不知道如何确切地表达对网上资源的需求,也不清楚如何准确有效地寻找资源。个性化信息服务系统能够根据用户的兴趣偏好主动推荐他所需的资料,即从Web Log文件中挖掘出用户感兴趣的浏览模式,在线向用户提供推荐服务,指导用户的浏览,提高搜索效率和准确率。  相似文献   

5.
构建个性化知识推荐系统是数字图书馆实现个性化信息服务的有效手段,推荐服务的关键在于完整地理解用户兴趣并准确作出推荐.文章提出了一种基于语义扩展的知识推荐方法,通过分析读者文献检索、浏览的行为提取读者偏好.利用扩展激活模型扩充读者偏好档案,对文献信息资源进行匹配和分级,通过文献的级别决定推荐的次序,对推荐信息进行反馈,动态更新读者的偏好档案.  相似文献   

6.
恶意爬虫蕴含计算机信息系统破坏、计算机信息系统侵入、计算机信息系统数据泄露三重风险,有必要对其进行刑事规制。为避免刑事打击泛化,应依据网络爬虫运行流程对其作出情景化区分,根据不同情境下网络爬虫所含风险特征作法律性质辨析,以此建构恶意爬虫入罪路径,并划定刑事规制范围。当数据抓取行为违反授权判断型技术措施、所抓取数据已侵害数据安全法益、达到相当危害程度,则属于恶意网络爬虫,应予刑事规制。  相似文献   

7.
浅谈高校图书馆网页的创意制作   总被引:3,自引:0,他引:3  
高校图书馆网页的创意制作要有步骤地进行.要精心设计网页,把因特网资源组织分类规范化,要设计好一级标题和二级标题.只要不断更新、完善网页,就能给用户提供最新最可靠的信息.  相似文献   

8.
网页是网络信息组织与传播的主要表现形式.网页编辑通过应用程序的操作对信息加以组织、取舍以更加有利于信息的传播,网页编辑学研究的是信息资源通过网页模式进行开发、设计与管理的实践,并对其进行理论总结,以探讨网页编辑工作的规律、特征与方法.网页编辑系统内部分工的专业化趋势等原因也使得网页编辑学作为一门科学编辑学分支的基本条件已经成熟.  相似文献   

9.
在庞大的网页组成的信息网络上利用链接信息进行信息搜索是极具挑战性的工作。传统的方法是将网页看成同质的或者是将异质的网络先投影为同质的网络加权后进行相似性分析然后推荐,这样做简化了问题但使得一些异质网络上的信息损失了。在收集了豆瓣小组成员读书的信息后,运用的判定树分析方法是在没有投影的情况下,对小组、组员、书籍含有三种类型节点的异质网络直接进行分析,发现一些小众书籍得到推荐通过的路径是小组,组员关注的其他成员这条路径获得的。研究的结论与传统的推荐方法不同且对如何分析异质性网络提供了方法上的创新。  相似文献   

10.
推荐过载会导致旅游推荐系统用户的不持续使用行为。为揭示该过程的影响机制,本文以SSO框架为主体,引入倦怠和心理弹性两个变量构建了一个有调节的中介模型,并对回收的214份问卷进行实证研究,结果显示(:1)信息过载和系统功能过载均与不持续使用行为呈显著正相关(;2)旅游推荐系统倦怠在由过载引起不持续使用行为的过程中产生显著中介作用;(3)心理弹性在系统功能过载与旅游推荐系统倦怠之间起调节作用。本研究为旅游推荐系统开发者理解用户不持续使用行为提供了参考。  相似文献   

11.
网络爬虫是一项能够根据指令自动搜索并抓取指定网络信息内容的新兴互联网技术,存在被滥用之风险。作为爬取网络版权数据信息的工具,网络爬虫行为版权侵权现象时有发生。目前,对于网络爬虫行为版权侵权的规制多见于民法与刑法领域,忽视了行政规制。目前存在的网络爬虫行为侵权规制过于依赖司法手段、缺乏针对网络爬虫行为的必要规范以及行政机关针对网络爬虫行为的互联网监管缺失等问题,阻碍了网络爬虫行为版权侵权行政规制的应用与发展。对此,可以从构建网络爬虫行为版权侵权的全覆盖预警系统、完善网络爬虫行为版权规范内容和设置网络爬虫使用者自律管理义务等方面着手,充分利用行政手段遏制网络爬虫行为版权侵权,保护版权权利人的合法权益。  相似文献   

12.
高等学校图书馆的网页设计应以图书馆性质和读者利用为出发点,以信息传递和资源检索为目的。高等学校图书馆网页设计的基本原则,应根据审美需求,页面的形式和内容要统一有序;文字的设计风格是同网页的整体风格相一致,含义准确,优美流畅;图片设计风格同相关文字相配合,悦目、突出重点,和谐整齐;可以利用现代视频技术,适度展示网页的视听效果。高等学校图书馆网页设计应科学选用网页制作工具,使网页能在各种浏览器中表现统一的样式;必须提供网页使用的说明,提示用户注重下载速度;充分利用页面空间,建立友好的用户界面。  相似文献   

13.
以移动互联网营销中主动式推荐信息为对象, 探索用户对主动式推荐信息接受意愿的影响因素. 基于移动互联网主动式推荐信息的实际情况和心理抗拒理论, 构建了心理抗拒影响因素通过心理抗拒影响接受意愿的概念模型. 以情景实验的方式收集了264份有效问卷, 并利用结构方程模型对假设进行了检验. 研究结果表明: 用户对移动互联网主动式推荐信息的接受意愿受到心理抗拒的影响, 而后者又会受到信息、 情境和受众三个方面因素的影响.  相似文献   

14.
在传统的推荐算法中存在数据评分稀疏的问题,同时,在建立预测模型时默认每个用户评分都是真实可信的.但实际评分中存在某些数据不符合用户的整体评分趋势和偏好.为了解决上述问题,对每项用户评分的真实性进行计算,在进行评分预测时,使符合用户整体评分趋势的评分数据获得更高的权重,让推荐算法更精准的把握用户和项目的特征信息,提升推荐系统的整体性能.经过在Movie Lens 100k数据集上与其它三种经典算法的对比实验表明,本文提出的改进算法能更好地把握用户真实喜好,提高预测的准确性.  相似文献   

15.
传统的Web应用只提供有限的静态Web页面,不能根据用户的需求提供不同的信息(包括显示格式和内容)。随着计算机和互联网技术的飞速发展,由于动态网页具有良好的交互性、数据库查询、缩短查询时间、提高浏览效率等一些静态网页所无法比拟的优点,逐渐成为构建WEB网站的主流。常见的动态网页技术有CGI、JSP、ASP和PHP等几种。  相似文献   

16.
随着网络爬虫技术的信息收集能力不断提升,其在被滥用时所造成的损失日益严重。认定“非法收集”个人信息,不仅应考察方法本身是否具有非法性质,还应考察收集信息的依据或资格。对突破反爬虫技术措施收集个人信息的行为,应根据法条之间的竞合关系,适用侵犯公民个人信息罪。对正常登录系统收集个人信息的行为,应考察收集行为是否出于履职的必要。对收集网站外部访问者的个人信息的行为,应根据网站功能、浏览内容确定信息的收集权限。  相似文献   

17.
动态网站可以接收和处理用户的请求信息,并生成在内容和格式上都符合用户个性化要求的网页。本文主要阐述利用URL参数采创建满足不同类型用户要求的个性化网站和在动态网站中创建"主-详细页"的方法。  相似文献   

18.
近年来,随着Internet的快速发展,互联网已经成为了用户生活中的一部分,它能方便于用户浏览网页信息。于是电子商务慢慢地发展起来,越来越多的商家开始在网上建起网店,向消费者群提供了一些全新的购物理念。  相似文献   

19.
针对微博用户兴趣多样性和变化度较大的特点,通过对传统微博用户兴趣模型的改进,实现了精准为微博用户推荐感兴趣的信息.  相似文献   

20.
针对传统协同过滤中对整个用户网络进行运算的数据量较大、推荐效率不高的问题,将用户-项目二分网转化为由用户构成的社会网络,基于中心节点重叠社区发现的思想进行加权网社区划分以充分利用网络结构信息。在社区内部采用加权相似度与top-n算法相结合的方法进行项目推荐,并将Movie Lens数据集作为测试数据。通过与传统协同过滤的对比可见,基于中心节点重叠社区发现的top-n算法的个性化推荐方法在保证推荐精度的前提下,使推荐效率得到大幅度提升。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号