共查询到20条相似文献,搜索用时 15 毫秒
1.
针对用户评分数据稀疏性问题,在对项目进行聚类基础上,文章提出了基于属性聚类的项目评分预测推荐算法。算法从项目属性特征相似性分析出发,利用K-Means聚类算法对项目进行聚类。对于未评分项目找到其所属的类簇;利用用户对类簇中其它项目的评分预测该用户对未评分项目的评分,达到降低数据稀疏性目的;最后结合协同过滤思想为用户提供推荐服务。实验结果表明,与基于项目评分预测的推荐算法相比,文章的算法推荐精度显著提高。 相似文献
2.
基于内容过滤的电子商务推荐算法分析 总被引:1,自引:0,他引:1
一、数据处理
1.数据处理流程
首先将用户当前访问序列转变为兴趣主题向量,连同从用户历史购物数据和Web日志中抽取的特征向量进行加权和运算,得到初始推荐模型,再计算初始向量和当前访问序列之间的相似度,最后为每一个兴趣主题设置最优的初始相似度阈值. 相似文献
3.
Rough Set综合评价算法的优化及应用 总被引:2,自引:0,他引:2
粗集理论是由波兰数学家Z.Pawlak,在20世纪80年代初提出的一种处理模糊和不精确性问题的新型数学工具,粗集理论在处理有限元集合数据时,即不需要关于数据的任何附加信息,也无需预先给定某些特征或属性的数量描述,如统计学中的概率分布、模糊集理论中的隶属度或隶属函数等,通过对大量数据进行分析,根据论域中等价关系的依赖关系,剔除相容信息,抽取潜在有价值的规则知识.依据粗糙集理论的对象分类能力,以及粗糙集理论中的知识依赖性和属性重要性度量方法,可以得出一种完全数据驱动的综合评价方法,它克服了传统方法存在的主观性和片面性的问题,本文将属性的同分辨能力数引入到粗糙集评价,优化了评价算法. 相似文献
4.
5.
6.
7.
8.
粗糙集条件信息熵权重确定方法的改进 总被引:2,自引:0,他引:2
权重确定是决策和评价的重要环节.文献[1]基于粗糙集条件信息熵的权重确定方法是为了避免冗余属性权重为0的情况,但是该方法得到的冗余属性的重要度却高于非冗余属性的重要度.通过对文献[1]粗糙集条件信息熵权重确定方法的分析,找出相矛盾的原因,并讨论了属性重要度优先级队列的构造,进而在此基础上提出了以粗糙集的代数理论为基础的粗糙集条件信息熵权重确定的改进方法. 相似文献
9.
文章在项目方案综合评价系统中,根据项目特点构建了评价指标体系,考虑到定性与定量指标的处理,以及为了克服单一评价方法的不足,建立了基于集值统计法、层次分析法和属性分析法的综合评价模型。通过案例分析表明,该综合评价模型及方法充分融合集值统计法、层次分析法和属性分析法的优点,具有较广的实用性。 相似文献
10.
文章通过分析现有的基于蕴涵算子的相似度量方法的不足,提出了一个新的基于R0蕴涵算子的Vague集相似度量方法,并证明该方法符合Vague集相似度量基本准则,通过与现有的相似度量比较,指出了现有相似度量方法的主要问题,说明新的相似度量方法克服了现有相似度量方法的缺点,度量结果是合理的,对不同数据的相似度具有较好的区分能力. 相似文献
11.
针对只有部分权重信息已知且属性为混合型的航空公司航线决策问题,对用模糊语言和实数表示的属性进行了区间化处理,把多混合属性决策转化为属性值为区间数的多属性决策.然后基于推广定义的相离度和可能度计算公式,利用线性规划模型求取属性权重且依据求取的可能度排序向量给出了航线排序,最后通过实例说明了方法的可行性和有效性. 相似文献
12.
文章针对食品供应商选择的多属性决策问题,提出了基于犹豫模糊语言的TODIM方法.首先基于均匀分布的概率准则给出了犹豫模糊语言排序的可能度公式;进一步考虑到TODIM决策方法能够充分考虑决策者心理行为,构造了基于犹豫模糊语言TODIM方法;结合算例,较好地解决了食品供应商选择问题. 相似文献
13.
14.
连续属性离散化在人工智能和数据挖掘领域具有重要的作用。文章用杂度削减指标来量化离散化后区间内的一致性和区间之间的差异性,进而提出了基于这一指标的离散化方法。通过调整最小杂度削减阈值并构建二叉树来确定划分区间的断点,能够有效地寻求全局最优的离散化方案。模拟实验验证了该方法相对于传统方法的优势。 相似文献
15.
《统计与信息论坛》2019,(2):121-128
在大数据时代,数据挖掘技术在聚合信息客户端中的应用有利于提高聚合信息企业的运行效率。基于聚合信息企业的实际运营和用户数据,从用户登录行为和文章推荐数据库两个角度,利用机器学习算法,构建用户登录行为预测模型和优秀文章分类模型。研究发现,随机森林和Logistic回归模型在互联网大数据分析中的综合表现最好,在分类预测准确度和运行速度方面明显优于其他模型;用户对平台的使用频率和依赖度是决定其登录行为的最关键因素,且区域用户习惯和年龄显著影响用户的登录决策;文章基本信息和自媒体属性均对优秀文章筛选有显著影响,其中,文章等级、自媒体的产量和自媒体专注度等均与文章质量存在显著的负相关关系;发文类型、是否原创和自媒体领域等分类变量各水平之间都存在显著差异,且均会影响用户对文章的青睐程度。 相似文献
16.
零膨胀计数数据破坏了泊松分布的方差-均值关系,可由取值服从泊松分布的数据和取值为零(退化分布)的数据各占一定比例所构成的混合分布所解释。本文基于自适应弹性网技术, 研究了零膨胀计数数据的联合建模及变量选择问题.对于零膨胀泊松分布,引入潜变量,构造出零膨胀泊松模型的完全似然, 其中由零膨胀部分和泊松部分两项组成.考虑到协变量可能存在共线性和稀疏性,通过对似然函数加自适应弹性网惩罚得到目标函数,然后利用EM算法得到回归系数的稀疏估计量,并用贝叶斯信息准则BIC来确定最优调节参数.本文也给出了估计量的大样本性质的理论证明和模拟研究,最后把所提出的方法应用到实际问题中。 相似文献
17.
18.
19.