首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
提出一种融合卡方统计和TF-IWF算法的短文本分类方法,通过卡方统计对训练数据集提取特征词,由TF-IWF算法赋予特征词权重,使用SVM分类器进行分类。实验结果表明:融合卡方统计和TF-IWF方法在文本分类准确率上提升3.1%,召回率提升5.2%,F1值提升3.7%。该方法扩大了特征词权重值的范围,使文本集的权值方差增大,一定程度上解决了短文本内容稀疏性的问题,从而提高短文本分类的性能。  相似文献   

2.
研究了一类新的广义集值变分包含:0∈N(w,y)+A(z ,u).在实Hilbert空间中,利用极大单调算子的性质,建立了广义集值变分包含和不动点问题间的等价性.利用这种等价性,建立了一些摄动迭代算法,并证明了近似解序列强收敛于精确解.  相似文献   

3.
针对传统谱聚类算法无法自动确定聚类数目,初始聚类中心K值依赖性较强以及算法全局寻优能力较差等问题,提出了一种基于人工蜂群算法的自适应谱聚类算法。将本征间隙的思想引入谱聚类算法中,在拉普拉斯矩阵的基础上构造本证间隙序列,从而解决初始聚类数目问题。利用人工蜂群算法全局搜索能力强的优点弥补谱聚类算法易陷入局部最优的缺点,同时,为防止人工蜂群算法出现早熟现象,改进了其位置搜索公式。通过标准测试函数以及UCI数据库中的不同数据集进行实验仿真,结果表明改进算法弥补了原算法的不足。  相似文献   

4.
研究了一类新的无穷簇广义集值拟变分不等式问题,利用Nadler定理,得到并构造了逼近解的迭代算法,证明了这类拟变分不等式的解的存在性及该算法产生的迭代序列的收敛性。  相似文献   

5.
因为恶意网购(评价)行为具有偶发性和隐蔽性,所以成为卖家和网购平台提供者关注的问题。针对这一问题,本文设计了一种方案,即通过分析网上购物历史交易数据集(偏斜数据集),找出恶意评价行为的"特征"。本文使用3组UCI中的偏斜数据集进行实验,首先使用了两种能够让偏斜数据集趋于平衡的算法(SSGP、Ensemble算法),再对平衡算法处理后的数据集分别使用经典分类和神经网络算法,最后通过对比实验结果发现SSGP+神经网络这一组合算法对处理偏斜程度较高的训练集效果较好,使用这一组合算法对网上购物的历史交易数据集进行分类,得出的结果对卖家判断恶意购买行为具有较高的参考价值。  相似文献   

6.
吴楠 《宿州学院学报》2008,23(2):102-103
大多序列模式挖掘算法在处理呈指数增长的模式时性能有限,而且当输入的数据集很大时,因为主存限制将使其变成不可解的。本文提出基于分区的序列模式挖掘算法,克服了主存限制的缺点,并通过增量聚类方法对数据预处理,得到更合理的分区以提高整体性能。  相似文献   

7.
针对金融时间序列分析中注重快速作出趋势判断的特点,利用数据挖掘的思想和工具,提出一种金融时间序列模式快速发现算法.与传统的预测算法相比较,该算法对数据的分布和平稳性等方面的要求不高,不基于任何假设,能够非常快速地发现时间序列中的频繁模式,经过模式匹配后,可以用于金融时间序列的分析与预测.以实际汇率数据为例,证明了该算法的有效性.  相似文献   

8.
对基于激光测量的管形零件内轮廓母线采样数据进行滤波.提出了基于能量差的加权均值递归滤波算法.该滤波方法中权值求取方法的思想是尽量给滤波窗口内能量频谱相对集中的采样数据赋予较大的权值,而给由于干扰引起的畸变数据赋予较小的权值.合适的滤波窗口长度通过仿真对比试验获得.这一思想的合理性通过仿真分析和实验测试得到验证,并表现出良好的效果.  相似文献   

9.
在q-一致光滑Banach空间中引入和研究了一类新的含(H,η)-增生算子的集值变分包含组问题.利用所定义的(H,η)-增生算子的预解算子,给出了此类变分包含组的迭代算法,并证明了由该算法生成的迭代序列的强收敛性.所得结果改进和推广了最近一些文献中的相应结果.  相似文献   

10.
序列最小化算法(SMO)是支持向量机重要的常用分解方法。而工作集的选择是实现序列最小优化算法的关键。通过重写KKT条件,提出了一种改进的新工作集选择方法,并相应提出最小化步骤。通过将改进的支持向量机方法应用于网络用户行为数据的分析,与现有方法进行对比测试,验证了新工作集选择方法将减少支持向量机的学习时间并加快收敛过程,改进的支持向量机方法在运行效率和准确度上都有不同程度的提高。  相似文献   

11.
交巡警服务平台的设置与调度问题是以该城市的实际情况与需求为原则,交通网络建立基于邻接表结构的计算机存储模型,用JAVA语言实现的Dijkstra算法,利用该算法进行交巡警服务平台到各节点的最优路径计算,得到权值矩阵,利用指派问题求解算法结合案发率等数据进行平台管辖范围的划分。用递归搜索算法计算案发后罪犯的活动封锁范围,确定交巡警平台到必要关卡的调度关系,采用逐步缩小封锁范围的策略达到围堵罪犯的最终目的。  相似文献   

12.
针对协同过滤推荐系统中数据稀疏性导致推荐准确性低下问题,提出信任传递的矩阵分解推荐算法.该算法利用用户社交网络的直接信任关系,基于信任传递思想,预测用户在社交网络中的间接信任关系,以解决社交网络信任关系的稀疏性问题.该算法使用填充后的社交网络信任数据,预测填充用户评分数据,以解决用户评分数据的稀疏性问题;将处理后的用户评分数据在基于正则化迭代最小二乘方法推荐系统中进行应用,取得良好效果.实验结果表明:使用Epinions数据集,相比传统的矩阵分解算法,该算法的平均绝对误差下降了10.77﹪.  相似文献   

13.
肝脏CT图像三维分割研究   总被引:1,自引:0,他引:1  
针对肝脏CT图像的特征,提出了一种将种子区域生长算法和改进Snake模型相结合的策略,实现了肝脏的三维分割提取。该方法先从CT图像序列中筛选出肝脏有明显成像边缘的一张切片,在其肝脏区域内选择若干个种子点,利用种子区域生长算法得到初始边缘,再利用改进的Snake模型对初始边缘进行优化,然后,将此切片的边缘轮廓作为与其相邻切片上的初始边缘,重复该过程,直到分割完所有切片。实验表明该算法具有较高效率,分割结果精确,所产生的分割结果可以作为三维重建合适的数据集。  相似文献   

14.
针对传统的时间序列分析方法预测科学数据效果较差的特点,提出了一种结合自组织神经网络和灰色理论的时间序列预测方法。该方法利用度量时间序列相似性距离函数,将时间序列按照其变化规律分成不同的类别,并在GM算法中针对白化参数进行优化,对科学数据时间序列进行自组织聚类,针对各类别采用灰色理论建立预测模型。试验表明,该模型适合科学数据的变化特点,提高了预测精度。  相似文献   

15.
对于常用机器学习分类算法在不均衡数据上分类性能较差的问题,提出了一种基于生成对抗网络(GAN)的不平衡数据分类策略。所提出的策略首先利用生成对抗网络通过训练生成少数类样本,改善样本不均衡问题。使用机器学习分类器对改善后的数据集进行分类,提升该模型的分类性能。实验使用了商业银行客户数据集,采用Precision、F-mean等作为度量指标,并与SMOTE等传统数据不均衡处理方法进行对比。实验结果表明:对于不平衡数据集的二分类问题,提出的GAN模型在银行客户流失分类问题中具有可行性和适应性。最终取得了良好的度量效果,有很强的适用性及应用价值。  相似文献   

16.
蓝牙的E0加密算法是利用四个移位序列进行延迟并组合生成密流序列。利用其密流序列的相关性对算法进行攻击。攻击过程是基于给定有限的输出加密流,重新导出移位序列的初始值。基本攻击和优化攻击的时间复杂度分别为O(283)和O(278)。最后给出了该攻击手段的E0算法的改进方案和实验数据。  相似文献   

17.
针对多个不等强度的大功率窄带干扰,提出了一种权值反馈的频域自适应滤波算法。其优点是利用权值反馈不仅在权值迭代过程中实时调整更新步长,实现算法的快速收敛,同时达到有效地抑制多个强干扰的目的,使输出信号的平均功率更接近于扩频信号功率,改善了DSSS系统的性能。同时将算法的数学推导和分析与无权值反馈自适应滤波算法进行了比较,仿真结果验证了该算法在加快收敛速度以及改善系统性能方面的有效性。  相似文献   

18.
研究一类新的集值拟变分包含,在实Hilbert空间中,利用预解算子技术,建立了集值拟变分包含、预解方程和不动点问题间的等价性。利用该等价性,建立了新的迭代算法,得到了这种变分包含解的存在性定理。该文提出的算法和结果推广和改进了近年来许多作者所作的算法和结果。  相似文献   

19.
GDP增速与CPI指数具有复杂的时间序列和非线性特征。鉴于BP神经网络算法有良好的非线性拟合能力,但容易陷入局部极小值的特点,提出了基于主成分分析的PSO-BP算法。该方法主要通过主成分分析方法对输入变量进行降维,利用PSO算法良好的全局寻优能力对BP算法的权值和阈值进行优化,从而避免BP算法陷入局部极小值。最后运用模型对GDP增速和CPI指数进行拟合预测。实验结果表明:该模型比PCA-BP模型和PSO-BP模型具有更高的拟合精度和更小的均方误差。  相似文献   

20.
针对检测和消除数据仓库中的相似重复记录问题,提出了数据仓库中的相似重复记录检测方法。该方法先通过等级法计算每个字段的权值;然后,按照分组思想,选择关键字段或字段某些位将大数据集分割成许多不相交的小数据集;最后,在各个小数据集中检测和消除相似重复记录,为避免漏查,再选择其他关键字段或字段某些位重复多次检测。理论分析和实验表明,该方法不仅具有好的检测精度,而且具有很好的时间效率,能够有效地解决大数据量的相似重复记录检测问题。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号