基于近邻规则和粒子群优化的半监督自标记方法期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

按检索

基于近邻规则和粒子群优化的半监督自标记方法

引用本文：	周鹏,刘河,黎隽男.基于近邻规则和粒子群优化的半监督自标记方法[J].统计与决策,2023(18):44-49.

作者姓名：	周鹏刘河黎隽男

作者单位：	1. 重庆人文科技学院工商学院;2. 重庆市教育科学研究院;3. 重庆工商大学人工智能学院

摘要：	自标记方法能用少量有标记样本和大量无标记样本来训练给定分类模型。误标记是自标记方法中的主要挑战。尽管学者们用数据剪辑技术去识别和移除在自标记方法迭代过程中被误预测的样本，但是许多数据剪辑技术严重依赖于特定假设。为了克服误标记问题和相关解决方案中的缺陷，文章提出一种基于近邻规则和粒子群优化的自标记方法 SLM-NNPSO。首先，SLM-NNPSO用有标记集去训练一个给定的分类模型。其次，SLM-NNPSO用近邻规则来发现具有高置信度的无标记样本，并用被训练的分类模型来预测他们。再次，SLM-NNPSO用粒子优化来识别和移除被误预测的样本，并把被正确预测的样本加入有标记集中。上述过程不断迭代，直到SLM-NNPSO没有发现具有高置信度的无标记样本。最后，SLM-NNPSO输出在迭代过程中被训练的分类模型。经仿真实验证明，就训练k近邻分类器的平均分类正确率而言，在来自销售市场、医学检测、图像识别等领域的12个真实数据集上，SLM-NNPSO优于5个流行的自标记方法。
关键词：	统计机器学习数据挖掘半监督分类自标记方法粒子群优化算法智能管理

设为首页 | 免责声明 | 关于勤云 | 加入收藏