基于近邻规则和粒子群优化的半监督自标记方法 |
| |
引用本文: | 周鹏,刘河,黎隽男.基于近邻规则和粒子群优化的半监督自标记方法[J].统计与决策,2023(18):44-49. |
| |
作者姓名: | 周鹏 刘河 黎隽男 |
| |
作者单位: | 1. 重庆人文科技学院工商学院;2. 重庆市教育科学研究院;3. 重庆工商大学人工智能学院 |
| |
摘 要: | 自标记方法能用少量有标记样本和大量无标记样本来训练给定分类模型。误标记是自标记方法中的主要挑战。尽管学者们用数据剪辑技术去识别和移除在自标记方法迭代过程中被误预测的样本,但是许多数据剪辑技术严重依赖于特定假设。为了克服误标记问题和相关解决方案中的缺陷,文章提出一种基于近邻规则和粒子群优化的自标记方法 SLM-NNPSO。首先,SLM-NNPSO用有标记集去训练一个给定的分类模型。其次,SLM-NNPSO用近邻规则来发现具有高置信度的无标记样本,并用被训练的分类模型来预测他们。再次,SLM-NNPSO用粒子优化来识别和移除被误预测的样本,并把被正确预测的样本加入有标记集中。上述过程不断迭代,直到SLM-NNPSO没有发现具有高置信度的无标记样本。最后,SLM-NNPSO输出在迭代过程中被训练的分类模型。经仿真实验证明,就训练k近邻分类器的平均分类正确率而言,在来自销售市场、医学检测、图像识别等领域的12个真实数据集上,SLM-NNPSO优于5个流行的自标记方法。
|
关 键 词: | 统计机器学习 数据挖掘 半监督分类 自标记方法 粒子群优化算法 智能管理 |
|
|