基于二叉树模型的HTML转换为XML的方法 |
| |
引用本文: | 柏彬,牛红利.基于二叉树模型的HTML转换为XML的方法[J].才智.人事人才,2010(3). |
| |
作者姓名: | 柏彬 牛红利 |
| |
作者单位: | 贵州大学计算机科学与信息学院; |
| |
摘 要: | 在对Web中的HTML文档进行数据抽取的过程中,由于HTML文档结构的不严谨,因此快速而又正确地把不规范的HTML文档转换成XML文档在数据抽取的过程中是十分重要的。本文主要讨论了如何采用二叉树模型来实现上述转换工作。
|
关 键 词: | 数据抽取 HTML XML 二叉树模型 |
本文献已被 CNKI 等数据库收录! |
|