HtmIParser提取网页信息的设计与实现

黄颖; 黄治平

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

HtmIParser提取网页信息的设计与实现

作者：黄颖; 黄治平

来源：江西理工大学学报, 2007, (06): 26-28+35.

摘要

互联网上信息量的激增,迫切需要一些自动化的工具帮助人们在海量信息源中迅速找到真正需要的信息,如标题、链接、email和图片等,而HTML语言所表述的web页面经浏览器分析后只适合浏览,不适合作为一种数据交换的方式由机器处理,文中详细介绍了如何使用HtmlParser来提取网页当中的超链接信息,将其清洗后存入SQL数据库当中,以备后续工作使用。

出版日期2007
单位江西理工大学; 赣南师范大学

收藏分享被引浏览

更新时间：2019-01-07 21:32

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号