浅析Python网络爬虫

曲伟峰

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

浅析Python网络爬虫

作者：曲伟峰

来源：计算机产品与流通, 2019, (09): 108.

摘要

爬虫,被称为网络机器人,在FOAF社区中间,更经常的称为网页追逐者,是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本,主要用于搜索引擎,它将一个网站的所有内容与链接进行阅读,并建立相关的全文索引到数据库中,然后跳到另一个网站。传统爬虫从一个或若干初始网页的URL开始,获得初始网页上的URL,再不断从当前页面上抽取新的URL放入队列,直到满足系统的一定停止条件。

出版日期2019
单位辽宁轻工职业学院

收藏分享被引(2) 浏览

更新时间：2024-04-10 20:14

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号