page contents

Python爬虫

爬虫是指请求网站并获取数据的自动化程序,又称网页蜘蛛或网络机器,最常用领域是搜索引擎,它的基本流程是明确需求-发送请求-获取数据-解析数据-存储数据。 Python爬虫的主要作用有: 人工...

爬虫是指请求网站并获取数据的自动化程序,又称网页蜘蛛或网络机器,最常用领域是搜索引擎,它的基本流程是明确需求-发送请求-获取数据-解析数据-存储数据。


Python爬虫的主要作用有:

人工收集数据(比如问卷调查)

12306抢票,网络投票

进行数据分析或者是机器学习相关的项目



爬虫的流程:

向起始url发送请求,并获取响应

对响应进行提取

如果提取url,则继续发送请求获取响应

如果提取数据,则将数据进行保存


  • 发表于 2021-03-19 14:57
  • 阅读 ( 826 )
  • 分类:Python开发

你可能感兴趣的文章

相关问题

0 条评论

请先 登录 后评论

作家榜 »

  1. 轩辕小不懂 2403 文章
  2. 小柒 1470 文章
  3. Pack 1135 文章
  4. Nen 576 文章
  5. 王昭君 209 文章
  6. 文双 71 文章
  7. 小威 64 文章
  8. Cara 36 文章