page contents

7个 Python小项目,从教程到图片演示——5分钟教会Python新手

推荐你看一下GitHub上这些常见的网站爬虫例子, 代码通用性较高,时效性较久。项目代码对新手比较友好,是简单的python代码,并配有大量注释。 1.淘宝模拟登录 使用教程 点击这里下载下载ch...

推荐你看一下GitHub上这些常见的网站爬虫例子,

代码通用性较高,时效性较久。项目代码对新手比较友好,是简单的python代码,并配有大量注释。

1.淘宝模拟登录

使用教程

点击这里下载下载chrome浏览器查看chrome浏览器的版本号,点击这里下载对应版本号的chromedriver驱动pip安装下列包

pip install selenium

点击这里登录微博,并通过微博绑定淘宝账号密码在main中填写chromedriver的绝对路径在main中填写微博账号密码

#改成你的chromedriver的完整路径地址

chromedriver_path = "/Users/bird/Desktop/chromedriver.exe"

#改成你的微博账号

weibo_username = "改成你的微博账号"

#改成你的微博密码

weibo_password = "改成你的微博密码"

演示图片

7个 Python小项目,从教程到图片演示——5分钟教会Python新手

2.天猫商品数据爬虫

使用教程

点击这里下载下载chrome浏览器查看chrome浏览器的版本号,点击这里下载对应版本号的chromedriver驱动pip安装下列包

  • pip install selenium
  • pip install pyquery

点击这里登录微博,并通过微博绑定淘宝账号密码在main中填写chromedriver的绝对路径在main中填写微博账号密码

#改成你的chromedriver的完整路径地址

chromedriver_path = "/Users/bird/Desktop/chromedriver.exe"

#改成你的微博账号

weibo_username = "改成你的微博账号"

#改成你的微博密码

weibo_password = "改成你的微博密码"

演示图片

7个 Python小项目,从教程到图片演示——5分钟教会Python新手


7个 Python小项目,从教程到图片演示——5分钟教会Python新手


3.爬取淘宝我已购买的宝贝数据

使用教程

点击这里下载下载chrome浏览器查看chrome浏览器的版本号,点击这里下载对应版本号的chromedriver驱动pip安装下列包

  • pip install selenium
  • pip install pyquery

点击这里登录微博,并通过微博绑定淘宝账号密码在main中填写chromedriver的绝对路径在main中填写微博账号密码

#改成你的chromedriver的完整路径地址

chromedriver_path = "/Users/bird/Desktop/chromedriver.exe"

#改成你的微博账号

weibo_username = "改成你的微博账号"

#改成你的微博密码

weibo_password = "改成你的微博密码"

演示图片

7个 Python小项目,从教程到图片演示——5分钟教会Python新手


7个 Python小项目,从教程到图片演示——5分钟教会Python新手

4.每天不同时间段通过微信发消息提醒女友

简介

有时候,你很想关心她,但是你太忙了,以至于她一直抱怨,觉得你不够关心她。你暗自下决心,下次一定要准时发消息给她,哪怕是几句话,可是你又忘记了。你觉得自己很委屈 ,但是她又觉得你不负责。

现在,再不用担心了,用python就可以给女友定时发提示消息了,而且不会漏过每一个关键时刻,每天早上起床、中午吃饭、晚上吃饭、晚上睡觉,都会准时发消息给她了,而且还可以让她学习英语单词哦!

在生日来临之时,自动发祝福语。在节日来临之时,比如**三八妇女节、女神节、情人节、春节、圣诞节**,自动发问候语哦,再也不用担心他说你没有仪式感了

最重要的时候,实时可以知道女友的情感情绪指数哦,再也不用担心女友莫名其妙生气了。

使用教程

1.pip安装下列包

  • pip install wxpy
  • pip install requests

2.设置以下内容

  • 设置config.ini相关信息

演示图片

7个 Python小项目,从教程到图片演示——5分钟教会Python新手


7个 Python小项目,从教程到图片演示——5分钟教会Python新手


7个 Python小项目,从教程到图片演示——5分钟教会Python新手

5.爬取5K分辨率超清唯美壁纸

简介

壁纸的选择其实很大程度上能看出电脑主人的内心世界,有的人喜欢风景,有的人喜欢星空,有的人喜欢美女,有的人喜欢动物。然而,终究有一天你已经产生审美疲劳了,但你下定决定要换壁纸的时候,又发现网上的壁纸要么分辨率低,要么带有水印。


这里有一款Mac下的小清新壁纸神器Pap.er,可能是Mac下最好的壁纸软件,自带5K超清分辨率壁纸,富有多种类型壁纸,当我们想在Windows或者Linux下使用的时候,就可以考虑将5K超清分辨率壁纸爬取下来。

使用教程

  1. 确保以下库均已安装:

# 如果没有安装,请使用pip install module安装

import requests

import filetype

import os

import json

from contextlib import closing

演示图片

7个 Python小项目,从教程到图片演示——5分钟教会Python新手


7个 Python小项目,从教程到图片演示——5分钟教会Python新手

6.爬取豆瓣排行榜电影数据(含GUI界面版)

简介

这个项目源于大三某课程设计。平常经常需要搜索一些电影,但是不知道哪些评分高且评价人数多的电影。为了方便使用,就将原来的项目重新改写了。当做是对爬虫技术、可视化技术的实践了。主要是通过从排行榜和从影片关键词两种方式爬取电影数据。

使用教程

打开http://chromedriver.storage.googleapis.com/index.html,根据自己的操作系统下载对应的chromedriver

打开当前面目录下的**getMovieInRankingList.py**,定位到第59行,将executable_path=/Users/bird/Desktop/chromedriver.exe修改成你自己的chromedriver路径

打开pycharm,依次安装以下包

  • pip install Pillow
  • pip install selenium

演示图片

7个 Python小项目,从教程到图片演示——5分钟教会Python新手


7个 Python小项目,从教程到图片演示——5分钟教会Python新手

包含功能

根据关键字搜索电影

根据排行榜(TOP250)搜索电影

显示IMDB评分及其他基本信息

提供多个在线视频站点,无需vip

提供多个云盘站点搜索该视频,以便保存到云盘

提供多个站点下载该视频

等待更新

存在问题

目前没有加入反爬虫策略,如果运行出现403 forbidden提示,则说明暂时被禁止,解决方式如下:

加入cookies

采用随机延时方式

采用IP代理池方式(较不稳定)


7.多线程+代理池爬取天天基金网、股票数据(无需使用爬虫框架)

简介

提到爬虫,大部分人都会想到使用Scrapy工具,但是仅仅停留在会使用的阶段。为了增加对爬虫机制的理解,我们可以手动实现多线程的爬虫过程,同时,引入IP代理池进行基本的反爬操作。本次使用天天基金网进行爬虫,该网站具有反爬机制,同时数量足够大,多线程效果较为明显。

技术路线

  • IP代理池
  • 多线程
  • 爬虫与反爬

数据格式

000056,建信消费升级混合,2019-03-26,1.7740,1.7914,0.98,2019-03-27 15:00000031,华夏复兴混合,2019-03-26,1.5650,1.5709,0.38,2019-03-27 15:00000048,华夏双债增强债券C,2019-03-26,1.2230,1.2236,0.05,2019-03-27 15:00000008,嘉实中证500ETF联接A,2019-03-26,1.4417,1.4552,0.93,2019-03-27 15:00000024,大摩双利增强债券A,2019-03-26,1.1670,1.1674,0.04,2019-03-27 15:00000054,鹏华双债增利债券,2019-03-26,1.1697,1.1693,-0.03,2019-03-27 15:00000016,华夏纯债债券C,2019-03-26,1.1790,1.1793,0.03,2019-03-27 15:00

功能截图

7个 Python小项目,从教程到图片演示——5分钟教会Python新手

配置说明

# 确保安装以下库,如果没有,请在python3环境下执行pip install 模块名

import requests

import random

import re

import queue

import threading

import csv

import json

  • 发表于 2020-02-22 16:23
  • 阅读 ( 580 )
  • 分类:Python开发

你可能感兴趣的文章

相关问题

0 条评论

请先 登录 后评论
Pack
Pack

1135 篇文章

作家榜 »

  1. 轩辕小不懂 2403 文章
  2. 小柒 1470 文章
  3. Pack 1135 文章
  4. Nen 576 文章
  5. 王昭君 209 文章
  6. 文双 71 文章
  7. 小威 64 文章
  8. Cara 36 文章