page contents

python爬虫csdn博客之星数据

这篇文章主要介绍了python爬虫csdn博客之星数据,具有很好的参考价值,希望对大家有所帮助。一起跟随六星小编过来看看吧

attachments-2021-12-9uOPxMhN61b411348533d.png

这篇文章主要介绍了python爬虫csdn博客之星数据,具有很好的参考价值,希望对大家有所帮助。一起跟随六星小编过来看看吧

一直都有在csdn上发文章,但是从来不知道csdn每年还有一个博客之星的活动,最近偶然看到去了解了下感觉挺有意思的,竞选还有一定的规则,比如对报名的用户的粉丝量,文章原创量,活跃程度等有一定的参考标准,然后默默的看了下自己的数据,差的十万八千里哦。虽然没有资格参加这个竞赛,但是呢我们可以利用爬虫技术看下往年的那些博客之星有啊,通过数据膜拜下大佬们的实力。


首选我们找到目标地址:http://csdn.bytedemo.com/getStatistics
然后通过python获取数据再进行数据分析,找到请求接口后,使用 Python 爬虫很容易将其爬取下来,然后对数据进行处理,按照票数进行排名,完整代码如下:
import org.apache.commons.httpclient.Credentials;
import org.apache.commons.httpclient.HostConfiguration;
import org.apache.commons.httpclient.HttpClient;
import org.apache.commons.httpclient.HttpMethod;
import org.apache.commons.httpclient.HttpStatus;
import org.apache.commons.httpclient.UsernamePasswordCredentials;
import org.apache.commons.httpclient.auth.AuthScope;
import org.apache.commons.httpclient.methods.GetMethod;

import java.io.IOException;

public class Main {
# 代理服务器(产品官网 www.16yun.cn)
private static final String PROXY_HOST = “t.16yun.cn”;
private static final int PROXY_PORT = 31111;

public static void main(String[] args) {
    HttpClient client = new HttpClient();
    HttpMethod method = new GetMethod("https://httpbin.org/ip");

    HostConfiguration config = client.getHostConfiguration();
    config.setProxy(PROXY_HOST, PROXY_PORT);

    client.getParams().setAuthenticationPreemptive(true);

    String username = "16ABCCKJ";
    String password = "712323";
    Credentials credentials = new UsernamePasswordCredentials(username, password);
    AuthScope authScope = new AuthScope(PROXY_HOST, PROXY_PORT);

    client.getState().setProxyCredentials(authScope, credentials);

    try {
        client.executeMethod(method);

        if (method.getStatusCode() == HttpStatus.SC_OK) {
            String response = method.getResponseBodyAsString();
            System.out.println("Response = " + response);
        }
    } catch (IOException e) {
        e.printStackTrace();
    } finally {
        method.releaseConnection();
    }
}

}
根据获取到的数据看了下以往的博客之星的数据,果然是大佬,粉丝量,数据量都是我们遥不可及的,希望自己多多发文,写好的文章发给大家看,收获更多的粉丝,让我也有机会参与这样打的竞选活动呀!


更多相关技术内容咨询欢迎前往并持续关注六星社区了解详情。

如果你想用Python开辟副业赚钱,但不熟悉爬虫与反爬虫技术,没有接单途径,也缺乏兼职经验
关注下方微信公众号:Python编程学习圈,获取价值999元全套Python入门到进阶的学习资料以及教程,还有Python技术交流群一起交流学习哦。

attachments-2022-06-EMN9UU5Y62b17b3da6a0d.jpeg

  • 发表于 2021-12-11 10:47
  • 阅读 ( 410 )
  • 分类:Python开发

你可能感兴趣的文章

相关问题

0 条评论

请先 登录 后评论
轩辕小不懂
轩辕小不懂

2403 篇文章

作家榜 »

  1. 轩辕小不懂 2403 文章
  2. 小柒 1474 文章
  3. Pack 1135 文章
  4. Nen 576 文章
  5. 王昭君 209 文章
  6. 文双 71 文章
  7. 小威 64 文章
  8. Cara 36 文章