Python网络爬虫
  1. 数据爬虫

    1. 录播
      【掌握】网路爬虫简介
      26分钟
    2. 录播
      【掌握】BeautifulSoup网页解析
      11分钟
    3. 录播
      【掌握】selenium异步爬取
      52分钟
    4. 录播
      【掌握】爬取豆瓣经典电影
      25分钟
  2. 数据显示与处理

    1. 录播
      【理解】数据图形展示
      45分钟
    2. 录播
      【掌握】jieba分词
      18分钟
    3. 录播
      【掌握】wordcloud
      21分钟

对课程感兴趣?

点击报名,听课时长可兑换余额哦~

Python网络爬虫免费

最近在学 17 累计报名 208 好评度 -
咨询老师
用手机看

扫一扫继续用手机看

  • 微信扫码

  • QQ扫码

下载手机APP

课程概述

目录

往期学员作业()

评论

老师介绍

  • 【营长】李兴华

    【营长】李兴华

    李兴华:沐言优拓教学总监。从事软件编程教育15年,从2008年起由清华大学出版社、人民邮电出版社、水利水电出版社,先后出版了十多本编程图书。
简  介 requests、urllib3、BeautifulSoup、selenium、jieba、wordcloud实现原生网络爬虫,让豆瓣受受“伤害”


网络爬虫是Python中的一项重要技术应用,也是Python比较有特点的应用环境,Python内部可以直接使用requests或urllib3实现本地伪造HTTP请求获取数据内容,用户则需要通过获取到的HTML页面结构通过BeautifulSoup组件进行分析,而后根据分析结果来获取下一个请求路径,在整体处理中还需要考虑到Ajax异步加载的操作,所以本课程也使用了selenium实现了本地浏览器的模拟调用,基于异步动态获取解析数据,并形成最终的CSV数据文件。

针对于爬取到的数据,可以直接使用jieba实现数据分析统计并且结合wordcloud做出一个词云统计图形,通过直观的形式进行结果观察。


* 课程提供者:沐言科技李兴华编程训练营