课程分类

课程介绍
课程目录
用户评论
课程介绍
课程目录
用户评论

你将获得

  • 掌握某些知识点
  • 学会某些技巧(或思路)

教学服务

  • icon

    1v1专属答疑服务

  • icon

    BAT专家面试辅导

讲师介绍

  • 李兴华:沐言优拓教学总监。从事软件编程教育15年,从2008年起由清华大学出版社、人民邮电出版社、水利水电出版社,先后出版了十多本编程图书。

  • 课程详情



    网络爬虫是Python中的一项重要技术应用,也是Python比较有特点的应用环境,Python内部可以直接使用requests或urllib3实现本地伪造HTTP请求获取数据内容,用户则需要通过获取到的HTML页面结构通过BeautifulSoup组件进行分析,而后根据分析结果来获取下一个请求路径,在整体处理中还需要考虑到Ajax异步加载的操作,所以本课程也使用了selenium实现了本地浏览器的模拟调用,基于异步动态获取解析数据,并形成最终的CSV数据文件。

    针对于爬取到的数据,可以直接使用jieba实现数据分析统计并且结合wordcloud做出一个词云统计图形,通过直观的形式进行结果观察。