课程介绍
课程目录
往期学员作品
用户评论
课程介绍
课程目录
往期学员作品
用户评论
你将获得
- 掌握某些知识点
- 学会某些技巧(或思路)
教学服务
1v1专属答疑服务
BAT专家面试辅导
讲师介绍
【营长】李兴华
李兴华:沐言优拓教学总监。从事软件编程教育15年,从2008年起由清华大学出版社、人民邮电出版社、水利水电出版社,先后出版了十多本编程图书。
李兴华:沐言优拓教学总监。从事软件编程教育15年,从2008年起由清华大学出版社、人民邮电出版社、水利水电出版社,先后出版了十多本编程图书。
课程详情
网络爬虫是Python中的一项重要技术应用,也是Python比较有特点的应用环境,Python内部可以直接使用requests或urllib3实现本地伪造HTTP请求获取数据内容,用户则需要通过获取到的HTML页面结构通过BeautifulSoup组件进行分析,而后根据分析结果来获取下一个请求路径,在整体处理中还需要考虑到Ajax异步加载的操作,所以本课程也使用了selenium实现了本地浏览器的模拟调用,基于异步动态获取解析数据,并形成最终的CSV数据文件。
针对于爬取到的数据,可以直接使用jieba实现数据分析统计并且结合wordcloud做出一个词云统计图形,通过直观的形式进行结果观察。