日月光华答疑群:645853094
【课程简介】
本课程讲解利用Python控制、处理、整理、分析结构化数据的基本知识,并通过实践案例让同学们学会如何利用各种Python库(包括NumPy、pandas、Jupyter Pyhton等)高效地解决各式各样的数据分析问题。
【课程适用对象】
本课程可以作为利用Python实现数据密集型应用的科学计算实践指南,也适合刚刚接触Python的分析人员以及刚刚接触科学计算的Python程序员。对于从事产品、市场、营销、金融以及机器学习等行业的需要经常分析大量数据的人员也有帮助。
【主要内容】
本课程主要讲解与数据分析相关的以下几个方面的内容:
(一)numpy库
NumPy库是Python的一种开源的数值计算扩展。这种工具可用来存储和处理大型矩阵,比Python自身的嵌套列表(nested list structure)结构要高效的多。NumPy的学习对于数据分析、数据建模、机器学习具有重要的意义。
(二)pandas库
pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现,它是使Python成为强大而高效的数据分析环境的重要因素之一。
(三)数据分析绘图
绘图是数据分析的重要工具和任务之一。本课程通过基于matplotlib的pandas绘图,讲解常见的线图、直方图、柱状图、散点图、饼图等的画法。
(四)Jupyter Notebook
Jupyter Notebook是一个数据分析和编写代码的好工具,本质是一个 Web 应用程序,便于创建和共享程序文档,支持实时代码,数学方程,可视化和markdown。 用途包括:数据清理和转换,数值模拟,统计建模,机器学习等等。Jupyter Notebook最大的好处就是所见所得,可以在浏览器上编辑代码。
【实践案例】
本课程讲解以下实践案例:
(一)全球空难数据的分析
(二)共享单车骑行数据的分析
(三)谷歌股票趋势技术分析
(四)人力资源数据分析