课程包含19章内容
缺失值处理
数值离散化
特征提取
IRIS数据集
类别字段编码
乳腺癌数据集
线性回归
多项式特征
数值标准化
数据指标计算
决策树
随机森林
文本数据处理
数据聚类
数据降维PCA
关联规则
异常值检测
手写数字识别
邮件文本分类
房价预估
覆盖sklearn知识点
为机器学习模型准备数据
处理缺失值,SimpleImputer类
分类、回归、聚类
离散化
特征提取
PolynomialFeatures类
LabelEncoder类
OneHotEncoder类
StandardScaler类
虚拟编码
将数据拆分为训练集和测试集
LogisticRegression类
混淆矩阵
分类报告
线性回归类
MAE - 平均绝对误差
MSE - 均方误差
sigmoid()函数
熵
准确率
决策树分类器类
GridSearchCV类
RandomForestClassifier类
CountVectorizer类
TfidfVectorizer类
KMeans类
AgglomerativeClustering类
层次聚类类
DBSCAN类
降维,PCA 分析
关联规则
LocalOutlierFactor类
隔离森林类
KNeighborsClassifier类
多项式NB 类
GradientBoostingRegressor类