【回归】就是用属性的历史数据预测未来的趋势。回归首先假设一些已知类型的函数可以拟合目标数据,然后利用某种误差分析确定一个与目标数据拟合程度最好的函数。回归模式的函数定义与分类模型相似,主要差别在于分类模型采取离散预测值(例如类标号),而回归模式采取采取的预测值。
回归算法在解决实际问题时经常会把数据拆分为两个数据集:训练数据集、测试数据集。通过数据挖掘算法对训练数据集进行建模,寻找X和Y之间的数学模型,然后通过测试数据集来验证该数学模型的准确率,如果误差能够达控制到一定精度,则认为该模型很好的反映了X和Y的关系,可以用来进行预测和分析。