机器学习 Machine Learning 笔记(2)

一、多特征的线性回归(多元线性回归)

针对房价场景,则假设算法为

假设有n个特征,x0 = 1,则训练数据X跟特征A可以用矩阵表示为

则对应的算法为矩阵A的转置 乘以 向量 X

1.1 代价函数

1.2 梯度下降

对应的梯度下降在x0 = 1 的前提下,统一为:

为了更好的梯度下降,可进行如下调整:

1.2.1 特征缩放

让各特征值的取值范围尽量接近,可以进行如下操作对特征值进行缩放

1.2.2 学习率选择

学习率太小的话,会下降的很慢;

学习率太大的话,会导致无法收敛;

1.3 多项式回归

当假设算法跟训练数据不吻合时,我们的假设函数不一定是线性的,可以变成多项式,如:

二、正规方程

对于一些线性回归问题,正规方程可以更好的解决theta值,不要一步步迭代得到最佳theta值,也不需要特征缩放,可以直接获取到,即:

推理过程,X 为样本矩阵,Y为结果矩阵

假设

矩阵 * 矩阵的逆 = 身份矩阵(单位矩阵)

身份举证 * 矩阵 = 矩阵本身

当数据特征不是很大的情况下,正规方程有不错的效果,反之梯度下降更合适。