机器学习 Machine Learning 笔记(2)
一、多特征的线性回归(多元线性回归)
针对房价场景,则假设算法为
假设有n个特征,x0 = 1,则训练数据X跟特征A可以用矩阵表示为
则对应的算法为矩阵A的转置 乘以 向量 X
1.1 代价函数
1.2 梯度下降
对应的梯度下降在x0 = 1 的前提下,统一为:
为了更好的梯度下降,可进行如下调整:
1.2.1 特征缩放
让各特征值的取值范围尽量接近,可以进行如下操作对特征值进行缩放
1.2.2 学习率选择
学习率太小的话,会下降的很慢;
学习率太大的话,会导致无法收敛;
1.3 多项式回归
当假设算法跟训练数据不吻合时,我们的假设函数不一定是线性的,可以变成多项式,如:
二、正规方程
对于一些线性回归问题,正规方程可以更好的解决theta值,不要一步步迭代得到最佳theta值,也不需要特征缩放,可以直接获取到,即:
推理过程,X 为样本矩阵,Y为结果矩阵
假设
矩阵 * 矩阵的逆 = 身份矩阵(单位矩阵)
身份举证 * 矩阵 = 矩阵本身
当数据特征不是很大的情况下,正规方程有不错的效果,反之梯度下降更合适。