https://developers.google.cn/machine-learning/crash-course/framing/ml-terminology
什么是(监督式)机器学习?简单来说,它的定义如下:
机器学习系统通过学习如何组合输入信息来对从未见过的数据做出有用的预测。
标签
是我们要预测的事物,即简单线性回归中的 y 变量。
特征
特征是输入变量,即简单线性回归中的 x 变量。
简单的机器学习项目可能会使用单个特征,而比较复杂的机器学习项目可能会使用数百万个特征。
样本
样本是指数据的特定实例:x。(我们采用粗体 x 表示它是一个矢量。)
模型
模型定义了特征与标签之间的关系。
回归与分类
- 回归模型可预测连续值.
- 分类模型可预测离散值.
线性回归
https://developers.google.cn/machine-learning/crash-course/descending-into-ml/linear-regression
训练与损失
https://developers.google.cn/machine-learning/crash-course/descending-into-ml/training-and-loss
均方误差 (MSE) 指的是每个样本的平均平方损失
迭代方法
https://developers.google.cn/machine-learning/crash-course/reducing-loss/an-iterative-approach
学习过程会持续迭代,直到该算法发现损失可能最低的模型参数。
通常,您可以不断迭代,直到总体损失不再变化或至少变化极其缓慢为止。
这时候,我们可以说该模型已收敛。