主要是介绍 Machine Learning 中常见的数学表达式, 有助于之后读论文的时候理解其中的步骤, 当然其他地方可能用的 Notation 会有不同的地方, 但万变不离其中.
Ok, Let’s enter the world of Machine Learning!!!
注: 我在这里想解释一下其中的 parameters
和 hyperparameters
:
model parameters
模型参数是模型内部的配置变量, 其值可以根据数据进行估计.
- 模型在进行预测时需要它们
- 它们的值定义了可使用的模型
- 他们是从数据估计或获悉的
- 它们通常不由编程者手动设置
- 他们通常被保存为学习模型的一部分
在经典的机器学习文献中, 我们可以将模型看作假设, 将参数视为对特定数据集的量身打造的假设.
model hyperparameters
模型超参数是模型外部的配置, 其值无法从数据中估计.
- 它们通常用于帮助估计模型参数
- 它们通常由人工指定
- 他们通常可以使用启发式设置
- 他们经常被调整为给定的预测建模问题
我们虽然无法知道给定问题的模型超参数的最佳值, 但是我们可以使用经验法则, 在其他问题上使用复制值, 或通过反复试验来搜索最佳值. 模型超参数的一些例子包括:
- 训练神经网络的学习速率
- 用于支持向量机的C和sigma超参数
- K最近邻的K