在这里我们引用李沐老师的一篇文章作为讲解。
线性假设是指目标(房屋价格)可以表示为特征(面积和房龄)的加权和,如下面的式子:price=warea·area+wage·age+b.中的warea和wage称为权重(weight),权重决定了每个特征对我们预测值的影响。b称为偏置(bias)偏移量(ofset)或截距(intercept)。偏置是指当所有特征都取值为0时,预测值应该为多少。即使现实中不会有任何房子的面积是0或房龄正好是0年,我们仍然需要偏置项。如果没有偏置项,我们模型的表达能力将受到限制。严格来说,(3.1.1)是输入特征的一仿射变换(afnetransformation)。仿射变换的特点是通过加权和对特征进行线性变换(lineartransformation),并通过偏置项来进行平移(translation)。 给定一个数据集,我们的标是寻找模型的权重w和偏置b,使得根据模型做出的预测大体符合数据里的真实价格。输出的预测值由输入特征通过线性模型的仿射变换决定,仿射变换由所选权重和偏置确定。而在机器学习领域,我们通常使用的是高维数据集,建模时采用线性代数表示法会比较方便。当我们的输入包含d个特征时,我们将预测结果yˆ(通常使用“尖角”符号表示y的估计值)表示为:yˆ=w1x1+...+wdxd+b. (3.1.2) 将所有特征放到向量x ∈ R d中,并将所有权重放到向量w ∈ R d中,我们可以用点积形式来简洁地表达模型: yˆ = w ⊤x + b. (3.1.3) 在 (3.1.3)中,向量x对应于单个数据样本的特征。用符号表示的矩阵X ∈ R n×d 可以很方便地引用我们整个数据集的n个样本。其中,X的每一行是一个样本,每一列是一种特征。 对于特征集合X,预测值ˆy ∈ R n 可以通过矩阵‐向量乘法表示为: ˆy = Xw + b (3.1.4) 这个过程中的求和将使用广播机制(广播机制在 2.1.3节中有详细介绍)。给定训练数据特征X和对应的已知 标签y,线性回归的目标是找到一组权重向量w和偏置b:当给定从X的同分布中取样的新样本特征时,这组权重向量和偏置能够使得新样本预测标签的误差尽可能小。 虽然我们相信给定x预测y的最佳模型会是线性的,但我们很难找到一个有n个样本的真实数据集,其中对于所有的1 ≤ i ≤ n,y (i)完全等于w⊤x (i) + b。无论我们使用什么手段来观察特征X和标签y,都可能会出现少量的观测误差。因此,即使确信特征与标签的潜在关系是线性的,我们也会加入一个噪声项来考虑观测误差带来的影响。在开始寻找最好的模型参数(model parameters)w和b之前,我们还需要两个东西:(1)一种模型质量的度量方式。(2)一种能够更新模型以提高模型预测质量的方法。
上一篇:创建ftp服务器 主机名_FTP
下一篇:谷歌浏览器广告拦截插件怎么设置