机器学习教程-代价函数一

下面是几种不同取值的情况

在线性回归中我们有一个训练集可能就像我在这里绘制的我们要做的就是得出θ0 θ1这两个参数的值来让假设函数表示的直线尽量地与这些数据点很好的拟合也许就像这里的这条线一样那么我们如何得出θ0 θ1的值来使它很好地拟合数据的呢？

我们的想法是我们要选择能使h(x) 也就是输入x时我们预测的值最接近该样本对应的y值的参数θ0 θ1 所以在我们的训练集中我们会得到一定数量的样本我们知道x表示卖出哪所房子并且知道这所房子的实际价格所以我们要尽量选择参数值使得在训练集中给出训练集中的x值我们能合理准确地预测y的值让我们给出标准的定义在线性回归中我们要解决的是一个最小化问题所以我要写出关于θ0 θ1的最小化而且我希望这个式子极其小是吧我想要h(x)和y之间的差异要小我要做的事情是尽量减少假设的输出与房子真实价格之间的差的平方明白吗？

接下来我会详细的阐述别忘了我用符号( x(i),y(i) )代表第i个样本所以我想要做的是对所有训练样本进行一个求和对i=1到i=M的样本将对假设进行预测得到的结果此时的输入是第i号房子的面积对吧将第i号对应的预测结果减去第i号房子的实际价格所得的差的平方相加得到总和而我希望尽量减小这个值也就是预测值和实际值的差的平方误差和或者说预测价格和实际卖出价格的差的平方

在这里hθ(x)的这种表达这是我们的假设它等于θ0加上θ1与x(i)的乘积而这个表达表示关于θ0和θ1的最小化过程这意味着我们要找到θ0和θ1 的值来使这个表达式的值最小这个表达式因θ0和θ1的变化而变化对吧？

因此简单地说我们正在把这个问题变成找到能使我的训练集中预测值和真实值的差的平方的和的1/2M最小的θ0和θ1的值因此这将是我的线性回归的整体目标函数为了使它更明确一点我们要改写这个函数按照惯例我要定义一个代价函数正如屏幕中所示这里的这个公式我们想要做的就是关于θ0和θ1 对函数J(θ0,θ1)求最小值这就是我的代价函数代价函数也被称作平方误差函数有时也被称为平方误差代价函数。

事实上我们之所以要求出误差的平方和是因为误差平方代价函数对于大多数问题特别是回归问题都是一个合理的选择还有其他的代价函数也能很好地发挥作用但是平方误差代价函数可能是解决回归问题最常用的手段了在后续课程中我们还会谈论其他的代价函数但我们刚刚讲的选择是对于大多数线性回归问题非常合理的好吧所以这是代价函数到目前为止我们已经介绍了代价函数的数学定义也许这个函数J(θ0,θ1)有点抽象可能你仍然不知道它的内涵在接下来的几个视频里我们要更进一步解释代价函数J的工作原理并尝试更直观地解释它在计算什么以及我们使用它的目的。

We can measure the accuracy of our hypothesis function by using a cost function. This takes an average difference (actually a fancier version of an average) of all the results of the hypothesis with inputs from x’s and the actual output y’s.

J(θ0,θ1)=12m∑i=1m(y^i−yi)2=12m∑i=1m(hθ(xi)−yi)2

To break it apart, it is 12 x¯ where x¯ is the mean of the squares of hθ(xi)−yi , or the difference between the predicted value and the actual value.

This function is otherwise called the “Squared error function”, or “Mean squared error”. The mean is halved (12) as a convenience for the computation of the gradient descent, as the derivative term of the square function will cancel out the 12 term. The following image summarizes what the cost function does:

让我们通过一些例子来获取一些直观的感受看看代价函数到底是在干什么的。回顾一下这是我们上次所讲过的内容我们想找一条直线来拟合我们的数据所以我们用 θ0 θ1 等参数得到了这个假设而且通过选择不同的参数我们会得到不同的直线拟合。

所以拟合出的数据就像这样然后我们还有一个代价函数这就是我们的优化目标.

我将使用一个简化的假设函数就是右边这个函数然后我将会用这个简化的假设也就是 θ1*x 我们可以将这个函数看成是把 θ0 设为0 所以我只有一个参数也就是 θ1 代价函数看起来与之前的很像唯一的区别是现在 h(x) 等于 θ1*x 只有一个参数 θ1 所以我的优化目标是将 J(θ1) 最小化用图形来表示就是如果 θ0 等于零也就意味这我们选择的假设函数会经过原点也就是经过坐标 (0,0) 通过利用简化的假设得到的代价函数我们可以试着更好地理解代价函数这个概念

我们要理解的是这两个重要的函数第一个是假设函数第二个是代价函数。

注意这个假设函数 h(x) 对于一个固定的 θ1 这是一个关于 x 的函数所以这个假设函数就是一个关于 x 这个房子大小的函数与此不同的是代价函数 J 是一个关于参数 θ1 的函数而 θ1 控制着这条直线的斜率现在我们把这写函数都画出来试着更好地理解它们。

我们从假设函数开始比如说这里是我的训练样本它包含了三个点 (1,1) (2,2) 和 (3,3) 现在我们选择一个值 θ1 所以当 θ1 等于1 如果这是我选择的 θ1 那么我的假设函数看起来就会像是这条直线我将要指出的是当我描绘出我的假设函数 X轴我的横轴被标定为X轴 X轴是表示房子大小的量现在暂时把 θ1 定为1 我想要做的就是算出在 θ1 等于 1 的时候 J(θ1) 等于多少所以我们按照这个思路来计算代价函数的大小。

代价函数定义如下是吧对这个误差平方项进行求和这就等于这样一个形式简化以后就等于三个0的平方和当然还是0 现在在代价函数里我们发现所有这些值都等于0 因为对于我所选定的这三个训练样本 ( 1 ,1 ) (2,2) 和 (3,3) 如果 θ1 等于 1 那么 h(x(i)) 就会正好等于 y(i) 让我把这个写得好一点对吧所以 h(x) – y 所有的这些值都会等于零这也就是为什么 J(1) 等于零所以我们现在知道了 J(1) 是0 让我把这个画出来我将要在屏幕右边画出我的代价函数 J 要注意的是因为我的代价函数是关于参数 θ1 的函数当我描绘我的代价函数时 X轴就是 θ1 现在我有 J(1) 等于零让我们继续把函数画出来结果我们会得到这样一个点

现在我们来看其它一些样本 θ1 可以被设定为某个范围内各种可能的取值所以 θ1 可以取负数 0 或者正数所以如果 θ1 等于0.5会发生什么呢继续把它画出来现在要把 θ1 设为0.5 在这个条件下我的假设函数看起来就是这样这条线的斜率等于0.5 现在让我们计算 J(0.5) 所以这将会等于1除以2m 乘以那一块其实我们不难发现后面的求和就是这条线段的高度的平方加上这条线段高度的平方再加上这条线段高度的平方三者求和对吗？就是 y(i) 与预测值 h(x(i)) 的差对吗所以第一个样本将会是0.5减去1的平方因为我的假设函数预测的值是0.5 而实际值则是1 第二个样本我得到的是1减去2的平方因为我的假设函数预测的值是1 但是实际房价是2 最后加上 1.5减去3的平方那么这就等于1除以2乘以3 因为训练样本有三个点所以 m 等于3 对吧然后乘以括号里的内容简化后就是3.5 所以这就等于3.5除以6 也就约等于0.58 让我们把这个点画出来。

让我们试试θ1等于0 J(0) 会等于多少呢如果θ1等于0 那么 h(x) 就会等于一条水平的线对了就会像这样是水平的所以测出这些误差我们将会得到 J(0) 等于 1除以 2m 乘以1的平方加上2的平方加上3的平方也就是 1除以6乘以14 也就是2.3左右所以让我们接着把这个点也画出来所以这个点最后是2.3 。

当然我们可以接着设定 θ1 等于别的值进行计算你也可以把 θ1 设定成一个负数所以如果 θ1 是负数那么 h(x) 将会等于打个比方说－0.5 乘以x 然后 θ1 就是 -0.5 那么这将会对应着一个斜率为-0.5的假设函数而且你可以继续计算这些误差结果你会发现对于0.5 结果会是非常大的误差最后会得到一个较大的数值类似于5.25 等等对于不同的 θ1 你可以计算出这些对应的值对吗结果你会发现你算出来的这些值你得到一条这样的曲线通过计算这些值你可以慢慢地得到这条线这就是 J(θ) 的样子了我们来回顾一下任何一个 θ1 的取值对应着一个不同的假设函数或者说对应着左边一条不同的拟合直线对于任意的θ1 你可以算出一个不同的 J(θ1) 的取值举个例子你知道的 θ1 等于1时对应着穿过这些数据的这条直线当 θ1 等于0.5 也就是这个玫红色的点也许对应着这条线然后 θ1 等于0 也就是蓝色的这个点对应着这条水平的线对吧所以对于任意一个 θ1 的取值我们会得到一个不同的 J(θ1) 而且我们可以利用这些来描出右边的这条曲线。

此项目被张贴在未分类。书签的 permalink

一	二	三	四	五	六	日
« 6月
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30