代价函数的作用

和上次一样首先来理解假设h和代价函数J 这是房价数据组成的训练集数据让我们来构建某种假设就像这条线一样很显然这不是一个很好的假设但不管怎样如果我假设θ0等于50 θ1等于0.06的话那么我将得到这样一个假设函数对应于这条直线给出θ0和θ1的值我们要在右边画出代价函数的图像上一次我们是只有一个θ1 也就是说画出的代价函数是关于θ1的函数但现在我们有两个参数 θ0和θ1 因此图像就会复杂一些了当只有一个参数θ1的时候我们画出来是这样一个弓形函数。

你可能会得到这样的图形因此这是一个三维曲面图两个轴分别表示θ0和θ1 随着你改变θ0和θ1的大小你便会得到不同的代价函数 J(θ0,θ1) 对于某个特定的点 (θ0,θ1) 这个曲面的高度也就是竖直方向的高度就表示代价函数 J(θ0,θ1) 的值不难发现这是一个弓形曲面我们来看看三维图。

这是这个曲面的三维图水平轴是θ0、θ1 竖直方向表示 J(θ0,θ1) 旋转一下这个图你就更能理解这个弓形曲面所表示的代价函数了在这段视频的后半部分为了描述方便我将不再像这样给你用三维曲面图的方式解释代价函数J 而还是用轮廓图来表示 contour plot 或 contour figure 意思一样右边就是一个轮廓图两个轴分别表示 θ0 和 θ1 而这些一圈一圈的椭圆形每一个圈就表示 J(θ0,θ1) 相同的所有点的集合

具体举例来说我们选三个点出来这三个桃红色的点都表示相同的 J(θ0,θ1) 的值对吧横纵坐标分别是θ0 θ1 这三个点的 J(θ0,θ1) 值是相同的如果你之前没怎么接触轮廓图的话你就这么想你就想象一个弓形的函数从屏幕里冒出来因此最小值也就是这个弓形的最低点就是这个点对吧也就是这一系列同心椭圆的中心点想象一下这个弓形从屏幕里冒出来所以这些椭圆形都从我的屏幕上冒出相同的高度弓形的最小值点是这个位置因此轮廓图是一种很方便的方法能够直观地观察代价函数J

接下来让我们看几个例子在这里有一点这个点表示θ0等于800 θ1大概等于-0.15 那么这个红色的点代表了某个 (θ0,θ1) 组成的数值组而这个点也对应于左边这样一条线对吧 θ0等于800 也就是跟纵轴相交于大约800 斜率大概是-0.15 当然这条线并不能很好地拟合数据对吧以这组 θ0 θ1 为参数的这个假设 h(x) 并不是数据的较好拟合并且你也发现了这个代价值就是这里的这个值距离最小值点还很远也就是说这个代价值还是算比较大的因此不能很好拟合数据

让我们再来看几个例子这是另一个假设你不难发现这依然不是一个好的拟合但比刚才稍微好一点这是我的 θ0 θ1 点这是 θ0 的值大约为360 θ1 的值为0 我们把它写下来 θ0=360 θ1=0 因此这组θ值对应的假设是这条水平的直线也就是h(x) = 360 + 0 × x 这就是假设这个假设同样也有某个代价值而这个代价值就对应于这个代价函数在这一点的高度

让我们再来看一些例子这是另一个例子这个点这组 θ0 和 θ1 对应这样一条假设h(x) 同样地还是对数据拟合不好离最小值更远了

最后一个例子这个点其实不是最小值但已经非常靠近最小值点了这个点对数据的拟合就很不错它对应这样两个θ0 和 θ1 的值同时也对应这样一个 h(x) 这个点虽然不在最小值点但非常接近了因此误差平方和或者说训练样本和假设的距离的平方和这个距离值的平方和非常接近于最小值尽管它还不是最小值

通过这些图形我希望你能更好地理解这些代价函数 J 所表达的值它们是什么样的它们对应的假设是什么样的以及什么样的假设对应的点更接近于代价函数J的最小值当然我们真正需要的是一种有效的算法能够自动地找出这些使代价函数J取最小值的参数θ0和θ1来对吧我想我们也不希望编个程序把这些点画出来然后人工的方法来读出这些点的数值这很明显不是一个好办法事实上我们后面就会学到我们会遇到更复杂、更高维度、更多参数的情况这在我们在后面的视频中很快就会遇到而这些情况是很难画出图的因此更无法将其可视化因此我们真正需要的是编写程序来找出这些最小化代价函数的θ0和θ1的值在下一节视频中我们将介绍一种算法能够自动地找出能使代价函数 J 最小化的参数θ0和θ1的值。

Cost Function – Intuition II

A contour plot is a graph that contains many contour lines. A contour line of a two variable function has a constant value at all points of the same line. An example of such a graph is the one to the right below.

Taking any color and going along the ‘circle’, one would expect to get the same value of the cost function. For example, the three green points found on the green line above have the same value for J(θ0,θ1) and as a result, they are found along the same line. The circled x displays the value of the cost function for the graph on the left when θ0 = 800 and θ1= -0.15. Taking another h(x) and plotting its contour plot, one gets the following graphs:

When θ0 = 360 and θ1 = 0, the value of J(θ0,θ1) in the contour plot gets closer to the center thus reducing the cost function error. Now giving our hypothesis function a slightly positive slope results in a better fit of the data.

The graph above minimizes the cost function as much as possible and consequently, the result of θ1 and θ0 tend to be around 0.12 and 250 respectively. Plotting those values on our graph to the right seems to put our point in the center of the inner most ‘circle’.

一	二	三	四	五	六	日
« 6月
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30

股市自如行

机器学习教程-代价函数二

Cost Function – Intuition II

发表评论取消回复

Cost Function – Intuition II

发表评论 取消回复

发表评论取消回复