简介
编辑在机器学习中,学习曲线(或训练曲线)将一个模型的损失函数在训练集上的最优值与这个损失函数在验证数据集上的评估绘制成图,其参数与产生最优函数的参数相同。
它是一种工具,可以找出一个机器模型从添加更多的训练数据中受益的程度,以及估计器是否受到更多的方差误差或偏置误差的影响。如果验证分数和训练分数都随着训练集规模的增加而收敛到一个太低的值,那么它就不会从更多的训练数据中受益。
机器学习曲线有很多用途,包括比较不同的算法,在设计期间选择模型参数,调整优化以提高收敛性,以及确定用于训练的数据量。
在机器学习领域,有两种含义的学习曲线在曲线的X轴上有所不同,模型的经验被绘制成用于学习的训练实例的数量或用于训练模型的迭代数量。
正式定义
编辑机器学习的一个模型是产生一个函数f(x),它给定一些信息x,从训练数据中预测一些变量y{displaystyle{f_{theta}(x):thetainθ}},这样我们的函数就可以更加通用,或具有某些属性,比如说函数本身。
这样,我们的函数就更具有普遍性,或者说,该函数具有某些属性,例如,使找到一个好的更加容易,或者因为我们有一些先验的理由认为这些属性是真的。
鉴于不可能产生一个完全符合数据的函数,那么就有必要产生一个损失函数{displaystyleL(f_{theta}(X),Y')}来衡量我们的预测效果。来衡量我们的预测有多好。然后我们定义一个优化过程,找到一个
迭代次数的训练曲线
编辑许多优化过程是迭代的,重复相同的步骤,直到过程收敛到一个最佳值。梯度下降就是这样一种算法。
内容由匿名用户提供,本内容不代表vibaike.com立场,内容投诉举报请联系vibaike.com客服。如若转载,请注明出处:https://vibaike.com/175747/