简介
编辑在机器学习中,歧义正则化是一种利用数据集的形状来约束应该在该数据集上学习的函数的技术。
在许多机器学习问题中,需要学习的数据并不涵盖整个输入空间。例如,一个面部识别系统可能不需要对任何可能的图像进行分类,而只需要对包含面部的图像子集进行分类。流形学习技术假定相关的数据子集来自流形,即具有有用属性的数学结构。
该技术还假设要学习的函数是平滑的:具有不同标签的数据不可能靠得很近,因此在可能有很多数据点的地方,标签函数不应该快速变化。由于这个假设,流形正则化算法可以使用未标记的数据来告知哪里允许学习的函数快速变化,哪里不允许,这是使用Tikhonov正则化技术的延伸。
模糊正则化算法可以在半监督学习和过渡学习的环境中扩展监督学习算法,在这些环境中可以获得未标记的数据。该技术已被用于医学成像、地理成像和物体识别等应用。
流形正则化动机
编辑流形正则化是正则化的一种类型,是一个技术家族,通过惩罚复杂的解决方案来减少过拟合,并确保问题得到妥善解决。特别是,流形正则化扩展了应用于再现核希尔伯特空间(RKHSs)的Tikhonov正则化技术。
在RKHSs的标准Tikhonov正则化下,一个学习算法试图学习一个函数{displaystyleleft|fright|_{K}},表示候选函数在假设空间中的复杂性。它代表了候选函数在假设空间中的复杂性。当算法考虑一个候选函数时,它将其规范考虑在内,以便对复杂的函数进行惩罚。
形式上,给定一组标记的训练数据是一个超参数,控制算法在多大程度上倾向于选择更简单的函数,而不是更适合数据的函数。
流形正则化在标准Tikhonov正则化中使用的环境正则化的基础上增加了第二个正则化项,即内在正则化。
根据机器学习中的流形假设,有关数据并非来自整个输入空间它可以提供一个衡量目标函数平滑程度的标准。
一个平滑的函数在输入数据密集的地方应该变化缓慢;也就是说,梯度{displaystyle{mathcal{P}}_{X}}}是未知的。是未知的,但它可以从提供的数据中估计出来。
基于图的拉普拉斯准则的方法
编辑当输入点之间的距离被解释为一个图时,那么图的拉普拉斯矩阵可以帮助估计边际分布。
内容由匿名用户提供,本内容不代表vibaike.com立场,内容投诉举报请联系vibaike.com客服。如若转载,请注明出处:https://vibaike.com/175790/