简介
编辑形状背景是一种用于物体识别的特征描述符。SergeBelongie和JitendraMalik在2000年的论文《用形状背景进行匹配》中提出了这个术语。
形状背景的理论
编辑形状背景旨在成为一种描述形状的方式,允许测量形状相似性和恢复点的对应关系。
其基本思想是在一个形状的轮廓线上选取n个点。对于形状上的每个点pi,考虑通过连接pi和所有其他点得到的n-1个向量。
所有这些向量的集合是对该点局部形状的丰富描述,但过于详细。
关键的想法是,相对位置的分布是一个稳健的、紧凑的和高度鉴别性的描述符。
因此,对于点pi,其余n-1个点的相对坐标的粗略直方图。分组通常被认为是在对数极空间中均匀的。
形状上下文是一个丰富的、有鉴别力的描述符,这一事实可以看出,两个不同版本的字母A的形状上下文。(a)和(b)是这两个形状的边缘采样点。(c)是用于计算形状上下文的对数极点的图示。(d)是(a)中标有圆圈的点的形状背景,(e)是(b)中标有钻石的点的形状背景,(f)是三角形的形状背景。
可以看出,由于(d)和(e)是两个密切相关的点的形状背景,它们非常相似,而(f)的形状背景则非常不同。为了使一个特征描述符有用,它需要有某些不变性。特别是它需要对平移、缩放、小的扰动以及根据应用的需要对旋转不发生变化。
平移不变性对于形状背景来说是自然而然的。尺度不变性是通过将所有径向距离归一化为平均距离而获得的{displaystyle/alpha}将形状中所有点对之间的平均距离形状中的所有点对之间的平均距离α,尽管也可以使用中位距离。
形状上下文被经验证明是对变形、噪声和异常值的鲁棒性,使用合成点集匹配实验。人们可以在形状语境中提供完全的旋转不变性。一种方法是测量每一个点相对于该点的切线方向的角度(因为这些点被选在边缘)。这就产生了一个完全旋转不变的描述符。但当然这并不总是理想的,因为一些局部特征如果不相对于同一框架进行测量,就会失去其鉴别能力。许多应用实际上不允许旋转不变量,例如区分6和9。
在形状匹配中的应用
编辑一个使用形状上下文进行形状匹配的完整系统包括以下步骤。随机选择一组位于已知形状边缘的点和另一组位于未知形状上的点。计算步骤1中找到的每个点的形状上下文。将已知形状上的每个点与未知形状上的一个点进行匹配。为了最小化匹配的成本,首先选择一个变换(如仿生、薄板花键等),将已知形状的边缘与未知形状的边缘进行扭曲(基本上是将两个形状对齐)。
然后选择未知形状上与已知形状上的每个翘曲点最接近的点。计算这两个形状上每一对点之间的形状距离。
使用形状上下文距离、图像外观距离和弯曲能量(衡量使两个形状对齐需要多少转换)的加权和。为了识别未知形状,使用最近邻分类器将其形状距离与已知物体的形状距离进行比较。
实施细节第1步:寻找形状边缘的点列表该方法假定物体的形状基本上是由物体内部或外部轮廓上的点的有限子集捕获。这些可以简单地使用Canny边缘检测器获得,并从边缘上随机挑选一组点。
请注意,这些点不需要,而且一般来说也不对应于关键点,如曲率的xxx值或拐点。xxx是以大致均匀的间距对形状进行采样,尽管这并不是关键。
第2步:计算形状背景这一步在理论部分详细描述。
第3步:计算成本矩阵考虑两个具有归一化K-bin直方图(即形状背景)g(k)和h(k)的点p和q。由于形状上下文是以直方图表示的分布,因此很自然地使用χ2检验统计量作为匹配这两个点的形状上下文的成本。
内容由匿名用户提供,本内容不代表vibaike.com立场,内容投诉举报请联系vibaike.com客服。如若转载,请注明出处:https://vibaike.com/174627/