基于内容的图像检索
编辑基于内容的图像检索,也称为按图像内容查询(QBIC)和基于内容的视觉信息检索(CBVIR),是将计算机视觉技术应用于图像检索问题,即搜索数字图像的问题 在大型数据库中(有关 CBIR 领域的科学概述,请参阅此调查)。 基于内容的图像检查反对传统的基于概念的方法(参见基于概念的图像索引)。
基于内容意味着搜索分析图像的内容而不是元数据,例如与图像关联的关键字、标签或描述。 此上下文中的术语内容可能指的是颜色、形状、纹理或可以从图像本身导出的任何其他信息。 CBIR 是可取的,因为纯粹依赖元数据的搜索依赖于注释质量和完整性。
让人类通过在大型数据库中输入关键字或元数据来手动注释图像可能非常耗时,并且可能无法捕获描述图像所需的关键字。 关键词图片搜索的有效性评价是主观的,没有明确的定义。 同样,CBIR 系统在定义成功方面也面临着类似的挑战。 关键字还将查询范围限制在一组预定标准内。 并且,已设置的内容不如使用内容本身可靠。
历史
编辑基于内容的图像检索这个术语似乎起源于 1992 年,当时日本电工实验室工程师 Toshikazu Kato 使用它来描述基于当前颜色和形状从数据库中自动检索图像的实验。 从那时起,该术语就被用来描述基于句法图像特征从大量集合中检索所需图像的过程。 使用的技术、工具和算法源自统计、模式识别、信号处理和计算机视觉等领域。
QBIC - 按图片内容查询
最早的商用 CBIR 系统由 IBM 开发,称为 QBIC(Query By Image Content)。 最近基于网络和图形的方法已经提出了一种简单且有吸引力的现有方法的替代方法。
虽然将多个图像存储为单个实体的一部分出现在术语 BLOB(二进制大型对象)之前,但完全按内容而不是按描述进行搜索的能力必须等待 IBM 的 QBIC。
技术进步
编辑由于基于元数据的系统固有的局限性以及高效图像检索的广泛可能用途,人们对 CBIR 的兴趣有所增长。 使用现有技术可以轻松搜索有关图像的文本信息,但这需要人类手动描述数据库中的每张图像。 对于非常大的数据库或自动生成的图像,例如,这可能是不切实际的。 那些来自监控摄像头的。 也有可能错过在描述中使用不同同义词的图像。 基于将猫等语义类别中的图像分类为动物子类的系统可以避免错误分类问题,但用户需要付出更多努力才能找到可能是猫但仅被归类为动物的图像。 已经开发了许多标准来对图像进行分类,但所有标准仍然面临缩放和错误分类问题。
开发最初的 CBIR 系统是为了根据图像颜色、纹理和形状属性搜索数据库。 在开发出这些系统之后,对用户友好界面的需求变得显而易见。 因此,CBIR 领域的努力开始包括以人为本的设计,试图满足执行搜索的用户的需求。 这通常意味着包括:可能允许描述性语义的查询方法、可能涉及用户反馈的查询、可能包括机器学习的系统以及可能理解用户满意度水平的系统。
技术
编辑已经开发了许多 CBIR 系统,但截至 2006 年,根据像素内容检索图像的问题在很大程度上仍未解决。
CBIR 的不同查询技术和实现使用不同类型的用户查询。
实例查询
QBE(按示例查询)是一种查询技术,涉及为 CBIR 系统提供示例图像,然后系统将基于该图像进行搜索。 底层搜索算法可能因应用程序而异,但结果图像应与提供的示例共享共同元素。
向系统提供示例图像的选项包括:
- 预先存在的图像可以由用户提供或从随机集中选择。
- 用户画出他们正在寻找的图像的粗略近似值,例如使用颜色斑点或一般形状。
这种查询技术消除了尝试用文字描述图像时可能出现的困难。
内容由匿名用户提供,本内容不代表vibaike.com立场,内容投诉举报请联系vibaike.com客服。如若转载,请注明出处:https://vibaike.com/220260/