视觉图灵测试_全球百科

1 视觉图灵测试

2 视觉图灵测试

3 目前的评估实践

视觉图灵测试

编辑

计算机视觉研究是由标准的评估实践驱动的。目前的系统是通过其对物体检测、分割和定位等任务的准确性来测试的。像卷积神经网络这样的方法在这些任务中似乎做得很好，但目前的系统仍然没有接近解决像人类那样理解图像的最终问题。

正如其中所描述的，它是"一个由操作者协助的设备，从一个给定的测试图像中产生一个随机的二进制问题序列"。该测试只涉及视觉，不需要任何自然语言处理。人类操作员的工作是为问题提供正确的答案，或将其作为模棱两可的问题拒绝。

视觉图灵测试

编辑

这种复杂性与人类的视觉系统是一致的。大约50%的人脑用于处理视觉，这清楚地表明，这是一个困难的问题。后来，有人试图用受人脑启发的模型来解决这些问题。

这些简单的神经网络不能满足他们的期望，并有一定的局限性，因此在未来的研究中没有考虑它们。后来，随着硬件和一些处理能力的出现，研究转向了涉及像素级操作的图像处理，如寻找边缘、对图像进行去噪或应用过滤器等等。在这个领域有一些很大的进展，但视觉问题，即让机器理解图像的问题仍然没有得到解决。在这一时期，神经网络也再次出现，因为它表明多层感知器可以克服感知器的限制。图灵测试

特征与已经存在的机器学习算法一起被用来检测、定位和分割图像中的物体。在所有这些进展的同时，社区认为需要有标准化的数据集和评估指标，以便对性能进行比较标准评估指标的出现和公开挑战为研究提供了方向。更好的算法被引入到特定的任务中，如物体检测和分类。视觉图灵测试旨在为计算机视觉研究提供一个新的方向，这将导致引入的系统更接近于像人类那样理解图像。

目前的评估实践

编辑

大量的数据集已经被注释和概括为不同类别算法的基准性能，以评估一些图像领域的不同视觉任务。计算机视觉中最著名的数据集之一是ImageNet，它被用来评估对象层面的图像分类问题。ImageNet是目前xxx的注释数据集之一，拥有超过一百万张图像。另一个重要的视觉任务是物体检测和定位，指的是检测图像中的物体实例，并提供物体实例周围的边界盒坐标或分割物体。这个任务最流行的数据集是帕斯卡数据集。同样，还有其他用于特定任务的数据集，如用于人体姿势检测的H3D数据集，用于评估检测物体属性质量的Core数据集，如颜色、方向和活动。拥有这些标准数据集有助于视觉界为所有这些任务提出性能极佳的算法。

内容由匿名用户提供，本内容不代表vibaike.com立场，内容投诉举报请联系vibaike.com客服。如若转载，请注明出处：https://vibaike.com/174673/