图像检索是搜索大量图像以查找与给定查询图像最相似的图像的过程。 传统上,图像检索系统使用从图像中提取的特征(例如内容标签、标记和图像描述符)来比较图像并按相似性对图像进行排序。 然而,矢量相似性搜索由于比传统的基于关键字的搜索更具优势而越来越受欢迎,正在成为热门内容搜索服务的重要组成部分。

关键字搜索是最基本、最传统的信息检索方法。 在这种方法中,搜索引擎寻找用户在搜索查询中输入的关键字或短语的精确匹配项,并将其与为图像提供的标签和标记进行比较。 然后,搜索引擎返回包含这些确切关键字的图像作为内容标记和图像标签。 关键字搜索在很大程度上依赖于用户输入相关的特定搜索词的能力。

而矢量搜索则在高维空间中搜索大量矢量,以找到与给定查询相似的矢量。 矢量搜索通过捕获搜索查询的上下文和含义来寻找语义相似性。 这种方法通常比传统的图像检索技术更有效,因为它可以减少搜索空间并提高结果的准确度。

业务应用程序

图像检索在不同领域有多种应用,其中包括:

  • 数字资产管理:图像检索可用于管理大量数字图像,例如博物馆、档案馆或在线画廊中的数字图像。 用户可以根据视觉特征搜索图像,并检索符合其条件的图像。
  • 安全和监控:图像检索可用于安全和监控系统,以根据特定特征或模式搜索图像,例如在人物和对象跟踪或威胁检测中这样做。
  • 取证图像检索:图像检索可用于取证调查,以根据图像的视觉内容或元数据搜索图像,例如在网络犯罪案件中这样做。
  • 电子商务:图像检索可用于在线购物应用程序,以根据特征或描述搜索相似产品,或根据以前购买的产品提供推荐产品。
  • 时尚和设计:图像检索可用于时尚和设计,以根据图像的视觉特征(例如颜色、图案或纹理)搜索图像。 这可以帮助设计师或零售商识别相似的产品或趋势。
  • 图像检索不是为分析医学图像的诊断特征或疾病模式而设计的。 请不要将图像检索用于医疗目的。

    什么是矢量嵌入?

    矢量嵌入是一种将内容(文本或图像)表示为高维空间中的实数矢量的方法。 通常使用神经网络之类的机器学习算法从大量文本和视觉对象数据中学习矢量嵌入。 矢量的每个维度对应于内容的不同特征或属性,例如它的语义、语法角色或它通常出现在其中的上下文。

    只有来自相同模型类型的矢量嵌入才能进行有意义的比较。

    它是如何工作的?

  • 矢量化图像和文本:图像检索 API VectorizeImage 和 VectorizeText 可用于分别从图像或文本中提取特征矢量。 API 返回表示整个输入的单个特征矢量。

    图像检索不会对人脸进行任何生物识别处理。 有关人脸检测和识别,请参阅 Azure AI 人脸服务

  • 度量相似性:矢量搜索系统通常使用距离指标(例如余弦距离或欧氏距离)来比较矢量并按相似性对其进行排名。 Vision Studio 演示使用 余弦距离 来度量相似性。

  • 检索图像:使用与搜索查询相似的前 N 个矢量,从照片库中检索与这些矢量相对应的图像作为最终结果提供。

    为搜索服务启用图像检索,并按照步骤为文本和图像生成矢量嵌入。

  • 调用图像检索 API
  •