Azure 视频索引器光学字符识别(OCR) 概述- Azure Video Indexer ...

相关文章推荐

星星上的热带鱼 · 路由与交换(一)：路由概念及基本配置-CSDN博客· 3 月前 ·

爱听歌的铁板烧 · 化工机械设备_百度百科· 8 月前 ·

文雅的小蝌蚪 · 圣贞德天主教高中St. Joan of ...· 1 年前 ·

无邪的打火机 · 浅谈机器学习-分类和聚类的区别-腾讯云开发者 ...· 1 年前 ·

博学的乌冬面 · Bagage Aerial, sac et ...· 1 年前 ·

光学字符识别 (OCR) 是一项 Azure 视频索引器 AI 功能，可从图像（如图片、路标和媒体文件中的产品）中提取文本，以创建见解。

OCR 当前从 50 多种语言的印刷体和手写文本中提取见解，包括从具有多种语言文本的图像中提取见解。有关详细信息，请参阅 OCR 支持的语言。

查看透明度说明概述

本文讨论光学字符识别 (OCR) 以及负责任地使用此技术的关键注意事项。在决定如何使用和实现 AI 支持的功能时，需要考虑许多事项：

此功能在我的方案中是否表现良好？在将 OCR 部署到方案中之前，请使用实际数据测试其执行方式，并确保它可以提供所需的准确性。

我们是否具备识别并应对错误的能力？ AI 支持的产品和功能不会 100% 准确，因此请考虑如何识别和响应可能发生的任何错误。

在网站上工作时，见解将显示在“ 时间线 ”选项卡中。还可以在包含 ID、转录文本、持续时间和置信度分数的 JSON 文件的分类列表中生成它们。

若要查看网站上的实例，请执行以下操作：

转到“查看并检查 OCR”。

选择“时间线”以显示提取的文本。

还可以在 JSON 文件中的分类列表中生成见解，其中包含 ID、语言、文本以及每个实例的置信度分数。

若要查看 JSON 文件中的见解，请执行以下操作：

选择“下载 -> 见解 (JSON) ”。

复制下的 ocr insights 元素，并将其粘贴到联机 JSON 查看器中。

"ocr": [
      "id": 1,
      "text": "2017 Ruler",
      "confidence": 0.4365,
      "left": 901,
      "top": 3,
      "width": 80,
      "height": 23,
      "angle": 0,
      "language": "en-US",
      "instances": [
          "adjustedStart": "0:00:45.5",
          "adjustedEnd": "0:00:46",
          "start": "0:00:45.5",
          "end": "0:00:46"
          "adjustedStart": "0:00:55",
          "adjustedEnd": "0:00:55.5",
          "start": "0:00:55",
          "end": "0:00:55.5"
      "id": 2,
      "text": "2017 Ruler postppu - PowerPoint",
      "confidence": 0.4712,
      "left": 899,
      "top": 4,
      "width": 262,
      "height": 48,
      "angle": 0,
      "language": "en-US",
      "instances": [
          "adjustedStart": "0:00:44.5",
          "adjustedEnd": "0:00:45",
          "start": "0:00:44.5",
          "end": "0:00:45"
若要通过 API 下载 JSON 文件，请使用 Azure 视频索引器开发人员门户。
OCR 组件
在 OCR 过程中，将处理媒体文件中的文本图像，如下所示：
深入搜索媒体镜头，查找带有路标、街道名称或汽车牌照的图像，例如在执法部门。
从媒体文件中的图像中提取文本，然后在标签中将其翻译为多种语言，以便进行辅助功能，例如在媒体或娱乐中。
检测图像中的品牌名称并标记它们以进行翻译，例如在广告和品牌打造中。
提取图像中的文本，然后自动标记和分类以供辅助功能和将来使用，例如在通讯社生成内容。
提取在线说明中警告中的文本，然后翻译文本以符合当地标准，例如，使用设备的电子学习说明。
选择用例时的注意事项和限制
仔细考虑结果的准确性，促进更准确的检测，检查图像的质量，低质量的图像可能会影响检测到的见解。
在执法时，请仔细考虑 OCR 可能会误读或无法检测到部分文本。 为了确保公平和高质量的决策，请将基于 OCR 的自动化与人工监督相结合。
提取手写文本时，请避免使用人类和机器难以阅读的签名的 OCR 结果。 使用 OCR 的更好方法是使用它来检测是否存在签名，以便进一步分析。
请勿将 OCR 用于可能产生严重不利影响的决策。 提取文本的机器学习模型可能会导致未检测到或不正确的文本输出。 基于错误输出的决策可能会产生严重的不利影响。 此外，建议对可能对个人产生严重影响的决策进行人工审查。
当负责任且谨慎地使用时，Azure 视频索引器是许多行业的宝贵工具。 为了尊重他人的隐私和安全，并遵守当地和全球法规，我们建议执行以下操作：
始终尊重个人隐私权，仅出于合法和合理目的引入视频。  
不要故意披露有关年幼儿童或名人家庭成员的不当内容，或者可能有害或对个人个人自由构成威胁的其他内容。  
致力于在设计和部署所分析媒体时尊重和促进人权。  
使用第三方材料时，在分发派生自它们的内容之前，请注意所需的任何现有版权或权限。 
使用来自未知来源的内容时，请始终寻求法律建议。 
始终获取适当的法律和专业建议，以确保上传的视频受到保护，并具有足够的控制，以保持内容的完整性并防止未经授权的访问。    
提供一个反馈渠道，使用户和个人能够报告服务问题。  
请注意你所在地区关于处理、分析和共享包含人员的媒体的任何适用的法律或法规。 
让一个人在循环中。 不要使用任何解决方案来代替人工监督和决策。  
全面检查和查看你正在使用的任何 AI 模型的潜力，以了解其功能和限制。 
详细了解负责任 AI
Microsoft 负责任 AI 原则
Microsoft 负责任 AI 资源
有关负责任 AI 的 Microsoft Azure 学习课程
Microsoft 全球人权声明
visupport@microsoft.com
Azure 视频索引器见解
音频效果检测
关键字提取
听录，翻译 & 语言识别
观察到的人员跟踪和匹配的人脸