艾伦·图灵于 1950 年开发了图灵测试,并在论文 “Computing Machinery and Intelligence” 中进行了相关探讨。该测试最初称为“模仿游戏”,用于评估机器行为是否可以与人类行为进行区分。在这个测试中,有一个人被称为“评估者”,他试图通过一系列问题找出计算机生成的输出和人类生成的输出之间的差异。如果评估者无法可靠地区分机器和人类受试者,则机器通过测试。然而,如果评估者能够正确识别人类回答,则不能将机器归类为“具有人工智能”。

虽然图灵测试没有固定的评估准则,但图灵确实规定,5 分钟后,人类评估者只有 70% 的机会正确预测人类与计算机生成的对话。图灵测试使机器智能的概念得到了普遍认可。

然而,最初的图灵测试只测试一种技能集,例如文本输出或国际象棋。强 AI 需要同样出色地执行各种任务,因此开发了扩展版图灵测试。该测试评估 AI 的文本、视觉和听觉表现,并将其与人类生成的输出进行比较。此版本用于著名的勒布纳奖比赛,由人类评委猜测输出是由人类还是计算机创建的。

“中文房间争论”由 John Searle 于 1980 年提出。他在论文中探讨理解和思考的定义,并声称计算机永远无法做到这一点。在 斯坦福大学网站 上的这篇论文摘录中,很好地总结了他的论点,

“计算纯粹是从形式或句法方面进行定义,而思想具有实际的心理或语义内容,我们不能仅通过句法操作而非其他任何内容来从句法过渡到语义......例如,一个系统(即我)不会仅仅通过模拟说中文者行为的计算机程序的步骤来理解中文(第 17 页)。”

中文房间争论提出以下场景:

假设一个不会说中文的人坐在一个封闭的房间里。房间里有一本书,书里有中文规则、短语和说明。另一个能说流利中文的人把用中文写的纸条递进房间里。借助语言短语手册,房间内的人可以选择适当的答案并将其传回给讲中文的人。

虽然房间里的人能够使用语言短语手册做出正确回答,但他/她仍然不会说中文或听不懂中文;这只是通过将问题或语句与适当的回答相匹配来模拟理解。Searle 认为,强 AI 需要真正的头脑才能有意识或理解力。中文房间争论体现了图灵测试的缺陷,并表明对 人工智能 的定义存在差异。

虽然没有明确的强 人工智能 实例,但 AI 领域正在迅速创新。另一种 AI 理论已经出现,被称为超级人工智能 (ASI)、超级智能或超级 AI。这种类型的 AI 在人类智能和能力方面超越了强 AI。然而,超级 AI 仍然是存粹的假想性质,因为我们还没有实现强 AI 的例子。

尽管如此,在一些领域,AI 正发挥着更重要的作用,例如:

  • 网络安全: 人工智能将在组织的网络安全措施中发挥更多作用,包括漏洞检测、监控、威胁情报、事件响应和风险分析。
  • 娱乐和内容创作: 计算机科学程序在制作内容方面已经越来越出色,无论是文案写作、诗歌、视频游戏,甚至电影。OpenAI 的 GBT-3 文本生成 AI 应用程序已经在创建的内容几乎无法与人类编写的文案进行区分。
  • 行为识别和预测: 预测算法将使 AI 更加强大,范围从天气和股票市场预测的应用到更有趣的人类行为预测。这也引发了有关隐性偏见和伦理 AI 的问题。AI 社区的一些 AI 研究人员正在推动制定一套反歧视规则,这通常与主题标签 #responsibleAI 相关。

人工智能、机器学习和深度学习这些术语常常被用在错误的语境中。这些术语经常用于描述强 AI,因此值得对每个术语进行简要定义:

关于 人工智能 John McCarthy 的定义如下:“它是制造智能机器的科学和工程,特别是智能计算机程序。它与使用计算机理解人类智能的类似任务有关,但 AI 不必局限于生物学上能观察到的方法。”

机器学习 是人工智能的一个子领域。经典(非深度)机器学习模型需要更多的人类干预来将数据划分为多个类别(即通过功能学习)。

深度学习 也是机器学习的一个子领域,它试图利用神经网络来模仿人类大脑的互联互通。它的人工神经网络由多层模型组成,可以识别给定数据集内的模式。它们利用大量训练数据进行准确学习,这随后需要更强大的硬件,例如 GPU 或 TPU。深度学习算法与人类水平的 AI 联系最为紧密。

要了解有关这些技术之间细微差别的更多信息,请阅读“ AI 与机器学习、深度学习、神经网络:有什么区别?

深度学习可以很好地处理复杂问题,因此被应用于当今许多创新和新兴技术中。深度学习算法已经应用到各个领域。部分示例如下:

  • 自动驾驶汽车: Google 和 Elon Musk 向我们证实了实现自动驾驶汽车的可能性。然而,自动驾驶汽车需要更多的训练数据和测试,因为它需要考虑各种活动,例如让行或识别道路上的碎片。随着技术的成熟,它还需要克服人类采用的障碍,因为民意调查显示,许多司机并不愿意使用这种技术。
  • 语音识别: 语音识别与 AI 聊天机器人 虚拟代理 一样,是自然语言处理的重要组成部分。音频输入对 AI 来说更难处理,因为背景噪声、方言、言语障碍和其他影响等许多因素会使 AI 更难将输入转换为计算机可以使用的内容。
  • 模式识别: 深度神经网络的使用可以提高各种应用程序中的模式识别。通过发现有用数据点的模式,AI 可以过滤不相关的信息,得出有用的相关性,并提高通常被人类忽视的大数据计算效率。
  • 计算机编程: 弱 AI 在生成有意义的文本方面取得了一些成功,从而推动了编码技术的进步。OpenAI 最近刚刚发布了 GPT-3,这是一款开源软件,实际上可以使用非常有限的指令编写代码和简单的计算机程序,为程序开发实现了自动化。
  • 图像识别: 手动对图像进行分类可能非常耗时。然而,深度神经网络的特殊改进,例如 DenseNet,它将神经网络中的每一层都与其他层连接起来,使得图像识别更加准确。
  • 上下文推荐: 深度学习应用程序在提出推荐时可以考虑更多的上下文,包括语言理解模式和行为预测。
  • 事实核查: 滑铁卢大学最近发布了一种工具,可以将文章中的信息与其他信息来源进行比较,从而验证文章中的信息,以检测虚假信息。