计算机器与智能

A. M. Turing

Mind, 1950

1. 模仿游戏（Imitation Game）

我建议考察这样一个问题：“机器能思考吗？”这应当从界定“机器”和“思考”这两个词的含义开始。定义也许可以拟定得尽可能反映这些词的通常用法，但这种态度是危险的。如果要通过考察“机器”和“思考”通常如何使用来确定其含义，那么就很难摆脱这样的结论：问题“机器能思考吗？”的含义和答案，应当在类似 Gallup 民意调查这样的统计调查中寻找。但这是荒谬的。因此，我不试图给出这样的定义，而是用另一个问题来替代它；这个问题与原问题密切相关，并且用相对明确的词语表达。

这个新形式的问题可以用一个我们称为“模仿游戏”的游戏来描述。游戏由三个人参与：一名男子（A）、一名女子（B），以及一名询问者（C），询问者可以是任一性别。询问者待在一个与另外两人分开的房间里。对询问者而言，游戏的目标是判断另外两人中谁是男子、谁是女子。他通过标签 X 和 Y 认识他们，并在游戏结束时说出“X 是 A，Y 是 B”，或者“X 是 B，Y 是 A”。询问者可以这样向 A 和 B 提问：

C：请 X 告诉我他或她头发的长度好吗？

现在假设 X 实际上是 A，那么 A 必须回答。A 在游戏中的目标是设法使 C 作出错误的识别。因此他的回答可能是：

“我的头发剪成了短发，最长的几缕大约有九英寸长。”

为了使语调不能帮助询问者，回答应当用书面形式，或者更好地，用打字形式给出。理想的安排是在两个房间之间用电传打字机通信。另一种办法是由中间人转述问题和回答。第三名参与者（B）在游戏中的目标是帮助询问者。她的最佳策略大概是给出真实回答。她可以在回答中加上诸如“我是女人，别听他的！”之类的话，但这没有什么用，因为男子也可以说出类似的话。

现在我们问：“当机器在这个游戏中扮演 A 的角色时，会发生什么？”当游戏以这种方式进行时，询问者作出错误判断的频率是否会像在一男一女之间进行游戏时一样高？这些问题替代了我们原来的问题：“机器能思考吗？”

2. 对新问题的批评

除了问“这个新形式的问题答案是什么”之外，人们还可以问：“这个新问题值得研究吗？”我们直接考察后一个问题，从而截断无穷倒退。

新问题的优点在于，它在人的身体能力和智力能力之间划出了一条相当清楚的界线。没有工程师或化学家声称能够制造出一种与人的皮肤无法区分的材料。也许有一天这能够做到，但即使假设这种发明已经可用，我们也会觉得，试图给一台“会思考的机器”披上这种人造皮肉，使其更像人，并没有多少意义。我们设定问题的形式反映了这一点：它通过条件规定，询问者不能看见或触摸其他参赛者，也不能听到他们的声音。所提议标准的其他一些优点，可以通过样例问答显示出来。例如：

问：请以 Forth Bridge 为题为我写一首十四行诗。

答：这题就饶了我吧。我从来不会写诗。

问：把 34957 加到 70764 上。

答：（停顿约 30 秒，然后给出答案）105621。

问：你会下国际象棋吗？

答：会。

问：我方 K 在 K1，没有其他棋子。你方只有 K 在 K6，R 在 R1。轮到你走。你走哪一步？

答：（停顿 15 秒后）R-R8 将死。

问答方法似乎适合引入我们希望纳入的几乎任何一个人类活动领域。我们不希望因机器不能在选美比赛中出众而惩罚它，也不希望因人在与飞机赛跑时落败而惩罚人。我们的游戏条件使这些能力缺陷变得无关紧要。“证人”可以在他们认为明智时，尽情夸耀自己的魅力、力量或英勇，但询问者不能要求实际演示。

或许有人会批评这个游戏，理由是它使胜算过分不利于机器。如果人试图假装成机器，他显然会表现得非常糟糕。他会立刻因为算术中的迟缓和不准确而露馅。机器难道不能做某种应当被称为思考、但又与人所做的事情非常不同的事吗？这个反对意见很有力；但至少我们可以说，尽管如此，如果能够构造出一台机器令人满意地进行模仿游戏，那么我们就不必为这个反对意见所困扰。

也许有人会主张，在进行“模仿游戏”时，机器的最佳策略可能不是模仿人的行为。这是可能的，但我认为这类影响不大。无论如何，本文无意研究这个游戏的理论，并且将假定最佳策略是设法给出人会自然给出的回答。

3. 游戏中所涉及的机器

在我们明确“机器”一词的含义之前，第 1 节提出的问题还不会十分确定。我们自然希望允许在我们的机器中使用各种工程技术。我们也希望允许这样的可能性：一名工程师或一组工程师可以构造出一台能够工作的机器，但由于他们采用的方法很大程度上是实验性的，其运行方式甚至无法由构造者满意地描述。最后，我们希望把以通常方式出生的人排除在机器之外。要拟定同时满足这三个条件的定义是困难的。例如，可以坚持要求工程师团队全由同一性别的人组成，但这实际上并不令人满意，因为从一个人的皮肤（比如说）单个细胞培养出一个完整个体大概是可能的。这样做将是一项值得最高赞誉的生物技术成就，但我们不会倾向于把它看作“构造一台会思考的机器”的实例。这促使我们放弃允许各种技术的要求。鉴于目前对“会思考的机器”的兴趣是由一种特殊的机器激发的，这种机器通常称为“电子计算机”或“数字计算机”，我们更愿意这样做。按照这个提示，我们只允许数字计算机参加我们的游戏。

这种限制乍看之下似乎非常严厉。我将试图说明，实际上并非如此。为此，需要简短说明这些计算机的性质和特性。

还可以说，把机器等同于数字计算机，就像我们关于“思考”的标准一样，只有在（与我的信念相反）数字计算机原来无法在游戏中表现良好时，才会令人不满意。

已经有若干台数字计算机在运转，因此可以问：“为什么不马上做这个实验？满足游戏条件会很容易。可以使用若干名询问者，并汇编统计数据，显示正确识别出现的频率。”简短的回答是：我们问的不是所有数字计算机是否都会在游戏中表现良好，也不是目前可用的计算机是否会表现良好，而是是否存在可以想象的、会表现良好的计算机。但这只是简短回答。稍后我们会从不同角度看待这个问题。

4. 数字计算机

数字计算机背后的思想可以这样解释：这些机器旨在执行任何可由人类计算员（human computer）完成的操作。人类计算员应当遵循固定规则；他无权在任何细节上偏离这些规则。我们可以假设这些规则写在一本书中，每当他被安排到一项新工作时，这本书就会改变。他还拥有无限量的纸张来进行计算。他也可以在一台“桌上机器”上做乘法和加法，但这并不重要。

如果我们把上述解释用作定义，就会有论证循环的危险。我们通过给出一种概要来避免这一点，说明期望效果是通过什么手段实现的。数字计算机通常可以看作由三部分组成：

(i) 存储器。

(ii) 执行单元。

(iii) 控制器。

存储器是信息的存储处，对应于人类计算员的纸张，无论这是他进行计算的纸张，还是印有规则书的纸张。就人类计算员在头脑中进行计算而言，存储器的一部分将对应于他的记忆。

执行单元是执行计算中涉及的各种单个操作的部分。这些单个操作是什么，会因机器而异。通常可以完成相当冗长的操作，例如“把 3540675445 乘以 7076345687”，但在某些机器中只可能完成非常简单的操作，例如“写下 0”。

我们已经提到，供给计算员的“规则书”在机器中由存储器的一部分代替。于是它被称为“指令表”。控制器的职责是确保这些指令被正确地、按正确顺序执行。控制器被构造成使这种情况必然发生。

存储器中的信息通常被分成大小适中的信息包（packet of information）。例如，在一台机器中，一个信息包可能由十个十进制数字组成。以某种系统方式，给存储各种信息包的存储器各部分赋予编号。一条典型的指令可能说：

“把存储在位置 6809 的数加到位置 4302 的数上，并把结果放回后一个存储位置。”

不用说，它在机器中不会用英语表达。更可能会被编码成诸如 6809430217 的形式。这里 17 表示要对这两个数执行各种可能操作中的哪一种。在这个例子中，该操作就是上面描述的那个，即“把这个数加上……”。可以注意到，这条指令占用 10 位数字，因此构成一个信息包，非常方便。控制器通常会按照指令所在位置的顺序取出要执行的指令，但偶尔也会遇到这样的指令：

“现在执行存储在位置 5606 的指令，并从那里继续”

或者又如：

“如果位置 4505 中含有 0，则接下来执行存储在 6707 的指令，否则径直继续。”

后一类指令非常重要，因为它们使得一系列操作可以一遍又一遍地重复，直到某个条件得到满足；在这样做时，每次重复并不执行新的指令，而是反复执行同一组指令。举一个家庭中的类比。假设母亲希望 Tommy 每天早晨上学途中到鞋匠铺看看她的鞋修好了没有，她可以每天早晨重新要求他。或者，她可以一次性在门厅贴一张通知，他离家上学时会看见，通知告诉他去取鞋，并且如果他回来时带着鞋，就把通知撕掉。

读者必须接受这样一个事实：数字计算机能够按照我们已经描述的原则构造出来，而且确实已经被构造出来，并且它们事实上能够非常接近地模仿人类计算员的动作。

我们把人类计算员描述为使用一本规则书，这当然是一种方便的虚构。实际的人类计算员确实会记住自己必须做什么。如果一个人想让一台机器模仿人类计算员在某项复杂操作中的行为，就必须问他这件事是怎么做的，然后把答案翻译成指令表的形式。构造指令表通常称为“编程”。“给一台机器编程以执行操作 A”，意思就是把适当的指令表放入机器，使它完成 A。

数字计算机思想的一个有趣变体是“带有随机元素的数字计算机”（digital computer with a random element）。这类机器有涉及掷骰子或某种等价电子过程的指令；例如，一条这样的指令可能是：“掷骰子，并把得到的数放入存储器 1000。”有时人们把这样的机器描述为具有自由意志（尽管我本人不会使用这个短语）。通常不可能通过观察一台机器来确定它是否具有随机元素，因为可以用一些装置产生类似效果，例如让选择取决于 π 的小数位数字。

大多数实际的数字计算机只有有限的存储器。关于具有无限存储器的计算机这一思想，在理论上没有困难。当然，在任何一个时刻只能使用其中有限的一部分。同样，也只能构造出有限的量，但我们可以想象按需要不断增加。这样的计算机具有特殊的理论意义，将称为无限容量计算机。

数字计算机的思想由来已久。查尔斯·巴贝奇于 1828 年至 1839 年任剑桥 Lucasian Professor of Mathematics，他设计过这样一台机器，称为分析机，但它从未完成。尽管巴贝奇已经具备所有基本思想，但他的机器在当时并不是一个十分有吸引力的前景。它本可达到的速度肯定快于人类计算员，但大约比曼彻斯特机器慢 100 倍，而后者本身就是现代机器中较慢的一种。存储将是纯机械的，使用齿轮和卡片。

巴贝奇的分析机将完全是机械的这一事实，有助于我们摆脱一种迷信。人们常常重视这样一个事实：现代数字计算机是电气的，而神经系统也是电气的。既然巴贝奇的机器不是电气的，并且所有数字计算机在某种意义上是等价的，我们就看到，这种对电的使用并不具有理论上的重要性。当然，在涉及快速信号传递时，电通常会出现，因此我们在这两种联系中都发现它并不奇怪。在神经系统中，化学现象至少和电现象同样重要。在某些计算机中，存储系统主要是声学的。因此，使用电这一特征只是一种非常表面的相似。如果我们希望寻找这样的相似性，倒应当寻找功能上的数学类比。

5. 数字计算机的通用性

上一节考虑的数字计算机可以归入“离散状态机器”（discrete-state machine）之列。这些机器以突然的跳变或咔嗒声，从一个完全确定的状态移动到另一个状态。这些状态彼此差异足够大，因此可以忽略它们之间混淆的可能性。严格说来，并不存在这样的机器。一切实际上都是连续运动的。但有许多种机器可以有益地被看作离散状态机器。例如，在考虑照明系统的开关时，把每个开关都视为必定明确地处于开或关，是一种方便的虚构。中间位置必然存在，但对大多数目的来说，我们可以忘掉它们。作为离散状态机器的一个例子，我们可以考虑一个每秒钟咔嗒一声转过 120° 的轮子，但它可以由一个从外部操作的杠杆停止；此外，在轮子的某一个位置上，一盏灯会亮起。这台机器可以抽象地描述如下。机器的内部状态（由轮子的位置描述）可以是 q1、q2 或 q3。有一个输入信号 i0 或 i1（杠杆的位置）。任一时刻的内部状态由上一个状态和输入信号按照下表决定：

              Last State
              q1   q2   q3
Input i0      q2   q3   q1
Input i1      q1   q2   q3

注：这个转移表在所提供的 PDF 中印为 (TABLE DELETED)。它是根据同一篇文章的外部转录本重构的。

输出信号，即内部状态在外部可见的唯一指示（灯），由下表描述：

State   q1   q2   q3
Output  o0   o0   o1

这个例子是离散状态机器的典型。只要它们可能状态的数目有限，它们就可以由这样的表来描述。

似乎只要给定机器的初始状态和输入信号，就总是能够预测所有未来状态。这让人想起拉普拉斯的观点：从某一时刻宇宙的完整状态，也就是所有粒子的位置和速度，应当能够预测所有未来状态。不过，我们正在考虑的预测比拉普拉斯所考虑的预测更接近于可实际操作。“作为整体的宇宙”这一系统具有这样的性质：初始条件中极小的误差，在较晚时刻可能产生压倒性的影响。某一时刻一个电子移动十亿分之一厘米，可能造成一年后一个人被雪崩杀死，或者逃生的差别。我们称为“离散状态机器”的机械系统的一个本质特性是，这种现象不会发生。即使我们考虑实际的物理机器而不是理想化机器，对某一时刻状态的合理准确知识，也会产生对之后任意步数状态的合理准确知识。

如前所述，数字计算机属于离散状态机器这一类。但这样的机器能够具有的状态数通常极其巨大。例如，现在曼彻斯特正在运行的机器，其状态数约为 2^165,000，即大约 10^50,000。把它与上面描述的咔嗒作响的轮子例子相比，后者只有三个状态。不难看出为什么状态数会如此巨大。计算机包含一个对应于人类计算员所用纸张的存储器。必须能够把可能写在纸上的任何一种符号组合写入存储器。为简单起见，假设只使用 0 到 9 的数字作为符号。忽略笔迹变化。假设允许计算机使用 100 张纸，每张含 50 行，每行有 30 个数字的位置。那么状态数就是 10^(100x50x30)，即 10^150,000。这大约是三台曼彻斯特机器合在一起的状态数。状态数以二为底的对数通常称为机器的“存储容量”。因此曼彻斯特机器的存储容量约为 165,000，而我们例子中的轮式机器约为 1.6。如果把两台机器合在一起，必须把它们的容量相加，以得到所得机器的容量。这就使得类似下面的说法成为可能：“曼彻斯特机器包含 64 条磁道，每条容量为 2560，八个电子管，每个容量为 1280。杂项存储约为 300，总计 174,380。”

给定与一台离散状态机器相对应的表，就可以预测它将做什么。没有理由不通过数字计算机来完成这个计算。只要计算能够足够快地完成，数字计算机就能够模仿任何离散状态机器的行为。于是，模仿游戏可以由所讨论的机器（作为 B）和进行模仿的数字计算机（作为 A）参与，询问者将无法区分它们。当然，数字计算机必须有足够的存储容量，并且运行得足够快。此外，对于每一台希望它模仿的新机器，都必须重新给它编程。

数字计算机能够模仿任何离散状态机器的这种特殊性质，被称为它们是通用机器（universal machines）。具有这种性质的机器的存在带来一个重要后果：撇开速度因素，不必为了各种计算过程而设计各种新机器。它们都可以由一台数字计算机完成，只要针对每种情况适当地编程。由此可见，作为一个后果，所有数字计算机在某种意义上是等价的。

现在我们可以重新考虑第 3 节末尾提出的观点。那里试探性地建议，问题“机器能思考吗？”应由“是否存在可以想象的、会在模仿游戏中表现良好的数字计算机？”来替代。如果愿意，我们可以在表面上使其更一般，问“是否存在会表现良好的离散状态机器？”但鉴于通用性这一性质，我们看到，这两个问题中任一个都等价于如下问题：“让我们把注意力固定在一台特定的数字计算机 C 上。通过修改这台计算机，使它具有足够的存储，适当地提高其动作速度，并为它提供适当的程序，是否能够使 C 在模仿游戏中令人满意地扮演 A 的角色，而 B 的角色由人来扮演？”

6. 对主要问题的相反观点

现在可以认为准备工作已经完成，我们可以开始讨论“机器能思考吗？”这一问题，以及上一节末尾所引用的变体。我们不能完全放弃原问题的形式，因为对于这种替代是否恰当，人们会有不同意见；我们至少必须听听对此有什么可说的。

如果我先说明自己在这件事上的信念，会使读者更容易理解。先考虑这个问题更精确的形式。我相信，在大约五十年后，将有可能给存储容量约为 10^9 的计算机编程，使它们把模仿游戏玩得如此之好，以至于一名普通询问者在五分钟提问之后，作出正确识别的机会不会超过 70%。原来的问题“机器能思考吗？”在我看来过于无意义，不值得讨论。尽管如此，我相信到本世纪末，词语的使用和一般受过教育者的意见都会发生如此大的变化，以至于人们能够谈论机器思考，而不会预期遭到反驳。我还相信，隐瞒这些信念没有任何有用的目的。流行观点认为，科学家不可阻挡地从一个已确立的事实推进到另一个已确立的事实，从不受任何未经证明的猜想影响，这是完全错误的。只要明确哪些是已证明事实、哪些是猜想，就不会造成伤害。猜想非常重要，因为它们提示有用的研究方向。

现在我继续考虑与我自己的观点相反的意见。

(1) 神学反对意见

思考是人的不朽灵魂的一项功能。上帝给了每个男人和女人一个不朽的灵魂，但没有给任何其他动物或机器。因此，没有动物或机器能够思考。

我无法接受其中任何部分，但会尝试用神学术语来回答。如果把动物和人归为一类，我会觉得这个论证更有说服力，因为在我看来，典型的有生命物与无生命物之间的差异，比人与其他动物之间的差异更大。如果我们考虑正统观点在某个其他宗教共同体成员看来可能是什么样子，它的任意性就会更加清楚。基督徒如何看待穆斯林关于女人没有灵魂的观点？不过，让我们把这一点放在一边，回到主要论证。在我看来，上面引用的论证意味着对全能者的全能作出了严重限制。人们承认，祂有某些事情不能做，例如使一等于二；但我们难道不应相信，如果祂认为合适，祂有自由把灵魂赋予一头大象吗？我们或许会预期，祂只会把这种能力与某种突变结合起来运用，这种突变为大象提供一个经过适当改进的大脑，以照料这个灵魂的需要。对于机器的情形，也可以作出形式完全相同的论证。它也许显得不同，因为更难“咽下去”。但这实际上只是意味着，我们认为祂不太可能认为环境适合赋予一个灵魂。本文其余部分会讨论所涉及的环境。在试图构造这样的机器时，我们并不是不敬地篡夺祂创造灵魂的权能，就像我们在生育孩子时也不是这样；相反，在任一情形中，我们都是祂意志的工具，为祂创造的灵魂提供居所。

不过，这只是揣测。无论神学论证被用来支持什么，我都不太为其所动。在过去，这类论证常常被发现并不令人满意。在伽利略的时代，人们曾论证说，经文“太阳就停住……不急速下落，约有一整日”（Joshua x. 13）和“祂将地立在根基上，使地永不动摇”（Psalm cv. 5）足以驳倒哥白尼理论。以我们现在的知识看，这种论证显得徒劳。当那种知识还不可得时，它给人的印象则完全不同。

(2) “把头埋在沙里”的反对意见

机器思考的后果会太可怕。让我们希望并相信它们不能这样做。”

这个论证很少像上面的形式那样坦率地表达出来。但它影响了我们大多数认真想过这件事的人。我们愿意相信，人以某种微妙方式优越于其余造物。最好能够证明他必然优越，因为这样他就没有失去支配地位的危险。神学论证的流行显然与这种感受有关。这种感受在知识分子那里很可能相当强烈，因为他们比其他人更看重思考的能力，也更倾向于把自己对人类优越性的信念建立在这种能力之上。

我不认为这个论证足够有分量，需要加以反驳。安慰会更合适；也许应当在灵魂转世中寻找这种安慰。

(3) 数学反对意见

数学逻辑中有若干结果可用来说明，离散状态机器的能力存在限制。其中最著名的是哥德尔定理（Gödel’s theorem，1931），它表明，在任何足够强大的逻辑系统中，都可以构造出既不能在系统内证明、也不能在系统内否证的命题，除非该系统本身可能是不一致的。还有其他在某些方面相似的结果，归功于丘奇（1936）、克莱尼（1935）、罗瑟和图灵（1937）。最后这个结果最便于考虑，因为它直接涉及机器，而其他结果只能用于相对间接的论证：例如，如果要使用哥德尔定理，还需要有某种手段用机器来描述逻辑系统，并用逻辑系统来描述机器。所讨论的结果涉及一种本质上是具有无限容量的数字计算机的机器。它断言，这样的机器有某些事情不能做。如果它被接上设备，像在模仿游戏中那样回答问题，那么将有一些问题，无论允许它用多少时间来回答，它要么会给出错误答案，要么根本不给出答案。当然，这样的问题可能有许多；一台机器无法回答的问题，另一台机器可能会令人满意地回答。我们目前当然假定这些问题属于适合用“是”或“否”回答的那类，而不是诸如“你怎么看毕加索？”这样的问题。我们知道机器必定失败的问题属于这种类型：“考虑如下指定的机器……这台机器是否会对任何问题回答‘是’？”省略号将由某台机器以标准形式给出的描述来替代，可能类似于第 5 节所使用的形式。当所描述的机器与正在受询问的机器之间具有某种相当简单的关系时，可以证明，答案要么错误，要么不会给出。这就是数学结果；有人论证说，它证明了机器有一种人类智力所不受制约的能力缺陷。

对这个论证的简短回答是：尽管已经确立，任何特定机器的能力都有局限，但只是未经任何证明地声称，人类智力没有这类局限。不过，我认为这种观点不能如此轻率地打发掉。每当这些机器之一被问到适当的关键问题，并给出确定答案时，我们就知道这个答案必定是错误的，这使我们产生某种优越感。这种感受是幻觉吗？它无疑十分真实，但我认为不应过分重视它。我们自己也常常给问题作出错误回答，因此并没有理由因为机器方面的这种易错证据而过于自得。此外，我们的优越性只能在这样的场合相对于那一台我们取得小小胜利的机器而感受到。不存在同时战胜所有机器的问题。简言之，可能有一些人比任何给定机器更聪明；但同样也可能有其他机器又更聪明，如此等等。

我认为，坚持数学论证的人大多会愿意接受模仿游戏作为讨论的基础。相信前两个反对意见的人，大概不会对任何标准感兴趣。

(4) 来自意识的论证

这一论证在 Jefferson 教授 1949 年的 Lister Oration 中表达得非常好，我引述如下：“除非一台机器能够因所感受到的思想和情感，而不是由于符号的偶然落下，写出一首十四行诗或谱写一首协奏曲，否则我们不能同意机器等于大脑；也就是说，它不仅要写出它，而且要知道它已经写出了它。没有任何机制能够因自身成功而感到（而不是仅仅人为地发出信号，那只是很容易做成的装置）愉悦，因电子管熔断而悲伤，因奉承而心生暖意，因自己的错误而痛苦，被性所吸引，在得不到想要的东西时愤怒或沮丧。”

这个论证似乎是在否认我们测试的有效性。按照这一观点最极端的形式，人们能够确信机器思考的唯一方式，是成为那台机器并感受到自己在思考。然后人们可以向世界描述这些感受，但当然没有人有理由理会。同样，按照这一观点，知道一个人在思考的唯一方式，就是成为那个特定的人。事实上，这是唯我论（solipsism）的观点。它也许是最合乎逻辑的观点，但它使思想交流变得困难。A 容易相信“A 在思考而 B 没有”，而 B 相信“B 在思考而 A 没有”。通常的做法不是不断围绕这一点争论，而是采用一种礼貌的惯例，即每个人都在思考。

我确信 Jefferson 教授并不希望采纳这种极端的唯我论观点。他大概会很愿意接受模仿游戏作为一种测试。这个游戏（省略参与者 B）在实践中常常以 viva voce（口试）的名义使用，用来发现某人是否真正理解某事，或者只是“鹦鹉学舌式地学会了”。让我们旁听这样一段 viva voce：

询问者：在你十四行诗的第一行“Shall I compare thee to a summer’s day”中，换成“a spring day”是否同样好，或者更好？

证人：那就不合格律了。

询问者：那么“a winter’s day”怎么样？那样格律没有问题。

证人：是的，但没有人愿意被比作冬日。

询问者：你会说 Mr. Pickwick 让你想起 Christmas 吗？

证人：某种程度上是。

询问者：然而 Christmas 是冬日，而我认为 Mr. Pickwick 不会介意这种比较。

证人：我不认为你是认真的。所谓冬日，人们指的是典型的冬日，而不是像 Christmas 这样特殊的一天。

如此等等。如果那台写十四行诗的机器能够在 viva voce（口试）中这样回答，Jefferson 教授会怎么说？我不知道他是否会把这台机器看作“仅仅人为地发出”这些回答；但如果这些回答像上面这段一样令人满意且能够持续，我认为他不会把它描述为“一种很容易做成的装置”。我认为这个短语意在涵盖这样的装置，例如在机器中包含某人朗读十四行诗的录音，并配以适当的开关，使它不时启动。

简言之，我认为大多数支持来自意识论证的人，可以被说服放弃这个论证，而不是被迫进入唯我论立场。那时他们大概会愿意接受我们的测试。

我不想给人造成这样的印象：我认为意识没有任何奥秘。例如，任何试图定位意识的尝试都伴随着某种悖论。但我认为，在我们能够回答本文所关心的问题之前，并不一定需要解决这些奥秘。

(5) 来自各种能力缺陷的论证

这些论证采取这样的形式：“我承认你能够使机器做你已经提到的所有事情，但你永远不能使它做 X。”在这方面，人们提出了许多特征 X。我列举一组：

善良、足智多谋、美丽、友好、有主动性、有幽默感、分辨是非、犯错误、恋爱、享受草莓和奶油、让某人爱上它、从经验中学习、恰当地使用词语、成为它自己思想的主题、拥有像人一样多样的行为、做出真正新颖的事情。

通常没有人为这些陈述提供支持。我相信，它们多半建立在科学归纳（scientific induction）原则之上。一个人在一生中见过成千上万台机器。根据他对它们的观察，他得出若干一般性结论。它们丑陋，每台都是为非常有限的目的而设计；当所需用途有极细微的差异时，它们就无用了；其中任何一台的行为多样性都很小，等等等等。他自然得出结论，认为这些是一般机器的必然性质。许多这些限制与大多数机器非常小的存储容量有关。（我假定存储容量这一思想以某种方式扩展到离散状态机器之外的机器。精确定义并不重要，因为当前讨论并不声称有数学精确性。）几年前，当人们对数字计算机还知之甚少时，如果有人提到它们的性质而不描述其构造，就可能引出许多怀疑。这大概也是由于类似地应用了科学归纳原则。这些原则的应用当然很大程度上是无意识的。当一个被火烧过的孩子害怕火，并通过避开火来表现他的害怕时，我会说他是在应用科学归纳。（当然，我也可以用许多其他方式描述他的行为。）人类的作品和习俗似乎并不是非常适合应用科学归纳的材料。如果要获得可靠结果，就必须考察时空中的很大一部分。否则，我们可能会像大多数英国儿童那样断定，人人都说英语，学习法语是愚蠢的。

不过，对于许多已经提到的能力缺陷，还需要作出特别说明。不能享受草莓和奶油，可能会让读者觉得轻浮。也许可以制造出一台机器来享受这道美味，但任何试图这样做的尝试都会是愚蠢的。关于这一能力缺陷的重要之处在于，它会促成其他一些能力缺陷，例如，使人与机器之间发生同种友谊的困难，而那种友谊可以发生在白人与白人之间，或黑人与黑人之间。

声称“机器不能犯错误”似乎很奇怪。人们很想反驳说：“它们难道因此更糟吗？”但让我们采取更同情的态度，试着看看真正的意思是什么。我认为可以用模仿游戏来解释这种批评。有人声称，询问者只要给机器和人出若干算术题，就能把机器与人区分开来。机器会因为其致命的准确性而暴露。对此的回答很简单。机器（为玩这个游戏而编程）不会试图给出算术题的正确答案。它会故意以一种经过计算、足以迷惑询问者的方式引入错误。机械故障大概会通过对算术中该犯哪种错误作出不合适决定而显现出来。即使这种对批评的解释也还不够同情。但我们没有篇幅进一步深入讨论。在我看来，这种批评取决于把两种错误混淆起来。我们可以把它们称为“功能错误”和“结论错误”。功能错误是由于某些机械或电气故障导致机器的行为不同于其设计所规定的行为。在哲学讨论中，人们愿意忽略这类错误的可能性；因此讨论的是“抽象机器”。这些抽象机器是数学虚构，而不是物理对象。按照定义，它们不可能有功能错误。在这个意义上，我们可以真实地说“机器永远不会犯错误”。结论错误只有在机器的输出信号被赋予某种意义时才可能出现。例如，机器可能打出数学方程，或者英语句子。当一个假命题被打出时，我们说机器犯了结论错误。显然，完全没有理由说机器不能犯这种错误。它可以什么也不做，只是一遍又一遍地打出“0 = 1”。举一个不那么反常的例子，它可能有某种通过科学归纳得出结论的方法。我们必须预期，这样的方法偶尔会导致错误结果。

声称机器不能成为它自己思想的主题，当然只有在能够表明机器具有某种以某物为主题的思想时，才能回答。尽管如此，“机器操作的主题”似乎确实有意义，至少对处理机器的人来说如此。例如，如果机器正试图求方程 x^2 - 40x - 11 = 0 的解，人们会倾向于把这个方程描述为那一刻机器主题的一部分。从这种意义上说，机器无疑可以成为它自己的主题。它可以被用来帮助编写自己的程序，或者预测自身结构改变的效果。通过观察自身行为的结果，它可以修改自己的程序，以便更有效地达到某个目的。这些是近未来的可能性，而不是乌托邦式的梦想。

批评机器不能有很大的行为多样性，不过是在说它不能有很大的存储容量。直到相当近的时期，哪怕一千位数字的存储容量也非常罕见。

我们这里考虑的批评常常是来自意识论证的伪装形式。通常，如果有人主张机器能够做这些事情之一，并描述机器可以使用的方法，人们并不会留下深刻印象。人们认为这种方法（不管它是什么，因为它必须是机械的）实际上相当低劣。可与第 22 页引用的 Jefferson 陈述中的括号内容相比。

(6) 洛夫莱斯夫人（Lady Lovelace，即 Ada Lovelace）的反对意见

我们关于巴贝奇的分析机的最详细资料来自洛夫莱斯夫人（1842）的一篇回忆录。她是巴贝奇分析机相关说明和注释的作者之一。她在其中写道：“The Analytical Engine has no pretensions to originate anything. It can do whatever we know how to order it to perform”（斜体为她所加）。Hartree（1949）引用了这一陈述，并补充说：“这并不意味着不可能构造出会‘自己思考’的电子设备，或者用生物学术语说，人们可以在其中建立一种条件反射，作为‘学习’的基础。原则上这是否可能，是一个由这些近期发展所提示的、令人振奋和激动的问题。但当时已构造或计划构造的机器似乎并不具有这种性质。”

我与 Hartree 在这一点上完全一致。可以注意到，他并没有断言所讨论的机器没有这种性质，而只是说洛夫莱斯夫人可获得的证据并没有鼓励她相信它们有这种性质。所讨论的机器在某种意义上完全可能已经具有这种性质。假设某台离散状态机器具有这种性质。分析机是一台通用数字计算机，因此，如果它的存储容量和速度足够，就可以通过适当编程使其模仿所讨论的那台机器。伯爵夫人或巴贝奇大概没有想到这个论证。无论如何，他们也没有义务主张一切可以主张的东西。

整个问题将在学习机器这一标题下再次考虑。

洛夫莱斯夫人反对意见的一个变体说，机器“永远不能做任何真正新的事情”。这可以暂时用一句谚语来抵挡：“太阳底下无新事。”谁能确定自己所做的“原创工作”不是教学在他心中播下的种子生长出来的，或者不是遵循众所周知的一般原则的结果？这个反对意见的更好变体说，机器永远不能“让我们惊讶”。这一陈述是一种更直接的挑战，可以直接应对。机器非常频繁地让我惊讶。这很大程度上是因为我没有做足够的计算来判断该预期它们做什么，或者更确切地说，虽然我做了计算，但我做得匆忙、粗疏，并冒了风险。也许我会对自己说：“我猜这里的电压应当和那里一样；不管怎样，就假定它是这样吧。”自然，我常常是错的，其结果对我来说就是一个惊讶，因为到实验完成时，这些假设已经被忘掉了。这些承认使我容易受到关于我恶劣做法的训诫，但当我证明自己所经历的惊讶时，并不会使我的可信性受到怀疑。

我并不预期这个回答能使我的批评者沉默。他大概会说，他的惊讶是由于我这方面某种创造性的心理活动，而不是机器的功劳。这又把我们带回来自意识的论证，远离惊讶这一观念。我们必须把这条论证线索视为已经关闭；不过也许值得指出的是，无论令人惊讶的事件来自一个人、一本书、一台机器，还是任何其他事物，把某事物评价为令人惊讶都同样需要一种“创造性的心理活动”。

我认为，机器不能引发惊讶这一观点，是由于哲学家和数学家特别容易犯的一种谬误。这种谬误就是假定：一旦一个事实呈现在心灵面前，该事实的一切后果就会与之同时涌入心灵。在许多情况下，这是一个非常有用的假设，但人们太容易忘记它是假的。这样做的一个自然后果是，人们于是认为，仅仅从数据和一般原则推出后果，并没有什么价值。

(7) 来自神经系统连续性的论证

神经系统当然不是一台离散状态机器。关于撞击一个神经元的神经冲动大小的信息中，一个小误差可能会对传出冲动的大小产生很大差别。有人也许会论证说，既然如此，就不能期望用一个离散状态系统来模仿神经系统的行为。

一台离散状态机器确实必须不同于一台连续机器。但如果我们坚持模仿游戏的条件，询问者将无法利用这种差异。如果考虑另一种更简单的连续机器，情况会更加清楚。微分分析仪就很合适。（微分分析仪是一种用于某些计算的机器，不属于离散状态类型。）其中一些以打字形式给出答案，因此适合参加游戏。数字计算机不可能精确预测微分分析仪会对一个问题给出什么答案，但它完全能够给出正确类型的答案。例如，如果被要求给出 π 的值（实际约为 3.1416），在数值 3.12、3.13、3.14、3.15、3.16 之间按 0.05、0.15、0.55、0.19、0.06 的概率（比如说）随机选择，就是合理的。在这些情况下，询问者将很难区分微分分析仪和数字计算机。

(8) 来自行为非形式性的论证

不可能产生一套声称能够描述人在每一种可以想象的情形下应当做什么的规则。例如，人们也许有一条规则：看到红色交通灯时应当停下，看到绿色交通灯时应当前进；但如果由于某种故障，两者同时出现怎么办？人们也许会决定，最安全的是停下。但这个决定以后很可能又引发进一步困难。试图提供涵盖每一种偶发情况的行为规则，即使只是那些由交通灯引起的情况，似乎也是不可能的。对此我全部同意。

由此有人论证说，我们不可能是机器。我将试着复述这个论证，但恐怕很难公允地表达它。它似乎大致是这样：“如果每个人都有一套确定的行为规则，并通过它来调节自己的生活，他就不过是一台机器。但不存在这样的规则，所以人不能是机器。”未周延中项十分明显。我不认为这个论证曾经完全这样表述过，但我相信所使用的论证仍然就是这个。不过，问题可能被“行为准则”和“行为定律”之间的某种混淆所遮蔽。所谓“行为准则”，我指的是诸如“如果你看见红灯就停下”这样的戒律，人们可以依据它行动，并且可以意识到它。所谓“行为定律”，我指的是应用于人的身体的自然定律，例如“如果你掐他，他会尖叫”。如果在所引论证中用“调节其生活的行为定律”替换“他调节其生活所依据的行为准则”，未周延中项就不再不可克服。因为我们相信，不仅受行为定律调节意味着是某种机器（尽管不一定是离散状态机器），而且反过来，作为这样一种机器也意味着受这样的定律调节。不过，我们无法像确信不存在完整的行为准则那样容易地说服自己，不存在完整的行为定律。我们所知道的寻找这类定律的唯一方式是科学观察，而且我们当然不知道在什么情况下能够说：“我们已经找得足够多了。不存在这样的定律。”

我们可以更有力地说明，任何这样的陈述都是没有根据的。假设如果这类定律存在，我们就能确信找到它们。那么给定一台离散状态机器，就应当当然可以通过观察发现足够多的信息，以便在合理时间内，比如一千年内，预测它的未来行为。但情况似乎并非如此。我曾在曼彻斯特计算机上设置了一个只使用 1,000 个存储单位的小程序，机器在给定一个十六位数后，会在两秒内回答另一个数。我敢挑战任何人，仅从这些回答中学到关于这个程序的足够信息，以便能够预测它对未尝试数值的任何回答。

(9) 来自超感知觉的论证

我假定读者熟悉超感知觉（extrasensory perception, ESP）这一观念，以及它的四个项目，即心灵感应、透视、预知和意念致动的含义。这些令人不安的现象似乎否定了我们所有通常的科学观念。我们多么希望能驳倒它们！不幸的是，至少对于心灵感应，统计证据是压倒性的。要重新安排自己的观念以容纳这些新事实，是非常困难的。一旦接受它们，相信鬼魂和妖怪似乎并不是很大一步。认为我们的身体只是按照已知物理定律，以及一些尚未发现但有些相似的其他定律运动，这一观念会是首先消失的观念之一。

在我看来，这个论证相当有力。作为回答，人们可以说，许多科学理论尽管与 ESP 冲突，在实践中似乎仍然可用；事实上，如果忘掉它，人们可以过得很好。这是一种相当冷淡的安慰；而人们担心，思考正是 ESP 可能特别相关的那类现象。

一个基于 ESP 的更具体论证可能如下：“让我们玩模仿游戏，使用一名擅长作为心灵感应接收者的人和一台数字计算机作为证人。询问者可以问这样的问题：‘我右手中的牌属于哪种花色？’这个人通过心灵感应或透视，在 400 张牌中正确回答 130 次。机器只能随机猜测，也许正确 104 次，于是询问者作出了正确识别。”这里出现了一个有趣的可能性。假设数字计算机包含一个随机数生成器。那么自然会使用它来决定给出什么答案。但这样，随机数生成器就会受到询问者意念致动能力的影响。也许这种意念致动会使机器比概率计算所预期的更常猜对，从而询问者仍然可能无法作出正确识别。另一方面，他也可能通过透视，不经任何提问就猜对。对于 ESP，什么都可能发生。

如果承认心灵感应，就有必要把我们的测试收紧。可以把这种情况看作类似于询问者在自言自语，而参赛者之一正贴着墙用耳朵偷听。把参赛者放进一个“防心灵感应室”就能满足所有要求。

7. 学习机器（Learning Machines）

读者会已经预料到，我没有什么十分令人信服的正面论证来支持自己的观点。如果有，我就不会如此费力地指出相反观点中的谬误。我拥有的证据现在将给出。

让我们暂时回到洛夫莱斯夫人的反对意见，它说机器只能做我们告诉它去做的事情。人们可以说，一个人能够把一个观念“注入”机器，机器会在一定程度上作出响应，然后陷入静止，就像被锤子击中的钢琴弦。另一个比喻是小于临界尺寸的原子堆：一个被注入的观念对应于一个从外部进入堆中的中子。每个这样的中子都会造成一定扰动，而这种扰动最终会消失。不过，如果堆的尺寸充分增加，由这样一个进入的中子引起的扰动就很可能不断增长，直到整个堆被摧毁。心灵是否有相应现象，机器是否有相应现象？对于人类心灵而言，似乎确有这样一种现象。其中大多数似乎是“亚临界的”，即在这个类比中对应于亚临界尺寸的堆。呈现给这种心灵的一个观念，平均会引起少于一个观念作为回应。较小一部分是超临界的。呈现给这种心灵的一个观念，可能会引起一个完整的“理论”，由二级、三级以及更远的观念组成。动物的心灵似乎非常明确地是亚临界的。坚持这个类比，我们问：“能否使一台机器成为超临界的？”

“洋葱皮”类比也很有帮助。在考虑心灵或大脑的功能时，我们会发现某些能够用纯机械术语解释的操作。我们说，这并不对应于真正的心灵；它是一种皮，如果我们要找到真正的心灵，就必须把它剥掉。但随后在剩余部分中，我们又发现另一层要剥掉的皮，如此等等。以这种方式继续下去，我们是否终究会来到“真正的”心灵，还是最终来到一层里面什么也没有的皮？在后一种情况下，整个心灵就是机械的。（不过它不会是一台离散状态机器。我们已经讨论过这一点。）

最后这两段并不声称是令人信服的论证。它们更应当被描述为“倾向于产生信念的诵读”。

对于第 6 节开头所表达的观点，唯一真正令人满意的支持，将是等到本世纪末再进行所描述的实验所提供的支持。但与此同时，我们能说什么？如果实验要成功，现在应当采取什么步骤？

正如我已经解释的，问题主要是编程问题。工程方面也必须取得进展，但这些进展似乎不太可能不足以满足要求。对大脑存储容量的估计从 10^10 到 10^15 个二进制数字不等。我倾向于较低的数值，并且相信只有很小一部分用于较高类型的思考。大部分大概用于保存视觉印象。如果要令人满意地进行模仿游戏，无论如何哪怕面对一个盲人，我也会惊讶于需要超过 10^9。（注：Encyclopaedia Britannica 第 11 版的容量为 2 x 10^9。）即使按现有技术，10^7 的存储容量也是非常可行的可能性。大概完全没有必要提高机器的操作速度。现代机器中可以被看作神经细胞类似物的部分，其工作速度比后者快约一千倍。这应当提供一个“安全余量”，足以覆盖多种方式产生的速度损失。因此，我们的问题是找出如何给这些机器编程，使其玩这个游戏。按照我目前的工作速度，我每天产生约一千位程序，所以约六十名工作人员在五十年中稳定工作，可能完成这项工作，前提是没有任何东西进废纸篓。似乎需要某种更快捷的方法。

在试图模仿一个成年人的心灵的过程中，我们必然会大量思考使其达到当前状态的过程。我们可以注意到三个组成部分。

(a) 心灵的初始状态，比如出生时，

(b) 它所受的教育，

与其试图产生一个模拟成人心灵的程序，为什么不转而试图产生一个模拟儿童心灵的程序呢？如果随后对它施加适当的教育过程，就会得到成人大脑。儿童大脑大概有点像人们从文具店买来的笔记本。机制相当少，空白页很多。（从我们的观点看，机制和书写几乎是同义的。）我们的希望是，儿童大脑中的机制如此之少，以至于类似的东西可以容易地编程。作为第一次近似，我们可以假定教育中的工作量与人类儿童大致相同。

这样，我们已经把问题分成两部分：儿童程序（child programme）和教育过程。这两者仍然联系得非常紧密。我们不能期望第一次尝试就找到一台好的儿童机器（child machine）。必须用一台这样的机器进行教学实验，看看它学得怎样。然后可以尝试另一台，看看它更好还是更差。这个过程与进化之间有一种显而易见的联系，可作如下对应：

儿童机器的结构 = 遗传材料

儿童机器的变化 = 突变，

自然选择 = 实验者的判断

不过，人们可以希望，这个过程会比进化更快捷。适者生存是一种衡量优势的缓慢方法。实验者通过运用智能，应当能够加快它。同样重要的是，他不限于随机突变。如果他能追踪某个弱点的原因，他大概就能想到会改进它的那种突变。

不可能把与正常儿童完全相同的教学过程应用于机器。例如，它不会配备双腿，因此不能要求它出去把煤斗装满。也许它也没有眼睛。但无论通过巧妙工程如何克服这些缺陷，人们都无法把这个生物送进学校，而不让其他孩子过分取笑它。它必须接受某种个别教学。我们不必太担心双腿、眼睛等。海伦·凯勒小姐的例子表明，只要教师和学生之间能够以某种手段双向通信，教育就能够发生。

我们通常把惩罚和奖励与教学过程联系起来。可以按照这种原则构造或编程某些简单的儿童机器。机器必须这样构造：在惩罚信号出现之前不久发生的事件不太可能被重复，而奖励信号则增加导致它的那些事件重复的概率。这些定义并不预设机器方面有任何感受。我用这样一台儿童机器做过一些实验，并成功地教会它一些事情，但教学方法过于非正统，因此这个实验不能被认为真正成功。

惩罚和奖励至多只能是教学过程的一部分。粗略地说，如果教师没有其他手段同学生通信，那么能够到达学生的信息量不会超过所施加奖励和惩罚的总次数。当一个孩子学会背诵“Casabianca”时，如果文本只能通过“二十问”技术发现，每一个“NO”都采取一次打击的形式，他大概会感到非常疼痛。因此，有必要拥有某些其他“非情感的”通信通道。如果这些通道可用，就可以通过惩罚和奖励教机器服从用某种语言给出的命令，例如一种符号语言。这些命令要通过“非情感的”通道传递。使用这种语言将大大减少所需的惩罚和奖励数量。

对于儿童机器中适合具有多大复杂性，人们意见可能不同。一种尝试是，在符合一般原则的情况下让它尽可能简单。另一种办法是让它“内置”一套完整的逻辑推理系统。在后一种情形下，存储器将主要被定义和命题占据。命题会有各种状态，例如已确立的事实、猜想、数学上证明的定理、由权威给出的陈述、具有命题逻辑形式但没有信念值的表达式。某些命题可以被描述为“命令式”（imperatives）。机器应当这样构造：一旦一个命令式被归类为“已确立”，适当的行动就会自动发生。为说明这一点，假设教师对机器说：“现在做你的家庭作业。”这可能导致“教师说‘现在做你的家庭作业’”被纳入已确立的事实之中。另一个这样的事实可能是：“教师说的一切都是真的。”把这些结合起来，最终可能导致命令式“现在做你的家庭作业”被纳入已确立的事实之中；而按照机器的构造，这将意味着家庭作业实际开始进行，但效果十分令人满意。机器使用的推理过程不必满足最严格的逻辑学家。例如，可能没有类型层级。但这并不意味着会出现类型谬误，就像我们并非一定会从没有围栏的悬崖上摔下去一样。适当的命令式（在系统内部表达，而不是构成系统规则的一部分），例如“除非一个类是教师提到过的某个类的子类，否则不要使用它”，可以产生类似于“不要太靠近边缘”的效果。

没有肢体的机器能够服从的命令式必然具有相当智力性的特征，如上面给出的例子（做家庭作业）。这类命令式中重要的一类，将是调节有关逻辑系统规则应用顺序的那些命令式。因为在使用一个逻辑系统时，在每一阶段都有数量极多的可选步骤；就服从逻辑系统规则而言，其中任何一步都是允许采用的。这些选择造成优秀推理者和平庸推理者之间的差别，而不是可靠推理者和谬误推理者之间的差别。导致这种命令式的命题可能是“当提到苏格拉底时，使用 Barbara 式三段论（syllogism in Barbara，传统三段论 AAA-1 格式名）”，或者“如果一种方法已被证明比另一种更快，就不要使用较慢的方法”。其中一些可能是“由权威给出的”，但另一些可能由机器自身产生，例如通过科学归纳。

学习机器的思想对某些读者来说可能显得悖论。机器的操作规则怎么能够改变？这些规则应当完整描述机器无论经历了什么历史、无论发生了什么变化都会如何反应。因此，这些规则完全是时间不变的。这很正确。对悖论的解释是，学习过程中被改变的规则是一种要求不那么高的规则，只声称具有短暂的有效性。读者可以把它与美国宪法作类比。

学习机器的一个重要特征是，它的教师常常在很大程度上不知道机器内部究竟发生了什么，尽管他仍然可以在某种程度上预测学生的行为。这一点应当最强地适用于由经过充分检验设计（或程序）的儿童机器产生的机器的后期教育。这与使用机器进行计算时的通常程序形成鲜明对比；那时人们的目标是在计算的每一时刻对机器状态有清楚的心理图像。这个目标只能经过努力才能达到。面对这一点，“机器只能做我们知道如何命令它做的事情”这一观点显得奇怪。我们能够放入机器的大多数程序，会导致它做出我们完全无法理解的事情，或者被我们看作完全随机行为的事情。智能行为大概在于偏离计算所涉及的完全严格受控行为，但偏离程度相当轻微，不会导致随机行为或无意义的重复循环。通过教学和学习过程使我们的机器准备好在模仿游戏中扮演角色，另一个重要结果是，“人类易错性”很可能会以一种相当自然的方式被省略，即不需要特别“指导”。（读者应将这一点与第 23 和 24 页上的观点协调起来。）学会的过程并不产生百分之百确定的结果；如果它们会，那就无法被遗忘。

在学习机器中包含随机元素大概是明智的。当我们为某个问题寻找解时，随机元素相当有用。假设例如我们想找一个 50 到 200 之间的数，它等于其各位数字之和的平方；我们可以从 51 开始，然后试 52，一直继续，直到得到一个可行的数。另一种办法是随机选择数，直到得到一个好数。这种方法的优点是没有必要记录已经尝试过的值，缺点是可能会把同一个数试两次；但如果有若干解，这并不很重要。系统方法的缺点是，在必须首先考察的区域中，可能有一个巨大的无解区间。现在，学习过程可以被看作寻找一种会使教师（或某个其他标准）满意的行为形式。由于令人满意的解大概数量非常多，随机方法似乎优于系统方法。应当注意，它被用于类似的进化过程中。但在那里，系统方法是不可能的。人们如何能够记录已经尝试过的不同遗传组合，以避免再次尝试它们？

我们可以希望，机器最终会在所有纯粹智力领域与人竞争。但哪些领域最适合作为起点？即便这也是一个困难的决定。许多人认为，像下棋这样非常抽象的活动会是最好的。也可以主张，最好给机器配备金钱可以买到的最好感官，然后教它理解和说英语。这个过程可以遵循儿童的正常教学。人们会指出事物并命名，等等。我仍然不知道正确答案是什么，但我认为两种方法都应当尝试。

我们只能看到前方很短的一段距离，但我们在那里可以看到大量需要做的事情。