一旦人们知道你是一个 “人工智能人",这个问题很快就会在聚会上出现(我想这就是足科医生的感受,除了聚会中的拇囊炎检查和医学博士级别的收入)。不过,这个问题还是很棘手。
这是一个很难回答的问题,尤其是当你想在鸡尾酒会的音乐中大声说出答案时。说它 “具有欺骗性",是因为它应该很简单:毕竟,它代表的是 “人工智能"–答案就在名字里!事实上,要简明扼要地定义 “人工智能 “确实很难,因为人工智能并不简明扼要–人工智能有很多种,从玩比国际象棋复杂得多的游戏,到制作令人信服的艺术作品甚至视频,无所不能。鉴于每年都有成千上万篇新颖的人工智能论文,人工智能的范围只会越来越广。
如果你在网上搜索 “人工智能的简单定义是什么",排名靠前的搜索结果会让鸡尾酒会上的普通提问者感到非常不满意:
“人工智能是通过机器,特别是计算机系统来模拟人类的智能过程"。
这种回答很可能会遭到白眼并转移话题–真正好奇的人可能会坚持说:"是啊,很酷,但人工智能到底是什么呢?
我认为,人们实际上问的是 “人工智能是做什么的?",或者更确切地说,是 “Ambiq 的人工智能是做什么的?"。这个问题比较容易回答,也是一个非常好的问题,让我来试一试:
“人工智能是一类非常擅长从模糊的现实世界输入中得出结论的算法"。
听起来不错!不过,我们还是应该对我们的定义进行一下解读。
当我们说 “模糊的真实世界输入“时,我们指的是来自真实世界的数据,如图像、声音、噪音、振动,甚至心电图。所有这些数据都具有一定的随机性和混沌性。例如,一张猫的照片几乎可以是无限变化的(任何猫的主人都会这么说!),即使我们谈论的是一只特定的猫,我们也会得到不同的光线、角度、距离、弱光噪音以及图像中的其他物体。对于一个人来说,很容易就能发现自己看到的是一只猫(我们几乎是无意识地这样做的–人们不需要分析图片,我们就是知道),但如果没有人工智能,要给计算机编程来做同样的事情是极具挑战性的。真正令人兴奋的是,我们可以将人工智能应用到对我们来说并不那么 “自动 “的事情上。例如,观察一个斜线并找出它对应于一个人慢跑时的三维加速度,这对人类来说很难,但对人工智能来说却比处理猫的图片要容易得多。同样,教人类读懂心电图需要花费数年时间进行昂贵的教育,但人工智能在智能手表上就能做到。
当我们说 “结论 “时,我们的意思是 “这可能是一张猫的照片"。这里的 “可能 “很重要,因为和人类一样,人工智能也是以概率为基础的。人工智能算法很少能百分百确定自己的结论。这在处理现实世界中的模糊问题时非常有用,比如判断一只狗是马拉穆特犬、哈士奇犬、秋田犬还是萨摩耶犬(谁知道有这么多长得像的狗?)
最后,当我们说 “非常好“时,我们指的是 “人类在这类问题上所创造的最佳算法"。例如,自上世纪中叶以来,教计算机理解人类语言就一直是一个持续进行的项目,但直到人工智能驱动的语音识别出现后,它才派上了用场(任何在 2000 年代初尝试口述电子邮件的人都知道这一点)。计算机视觉、语言翻译,甚至简单的步数计算都是存在了几十年甚至上百年的其他功能,但一旦应用了人工智能,这些功能都变得更好用了。
在鸡尾酒会的谈话中,我往往会过于兴奋地谈论我们在 Ambiq 所做的人工智能工作(例如我们的高效语音识别、心电图监测仪和其他功能),人们开始找借口回到吧台,而我则去寻找更多的受害者来谈论人工智能,这比谈论拇指外翻要有趣得多。

教学与听写
人工智能之所以如此强大,在于我们如何告诉计算机做事情–在人工智能中,我们是在 “教 “它,而不是向它发号施令。
传统编程是 “基于规则 “的,也就是说,你要详细地告诉计算机规则是什么。这种传统方法对于 ATM 交易或网上商店非常有效,但对于人工智能最擅长的模糊任务却非常糟糕。
举个我们最喜欢的例子:猫的图片。如果你要向外星人解释如何判断猫是猫,你会使用什么规则?眼睛形状?两眼之间的距离?鼻子形状?眼睛到鼻子的距离?相信我,这些规则很快就会多达数千条甚至数百万条。几十年来,计算机科学家一直是这样处理这类问题的(并不是因为他们不了解人工智能,人工智能在 20 世纪 40 年代就有了雏形,而是因为当时还不具备实用人工智能所需的计算能力)。
一旦人工智能所需的计算能力和数据变得切实可行,人工智能开发人员就能够建立一套简单的统计规则(神经网络架构和训练规则),模仿大脑的工作方式,并将数以百万计的猫咪图片塞给它。最巧妙的是,对于每张图片,他们都让人工智能得出结论,并巧妙地改变神经网络,使结论一次比一次更准确。
最终,人工智能的神经网络将学会猫就是猫,无论图片的环境如何。那些我们没有明确定义的数百万条规则呢?我们仍然需要它们,只不过不是把每一条都写下来,而是把它们记录在组成神经网络的成千上万个神经元中。
