建筑智能机器变得越来越聪明的大脑

照片:Pixabay CCO知识共享

作者:布莱恩冷

人工智能(AI)正在好转。你可以看到它在你周围,Alexa和Siri保持你的约会和购物清单,对自动驾驶汽车新闻文章,名为AlphaZero (万博下载包银et al ., 2018),可能会永远不要失去在国际象棋或任何人类。但即使最聪明的人工智能仍然无法导航通过社会互动在操场上满是二年级学生,虽然第二年级一直都这样做。这是因为当今最成功的人工智能需要大量的训练数据的特定区域,它将工作为了知道在任何情况下的反应,和没有人试图收集二年级操场数据。的难以置信的力量背后的大脑这些车外的无人驾驶汽车是无用的——特斯拉不能下棋,Alexa不能开车,AlphaZero不知道如何抓住一个购物清单。

然而单个个体人类最终能够找出如何开车,找到音乐,下棋至少相当不错,虽然过程需要许多年。人们不断学习和改善他们的表现在各种各样的任务,而这成就指出人类的大脑和研发核心区别在AI:人们general-purpose-learning-and-performance实体,而人工智能是最有效的针对特定任务的时候。

这种差异的原因是显而易见的,当你考虑如何以及为什么人们和人工智能的设计。人类应对各种各样的生态约束条件,如需要成功的食品发现者,庇护提供者,mate-finders,儿童照顾者。进化的过程,在这些压力给人们一般学习能力,所以我们可以了解一个特定的概念,适用于许多不同的情况。例如,一个孩子可能学习,通过努力在篮球和投入大量的时间和练习在夏天,在冬天她能回来的篮球队。当这个孩子长大后,她可以应用课准备和努力工作的价值,让在她喜欢的大学,建立一个舒适的家,甚至保持婚姻稳固。

目前成功的人工智能,另一方面,是设计和建造工作很好只是一个或一个非常有限的任务。这并不一定是坏事,工程师建造技术来解决问题,和个人的人工智能应用程序可以解决很多问题,这集中的方法。自动驾驶汽车的性能近年来已经有了很大的改善,但在有些情况下,人工智能可以适应意想不到的情况和有很大的影响。一些明确的例子是移动机器人控制系统,操作没有任何人类的指导,比如机器人正在探索一个危险的地区,没有可靠的通信与人类用户。

如果我们的大脑能做它,所以我们可以

建筑人工智能可以处理小说情境输入是一个艰难的挑战,目前收到关注和研究经费低于生产成功的方法,更多的目光狭隘的应用程序。大道之一的研究有可能加快构建具有更好的适应性和可概括的AI进步是转向一个旧的,可靠的灵感来源:人类的大脑本身。大脑一直担任构建人工智能模型。网络互联计算元素设计工作像神经元(神经网络)是当今成功的深度学习的核心策略。但神经网络是出了名的坏在产生合理的结果当他们测试了意想不到的输入。因为大脑使用神经元计算,与人工神经网络不同,大脑做好处理意想不到的改变他们的环境,我们必须仔细看看人类神经系统如何处理信息来了解如何构建适应性强人工智能。

对未来的预测是困难的,尤其是(约吉贝拉)

的新兴技术研究小组在横切阅读认知信息加工理论(例如,Pezzulo et al ., 2018)和审查发表神经科学和认知科学实验(例如,Klein-Flugge & Bestmann, 2012)来拼凑一个高级的大脑从环境中使用输入来指导行动。开始与其他科学家的观念,我们的大脑不断预测未来,而神经表征的行动总是与世界会发生什么,因为这一行动,我们开发了一个框架(冷,2017)描述如何认知信息处理是关于创造可能的未来,选择其中一个期货,然后试图让未来发生。

现在框架只是一个猜测,但这是一个猜测,同意先前的许多理论(花岗岩碎砾,2004;克拉克,2013),和许多神经科学和认知科学实验的结果(Giovannucci et al ., 2017)。我们知道人类的大脑在不同的时间使用不同类型的学习,和框架包括的想法这些不同的学习类型如何帮助创造未来,未来的选择,和试图实现未来。

我们认为,不同类型的学习与互动的方式表示的期货是人们如何可以应用的关键教训他们学习一个任务在其他任务工作,以及我们如何在意外的情况下反应相当不错。作为一个例子,我们知道我们醒着的每一刻,我们的大脑不断了解世界的不同部分是如何交互的。经过多年的不断学习,人们建立一个巨大的知识库的所谓常识,他们可以利用在任何情况下。

使它工作

我们的团队现在的目标是使用这个新框架作为人工智能的设计灵感,也可以很容易地将学习任务和适应环境的变化。我们致力于给人工智能代理常识引导他们当他们面临意想不到的挑战。现在我们调查框架如何使用奖励来自环境的信息来创建目标,并使用其优先考虑这些目标的持续的无监督学习。创建和优化自己的目标的能力应该允许代理在多个领域,如穿越困难地形以及新奇的刺激信息交流。

然而,允许一个代理从头开始学习目标和优先级将需要更长的时间比构建目标代理与精心挑选和训练数据。我们必须找出如何扩展和优化学习过程。最终目标是设计一种机器,可以在多个域适应意料之外的输入。也许有一天,同样的人工智能应用程序驱动的车可以停在商店买些杂货,然后订比萨饼如果杂货店的披萨面团准备晚餐。如果是这样,我们认为这将是类人脑学习,适应性强人工智能。

布莱恩冷是一个神经学家,软件工程师大脑结构和功能建模,开发了一个自动化的股票投资组合风险优化器,记录的证据无意识加工,指导他女儿的篮球,垒球和足球队,非常喜欢浮潜。他是一个组的一部分,应用神经技术和生物力学建模的大脑和身体,提高赞助商团队培训计划,分析损伤与预防的目的。

引用

克拉克,a (2013)。无论下一个吗?预测大脑,位于代理和认知科学的未来。Behav。大脑科学。36岁,181 - 204。doi: 10.1017 / S0140525X12000477

冷,b (2017)。扩展的标准理论选择动作产生一个更完整的认知模式。在AAAI秋季研讨会系列。从检索https://www.aaai.org/ocs/index.php/FSS/FSS17/paper/view/15991

Giovannucci,。Badura,。,Deverett, B., Najafi, F., Pereira, T. D., Gao, Z., et al. (2017). Cerebellar granule cells acquire a widespread predictive feedback signal during motor learning. Nat. Neurosci. 20, 727–734. doi: 10.1038/nn.4531

花岗岩碎砾,r (2004)。的仿真理论表示:电机控制,图像和感知。Behav。大脑科学。27日,377 - 442。doi: 10.1017 / s0140525x04000093

Klein-Flugge, m . C。,and Bestmann, S. (2012). Time-dependent changes in human corticospinal excitability reveal value-based competition for action during decision processing.j . >。32岁,8373 - 8382。doi: 10.1523 / jneurosci.0270 - 12.2012

Pezzulo G。,Rigoli F., Friston K. J. (2018). Hierarchical active inference: a theory of motivated control. Trends Cogn. Sci. 22, 294–306. 10.1016/j.tics.2018.01.009

银,D。,Hubert, T., Schrittwieser, J., Antonoglou, I., Lai, M., Guez, A., Lanctot, M., Sifre, L., Kumaran, D., Graepel, T., Lillicrap, T., Simonyan, K., Hassabis, D. (2018). A general reinforcement learning algorithm that masters chess, shogi, and Go through self-play. Science, 362 (6419), pp. 1140-1144

横切为导向的团队致力于解决问题的一个更安全的世界。了解更多关于斜方。

参见:

真实的世界将会是:劳动力发展内外斜接

抓住你后:回顾的一代人工智能网络的挑战

网络钓鱼、旗帜和教案:即将到来的这家网站代AI连结

数据科学的技术挑战

定义、应用、和协调数据科学横切

升级机器学习。安装的大脑(Y / N) ?

这是一只狼吗?机器学习理解的偏见

2019年1月7日,

博客,机器学习、人工智能和科学数据