c

终身学习的人工智能

文=马修•赫特森

如果你毕业后就不再学习会怎么样?这么做可能会让你变得落伍,但这正是大部分机器学习系统被训练的方式——当它们能胜任某项任务后便被用于实际场景。不过目前,一些计算机科学家正在开发像人类大脑那样可以持续学习和改进的人工智能。

 

机器学习算法通常采用神经网络的形式,即很多简单的计算元件(神经元)通过彼此间强度(权重)不同的联系来相互交流。比如在设计一种用来识别图片的算法时,如果在训练时,算法错误标记了一张图片,那么权重就会被调整。当错误被降低到特定阈值以下时,权重就不会再变,会被冻结在设定值上。新技术将每个权重部分成了两个数值,二者共同影响了一个神经元在多大程度上能激活另一个神经元。其中第一个数值与传统系统中训练和冻结的方式相同。但是第二个数值会不断根据网络中周围的活动进行调整。很关键的是,该算法还会学习如何调整这些权重。因此,该神经网络不仅学到了行为模式,还学会了如何根据新环境来修改行为的各个部分。2018年7月,研究人员在瑞典斯德哥尔摩召开的一次会议中展示了他们的这项技术。

 

该团队使用这项技术创造了一个神经网络,在看到完整图片仅几次后就能把被擦掉了一半的图片复原。与之相比,传统的神经网络得看到更多图片才能恢复原始图片。研究人员还创造了一个神经网络,能在仅看到一个例子后便学着识别出了手写字母——手写体与打印体不同,是不规整的。

 

在另一项任务中,神经网络控制一个角色在一个简单迷宫中寻找奖励。在100万次尝试后,能半调节权重的系统在每次尝试中找到奖励的次数,比固定权重的系统多出两倍。半调节权重中固定的部分显然掌握了迷宫的结构,动态的部分则掌握了如何发现新的奖励的位置。“这太厉害了,”美国加利福尼亚大学伯克利分校的计算机科学家尼基尔·米什拉(Nikhil Mishra,未参与此项研究)说,“因为这样的算法能更快适应新任务和新场景,就像人一样”。

 

共享出行公司Uber的计算机科学家、论文的第一作者托马斯·米科尼(Thomas Miconi)说,他们的团队目前打算解决更复杂的任务,比如控制机器人和语音识别。米科尼想在此类新任务中模拟“神经调节”,这是一种即时的、基于神经网络的、适应性的调节,使得人类在发生了新奇或者重要的事情时能够吸收知识。信息化周刊

 

摘自:《环球科学》2018年12月号

电子杂志阅读

微信扫一扫

 

 

 

 

 

 

评分
( 0 人投票 0分 )

提交评论(不超过800字)