目标驱动系统模式是人工智能(AGI)的关键吗?

2020-06-01 10:32:24    来源:新经网    作者:冯思韵

自从人工智能诞生以来,研究人员一直试图通过让机器与人类玩游戏来测试机器系统的智能。人们通常认为,人类智慧的标志之一是能够创造性地思考,考虑各种可能性并在制定短期决策时牢记长期目标。如果计算机可以像人类一样玩困难的游戏,那么它们肯定可以处理更复杂的任务。从1950年代开发的具有早期跳棋功能的机器人到如今具有深层学习能力的机器人,在象棋,围棋和DOTA等游戏中甚至可以击败世界上最好的玩家,可以找到谜题解决方案的机器的想法早已古老。 AI本身,如果还不算老的话。

目标驱动系统模式是人工智能(AGI)的关键吗?

因此,组织开发的AI的核心模式之一就是目标驱动的系统模式,这是有道理的。像其他AI模式一样,我们看到这种形式的人工智能用于解决一系列常见问题,这些问题原本需要人类的认知能力。在这种特定模式下,机器要解决的挑战是找到问题的最佳解决方案的需求。问题可能是找到穿过迷宫的路径,优化供应链或优化驾驶路线和空闲时间。无论有什么特殊需求,我们在这里寻找的力量都是通过反复试验来学习,并确定解决问题的最佳方法的想法,即使这不是最显而易见的。

通过反复试验加强学习

增强学习是最有趣但使用最少的机器学习形式之一。 与监督学习的方法(其中机器通过人为训练,具有良好标签的数据进行培训来学习)或无监督的学习方法(其中机器尝试通过发现信息集群和其他分组来学习)不同,强化学习尝试通过尝试性学习来学习。错误,使用环境反馈和总体目​​标来迭代成功。

在不使用AI的情况下,组织依靠人类来创建基于程序和基于规则的系统,以指导软件和硬件系统如何操作。如果计划和规则在管理资金,员工,时间和其他资源方面可能有些有效,那么它们就会变得脆弱而僵化。这些系统仅与人类制定的规则一样强大,并且机器根本没有真正在学习。而是将人的智力纳入规则中才能使系统正常工作。

另一方面,目标学习型AI系统只有很少的规则,需要通过迭代来学习该系统如何独立工作。这样,AI可以完全优化整个系统,而不必依赖于人类设定的易碎规则。目标驱动的系统已证明其价值,表明系统找到解决挑战性问题的“隐藏规则”的超强能力。在必须进行资源优化的领域中,由目标驱动的系统多么有用就不足为奇了。

AI可以有效地用于场景模拟和资源优化。通过将这种通用方法应用于学习,可以将支持AI的系统设置为优化特定目标或方案,并找到许多解决方案,其中一些对于他们更具创造力的人类同行甚至都不是很明显。这样,尽管目标驱动的系统模式没有像其他模式(例如识别,预测性分析或对话模式)那样被广泛实施,但在广泛的行业中潜力却是巨大的。

在金融领域,基于强化学习的目标驱动系统正在用于“机器人咨询”等用例,“机器人咨询”利用学习来识别可满足个人特定需求的储蓄和投资计划。目标驱动系统模式的其他应用已用于交通信号灯系统的控制中,从而找到了控制交通信号灯而不引起中断的最佳方法。供应链和物流行业的其他用途是寻找包装和交付货物的最佳方法。进一步的用途包括帮助训练物理机器人,创建使机器人可以运行和跳跃的机制和算法。

目标驱动系统甚至被用于电子商务和广告中,以找到商品的最佳价格并自动进行广告空间的出价。目标驱动系统甚至在制药行业中用于执行蛋白质折叠和发现疾病的新方法和创新方法。这些系统能够选择最佳的试剂和反应参数,以获得所需的产品,从而使其成为复杂而精致的药物或治疗过程中的资产。

目标驱动的系统模式是人工智能(AGI)的关键吗?

通过反复试验学习的想法很有效,并且可以应用于任何问题。值得一提的是,DeepMind是一家将机器变成现实的组织,该组织可以解决一台曾经被人类打败的机器而无法解决的问题,该组织认为,强化学习型目标驱动系统可能是解锁机器人最终目标的关键。一台可以学到任何东西并完成任何任务的机器。“一般情报”的概念就像人类的大脑一样。人工智能(AGI)不再像今天所有现实世界AI系统那样专注于狭窄的单一学习任务,而是可以学习任何任务并将学习从一个领域应用于另一个领域,而无需进行大量的重新培训。

深心,该公司在英国成立,并于2014年被Google收购,旨在通过突破目标驱动系统和其他AI模式的能力界限,解决一些最复杂的机器智能问题。从专门为学习如何与人类对手玩Go游戏而专门设计的AlphaGo开始,该公司迅速扩展了AlphaZero,后者可以从头开始学习任何游戏。以前需要AlphaGo花费几个月的时间来学习,现在AlphaZero可以使用增强型学习在短短几天内完成。从零开始,以提高胜率的唯一目标,AlphaZero在所有100款测试游戏中均胜过AlphaGo。AlphaZero通过简单地对自己玩游戏并通过反复试验来实现这一目标。通过这种简单的方法,通用学习系统不仅能够创建模式,而且本质上可以为提供给它的任何输入设计最佳条件和结果。可以预见,这成为DeepMind的最高荣耀,也是AI行业的圣杯。

自然,就像技术行业中的人们经常使用新技术一样,他们将想法转向可能的实际应用。AlphaZero是利用当时可用的最佳技术创建的,例如机器学习和应用其他领域,例如神经科学和行为心理学研究。这些技术被用于强大的通用学习算法的开发中,也许我们距离AGI研究的真正突破可能还需要几年的时间。

人工智能行业在机器学习研究方面处于一个十字路口。当今使用最广泛的算法正在解决重要但相对简单的问题。尽管机器已经证明了它们能够识别图像,理解语音,查找模式,发现异常并做出预测的能力,但它们仍依赖于训练数据和狭窄的学习任务来以任何精确度完成任务。在这种情况下,机器学习非常耗费数据,并且计算量很大。如果您有足够复杂的学习任务,则可能需要PB或更多的训练数据,数十万美元的GPU密集型计算以及数月的训练。显然,仅靠暴力手段无法解决AGI。

目标驱动的系统模式虽然今天已成为七个模式中最少实施的模式之一,但它可能是掌握数据和计算密集型知识的关键。目标驱动的系统越来越多地在具有实际用例的项目中实施。因此,由于其潜在的前景,它是最有趣的模式之一。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。