致力于通用人工智能的微软公司Maluuba最近发布了一个新的开放式对话数据集,该数据集基于预订假期-尤其是寻找航班和旅馆。
聊天机器人的数量最近有所增加,特别是自一年前Facebook 对这些机器人开放Messenger平台以来。
目前,大多数漫游器仅支持非常简单和顺序的交互。聊天机器人仍然难以完成旅行计划之类的高级用例。
有了这个数据集,Maluuba(最近被Microsoft收购)可帮助研究人员和开发人员使其聊天机器人变得更智能。
Maluuba通过让两个人在聊天框中进行通信来收集此数据。一个人扮演用户,而另一个人则扮演他就像是一台计算机。
用户试图找到最适合自己航班的优惠,而玩聊天机器人的人则使用数据库来检索信息。交互仅由文本组成(没有语音交互),这是研究人员的有意识选择。
大多数人都喜欢打字而不是说话,这意味着该数据集没有不良的语音识别和背景噪音。结果是一个包含1,369个旅行计划对话的数据集,可以免费下载。
马鲁巴还提出了代表对话的一种方式。使旅行计划更加困难的是,用户经常更改他们的谈话主题。同时,您可能会讨论前往滑铁卢,蒙特利尔和多伦多的计划。我们的人类毫无疑问地将人们在谈话时制定的不同计划分开。
不幸的是,如果用户在预订之前浏览了多个选项,则计算机会遇到问题。当您突然进入新目的地时,大多数聊天机器人都会忘记您谈论的所有内容。
在左下方的图像中,您可以看到与“传统”聊天机器人的交互。一旦用户说出新城市,机器人就会忘记旧城市。在右侧,您可以看到发布的数据集中出现的一种模式:用户在做出决定之前先比较多个城市。