您当前的位置 :满洲里资讯网 > 汽车 > 旨在让聊天机器人变得更聪明微软发布了一个新的会话数据集

旨在让聊天机器人变得更聪明微软发布了一个新的会话数据集



最近,微软的Maluuba公司发布了一个开放的对话数据集。数据集基于假日计划方案——具体来说,查找航班和酒店。据报道,近年来聊天机器人的数量有所增加,特别是自Facebook一年前为这些机器人开放Messenger平台以来。目前,大多数机器人仅支持简单的顺序交互。

有了这个数据集,Maluuba(最近被微软收购)帮助研究人员和开发人员让他们的聊天机器人变得更聪明。 Maluuba让两个人在聊天室里聊天并收集数据。一个人扮演用户,另一个人扮演计算机。用户尝试查找特殊票证,另一个充当聊天机器人的人使用该数据库来检索信息。交互只包含文本(没有口头交互),研究人员有意识地选择了这种方法。大多数人喜欢打字,而不是说话,这意味着数据集远非低质量的语音识别和背景噪音。该数据集包含1,369个关于旅行计划的对话,可以免费下载。

Maluuba还提供了一种表达对话的方式。使旅行计划更加困难的原因是用户经常改变对话的主题。您也可以讨论去滑铁卢,蒙特利尔和多伦多的计划。对于我们人类而言,将人们在对话中制定的不同计划分开并不困难。但是,如果用户在预订之前探索多个选项,计算机通常会遇到问题。当您突然进入新目的地时,大多数聊天机器人都会忘记您刚刚谈到的所有内容。下面左边的图片是“传统”聊天机器人的互动。当用户说出新城市时,机器人会忘记旧城。右侧是Microsoft发布的数据集中的模式:用户在做出决策之前比较多个城市。

这就是微软推出所谓“盒子”的原因。每次用户修改以前设置的值时,向导都会创建一个新框。每个跟踪框记录所有用户提到的不同约束集。这让您可以谈论最昂贵的200美元蒙特利尔之旅以及最便宜的300美元多伦多之旅。这种会话记忆是建立机器人的一步,可以帮助用户在线旅行场景中探索不同的航班。传统的聊天机器人,就像你可以在Pandorabots上创建的那样,试图将对话引导到所谓的“插槽填充”。机器人将尝试在您给出的答案中找到一些属性(例如姓名和年龄)。一旦聊天机器人知道这些属性,对话就会继续,机器人会尝试填充下一个位置。 Facebook收购的其他公司,如Wit,已经将这一想法更进一步贯穿“故事”。语言理解层之上的这个“灵活层”创造了一种“感觉更自然”的对话。 Maluuba发布的数据集更进了一步,同时侧重于涉及多个主题的对话。