众所周知,非目标对话的完全数据驱动的 Chatbots 在轮流中的行为不一致,这源于控制参数(如假定的背景个性和对事实的了解)的一般困难。原因之一是相对缺乏标记数据,从这些数据中可以学到个性一致性和事实用法以及对话行为。为了解决这个问题,我们在电影讨论领域引入了一个新的标记对话数据集,其中每个对话都基于预先指定的事实和意见。我们彻底验证了收集的对话,以便参与者遵守他们给出的事实和意见,并发现这方面的一般质量很高。此过程还为我们提供了额外的注释层,该注释可能对培训模型有用。我们作为基线引入基于此数据的端到端训练的自我关注解码器模型,并表明它能够生成有意见的反应,这些响应被判断为自然和知识渊博,并表现出专注。