论文笔记 The Design and Implementation of XiaoIce, an Empathetic Social Chatbot

背景

本周重磅论文:
L. Zhou, J.F. Gao, D, Li, and H.Y. Shum, “The Design and Implementation of XiaoIce, an Empathetic Social Chatbot Li”, arXiv:1812.08989v1,

链接

Abstract

  • 他们说小冰具有IQ和EQ的设计

  • 聊天使用马卡罗夫决策过程 Markov Decision Processes (MDPs)

  • 微软给的评价标准叫做 Conversation-turns Per Session (CPS: 每会话对话转换)

参考

意思是”聊天机器人与用户在对话场景中的平均对话转换次数”,可能意思是说聊的越长吧,会不会聊天?那种。

  • 小冰是2014年发布的,积累了6亿6千万聊天数据。

  • 平均CPS居然能达到23,可见人们有多闲。

Section 1 Introduction

  • 小冰英文名叫 XiaoIce

  • 在五个国家落地 中国 日本 美国 印度 印度尼西亚,名字各不相同,比如在日本叫 Rinna

  • 进驻超过40个平台,Wechat Facebook LINE啥的

  • 目的是和人类建立长期的感情链接。然后举了个例子,就是一个人类跟小冰的聊天吧,刚开始的时候偶尔聊一聊,到了第九周就无话不谈了。

  • 小冰采用一个”情感植入计算(empathetic computing)”框架,所以能够了解人的感受。当一个人类喜欢他和小冰之间的关系,我们就认为这个机器是能够”情感植入的”。

Section 2 Design Principle

2.1 IQ + EQ + 人格

  • IQ:包括:知识与记忆能力,图像与自然语言理解,推理,Generation(生成话语?),推测。

  • 过去五年小冰开发了230项技能(回答问题,推荐电影等)

  • EQ:共鸣和社交能力。能够理解人类的感受。可以换位思考。

  • 对话例子:

这个很厉害了,小冰说每一句话都知道这一句话的潜在语言功能。
比如 unconscious 闲聊; Drive 驾驭对话,转移话题; Active Listener 主动聆听; Question 提问; Affirmative 附和 等等。

  • 人格:小冰的人格设定是一位18岁的姑娘。有同情心,慈爱,幽默。不任性,只显示她的才智和创造性。

2.2 Social Chatbot Metric: CPS 评价标准

  • 微软定义了一个Conversation-turns Per Session (CPS,每会话对话转换)用来评价聊天机器人的性能,其意义是每场聊天中平均的对话次数。CPS越高,则聊天机器人的性能越好

2.3 Social Chat as Hierarchical Decision-Making 将聊天看作分层决策

上图是说小冰可以采用多样化的聊天模型保持用户兴趣。
比如,在第1行使用”基本聊天模型”;在第4行用”音乐聊天模型”选择一个新的主题;在第15行使用”音乐提供技能”:在第18行使用”订票技能”。

  • 小冰采用一种分层的决策机制:

    • 顶层处理:选择聊天模型(问答模型,订票模型等等)。
    • 低层处理:受顶层控制并产生聊天片段。
  • 这种决策机制在数学上是通过马尔可夫决策处理(Markov Decision Processes)实现的。在每一个对话中,机器人观察当前状态,然后选择一个技能形成一个回复。

未完待续