登陆

美团对话了解技能及实践

admin 2019-09-07 277人围观 ,发现0个评论

智能客服是一种运用天然言语与用户交互的人工智能体系,经过剖析用户目的,以人性化的办法与用户沟通,向用户供给客户服务。

本议题首要介绍美团智能客服的对话交互结构,然后就咱们在其间目的发掘、目的了解、心情辨认、对话办理等中心模块中用到的机器学习算法进行具体的介绍。


美团点评的使命是 " 帮咱们吃得更好,日子更好 " 。美团线上服务的 APP 包含了日子服务方方面面,包含餐饮、外卖、打车、酒店事务等。2018 年全年美团的总买卖金额达 5156.4 亿元人民币,同比添加 44.3%;2018 年美团单日外卖买卖笔数超越 2100 万笔。美团的各个 APP 上具有很多的客服信息类的数据,这也为工程师供给了很好的练兵场。

一、智能客服对话结构


当用户进入到客服界面时往往是带着一个问题来的,那么咱们需求做的便是对这个问题进行了解,然后依据了解成果去恳求相应服务,去处理用户的问题。这里边首要分为两大块,一方面是离线练习和常识库收拾部分,另一部分是在线处理部分。

在在线部分,首要需求对问题进行根底特征的提取,比方:分词、语义标签抽取、心情剖析、NER 辨认等;从而进入下面一层 - 目的了解层,首要有问题范畴分类、目的辨认和特色抽取;目的了解之后就进入到了对话办理这个阶段,对话办理模块首要包含两个部分,状况追寻 ( DST ) 和对话决议计划,DST 依据上下文状况清晰当时用户的范畴和目的,而对话决议计划模块则依据用户当时目的决议后续动作;再之下是事务服务层,包含各事务的数据服务接口以及事务数据出现款式等。

二、目的了解


美团围绕着日子服务有着许许多多场景和事务,针对客服服务而言,用户或许是从单一的事务窗口进入到客服中,这时咱们是知道该客服服务归于哪个范畴;用户也有或许是从美团的归纳门户进口进入到客服中,在这种情况下咱们无法判别用户需求进行哪个事务范畴方面的咨询。

除此之外,在场景方面,首要触及单轮 QA 和多轮 Task,针对一些简略的问题,单轮的 QA 就能够处理,举个比方:

U: 美团送餐时刻

S: 用户您好,能否配送是以商家经营时刻为准的。如您所选的商家正在经营,便代表能够供给点餐及配送服务。

而很多杂乱的事务经过单轮的 QA 是无法完结的,这时分就需求多轮对话,举个比方:

怎么成为美团商家?


像这种就需求多轮的使命 Task 才干处理。


因为美团包含很多的事务范畴,所以当用户提出一个问题时,咱们首要要将这个问题进行范畴分类,把它分到某个事务范畴去,然后用事务常识去处理这个问题;范畴清晰后便是目的分类,依据问题的不同类别,比方问答类的、闲谈类的等,选用的办法也会有所差异。接下来将对这两个方面做具体介绍。

2.1 范畴分类


针对范畴分类使命,如上图所示,咱们首要会从不同的事务中收集很多的事务数据,作为根底的练习数据,尽管这些数据来自不同的事务,可是仍然存在一些问题,首要有以下两方面:

  • 标签禁绝:用户有或许会在某个事务对话中发问其它范畴的问题;
  • 范畴堆叠:某些问题或许会在多个范畴中出现。

所以,原始数据不能直接拿来作为练习数据,必需求经过人工挑选和标示方可运用。 为了节约人力本钱和进步迭代速度,咱们选用了自动学习结构,模型的迭代首要分为如下几步:

  1. 收集事务数据,为每条事务数据打上相应的事务标签
  2. 对数据进行模型练习
  3. 将上步练习好的模型对样本进行猜测
  4. 标示人员对猜测样本进行标示,选出过错和难分隔的样本
  5. 回来第 2 步,对标示好的数据从头进行练习



咱们一起也在不同的模型上测验范畴分类作用,实践中的各模型作用如上图所示。 从成果中咱们能够看出,BERT 的作用是十分高的,可是呢咱们也会考虑模型在实践运转中的功率问题。 关于一个 15 个字左右的 query 来说,用 TextCNN 模型在 10ms 以内就能够处理,假如用 BERT 模型的话或许需求 70ms 左右,这个时刻仍是比较长的,当时实践上线的时分咱们选用的是 TextCNN 模型。 这是 2014 年 Yoon Kim 提出的一种办法。


2.2 目的分类

针对目的分类,首要包含问答型目的了解和使命型目的了解两个方面。


这两类问题有着各自的特色,针对问答类,咱们选用检索和类似度排序的战略,下图是问答类的规划架构。


针对使命型的目的了解,咱们选用规矩和模型结合的办法,一种是经过规矩的办法,比方上下文无关文法,另一种是选用模型练习的办法。

上下文无关文法


上图便是其间一个比方,在工业界这种办法仍是十分通用的,关于问题冷启动,高频出现的问题和惯例的问题,选用规矩的办法能够很好的处理。

多使命学习模型


模型部分咱们把目的分类和特色抽取联合建模,作为一个多使命学习 ( Multi-task Learning ) 使命,如上图所示 ( 算法详见 Zhang, Xiaodong 2016IJCAI ) 。双向 LSTM 处理后,一方面会经过 softmax 分类输出目的多分类的成果 ( 右边的 y^u );别的经过 CRF 层,符号每一个词的槽位标签。具体来说,关于 " 帮我找一家明日正午合适 10 人聚餐的川菜馆 ",模型应该能辨认出来它是归于订餐目的,一起又能够抽取出时刻 " 明日正午 " 、人数 " 10 " 和美团对话了解技能及实践口味菜系 " 川菜 " 等特色信息。

2.3 对话状况追寻 ( DST )


DST 处理的仍是一个目的的问题,依据当时上下文的环境或许状况来清晰当时用户的切当目的。


上图是咱们当时的结构,这个 session context 为上下文信息,NLU 模块的输出信息或许是多个目的,咱们需求依据其他的一些信息,比方,订单信息、门户信息,美团对话了解技能及实践进口信息等,结合 session context 去清晰它是归于哪个范畴。

假如这个范畴不能清晰怎么办?咱们的做法是会跟用户进美团对话了解技能及实践行一轮的弄清,反诘用户一次,来处理这个问题,也便是结构最左面的 " domain 不清晰进行弄清 " 逻辑。

范畴一旦清晰后,下一步会进入到目的这一块,咱们要清晰它当时是什么目的,当然接收到的 query 也面对多目的判别的问题,相同咱们也能够去做弄清,弄清包含运用上下文信息断定,或许添加一轮与用户的交互来弄清,假如清晰则持续下面的流程,这是咱们全体的架构。美团对话了解技能及实践

举个栗子

假如接收到一个信息是 " 牛肉汤撒了 ",首选咱们要判别它是归于哪个范畴的,它是归于外卖商家这个范畴,接着判别其目的,对目的进行弄清后得知目的是 " 怎么恳求餐损 ",然后走餐损的流程。


三、常识发现

3.1 人在回路

客服的目的是为了处理用户的问题,AI 在现有的 work flow 中节约人力,可是机器处理不了的工作仍是要交给人来处理。所以鄙人图中,咱们一定要加一条转人工的服务。别的咱们运用无监督学习从日志中发掘出的常识点也需求人工 " 事务运营 " 来 check 。在整个环路里监督学习从常识库中学习到的语义表明才能又能够供给给无监督学习运用,这个鄙人面会进一步说到。


3.2 无监督学习在常识发现中使用


无监督机器学习首要触及两个问题,一个是语句的语义表明,另一个便是怎么做常识聚类。

在语义表明问题上,咱们做了很多的试验,在迭代的过程中,咱们用到了 DSSM 模型、seq2seq 模型和 BERT 模型来做目的的类似度核算,在这个过程中咱们发现不同的模型有各自的特色,它或许捉住不同维度的特征,在离线模型中咱们用多个模型的拼接的办法来表明其语义向量。


在常识点聚类这个问题上,咱们选用用了最通用的 K-means 模型来做的。


上面讲到的是目的和说法的发掘,在实践事务中咱们有很多的 Task 的问题。下图出现的是一个 " 怎么恳求餐损 " 的 Task 树。


当用户的问题触发 Task 后,Task 机器人依据和用户的沟通来获取槽信息,调用不同 API 接口来获取槽信息,从而回复用户。上图 " 怎么恳求餐损 " Task 需求清晰的槽包含 " 配送办法 " 、" 餐损原因 " 、 " 恳求状况 “,其间 " 配送办法 " 和 " 餐损原因 " 是经过与用户的交互来清晰,” 恳求状况 " 则是经过恳求后台服务来清晰。

在这个环节中咱们需求做的便是辅佐运营人员构建 Task 类的常识。

咱们依据用户的日志数据提取相应目的,然后依据目的共现,回复共现去发掘,当一个用户问了一个问题之后还会发问哪些问题,当美团对话了解技能及实践用户收到反应之后还会反诘哪些问题。依据这些去构建 Task 子树,离线构建好之后交给运营的同学,运营同学审阅经过之后就能够上线了。

四、心情辨认

4.1 布景介绍

客服热线是咱们公司对外服务的重要沟通通道,在售前、售中和售后的各个环节中发挥着重要作用,为用户供给定见处理、材料办理、技能支撑等多项服务。可是现在客服热线在运营过程中还存在一些痛点,如客服人工坐席的服务水平参差导致客户的体会存在差异,别的单个客户还存在动机杂乱等问题。因而怎么运用技能提高客服热线的服务水平、检测热线中或许的危险是现在需求处理的一个问题。 本项目对客服热线中的语音数据进行发掘与剖析,经过量化用户的心情能量值,完结对用户心情状况 ( 是否激动、情感倾向等 ) 的追寻,并且在客户心情超越设定阈值时供给预警信息,以便相关人员和应急办法的及时介入,从而为相关事务部门供给运营数据支撑和智力支撑,终究提高客服热线的服务质量和服务功率。

4.2 特征提取


FTT:短时傅里叶变换

每帧语音都对应于一个频谱 ( 经过短时 FFT 核算 ),频谱表明频率与能量的联系。

梅尔滤波:试验观测发现人耳就像一个滤波器组相同,它只重视某些特定的频率重量 ( 人的听觉对频率是有挑选性的 ) 。也就说,它只让某些频率的信号经过,而压根就直接无视它不想感知的某些频率信号。

4.3 模型挑选

特征处理完结之后便是选用哪种模型来进行练习。


在迭代中咱们选用过传统的机器学习模型,比方 LR、SVM 模型,神经网络模型,和一些预练习好的模型,在这个里边咱们遇到的一个应战便是,一个心情是不是激动的标签是针对整个通话记录标示的,可是用户在通话的过程中,不是一向的激动,而是在某个通话阶段心情激动,而一个标签无法体现出到底是那一部分激动,是全程激动,仍是部分激动,仍是全程安静的,其实这个里边就触及到一个弱标签的学习,如下图所示。


这是 19 年提出的一个算法,在实践使用中作用不错,感兴趣的同学能够依据信息去查找。

在实践的作用上,各个模型的体现如下:

MFCC + LSTM < MFCC + CNN < VGGish + ferture level attention < VGGish + decision level attention

五、展望

  • 多轮上下文建模,目的了解
  • 让用户做挑选题,做目的预判,目的引荐
  • 语音与文本多模态,弱符号学习,心情危险辨认
  • 对话前史的论题抽取及切开,话术引荐,坐席助理

以上是当时咱们正在展开及探究的智能客服了解部分的内容,从 ToC 的用户侧,以及 ToB 的坐席助理侧两方面来优化整个客服闭环。

作者介绍:

江会星博士,美团点评查找与 NLP 部 味道NLP 中心的研讨员,智能客服团队担任人,首要担任美团智能客服事务及对话渠道的建造。曾在阿里达摩院语音试验室从事智能语音对话交互方向研讨,首要担任主导的产品有斑马智行语音交互体系、YunOS 语音助理等。

团队介绍

美团点评查找与 NLP 部 NLP 中心秉承 " 让机器了解人类言语,让机器与人天然对话,用数据打造常识大脑 " 的信条,致力于建造国际一流的天然言语处理中心技能和服务才能,打造智能客服对话渠道,打造天然言语处理渠道及常识图谱 ( 美团大脑 ),助力美团事务场景智能化转型,提高美团科技水平缓品牌影响力。

当时咱们在 NLP 多个方向,包含但不限于目的了解,对话交互,目的引荐,危险辨认,常识图谱等岗位招聘算法及工程岗位,Base 北京、上海两地。欢迎参加咱们团队,简历请投递至邮箱:

jianghuixing@meituan.com

本文来自 DataFun 社区

原文链接

https://mp.weixin.qq.com/s/UH7r3oh4M4_qkqtIE1dGPw

请关注微信公众号
微信二维码
不容错过
Powered By Z-BlogPHP