产品 | 知识图谱落地应用：智能问答

shaoheshaohe · 发表于 2020-3-4 16:32:33

智能问答从20世纪80年代的手柄/按键/遥控交互，到2007年iphone带来的触摸交互，再到2015年echo诞生带来的语音交互，可以发现，人机交互方式越来越接近以视觉+自然语言为主的人人交互方式（未来也可能是视觉、表情、手势等的隔空交互），人机交互不再是人服从机器，而是机器服从人。知识图谱在这些变革中也具有重要的应用场景，下面分两部分介绍：一是对话系统的基本框架介绍；二是知识图谱在智能问答中的应用。
3.1 关于对话系统从具体应用场景来看，当前对话系统解决的典型问题有三种：任务型Task、问答型QA、闲聊型Chat。
a. 任务型：主要目的是依照用户意图收集必要的信息以协助用户完成任务或操作
e.g. 帮我订一张从北京到广州的高铁票；帮我打开空调
b. 问答型：主要目的是检索并为用户提出的自然语言问题提供答案
e.g. 忘记密码怎么办？奥巴马出生在哪？
c. 闲聊型：主要目的是满足用户的情感需求，拉近与用户的距离
e.g. 我今天心情不好、你太傻了
如果让我们来设计一个对话系统，通常需要考虑六大部分：

参见朱鹏臻《人工智能产品经理：人机对话系统设计逻辑探究》
[ 语音识别ASR ] 将原始的语音信号转换为文本信息
[ 自然语言理解NLU ] 将识别出来的文本信息转换为机器可以理解的语义表示
[ 对话管理DM ] 根据NLU模块输出的语义表示执行对话状态的跟踪，并根据一定的策略选择相应的候选动作。包括对话状态跟踪DST和候选动作选择Pollcy两部分
[ 自然语言生成NLG ] 负责生成需要回复给用户的自然语言文本
[ 语音合成TTS ] 将自然语言文本转换成语音输出给用户
[ 知识Knowledge ] 对话任务的完成离不开知识，不论是任务型中的意图及参数，问题型中的知识库，还是闲聊中的语料都属于知识（但是知识并不一定只有这三类）。对话系统结合知识后，能够形成完善的对话交互框架。
注意：有的对话交互框架中并不包含语音部分，回复给用户的也不一定是语音，可能是打电话或发送信息等，因此语音识别ASR、自然语言生成NLG、语音合成TTS是非必需的。
示例：假如你跟小助手说：“给我订一张明天的高铁票”，那么其简化的处理流程可能是：

3.2 知识图谱在对话系统中的应用从对话系统各个模块（ASR/NLU/DM/NLG/TTS/知识库）来看，知识图谱落地主要在“知识库”模块，侧重“问答型”需求场景，接下来主要介绍知识图谱在“问答型”问题中的应用，其他模块后续接触到再补充。

（1）“问答型”需求的答案是否都来自同类型的知识库？
在智能问答任务中，不同类型的问题通常需要基于不同类型的问答知识库生成答案。根据所使用问答知识库类型的不同，可分为四大类：
a. 知识图谱问答：使用知识图谱作为问答知识库，问题的答案可以来自知识图谱的实体集合，也可以基于知识图谱推理出来的内容。
b. 表格问答：使用从互联网上抓取得到的表格集合作为问答知识库，问题的答案既可以是某个表格，也可以是基于表格推理得到的内容。
c. 文本问答：使用无结构文本作为问答知识库，问题的答案既可以是输入文本中的句子，也可以是输入文本中的单词或短语。前者对应答案句子选择任务，其核心目标是计算问题和答案句子候选之间的相关性；后者对应机器阅读理解任务，其核心目标是根据问题定位答案在输入文本中的起始和终止位置。
d. 社区问答：使用从社区问答网站上抓取的<问题，答案>对作为问答知识库，问题的答案来自于和输入问题语义最为匹配的已有问题对应的答案。该类任务的核心目标之一是计算问题和已有问题之间的相似度。
（2）什么场景下适合基于知识图谱对话？（参考段楠《智能对话》中对问题的分类）
a. 事实类（factoid）问题
用户的问题通常比较客观，对应的答案是现实世界中的一个或多个实体，例如问题“金庸是哪里人”，对应的答案是地点类型实体“浙江嘉兴”。

b. 是非类(yes/no)问题
用户问题对应的答案是yes或no。例如问题“天空是红的吗”

c. 定义类（definition）问题
用户提问的模式相对固定，对应的答案是关于问题中提到的某个实体的术语解释，例如“谷歌知识图谱是什么”，对应的答案是“谷歌知识图谱”的术语解释。

d. 列表类（list）问题
用户问题对应的答案通常是一个集合，例如“list of highest mountains on earth”

others：
比较类、意见类和指导类问题，由于对应的答案较为主观，不适合基于知识图谱返回答案，而是通常基于来自问答社区网站的<问题，答案>对来进行解答。
e. 系统主动会话
还有一种场景，VUI（Voice User Interface）交互下，存在用户浏览内容的缺陷，使得产品的很多功能无法被用户感知。通过知识图谱，推荐相同实体下的其他关系/属性或者相同关系下的其他实体等，有助于引导用户发现产品功能or提高用户对产品智能化的感知。

（3）基于知识图谱的问答是如何实现的
该类任务可以采用语义分析和答案排序两种方法完成。
方法1. 语义分析：首先将输入问题转化为知识图谱能够理解的语义表示进行查询，然后据此从知识图谱中检索得到问题对应的答案。
方法2. 答案排序：首先根据输入问题从知识图谱中筛选得到答案实体候选集合，然后通过对不同答案实体候选进行打分和排序，得到问题对应的答案。
两种方法的具体实现原理可参见段楠《智能问答》。
以下是一个简单的示例。给定问题where was Barack Obama born?，首先采用实体链接（entity linking）技术识别出问题实体Barack Obama→然后采用关系分类(relation classification)技术识别出问题所表达的谓词关系PlaceOfBirth→根据实体链接和关系分类的结果生成问题对应的语义表示→根据语义分析结果从知识图谱中推理得到问题对应的答案实体Honolulu。

[ Reference ]

作者：毛里里求斯
链接：https://www.jianshu.com/p/27249c06d814
来源：简书
著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。

shaoheshaohe · 发表于 2020-3-4 16:32:48

https://www.jianshu.com/p/27249c06d814