您现在的位置:   首页 >> 新闻中心

【知识图谱】实践篇——基于医疗知识图谱的问答系统实践

医疗问答系统的应用_应用医保服务平台_医疗系统的问答系统

当然,原作者也是很厉害的,是中国科学院软件研究所刘焕勇老师。

该项目从无到有搭建一个以疾病为中心的一定规模医药领域知识图谱,并以该知识图谱完成自动问答与分析服务。适合一个初学人员了解该类项目的过程。

该项目立足医药领域,以垂直型医药网站为数据来源,以疾病为核心,构建起一个包含7类规模为4.4万的知识实体,11类规模约30万实体关系的知识图谱。项目包括以下两部分的内容:

基于垂直网站数据的医药知识图谱构建

基于医药知识图谱的自动问答

应用医保服务平台_医疗系统的问答系统_医疗问答系统的应用

该项目的最终效果如下:

应用医保服务平台_医疗问答系统的应用_医疗系统的问答系统

看看问答的内容,感觉还是挺好玩的。

该项目的技术架构如下:

医疗问答系统的应用_医疗系统的问答系统_应用医保服务平台

应用医保服务平台_医疗系统的问答系统_医疗问答系统的应用

其中涉及的各个模块也是现在当前进行问答的主要流程。只是在不同环节有不同的细分技术。例如 ,这个部分通常在不同性质的问答系统中有不同的叫法,通常也叫做意图识别,query 就是query解析,这个不仅在问答中有重要的使用,在搜索中也是如此,如果深究的话医疗问答系统的应用,就单凭query 就能够衍生很多知识,如query错误纠正,query改写等等。在知识搜寻中相关技术也比较多,有的会进行子图切分在图数据库中匹配,也有使用传统的规则匹配等方法去处理。

除此之外医疗问答系统的应用,单轮对话相对简单,如果涉及任务型对话的,则需要涉及填槽的工作以及对话管理等等。

项目源码阅读与改写

医疗系统的问答系统_医疗问答系统的应用_应用医保服务平台

这段时间在业余时间看完了项目代码,并对其进行了小小的重构。然后实现效果如下:

应用医保服务平台_医疗系统的问答系统_医疗问答系统的应用

做完之后总体感觉内容也不是特别多,但是整个还是比较清晰的。值得去阅读一下源码。

总结

总的来说,这个项目把使用知识图谱进行QA的一些流程介绍的比较清楚,但是在完成问答的过程中技术相对老旧,不过效果依然还不错。源码已经放到我的上:[2],有兴趣的可以下载运行看看哦,上面有运行介绍哦。

为了能够进一步提升效果的话可以引入很多新技术。例如在问题分类环节可以引入基于深度学习的问题分类方法,在进行问题解析的时候,可以引入基于深度学习的NER实体识别方式以及进一步处进行实体对齐等,这里不作进一步展开。

除此之外,知识图谱在构建时需要结合业务需求,也就是在接到业务的时候以及对现有数据进行分析然后构建基于业务的,再通过自然语言处理相关技术进行知识图谱的构建。在原项目中,使用爬虫的方式进行数据爬取,其也可以使用NLP相关的基础,优化提取的数据等等。

雄关漫道真如铁,而今迈步重头越。刚入门,一个新的开始。往后会增加更多基于深度学习算法的内容到知识图谱的建设,应用等。

应用医保服务平台_医疗系统的问答系统_医疗问答系统的应用

[1]

[2]

医疗问答系统的应用_应用医保服务平台_医疗系统的问答系统