垂直知识图谱构造工具与行业应用

垂直知识图谱构造工具与行业应用

ID:8268214

大小:3.69 MB

页数:34页

时间:2018-03-15

垂直知识图谱构造工具与行业应用_第1页
垂直知识图谱构造工具与行业应用_第2页
垂直知识图谱构造工具与行业应用_第3页
垂直知识图谱构造工具与行业应用_第4页
垂直知识图谱构造工具与行业应用_第5页
资源描述:

《垂直知识图谱构造工具与行业应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、+垂直知识图谱构造工具与行业应用阮彤自然语言处理与大数据挖掘实验室主任华东理工大学主要内容为什么垂直行业需要知识图谱垂直知识图谱的特点垂直知识图谱工具——VKGBuilder介绍垂直知识图谱应用+我们从通用知识图谱开始。。。。1.SSCO2.zhishi.me使用机器学习获得的知识网络,包括260,345个概念,5,602,180个实例,526,219个同义关系,下图显示了网络的部分节点对不同的中文数据源进行合并,组成统一的知识库。共有621万实例,73万类别,上亿的事实。成果在ISWC以及SCI期刊上发表。http

2、://ssco.zhishimofang.com/华东理工大学上海交大为了让知识图谱有用,准备构造一个搜索引擎?谷歌知识图谱01百度“知心”搜狗“知立方”02+为什么行业需要知识图谱1.图书馆行业的故事内容供应商数字图书馆链接舟山图书馆谁拥有更多的资源?门户大图书馆!超星链接浙江图书馆门户链接万方国家图书馆门户维普+地方图书馆利用知识图谱实现转型严重的内容相似与地方经济结合缺乏内容控制自有内容缺乏竞争力专有技术寻觅新的机会!+为什么行业需要知识图谱2.证券行业的故事——购买数据VS自己处理数据大智慧同花顺万德新闻网站大智慧同

3、花顺内部交易数据购买模式平台模式证券公司研报交易所集成并分析数据+为什么行业需要知识图谱2.证券行业的故事——现有搜索引擎的困惑为什么行业需要知识图谱3.医疗行业的例子——难点电子病历搜索不同来源知识库之间如何关联?某类患者,如心衰并患有高血疾病、药品、检查的关联压患者的患者?中西医疾病名称关联与某病人相似的患者?中西药成分关联电子病历文本中有大量的数据,如何进行结构化,以更好地进行电子病历数据的大数据挖掘?+为什么行业需要知识图谱3.医疗行业的例子——病历结构化的必要性传统非结构化病历数据,只能通过文本匹配

4、来进行查询词汇二义性关联查询无法理解相同文字但不同无法精确切分查询词,理解含义的词汇查询意图+为什么行业需要知识图谱3.医疗行业的例子——ICD-11的构造ICD10以及以前版本,基本上没有结构。分类码通常是一长串的疾病与它们相关的代码,以及少量属性,如同义词等。WHO在11版的ICD开发中使用语义Web技术,支持协同编辑的语义Web平台。4年中,有270个来自世界各地的领域专家使用iCAT编辑了45,000个类,执行了260,000个变更。构造了17,000个链接,链到外部医学术语。ICD11使用了类/子类关系,子属性,定

5、义域与值域,等价类。ICD11表达能力是SHOIN(D)。可以使用DL推理程序去推理系统之间的非一致性。每个疾病有56个属性,而其中52个是用填实例的。+为什么行业需要知识图谱总结行业需要数据(语义)集成能力文本与结构化数据的集成不同来源、不同格式的大量数据自动/半自动的集成行业需要(语义)数据查询能力更丰富的表达更精准的结果+为什么行业需要知识图谱知识图谱的技术优势语义搜索用户可以查询具有某现有标准支持类特征的某类实体,比起基于基于关键词有RDF(S),OWL,数据集成更轻松SPARQL等标准,可的搜索,更为

6、精准。以逐渐要求内容供应本体的语义互操作特性商支持。渐增式数据模式设计以及“链接数据”原则,使得来自不同供应商的初始设计的时候,很难数据集成更为方便。清楚所有的概念,而知识图谱的动态可扩充性以及“无模式”特性使得用户很容易增加或修改模式。主要内容为什么需要行业需要知识图谱垂直知识图谱的特点垂直知识图谱工具垂直知识图谱应用+垂直知识图谱特点1.更为丰富与精确的领域数据领域对数据质量要求更高,例如VS姚明的身高?药品名称处方当中,药品的克数企业名称企业股票价格领域数据字段与数据关联更丰富VS电影的字段一个企

7、业包含的信息字段可能有上百个字段ICD11当中,每个疾病有56个属性,而其中52个是用填实例的。(不是随意填写一个文本,而是这个填的值本身也是RDF的一个实例。只有满足了上述条件,才能用于商业分析与决策支持+垂直知识图谱特点2.自顶向下普通的KG,使用一种自底向上的方法,更强调数据的宽度。如DBpedia在构造过程中,先有数据,后有本体。对于行业本体来说,由于数据质量以及行业本身的规范要求,将使用自顶向下的方式。+垂直知识图谱特点3.丰富的内部数据来源企业/组织结构自有数据,如:对证券公司而言,自有用户交易数据

8、医院,电子病历,付费、检查记录图书馆地方政府数据行业数据如行业标准、规范,如MedicalGuideline如第三方收集的企业数据诸多以RDB方式存储+垂直知识图谱特点4.需要可扩充的第三方工具支持比起互联网企业,垂直行业客户相对投入低,能力弱。需要可配置、图形化界面。需要

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。