知识图谱本质 :是语义网络知识库,包含有:有向图结构、结点代表实体或概念、边代表实体/概念之间的语义关系
知识图谱的发展:从20世纪五六十年代提出语义网络,20世纪70年代-语义网络和一阶逻辑谓词的关系,20世纪80年代-语义网络理论完善(语义推理),20世纪90年代到概念关系建模,再到21世纪-新的应用场景语义web:通过W3C的标准拓展web,实现数据在不同应用中的共享和重用,用户上传各种图结构的数据(W3C的标准RDF)形成连接数据最后2012年谷歌提出知识图谱(knowledge graph)概念。
知识图谱相比早期语义网络:KG强调实体之间的关联,KG强调实体的属性值,KG概念的层次关系比实体之间的关系的数量少很多,早期的语义网络主要用于对自然语言的句子做表示构建方式不同:KG的主要来源是百科(尤其半结构化的数据)、早期语义网络主要靠人工构建、KG通过知识挖掘技术实现快速构建大规模高质量的知识图谱、KG的构建强调不同来源知识的融合和清洗。
与本体标准语言的区别是:本身不具备形式化语言、利用RDFS或OWL推理具备形式化语义、也不是所有的OWL本体都适合转换成KG。
知识图谱的构建技术:KG的技术地图包含有:
①:知识获取:机构化数据(ETL工具)、半结构化数据(包装器学习抽取规则)、非结构化数据(NLP技术)
②:数据融合:本体构建及管理、数据映射、实体匹配、本体融合、知识存储(NoSQL或RDB)、分布式算(SPARK或Hadoop)
③:知识计算及应用