1. 基本概念
一个属性图由顶点(vertex)、边(edge)、标签(label)、关系类型(relation type)和属性(property)组成的有向图。顶点也称作节点(node),边也称作关系(relationship)。
在图形中,节点和关系是最重要的实体,所有的节点是独立存在的,为节点设置标签,那么拥有相同标签的节点属于一个分组,也就是一个集合;关系通过关系类型来分组,类型相同的关系属于同一个集合。
关系是有向的,关系的两端是起始节点和结束节点,通过有向的箭头来标识方向,节点之间的双向关系通过两个方向相反的关系来标识。
节点可以有0个、1个或多个标签,但是关系必须设置关系类型,并且只能设置一个关系类型。
neo4j创建的图(Graph)基于属性图模型,在该模型中,每个实体都有ID唯一标识,每个节点由标签分组,每个关系有一个唯一的类型。
属性图模型的基本概念有:
※ 实体:节点和关系
- 每个实体有一个唯一的ID
- 每个实体都有0个、一个或多个属性,一个实体的属性键是唯一的
- 每个节点都有0个、1个或多个标签,属于1个或多个分组
- 每个关系都只有1个类型,用于连接两个节点
※ 路径:由起始节点和终止节点之间的实体(节点和关系)构成的有序组合
※ 标记:非空的字符串,用于标识标签,关系类型或属性键
- 标签:用于标记节点的分组,多个节点可以有相同的标签,一个节点可以有多个标签,标签用于对节点进行分组
- 关系类型:用于标记关系的类型,多个关系可以有相同的关系类型
- 属性键:用于唯一标识一个属性
※ 属性:是一个键值对,每个节点或关系可以有一个或多个属性;属性值可以是标量类型,或者标量类型的列表(数组)
2. 图形示例
上图中存在3个节点和两个关系共5个实体,其中,person和movie是标签,acted_in 和directed 是关系类型,name、title和roles是节点和关系的属性键。
实体包括节点和关系,节点有标签和属性,关系是有向的,用于链接两个节点,具有属性和关系类型。
1)实体
节点 + 关系
2)标签
在图形结构中,标签用于对节点进行分组,相当于节点的类型,拥有相同标签的节点属于同一分组。一个节点可以有多个标签,因此,一个节点可以属于多个分组。对分组进行查询,能够缩小查询的节点范围,提高查询性能。
3)属性
属性是一个键值对,用于为节点或关系提供信息。
上图中,person节点有两个属性:name和born,movie节点有两个属性:title和released。
关系类型acted_in有一个属性:roles,该属性值是一个数组,而关系类型为directed的关系没有属性。
3. 遍历
遍历一个图形,指的是沿着关系及其方向,访问图形的节点。关系是有向的,连接两个节点,从起始节点沿着关系,一步一步导航到结束节点的过程叫做遍历,遍历经过的节点和关系的有序组合称作路径path。
在示例图形中,查找Tom Hanks参演的电影,遍历的过程是:从Tom Hanks节点开始,沿着acted_in关系,寻找标签为movie 的目标节点。
4. 图形数据库的模式
neo4j的模式通常是指索引、约束和统计,通过创建模式,neo4j能够获得查询性能的提升和建模的遍历;neo4j数据库的模式是可选的,也可以是无模式的。
1) 索引
图形数据库也能创建索引,用于提高图形数据库的查询性能。和关系型数据库一样,索引是图形数据库的一个冗余副本,通过额外的存储空间和牺牲数据写操作的性能,来提高数据搜索的性能,避免创建不必要的索引,这样能够减少数据更新的性能损失。
neo4j在节点的一个或多个属性上创建索引,在索引创建完成之后,当图形数据更新时,neo4j负责索引的自动更新,索引的数据是实时同步的;在查询被索引的属性时,neo4j自动应用索引,以获得查询性能的提升。
create index on : Person(firstname)
create index on :Person(firstname, surname)
2) 约束
图形数据库中,能够创建4种类型的约束:
- 节点属性值唯一约束(unique node property):如果节点具有指定的标签和指定的属性,那么,这些节点的属性值是唯一的
- 节点属性存在约束(node property existence):创建的节点必须存在标签和指定的属性
- 关系属性存在约束(relationship property existence):创建的关系存在类型和指定的属性
- 节点键约束(node key):在指定标签的节点中,指定的属性必须存在,并且属性值的组合是唯一的
create constraint on (book:Book) assert book.isbn is unique;
create constriant on (book:Book) assert exists(book.isbn);
create constraint on () -[like:LIKED] -() assert exists(like.day);
create constraint on (n:Person) assert (n.firstname, n.surname) is node key;