一、Neo4j安装及服务启动
Neo4j 是目前最流行的图形数据库,支持完整的事务,图形数据库也就意味着它的数据并非保存在表或集合中,而是保存为节点以及节点之间的关系。图是由顶点(Vertex),边(Edge)和属性(Property)组成的,顶点和边都可以设置属性,顶点也称作节点,边也称作关系,每个节点和关系都可以有一个或多个属性。
1、Neo4j安装
[Windows平台安装] (https://www.cnblogs.com/ljhdo/archive/2017/05/19/5521577.html)
[Linux平台安装] (https://blog.csdn.net/qq_21383435/article/details/79557819)
2、启动配置
Neo4j应用程序有如下主要的目录结构:
bin/ -->Neo4j可执行程序
cypher-shell --> 操作Cypher的程序
neo4j --> 服务端程序
neo4j-admin -->管理工具,设置命令,数据恢复等功能。
neo4j-backup -->热备份工具(只有企业版支持)
neo4j-import -->数据导入导出工具
conf/ -->配置文件目录
neo4j.conf -->控制Neo4j启动的配置文件
data/ -->数据库文件目录
databases/
graph.db -->核心数据库文件
plugins/ -->Neo4j的插件
neo4j.conf的常用配置参数如下
参数 | 描述 |
---|---|
-dbms.active_database | 数据库名字,默认graph.db |
-dbms.directories.data | 数据库路径(会自动补上databases) |
-dbms.memory.heap.initial_size | jvm初始堆内存 |
-dbms.memory.heap.max_size | jvm最大堆内存 |
-dbms.memory.pagecache.size | 类似缓存,越大越好 |
-dbms.connectors.default_listen_address | 可以远程访问neo4j数据库的ip,0.0.0.0表示不限制 |
3、服务开启与关闭
(1)Windows下配置
使用WIN+R运行cmd命令执行进入bin目录下执行
neo4j install-service # 安装为服务
neo4j uninstall-service # 卸载服务
执行如下命令开启、关闭、重启、状态查询
neo4j start
neo4j stop
neo4j restart
neo4j status
(2)Linux下配置
进入安装目录下,执行如下命令开启、关闭、重启、状态查询
neo4j start
neo4j stop
neo4j restart
neo4j status
4、打开Neo4j集成的浏览器
Neo4j服务器具有一个集成的浏览器,在一个运行的服务器实例上访问 “http://localhost:7474/”,打开浏览器,显示启动页面
默认的用户是neo4j,其默认的密码是:neo4j,第一次成功登陆到Neo4j服务器之后,需要重置密码。
二、py2neo安装
py2neo 是用来对接 Neo4j的 Python 库
pip install py2neo
三、使用py2neo操作neo4j数据库
连接neo4j数据库
from py2neo import Graph,Node,Relationship
# 连接neo4j数据库,输入地址、用户名、密码
graph = Graph('http://localhost:7474',username='neo4j',password='test')
1、插入数据
创建了两个Node以及两者之间的Relationship。在这里有必要提一下,如果建立关系的时候,起始节点或者结束节点不存在,则在建立关系的同时建立这个节点。
# 可以一个一个创建
a = Node('Person',name='bubu')
graph.create(a)
b = Node('Person',name='kaka')
graph.create(b)
r = Relationship(a,'KNOWS',b)
graph.create(r)
'''
# 也可以一次性创建
s = a | b | r
graph.create(s)
'''
可以通过 setdefault() 方法赋值默认属性(当给location赋值了属性,则它会把默认的属性覆盖)
c = Node('City')
c.setdefault('location', '北京')
2、查询数据
(1)对Node的查询
方法一:使用CQL查询
直接也是最简单的方式,通过数据库语言进行寻找,不需要考虑python语法
# graph查询
graph.run("MATCH (n:leafCategory) RETURN n LIMIT 25").data() # list型
graph.run("MATCH (n:leafCategory) RETURN n LIMIT 25").to_data_frame() # dataframe型
graph.run("MATCH (n:leafCategory) RETURN n LIMIT 25").to_table() # table
方法二:使用NodeMatcher查询
如果要查询单个节点的话,可以使用 first() 方法
from py2neo import NodeMatcher
matcher = NodeMatcher(graph)
matcher.match("Person", name="Kevin").first()
matcher.match(“Person”, name__not="Rick Astley").first()
描述 | 后缀 | 示例 |
---|---|---|
表达相等 | __exact | matcher.match(“Person”, name__exact="Kevin Bacon") |
表达不相等 | __not | matcher.match(“Person”, name__not="Rick Astley") |
表达大于 | __gt | matcher.match(“Person”, born__gt=1985) |
表达大于等于 | __gte | matcher.match(“Person”, born__gte=1965) |
表达小于 | __lt | matcher.match(“Person”, born__lt=1965) |
表达小于等于 | __lte | matcher.match(“Person”, born__lte=1965) |
以XX开头 | __startswith | matcher.match(“Person”, name__startswith="Kevin") |
以XX结尾 | __endswith | matcher.match(“Person”, name__endswith="Smith") |
包含关系 | __contains | matcher.match(“Person”, name__contains="James") |
另外也可以使用 NodeMatch.where()进行更复杂的查询,例如下面的查询是查出以Kevin开头的 Person Node(用了正则表达式匹配查询)
from py2neo import NodeMatcher
matcher = NodeMatcher(graph)
persons = matcher.match("Person").where("_.name =~ 'Kevin.*' ").order_by("_.name", "max(_.a, _.b)").limit(3)
print(list(persons))
通过len()方法,可统计查找到节点的个数
from py2neo import NodeMatcher
matcher = NodeMatcher(graph)
nodeNum= len(matcher.match("Person").where('_.name =~ "Kevin.*" '))
print(nodeNum)
(2)对Relationship的查询
方法一:使用CQL查询
略
方法二:使用RelationshipMatcher查询
from py2neo import RelationshipMatcher
relMatch = RelationshipMatcher(graph)
relList = list(relMatch.match())
for i in relList:
print(i) # 查找图数据库中所有关系
语法:match(nodes=None, r_type=None, **properties)
分别对应节点、关系名、属性
from py2neo import RelationshipMatcher
relMatch = RelationshipMatcher(graph)
relList = list(relMatch.match(r_type="女儿"))
for i in relList:
print(i)