译者言:本文介绍了如何批量删除节点的属性的方法,重点介绍了apoc.create.removeProperties 函数的使用。
今天早些时候,Irfan和我在一个数据集上做实验,运行了一些图形算法的程序,结果节点上多了一些属性,所以,现在我要想办法清理这些属性。
现在的数据情况,可以用下面的语句模拟出来:
CREATE (:Node {name: "Mark", pagerank: 2.302, louvain: 1, lpa: 4 })
CREATE (:Node {name: "Michael", degree: 23, triangles: 12, betweeness: 48.70 })
CREATE (:Node {name: "Ryan", eigenvector: 2.302, scc: 1, unionFind: 4 })
除了name属性,其他都是算法生成的,我要怎样才能删除这些生成的属性呢?
我可以一次删除一个属性,像下面这样:
MATCH (n:Node)
REMOVE n.pagerank
对于其他要删除的属性只要重复这个命令就好,但是这个过程可有点痛苦啊----那么这个过程能自动化吗?当然可以,接下来我们就来看看如何自动化这个过程。
首先,我们需要将每个节点的属性除了name,都放到一个列表中。查询语句如下:
neo4j> MATCH (n:Node)
WITH [k in keys(n) where not k in ["name"]] as keys
RETURN keys;
+---------------------------------------+
| keys |
+---------------------------------------+
| ["lpa", "pagerank", "louvain"] |
| ["betweeness", "degree", "triangles"] |
| ["unionFind", "eigenvector", "scc"] |
+---------------------------------------+
接下来我们再来尝试删除这些属性,这次我们的查询语句这么写:
neo4j> MATCH (n:Node)
WITH n, [k in keys(n) where not k in ["name"]] as keys
UNWIND keys AS key
REMOVE n[key];
Invalid input '[': expected an identifier character, whitespace, node labels, 'u/U', '{', 'o/O', a property map, a relationship pattern, '.' or '(' (line 4, column 9 (offset: 103))
"REMOVE n[key];"
啊偶~, 出错了.....赶快看看APOC是不是有删除的方法,我也不知道APOC中有没有相应的方法,所以,我输入“remove”在APOC库中进行搜索。具体语句如下:
CALL dbms.procedures() YIELD name, signature, description
WHERE name starts with "apoc" and description contains "remove"
return name, signature, description
运行语句显示下图:
我看到apoc.create.removeProperties
方法,应该就是删除属性的,我们先来试一下:
neo4j> MATCH (n:Node)
WITH n, [k in keys(n) where not k in ["name"]] as keys
CALL apoc.create.removeProperties(n, keys) YIELD node
RETURN count(*);
+----------+
| count(*) |
+----------+
| 3 |
+----------+
我们再来看一下节点上还有哪些属性:
neo4j> MATCH (n:Node)
RETURN keys(n) AS keys;
+----------+
| keys |
+----------+
| ["name"] |
| ["name"] |
| ["name"] |
+----------+
哦耶,太好了。
虽然属性删除了,但是我还是想再优化一下,看是否能够不在每个节点上调用keys方法,而直接传一个除name之外的属性列表。我们可以先通过下面的语句得到除name之外的所有属性:
neo4j> CALL db.propertyKeys() YIELD propertyKey WHERE propertyKey <> 'name'
RETURN collect(propertyKey);
+-----------------------------------------------------------------------------------------+
| collect(propertyKey) |
+-----------------------------------------------------------------------------------------+
| ["degree", "pagerank", "louvain", "lpa", "triangles", "betweeness", "scc", "unionFind"] |
+-----------------------------------------------------------------------------------------+
如果我要把那个属性列表传到apoc.create.removeProperties中,只要像下面这样就可以了:
CALL db.propertyKeys() YIELD propertyKey WHERE propertyKey <> 'name'
WITH collect(propertyKey) AS properties
MATCH (n:Node)
WITH collect(n) AS nodes, properties
CALL apoc.create.removeProperties(nodes, properties)
YIELD node
RETURN count(*)
更多的数据
删除小规模数据节点上的属性时,上面的语句是可以正常工作的。但是在大型数据节点上去删除属性时,要怎么做呢?这时apoc.periodic.iterate
是你最好的选择。
下面我们先来创建100万个准备删除属性的节点:
CALL apoc.periodic.iterate(
"UNWIND range(0, 1000000) AS id RETURN id",
"CREATE (:Node {name: 'name-' + id, pagerank: 2.302, louvain: 1, lpa: 4 })", {})
现在我们稍微修改一下前面的删除语句,将删除除name之外的所有属性:
neo4j> CALL db.propertyKeys() YIELD propertyKey WHERE propertyKey <> 'name'
WITH collect(propertyKey) AS properties
CALL apoc.periodic.iterate(
"MATCH (n:Node) RETURN n",
"WITH collect(n) AS nodes
CALL apoc.create.removeProperties(nodes, $properties)
YIELD node
RETURN count(*)",
{params: {properties: properties}})
YIELD batches
RETURN batches;
+---------+
| batches |
+---------+
| 101 |
+---------+
最后,我们再来确认一下,所有属性是否都删除了?
neo4j> MATCH (n:Node)
RETURN keys(n), count(*);
+---------------------+
| keys(n) | count(*) |
+---------------------+
| ["name"] | 1000001 |
+---------------------+
OK,完美!
原文链接: https://markhneedham.com/blog/2019/03/14/neo4j-delete-dynamic-properties/
译者言:最后欢迎各位同行留言交流译文中的不足。