导入csv文件构建知识图谱_知识图谱 csv

作者：运维做开发 | 2024-06-27 02:50:47

踩

知识图谱 csv

使用 neo4j 构建知识图谱， neo4j 的使用就自行百度吧

1. 首先用 python 连接 neo4j，详细参考下面的代码

没有安装 py2neo 和 pandas 的使用 pip install 一下

2. 然后 neo4j 不允许有空值，所以使用函数把空值填充一下，填充内容自己定

3. 最后遍历导入数据的每一行，创建新的结点即可

笔者这里的数据集均为属性，没有创建其他关系，后续用到笔者还会分享


from py2neo import Graph,Node,Relationship,NodeMatcher
import pandas as pd
# 连接Neo4j数据库,http://localhost:7474这个一般是默认的端口，auth参数第一个是你的账户名，第二个是你的密码
graph = Graph('http://localhost:7474',auth=("neo4j", "123456"),name='neo4j')
# 读取数据集，参数为数据集的位置，最好别加中文路径。前面的r是禁止转义的意思，就比如\n，你不加r就给你转成换行符了
resume = pd.read_csv(r'D:\neo4j-community-5.17.0\import\data_all.csv')
# 这几个是读取每一列的值，把空的值赋值为字符串未知，不然无法导入
resume['address'] = resume['address'].fillna('未知')
resume['last_active'] = resume['last_active'].fillna('未知')
resume['company'] = resume['company'].fillna('未知')
resume['title'] = resume['title'].fillna('未知')
resume['salary'] = resume['salary'].fillna('未知')
resume['education'] = resume['education'].fillna('未知')
resume['description'] = resume['description'].fillna('未知')
resume['hiring_manager'] = resume['hiring_manager'].fillna('未知')
# 遍历读取的每一行，添加结点
for i in resume.values:
   a = Node('resume',id=i[0],company=i[1],title=i[2],salary=i[3],education=i[4],description=i[5],hiring_manager=i[6],last_active=i[7],address=i[8],link=i[9])
   graph.create(a)

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/运维做开发/article/detail/761081