当前位置:   article > 正文

导入csv文件构建知识图谱_知识图谱 csv

知识图谱 csv

使用 neo4j 构建知识图谱, neo4j 的使用就自行百度吧

1. 首先用 python 连接 neo4j,详细参考下面的代码

    没有安装 py2neo 和 pandas 的使用 pip install 一下

2. 然后 neo4j 不允许有空值,所以使用函数把空值填充一下,填充内容自己定

3. 最后遍历导入数据的每一行,创建新的结点即可

笔者这里的数据集均为属性,没有创建其他关系,后续用到笔者还会分享

  1. from py2neo import Graph,Node,Relationship,NodeMatcher
  2. import pandas as pd
  3. # 连接Neo4j数据库,http://localhost:7474这个一般是默认的端口,auth参数第一个是你的账户名,第二个是你的密码
  4. graph = Graph('http://localhost:7474',auth=("neo4j", "123456"),name='neo4j')
  5. # 读取数据集,参数为数据集的位置,最好别加中文路径。前面的r是禁止转义的意思,就比如\n,你不加r就给你转成换行符了
  6. resume = pd.read_csv(r'D:\neo4j-community-5.17.0\import\data_all.csv')
  7. # 这几个是读取每一列的值,把空的值赋值为字符串未知,不然无法导入
  8. resume['address'] = resume['address'].fillna('未知')
  9. resume['last_active'] = resume['last_active'].fillna('未知')
  10. resume['company'] = resume['company'].fillna('未知')
  11. resume['title'] = resume['title'].fillna('未知')
  12. resume['salary'] = resume['salary'].fillna('未知')
  13. resume['education'] = resume['education'].fillna('未知')
  14. resume['description'] = resume['description'].fillna('未知')
  15. resume['hiring_manager'] = resume['hiring_manager'].fillna('未知')
  16. # 遍历读取的每一行,添加结点
  17. for i in resume.values:
  18. a = Node('resume',id=i[0],company=i[1],title=i[2],salary=i[3],education=i[4],description=i[5],hiring_manager=i[6],last_active=i[7],address=i[8],link=i[9])
  19. graph.create(a)

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/运维做开发/article/detail/761081
推荐阅读
相关标签
  

闽ICP备14008679号