当前位置:   article > 正文

数仓4.0笔记——业务数据采集——Hive_文件采集hive

文件采集hive

1 Hive安装部署

把apache-hive-3.1.2-bin.tar.gz上传到Linux的/opt/software目录下

解压apache-hive-3.1.2-bin.tar.gz到/opt/module/目录下面

[zhang@hadoop102 software]$ tar -zxvf /opt/software/apache-hive-3.1.2-bin.tar.gz -C /opt/module/

修改apache-hive-3.1.2-bin.tar.gz的名称为hive

[zhang@hadoop102 hive]$ cd /opt/module/
[zhang@hadoop102 module]$ mv apache-hive-3.1.2-bin/ hive

修改/etc/profile.d/my_env.sh,添加环境变量

[zhang@hadoop102 software]$ sudo vim /etc/profile.d/my_env.sh

添加内容

  1. #HIVE_HOME
  2. export HIVE_HOME=/opt/module/hive
  3. export PATH=$PATH:$HIVE_HOME/bin

 

使环境变量生效

[zhang@hadoop102 software]$ source /etc/profile.d/my_env.sh

2 Hive元数据配置到MySQL

拷贝驱动

将MySQL的JDBC驱动拷贝到Hive的lib目录下

[zhang@hadoop102 module]$ cp /opt/software/mysql/mysql-connector-java-5.1.27-bin.jar /opt/module/hive/lib/

$HIVE_HOME/conf目录下新建hive-site.xml文件

[zhang@hadoop102 module]$ cd /opt/module/hive/conf/

[zhang@hadoop102 conf]$ vim hive-site.xml

添加如下内容

  1. <?xml version="1.0"?>
  2. <?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
  3. <configuration>
  4. <property>
  5. <name>javax.jdo.option.ConnectionURL</name>
  6. <value>jdbc:mysql://hadoop102:3306/metastore?useSSL=false</value>
  7. </property>
  8. <property>
  9. <name>javax.jdo.option.ConnectionDriverName</name>
  10. <value>com.mysql.jdbc.Driver</value>
  11. </property>
  12. <property>
  13. <name>javax.jdo.option.ConnectionUserName</name>
  14. <value>root</value>
  15. </property>
  16. <property>
  17. <name>javax.jdo.option.ConnectionPassword</name>
  18. <value>000000</value>
  19. </property>
  20. <property>
  21. <name>hive.metastore.warehouse.dir</name>
  22. <value>/user/hive/warehouse</value>
  23. </property>
  24. <property>
  25. <name>hive.metastore.schema.verification</name>
  26. <value>false</value>
  27. </property>
  28. <property>
  29. <name>hive.server2.thrift.port</name>
  30. <value>10000</value>
  31. </property>
  32. <property>
  33. <name>hive.server2.thrift.bind.host</name>
  34. <value>hadoop102</value>
  35. </property>
  36. <property>
  37. <name>hive.metastore.event.db.notification.api.auth</name>
  38. <value>false</value>
  39. </property>
  40. <property>
  41. <name>hive.cli.print.header</name>
  42. <value>true</value>
  43. </property>
  44. <property>
  45. <name>hive.cli.print.current.db</name>
  46. <value>true</value>
  47. </property>
  48. </configuration>

 3 启动Hive

登陆MySQL

[zhang@hadoop102 conf]$ mysql -uroot -p000000

新建Hive元数据库

mysql> create database metastore;

mysql> quit;

初始化Hive元数据库

[zhang@hadoop102 conf]$ schematool -initSchema -dbType mysql -verbose

启动Hive客户端

[zhang@hadoop102 conf]$ hive

hive (default)> show databases;

 

hive (default)> quit;

 部署完成!

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/空白诗007/article/detail/833709
推荐阅读
相关标签
  

闽ICP备14008679号