当前位置:   article > 正文

Hive JSON数据处理

hive json

Hive JSON数据处理

JSON(JavaScript Object Notation)文件格式是一种轻量级的数据交换格式,用于存储和传输结构化的数据。它基于JavaScript的语法,但是可以被多种编程语言所支持和解析,因此被广泛应用于各种场景。

JSON格式数据详解

在这里插入图片描述

1.需求

JSON数据格式是数据存储及数据处理中最常见的结构化数据格式之一,很多场景下公司都会将数据以JSON格式存储在HDFS中,当构建数据仓库时,需要对JSON格式的数据进行处理和分析,那么就需要在Hive中对JSON格式的数据进行解析读取。

在这里插入图片描述

2.处理方式

在这里插入图片描述

JSON函数

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述


在这里插入图片描述
在这里插入图片描述

JSONSerde

上述解析JSON的过程中是将数据作为字符串加载到表中,再通过JSON解析函数对JSON字符串进行解析,灵活性比较高,但是对于如果整个文件就是一个JSON文件,在使用起来就相对比较麻烦。

在这里插入图片描述

在这里插入图片描述

3.总结

  • 不论是Hive中的JSON函数还是自带的JSONSerde都可以实现对于JSON数据的解析,工作中一般根据数据格式以及对应的需求来实现解析。
  • 如果数据中每一行只有个别字段是JSON格式字符串,就可以使用JSON函数来实现处理。
  • 如果数据加载的文件整体就是JSON文件,每一行数据就是一个JSON数据,那么建议直接使用JSONSerde来实现处理最为方便。
声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/运维做开发/article/detail/911214
推荐阅读
相关标签
  

闽ICP备14008679号