hive数据仓库新增字段方法

 更新时间:2022年06月23日 14:40:35   作者:大大大大肉包  
这篇文章主要为大家介绍了hive中新增字段的方法示例,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪

新增字段

1、方法1

alter table 表名 add columns (列名 string COMMENT '新添加的列') CASCADE;
alter table 表名 add columns (列名 string COMMENT '新添加的列');
hive表中指定位置增加一个字段
分两步,先添加字段到最后(add columns),然后再移动到指定位置(change)
alter table 表名 add columns (列名 string comment '当前时间'); -- 正确,添加在最后
alter table 表名 change 列名 string after 指定位置的列名; -- 正确,移动到指定位置,address字段的后面

添加之后字段由于hive底层是文件和系列化的设计,因此查数据会发现新增的列在所有已有列的后面

CASCADE会刷历史分区字段

cascade知识

  • cascade的中文翻译为“级联”,也就是不仅变更新分区的表结构(metadata),同时也变更旧分区的表结构。
  • 对于删除操作也是,级联删除表中的信息,当表A中的字段引用了表B中的字段时,一旦删除B中该字段的信息,表A的信息也自动删除。(当父表的信息删除,子表的信息也自动删除)
  • 标准语法如下:

2、方法2 (适用于外部表)

当分区过多的情况下,直接使用alter就行增加字段会报错

第一步:删除分区 ,当分区过多可以写个for循环

alter table table_name drop if exists partition(par_col=col_name)

第二步:使用alter操作就行添加字段,这时候就不会因为分区过多报错

第三步:进行修复分区

msck repair table 表名;

3、方法3(下下策)

创建新表修改表名,进行存储原表数据

将原表进行drop,再对新表进行改名操作

ALTER TABLE old_name RENAME TO new_name;

修改字段

alter table table_name change column 已有列 修改名称 类型 comment '';

删除列

Hive不能直接删除列,不然底层系列化就乱了,我们可以通过replace语句来替换整张表的字段,达到同样的效果

alter table table_name replace columns(column_1 string);

语句中只写想要保留的字段就可以

以上就是hive中新增字段方法的详细内容,更多关于hive新增字段的资料请关注脚本之家其它相关文章!

相关文章

  • DBeaver导入csv文件的踩坑记录

    DBeaver导入csv文件的踩坑记录

    在Debian系统下安装的MySQL数据库在导入CSV文件时可能会遇到数据丢失、乱码等问题,首先,遇到反斜杠"\\"字符时,应将其替换为"\\\\"以避免数据丢失,其次,若CSV文件包含中文,应确保文件编码为UTF-8以防出现乱码
    2024-10-10
  • sqlmap之os shell图文详细解析

    sqlmap之os shell图文详细解析

    在面那些出名的安全厂商时,面试官很喜欢问os-shell相关的原理,下面这篇文章主要给大家介绍了关于sqlmap之os shell图文详细解析的相关资料,需要的朋友可以参考下
    2023-03-03
  • 90%程序员面试会遇到的索引优化问题

    90%程序员面试会遇到的索引优化问题

    不管是用C/C++/Java等代码编写的程序,还是SQL编写的数据库脚本,都存在一个持续优化的过程。也就是说,代码优化对于程序员来说,是一个永恒的话题。下面这篇文章主要给大家总结介绍了90%程序员在面试的时候会遇到的索引优化问题,需要的朋友可以参考下。
    2017-11-11
  • 关于navicat事务自动提交问题

    关于navicat事务自动提交问题

    这篇文章主要介绍了关于navicat事务自动提交问题,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2020-12-12
  • 分布式数据存储系统的三要素

    分布式数据存储系统的三要素

    大家好,本篇文章主要讲的是分布式数据存储系统的三要素,感兴趣的同学赶快来看一看吧,对你有帮助的话记得收藏一下,方便下次浏览
    2021-12-12
  • 数据库查询排除重复记录的方法

    数据库查询排除重复记录的方法

    这篇文章主要介绍了数据库查询排除重复记录的方法,使用DISTINCT语句实现,需要的朋友可以参考下
    2014-06-06
  • 详解Unique SQL原理和应用

    详解Unique SQL原理和应用

    以一定的算法结合解析树中的各结点,计算出来一个整数值,用来唯一标识这一类SQL,这个整数值被称为Unique SQL ID,Unique SQL ID相同的SQL语句属于同一个“Unique SQL”。
    2021-05-05
  • 详解IDEA中便捷内存数据库H2的最简使用方式

    详解IDEA中便捷内存数据库H2的最简使用方式

    这篇文章主要介绍了详解IDEA中便捷内存数据库H2的最简使用方式,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2021-03-03
  • Navicat premium for mac 12的安装破解图文教程

    Navicat premium for mac 12的安装破解图文教程

    Navicat Premium是一款数据库管理工具,将此工具连接数据库,你可以从中看到各种数据库的详细信息,这篇文章主要介绍了Mac下Navicat premium for mac 12的安装破解过程,需要的朋友可以参考下
    2024-01-01
  • 数据库的设计方法、规范与技巧

    数据库的设计方法、规范与技巧

    数据库的设计方法、规范与技巧...
    2007-03-03

最新评论