发布网友 发布时间:2022-04-25 16:24
共1个回答
热心网友 时间:2022-04-07 18:16
1、创建一个表,字段之间用 \t 分隔;
Hive>create table student (id int, name string) row format delimited fields terminated by '\t' ;
2、将本地一个数据提交到hive里去
hive>load data local inpath '/home/student.txt' into table student ;
2.1 增加分区表数据
alter table ZHIYOUBAO.CHECK_RECORD add partition (years='xxxx',months='xx',days='xx') location '/ZYB/CHECK_RECORD/yy=xxxx/mm=xx/dd=xx/';
3、查询表里的数据:
hive>select * from student ;
4、只查询前两条:
hive>select * from student limit 2 ;
5、统计一个表的行数:
hive>select count(*) from student ;
6、求一个表id字段的id 之和:
hive>select sum(id) from student ;
7、创建外部表:
hive>create external table ext_student (id int, name string) row format delimited fields terminated by ' \t ' location ' /data ' ; //这样就不必将文件放到hive里去 就可以对其进行操作了 ,只需要将文件放到hdfs上的/data目录下面。