반응형
managed table
데이터가 hive.metastore.warehouse.dir 에 저장된다.
위의 경로는 CREATE TABLE시 LOCATION 구문으로 변경할 수도 있다.
테이블을 DROP하면 데이터도 사라진다.
테이블의 라이프사이클을 관리하거나 임시테이블을 만들 때 사용한다.
transaction, view 등이 가능하다. (external은 불가)
external table
원본이 저장된 데이터에 접근할 수 있다. (ex. S3, 다른 HDFS 등)
hive입장에서는 메타데이터만 관리한다고 여겨진다.
테이블을 DROP해도 데이터는 남아있다.
파일이 이미 있거나 원격 위치에 있는 경우 사용한다. -> 1차테이블로 많이 사용하는 듯
-> msck repair 필요 (metadata 갱신)
참고
반응형
'BigData 기술 > Hive,Presto,Trino' 카테고리의 다른 글
[Hive] export, import (127) | 2021.03.09 |
---|---|
Hive 트랜잭션 테이블 (Hive update, delete) (677) | 2021.01.03 |
[Presto] Memory Pool / Memory configuration (config.properties) (928) | 2020.07.22 |
IntelliJ에서 Presto Query 날리기 (2) | 2020.05.14 |
hive udf 등록하는 방법 (2) | 2019.11.28 |
댓글