본문 바로가기
BigData 기술/Hive,Presto,Trino

[Hive] managed table , external table 차이

by 잇서니 2021. 3. 9.
반응형

 

managed table

데이터가 hive.metastore.warehouse.dir 에 저장된다.

위의 경로는 CREATE TABLE시 LOCATION 구문으로 변경할 수도 있다.

테이블을 DROP하면 데이터도 사라진다.

테이블의 라이프사이클을 관리하거나 임시테이블을 만들 때 사용한다.

transaction, view 등이 가능하다. (external은 불가)

 

external table

원본이 저장된 데이터에 접근할 수 있다. (ex. S3, 다른 HDFS 등)
hive입장에서는 메타데이터만 관리한다고 여겨진다.

테이블을 DROP해도 데이터는 남아있다.

파일이 이미 있거나 원격 위치에 있는 경우 사용한다. -> 1차테이블로 많이 사용하는 듯
-> msck repair 필요 (metadata 갱신)

 

참고

Managed vs. External Tables - Apache Hive - Apache Software Foundation

Hive fundamentally knows two different types of tables: Managed (Internal)External Introduction This document lists some of the differences between the two but the fundamental difference is that Hive assumes that it owns the data for managed tables. That

cwiki.apache.org

 

반응형

댓글