본문 바로가기
BigData 기술/Spark

SPARK에서 저장소(HDFS, Hive 등)에 접근하는 방식

by 잇서니 2020. 7. 31.
반응형

 


 

SPARK에서 저장소(HDFS, Hive 등)에 접근하는 방식

 

(1) 저장소 바로 접근

  • HDFS, S3 등의 저장소를 지원한다.

 

(2) hive metastore

  • hive metastore를 통해 저장소에 접근한다.
  • 저장소에 저장된 hive 테이블을 사용할 수 있다.

 

(3) spark thrift server

  • jdbc/odbc 프로토콜을 통해 접속한다.
  • 이후 metastore를 통해 저장소에 접근한다.
  • 저장소에 저장된 hive 테이블을 사용할 수 있다.

 

 

 

참고링크

 

Using Spark SQL - Hortonworks Data Platform

Using SQLContext, Apache Spark SQL can read data directly from the file system. This is useful when the data you are trying to analyze does not reside in Apache Hive (for example, JSON files stored in HDFS). Using HiveContext, Spark SQL can also read data

docs.cloudera.com

 

반응형

댓글