Introduction to Hive

Hive 簡介

Jazz Yao-Tsung Wang

Hive 與傳統資料庫之比較

特徵 Hive RDBMS
Schema Schema on READ Schema on WRITE
更新(Update) 支援 INSERT 支援 UPDATE, INSERT, DELETE
交易(Transaction) 不支援 支援
索引(Indexes) 不支援 支援
延遲(Latency) 數分鐘 秒以內
函數(Function) 數十個內建函數 上百個內建函數
多重表格新增 支援 不支援
SELECT時建立資料表 支援 在 SQL-02 不支援
SELECT FROM 子句限用單一資料表 SQL-92 標準
JOIN INNER, OUTER, SEMI, MAP JOINS SQL-92 或其他變形
次查詢(Subqueries) 只能在 FROM 子句中使用 在任何子句
Table: Hive vs RDBMS Source: “表 12-2. SQL 與 HiveQL 的高階比較表”, Hadoop 技術大全,第三版

“Schema on Write” vs “Schema on Read”