Apache Impala


Apache_Impala

Apache Impalaは、Apache Hadoopを実行しているコンピュータークラスターに格納されているデータ用のオープンソースの 超並列処理(MPP)SQLクエリエンジンです。インパラは、オープンソースの同等物として記載されているGoogleのF1 2012年にその開発に影響を与え、 Apache Impala 開発者
Apache Software Foundation
初回リリース
2013年4月28日; 8年前 (2013-04-28)
安定リリース
3.4.0 / 2020年4月24日 ; 17か月前  (2020-04-24)
リポジトリ
Impalaリポジトリ
で書かれている
C ++、Java
オペレーティング・システム
クロスプラットフォーム
タイプ
リレーショナルのHadoop -analytics
ライセンス
Apacheライセンス2.0
Webサイト
インパラ.apache .ORG

コンテンツ
1 説明
2 も参照してください
3 参考文献
4 外部リンク

説明
Apache Impalaは、ApacheHadoopで実行されるクエリエンジンです。このプロジェクトは、2012年10月に公開ベータテスト配布で発表され 、2013年5月に一般提供されました。
インパラは、スケーラブルもたらす並列データベース発行低遅延にユーザーを可能にする、Hadoopのに技術をSQL用に格納されたデータへのクエリHDFSとのApache HBaseのデータの移動や変換を必要とせず。ImpalaはHadoopと統合されており、MapReduce、Apache Hive、Apache Pig、およびその他のHadoopソフトウェアで使用されているものと同じファイルおよびデータ形式、メタデータ、セキュリティ、およびリソース管理フレームワークを使用します。
Impalaは、アナリストやデータサイエンティストが、SQLまたはビジネスインテリジェンスツールを介してHadoopに保存されているデータの分析を実行することを目的としています。その結果、大規模なデータ処理(MapReduceを介して)とインタラクティブクエリを同じシステムで同じデータとメタデータを使用して実行できるため、分析を実行するためだけにデータセットを特殊なシステムや独自の形式に移行する必要がなくなります。
機能は次のとおりです。
サポートHDFS、S3、のABF、アパッチのHBaseとApacheのクーズーのストレージ、
テキスト、LZO、SequenceFile、Avro、RCFile、Parquet、ORCなどのHadoopファイル形式を読み取ります
Hadoopセキュリティ(Kerberos認証、Ldap)をサポートし、
ApacheSentryとApacheレンジャーによるきめ細かいロールベースの承認
Apache Hiveのメタデータ、ODBCドライバー、およびSQL構文を使用します。
2013年の初めに、Parquetと呼ばれる列指向のファイル形式がImpalaを含むアーキテクチャ用に発表されました。 2013年12月、Amazon WebServicesはImpalaのサポートを発表しました。 2014年の初めに、MapRはImpalaのサポートを追加しました。 2015年に、Kuduと呼ばれる別の形式が発表され、ClouderaはImpalaとともにApache SoftwareFoundationに寄付することを提案しました。 Impalaは、2017年11月28日にApache Top-Level Project(TLP)に卒業しました。

も参照してください
Apache Drill —Dremelに触発された同様のオープンソースプロジェクト
Dremel —Googleの同様のツール
Trino —Prestoの作成者によって作成されたオープンソースのSQLクエリエンジン
Presto — Facebookによって作成され、TeradataによってサポートされているオープンソースのSQLクエリエンジン

参考文献
^ 「3.4.0リリース」。
^ 「ApacheImpala」。
^ ケイドメッツ「男はグーグルからバストアウト、トップシークレットクエリマシンを再構築する」。ワイアードマガジン。
^ Larry Digna「Clouderaは、ビッグデータであるHadoopにリアルタイムのクエリを提供することを目的としています」。行間ブログ。ZDNet 。
^ Andrew Brust「ClouderaのImpalaはHadoopをSQLとBIにもたらします」。ZDNet 。
^ Marcel Kornacker、Justin Erickson「ClouderaImpala1.0:ここにあり、本物であり、Hadoop上のSQLの標準です」。
^ 「Parquet:Hadoop用の列型ストレージ」。プロジェクトのWebサイト。2013 。
^ 「AmazonElasticMapReduceによるImpalaのサポートの発表」。Amazon.com。
^ 「MapRのインパラ」。MapR.com。
^ David Ramel「ClouderaがImpalaおよびKuduビッグデータプロジェクトをApacheに寄付する」。アプリケーション開発の動向。
^ 「ApacheSoftwareFoundationがApache®Impala™をトップレベルプロジェクトとして発表」。

外部リンク
ApacheImpalaプロジェクトのWebサイト
ImpalaGitHubプロジェクトのソースコード
 title=