ユースケース¶
このセクションでは、将来の管理者とエンドユーザーがPrestoから何を期待できるかを理解できるように、Prestoについて概説します。
Prestoではないもの¶
コミュニティの多くのメンバーがPrestoを「データベース」と呼んでいるため、まずPrestoではないものから定義を始めましょう。
PrestoがSQLを理解するという事実を、標準的なデータベースの機能を提供しているという誤解に繋げてはいけません。Prestoは汎用的なリレーショナルデータベースではありません。MySQL、PostgreSQL、またはOracleなどのデータベースの代替物ではありません。Prestoはオンライントランザクション処理(OLTP)を処理するように設計されていません。これは、データウェアハウジングまたは分析用に設計および最適化された他の多くのデータベースにも当てはまります。
Prestoとは何か¶
Prestoは、分散クエリを使用して膨大な量のデータを効率的にクエリするように設計されたツールです。テラバイトまたはペタバイトのデータを使用している場合、HadoopとHDFSとやり取りするツールを使用している可能性があります。Prestoは、HiveやPigなどのMapReduceジョブのパイプラインを使用してHDFSをクエリするツールの代替として設計されましたが、HDFSへのアクセスに限定されるわけではありません。Prestoは、従来のリレーショナルデータベースやCassandraなどの他のデータソースを含むさまざまな種類のデータソースを操作するように拡張できます。
Prestoは、データウェアハウジングと分析(データ分析、大量データの集計、レポート作成)を処理するように設計されています。これらのワークロードは、オンライン分析処理(OLAP)として分類されることがよくあります。
Prestoのユーザー¶
Prestoは、Linux Foundationの一部であるPresto Foundationのガバナンスの下で運営されているオープンソースプロジェクトです。PrestoはMetaで発明され、Meta、Bytedance、IBM、Uber、Twitter、その他のコミュニティメンバーによって開発が続けられています。