Prestoとは?
データ分析とオープンレイクハウスのための高速で信頼性の高いSQLクエリエンジン
研究論文
Presto: Metaでの10年のSQL分析 (2023)
Meta, Alluxio, Ahana Cloud
Prestoの履歴ベースのクエリオプティマイザー (2024)
Meta, Uber
Prestoを選ぶ理由
1つの言語
ワークロードごとに異なるエンジンを使用するということは、いずれリプラットフォームする必要があるということです。
Prestoを使用すると、データ分析用に1つの使い慣れたANSI SQL言語と1つのエンジンを利用できるため、別のレイクハウスエンジンに移行する必要はありません。Prestoは、インタラクティブおよびバッチワークロード、少量および大量のデータに使用でき、数人から数千人のユーザーにスケールできます。
1つのインターフェース
ほとんどのデータチームは、データレイクストレージ上のさまざまなワークロードに対して異なるエンジンを使用しており、各エンジンには独自の言語とインターフェースがあります。
Prestoは、さまざまなサイロ化されたデータシステム内のすべてのデータに対して1つのシンプルなANSI SQLインターフェースを提供し、データエコシステムを結合するのに役立ちます。Prestoのコネクタアーキテクチャにより、データが存在する場所でクエリを実行できます。
高速、信頼性、効率性
データインフラストラクチャのコストは、データサイズとユーザーワークロードが増加するにつれて、データウェアハウスのような独自システムでは特に爆発的に増加する可能性があります。
PrestoはMetaとUberで実証されており、増大するデータサイズとワークロードに対応するためにスケールできます。多数の小規模クエリ向けに最適化されているため、他のエンジンよりも高速で効率的であり、独自のシステムと比較して、より優れた価格性能でデータをクエリできます。
ユースケース
アドホッククエリ
SQLを使用して、いつでも、データが存在する場所でアドホッククエリを実行します。Prestoを使用すると、データが保存されている場所でクエリを実行できるため、データを別のシステムにETLする必要はありません。
レポートとダッシュボード
複数のソースにまたがるデータをクエリして、PrestoセルフサービスBIビジネスインテリジェンス用のレポートとダッシュボードの1つのPrestoビューを作成します。
オープンレイクハウス
単一のインターフェースを通じて、Prestoは単なるクエリエンジン以上の役割を果たし、データエコシステムの中心に位置することで、大規模なデータ問題を解決し、すべてを結びつけるのに役立ちます。