データ分析とオープンレイクハウスのための高速で信頼性の高いSQLエンジン

    github star 10K
    Prestocon

    2024年12月3日~4日 | Meta オフィス | カリフォルニア州フリーモント

    無料の対面コミュニティイベント:
    オープンソースPresto

    Prestoとは?

    Prestoは、高速、信頼性があり、大規模で効率的なオープンソースのSQLクエリエンジンです。Prestoを使用して、大量のアプリに対して秒未満のパフォーマンスでインタラクティブ/アドホッククエリを実行します。
    Presto ecosystem architecture

    Prestoは大規模なスケールで信頼性高く動作します

    インターネット規模の大手企業が、現在どのように Presto を使用しているかをご覧ください。Meta のような規模で運用している場合でも、わずか数ノードで運用している場合でも、Presto は誰にとっても役立ちます。

    Meta
    300PB データレイクハウス
    1K 1日のアクティブユーザー数
    30K 1日のクエリ数
    Uber
    2 リージョン
    20 クラスター
    8K ノード
    7K 週ごとのアクティブユーザー数
    500K+ 1日のクエリ数
    90PB 1日のHDFS読み取りバイト数
    ByteDance
    10K+ コンピューティングコア
    1M 1日のクエリ数
    「Prestoを活用」ページをご覧ください

    クエリをフェデレートし、データが存在する場所(データレイク、レイクハウスなど)でデータをクエリします

    Prestoは、リレーショナルおよびNoSQLデータベース、データウェアハウス、データレイクなどをクエリでき、現在数十のコネクタが利用可能です。また、データが存在する場所でのクエリを可能にし、単一のPrestoクエリで複数のソースからのデータを組み合わせて、組織全体の分析を可能にします。

    驚くほど高速な分析

    Prestoは、分離されたスタック内の他の計算エンジンよりも高速な、インメモリ分散SQLエンジンです。

    1つのエンジンでSQLを標準化する

    Prestoは、インタラクティブおよびバッチワークロード、少量および大量のデータに使用でき、少数のユーザーから数千人のユーザーまでスケールします。Prestoを使用すると、1つの使い慣れたANSI SQL言語と、データ分析用の1つのエンジンを利用できるため、別のレイクハウスエンジンに移行する必要はありません。

    オープンソース

    Prestoは、The Linux Foundation傘下の、メンバー企業(増加中)が数十社ある、中立的な統治が行われているオープンソースプロジェクトです。オンプレミスでも、任意のクラウドでも、好きな場所でPrestoを実行できます。

    Prestoのユーザーと貢献者

    Prestoコミュニティに参加しましょう

    Prestoコミュニティに参加する方法はたくさんあります。Slackチャンネルに参加して他のPrestoエンジニアやユーザーとつながり、プロジェクトに貢献し、バーチャルミートアップに参加してコミュニティイベントの最新情報を入手してください。

    Presto Foundation

    Presto Foundationは、Prestoオープンソースプロジェクトの開発を監督する組織です。Prestoは独立したオープンソースプロジェクトであり、単一の企業によって管理されていません。Presto Foundationのメンバーは、ツール、インフラストラクチャ、コミュニティカンファレンスなど、共同開発プロセスに不可欠な財政的支援を提供しています。詳細はこちらをご覧ください。メンバーになる