Fabric 向けの Apache Spark における高コンカレンシーモード

コンカレンシーモードが高い場合、互換性のある Spark ワークロードは、ワークロードごとに個別のセッションを開始するのではなく、実行中の 1 つの Spark セッションを共有できます。このモードは、Fabric のノートブックとパイプラインのシナリオでよく使用されます。

この記事は、次の内容を理解するのに役立ちます。

高コンカレンシーモードとは何か、どのような場合に使用するか。
セッション共有の要件。
共有セッションの課金のしくみ。

標準モードでは、各ノートブックまたはパイプラインアクティビティが独自の Spark セッションを開始します。高コンカレンシーモードでは、1 つの Spark アプリケーションが、各ワークロードに独自の読み取り/eval-print ループ (REPL) コアを割り当てることで、複数のワークロードをホストします。各 REPL コアは実行状態を分離するため、あるワークロードのローカル変数は別のワークロードの変数を上書きしません。

共有セッションは既に実行されているため、後続のワークロードははるかに高速に開始できます。

注記

コンカレンシーモードが高いカスタムプールの場合、セッションの開始は標準の Spark セッションよりも最大 36 倍速くなる可能性があります。

主な機能

この図では、高コンカレンシーモードの 3 つの主要な特性を示します。

セキュリティ: セッション共有は、シングルユーザーの境界内に留まります。
マルチタスク: ノートブックを切り替えて、新しい Spark セッションが作成または初期化されるのを待たずに作業を続行できます。
コスト効率: 共有セッションにより、リソース使用率が向上し、データエンジニアリングおよびデータサイエンスワークロードのコンピューティングコストが削減されます。

セッション共有は、次の条件が満たされたときに適用されます。

セッションは、シングルユーザーの境界内にあります。
セッションでは、同じ既定の Lakehouse 構成が使用されます。
セッションでは、同じ Spark コンピューティング設定が使用されます。

要件が異なる場合、Fabric は別の Spark セッションを開始します。

セッションの初期化中に、ファブリックによって REPL コアが作成されます。新しいワークロードが共有セッションに参加すると、これらの REPL コア間で FAIR スケジューリングを使用して Executor が割り当てられ、不足リスクが軽減されます。

課金の動作

高コンカレンシーモードを使用する場合、共有 Spark アプリケーションを開始する開始ノートブックまたはパイプラインアクティビティのみが課金されます。同じ Spark セッションを共有する後続のセッションでは、個別の課金は発生しません。

例

ユーザーが Notebook 1 を起動すると、高コンカレンシーモードで Spark セッションが開始されます。
その後、 ノートブック 2、ノートブック3、ノートブック4、ノートブック 5 で同じセッションが共有されます。
この場合、Spark コンピューティングには Notebook 1 のみが課金されます。
共有ノートブック (2 から 5) は個別に課金されません。

この動作は、開始ノートブックに対して使用状況が報告される 容量メトリックにも反映されます。

注記

パイプラインアクティビティにも同じ課金動作が適用されます。 Spark セッションを開始するノートブックまたはアクティビティのみが課金されます。

Microsoft Fabric における Apache Spark の計算
ノートブックで高コンカレンシーモードの使用を開始するには、「Fabric Notebookの高コンカレンシーモードを構成する」を参照してください。
Lakehouse の読み込みとプレビューの動作については、「Microsoft Fabric。

フィードバック

このページはお役に立ちましたか?

Last updated on 2026-03-05

次の方法で共有

Fabric 向けの Apache Spark における高コンカレンシーモード

主な機能

セッション共有の要件

課金の動作

例

関連するコンテンツ

フィードバック

その他のリソース