Slurm (リソース管理用のシンプルな Linux ユーティリティ)は、あらゆるサイズの Linux クラスタ 向けに構築された、強力で強力なモジュール式のオープン ソース ワークロード マネージャおよびジョブ スケジューラです。 Slurm は、フォールト トレラントで高度にプラガブルなクラスター管理およびジョブ スケジューリング システムであり、使用できる多くのオプションのプラグインを備えています。世界中のいくつかの強力なコンピューターとデータセンターでワークロード管理を提供します。
Slurmの主な機能
Slurm には 3 つの主要な機能があります。まず、特定の期間、何らかの作業を行いたいユーザーに、リソースへの排他的および/または非排他的なアクセスを割り当てます。次に、Slurm は、クラスター内の割り当てられた一連のホストで作業を開始、実行、および監視するのに役立つフレームワークを利用します。その最後の機能は、保留中の作業のキューを管理することによってリソースの使用を制御することです。
Slurm独自の機能
多くのワークロード マネージャーを見つけることができますが、Slurm には他のワークロード マネージャーと差別化する多くの独自の機能があり、これらの機能には以下が含まれます:
スラーム アーキテクチャ
Slurm システムは集中管理者 slurmctld に基づいており、さまざまなリソースと作業を監視し、担当するバックアップ マネージャを含む場合があります。障害が発生した場合にシステム状態を保護するため。 クラスタ上の各ホストには slurmd デーモンがあり、リモート シェルと比較され、作業を受け取り、実行し、ステータスを返し、さらに作業が実行されるのを待ちます。また、デーモンは、システム セットアップ階層でフォールト トレラントな通信を有効にします。オプションの slurmdbd(slurm データベース デーモン) もあり、複数の Slurm 管理クラスタからのアカウンティング情報を 1 つのデータベースに記録するために使用されます。完全なアーキテクチャについては、ここから読むことができます
以下は、Slurm システムのさまざまなコンポーネントを示す画像です
スラーム システム コンポーネント
さまざまなスラーム システム エンティティを示す画像
スラームシステムエンティティ
お客様 お客様の声 Slurm について読む。 任意のサイズの Linux クラスターを使用している場合は、Slurm クラスター管理およびジョブ スケジューリング システムをチェックして試してみることをお勧めします。追加情報については、下のコメント セクションにコメントをドロップして、Slurm に関するご意見をここに残すことができます。