Tutorial: Set up W&B Launch with Docker

2 minute read

以下のガイドでは、 W&B Launch を設定して、ローンチエージェント環境とキューのターゲットリソースの両方でローカルマシン上の Docker を使用する方法について説明します。

ジョブの実行に Docker を使用すること、および同じローカルマシン上でローンチエージェントの環境として使用することは、お使いのコンピューティングが（Kubernetes などの）クラスター管理システムを持たないマシンにインストールされている場合に特に役立ちます。

また、 Docker キューを使用して、強力なワークステーションでワークロードを実行することもできます。

この設定は、ローカルマシンで実験を実行するユーザーや、SSH で接続してローンチジョブを送信するリモートマシンを持つユーザーによく見られます。

W&B Launch で Docker を使用すると、W&B は最初にイメージを構築し、次にそのイメージからコンテナを構築して実行します。イメージは、Docker docker run <image-uri> コマンドで構築されます。キュー構成は、 docker run コマンドに渡される追加の引数として解釈されます。

Docker キューの構成

（Docker ターゲットリソースの）ローンチキュー構成は、 docker run CLI コマンドで定義されているものと同じオプションを受け入れます。

エージェントは、キュー構成で定義されたオプションを受け取ります。次に、エージェントは、受信したオプションをローンチジョブの構成からのオーバーライドとマージして、ターゲットリソース（この場合はローカルマシン）で実行される最終的な docker run コマンドを生成します。

次の 2 つの構文変換が行われます。

繰り返されるオプションは、キュー構成でリストとして定義されます。
フラグオプションは、キュー構成で値が true のブール値として定義されます。

たとえば、次のキュー構成があるとします。

{
  "env": ["MY_ENV_VAR=value", "MY_EXISTING_ENV_VAR"],
  "volume": "/mnt/datasets:/mnt/datasets",
  "rm": true,
  "gpus": "all"
}

次の docker run コマンドになります。

docker run \
  --env MY_ENV_VAR=value \
  --env MY_EXISTING_ENV_VAR \
  --volume "/mnt/datasets:/mnt/datasets" \
  --rm <image-uri> \
  --gpus all

ボリュームは、文字列のリストまたは単一の文字列として指定できます。複数のボリュームを指定する場合は、リストを使用します。

Docker は、値が割り当てられていない環境変数をローンチエージェント環境から自動的に渡します。つまり、ローンチエージェントに環境変数 MY_EXISTING_ENV_VAR がある場合、その環境変数はコンテナで使用できます。これは、キュー構成で公開せずに他の構成キーを使用する場合に役立ちます。

docker run コマンドの --gpus フラグを使用すると、Docker コンテナで使用できる GPU を指定できます。 gpus フラグの使用方法の詳細については、 Docker のドキュメントを参照してください。

Docker コンテナ内で GPU を使用するには、 NVIDIA Container Toolkit をインストールします。
コードまたは Artifacts ソースのジョブからイメージを構築する場合、エージェントで使用されるベースイメージをオーバーライドして、NVIDIA Container Toolkit を含めることができます。たとえば、ローンチキュー内で、ベースイメージを tensorflow/tensorflow:latest-gpu にオーバーライドできます。
```
{
  "builder": {
    "accelerator": {
      "base_image": "tensorflow/tensorflow:latest-gpu"
    }
  }
}
```

キューの作成

W&B CLI を使用して、Docker をコンピューティングリソースとして使用するキューを作成します。

Launch pageに移動します。
[Create Queue] ボタンをクリックします。
キューを作成する Entities を選択します。
[Name] フィールドにキューの名前を入力します。
[Resource] として Docker を選択します。
[Configuration] フィールドで Docker キュー構成を定義します。
[Create Queue] ボタンをクリックしてキューを作成します。

ローカルマシンでのローンチエージェントの構成

launch-config.yaml という名前の YAML 構成ファイルを使用して、ローンチエージェントを構成します。デフォルトでは、W&B は ~/.config/wandb/launch-config.yaml で構成ファイルを確認します。オプションで、ローンチエージェントをアクティブ化するときに別のディレクトリーを指定できます。

W&B CLI を使用して、ローンチエージェントのコア構成可能オプション（ジョブの最大数、W&B Entity、ローンチキュー）を指定できます（構成 YAML ファイルの代わりに）。詳細については、 wandb launch-agent コマンドを参照してください。

コアエージェント構成オプション

次のタブは、W&B CLI および YAML 構成ファイルを使用して、コア構成エージェントオプションを指定する方法を示しています。

wandb launch-agent -q <queue-name> --max-jobs <n>

max_jobs: <n concurrent jobs>
queues:
	- <queue-name>

Docker イメージビルダー

マシン上のローンチエージェントは、Docker イメージを構築するように構成できます。デフォルトでは、これらのイメージはマシンのローカルイメージリポジトリーに保存されます。ローンチエージェントが Docker イメージを構築できるようにするには、ローンチエージェント構成の builder キーを docker に設定します。

builder:
	type: docker

エージェントに Docker イメージを構築させたくない場合は、代わりにレジストリーから事前に構築されたイメージを使用し、ローンチエージェント構成の builder キーを noop に設定します。

builder:
  type: noop

コンテナレジストリ

Launch は、 Dockerhub、Google Container Registry、Azure Container Registry、Amazon ECR などの外部コンテナレジストリを使用します。ジョブを構築した環境とは異なる環境でジョブを実行する場合は、コンテナレジストリからプルできるようにエージェントを構成します。

ローンチエージェントをクラウドレジストリに接続する方法の詳細については、高度なエージェントのセットアップページを参照してください。

[i18n] feedback_title

[i18n] feedback_question

Glad to hear it! Please tell us how we can improve.

Sorry to hear that. Please tell us how we can improve.

最終更新 April 3, 2025

ページの編集ドキュメントのissueを作成セクション全体を印刷