Configure launch queue

2 minute read

以下のページでは、ローンチキューのオプションを設定する方法について説明します。

キュー設定テンプレートの設定

キュー設定テンプレートを使用して、コンピュート消費に関するガードレールを管理します。メモリ消費量、 GPU 、ランタイム時間などのフィールドのデフォルト値、最小値、および最大値を設定します。

設定テンプレートでキューを設定すると、チームのメンバーは、定義した範囲内でのみ、定義したフィールドを変更できます。

キューテンプレートの設定

既存のキューでキューテンプレートを設定するか、新しいキューを作成できます。

https://wandb.ai/launch のローンチアプリに移動します。
テンプレートを追加するキューの名前の横にある View queue を選択します。
Config タブを選択します。これにより、キューが作成された時期、キューの設定、既存のローンチ時のオーバーライドなど、キューに関する情報が表示されます。
Queue config セクションに移動します。
テンプレートを作成する設定のキーの値を特定します。
設定内の値をテンプレートフィールドに置き換えます。テンプレートフィールドは {{variable-name}} の形式を取ります。
Parse configuration ボタンをクリックします。設定を解析すると、作成した各テンプレートのタイルが自動的にキュー設定の下に作成されます。
生成された各タイルについて、最初にキュー設定で許可するデータ型（文字列、整数、または浮動小数点）を指定する必要があります。これを行うには、Type ドロップダウンメニューからデータ型を選択します。
データ型に基づいて、各タイル内に表示されるフィールドに入力します。
Save config をクリックします。

たとえば、チームが使用できる AWS インスタンスを制限するテンプレートを作成するとします。テンプレートフィールドを追加する前は、キュー設定は次のようになります。

RoleArn: arn:aws:iam:region:account-id:resource-type/resource-id
ResourceConfig:
  InstanceType: ml.m4.xlarge
  InstanceCount: 1
  VolumeSizeInGB: 2
OutputDataConfig:
  S3OutputPath: s3://bucketname
StoppingCondition:
  MaxRuntimeInSeconds: 3600

InstanceType のテンプレートフィールドを追加すると、設定は次のようになります。

RoleArn: arn:aws:iam:region:account-id:resource-type/resource-id
ResourceConfig:
  InstanceType: "{{aws_instance}}"
  InstanceCount: 1
  VolumeSizeInGB: 2
OutputDataConfig:
  S3OutputPath: s3://bucketname
StoppingCondition:
  MaxRuntimeInSeconds: 3600

次に、Parse configuration をクリックします。aws-instance というラベルの新しいタイルが Queue config の下に表示されます。

そこから、Type ドロップダウンから String をデータ型として選択します。これにより、ユーザーが選択できる値を指定できるフィールドが入力されます。たとえば、次の図では、チームの管理者がユーザーが選択できる2つの異なる AWS インスタンスタイプ（ml.m4.xlarge と ml.p3.xlarge）を設定しています。

ローンチジョブの動的な設定

キュー設定は、エージェントがキューからジョブをデキューするときに評価されるマクロを使用して動的に設定できます。次のマクロを設定できます。

Macro	Description
`${project_name}`	run がローンチされているプロジェクトの名前。
`${entity_name}`	run がローンチされているプロジェクトの所有者。
`${run_id}`	ローンチされている run の ID。
`${run_name}`	ローンチされている run の名前。
`${image_uri}`	この run のコンテナイメージの URI。

上記の表にリストされていないカスタムマクロ（${MY_ENV_VAR} など）は、エージェントの環境から環境変数に置き換えられます。

ローンチエージェントを使用して、アクセラレータ（ GPU ）で実行されるイメージを構築する

アクセラレータ環境で実行されるイメージを構築するためにローンチを使用する場合は、アクセラレータベースイメージを指定する必要がある場合があります。

このアクセラレータベースイメージは、次の要件を満たしている必要があります。

Debian の互換性（ローンチ Dockerfile は apt-get を使用して python をフェッチします）
CPU と GPU のハードウェア命令セットの互換性（使用する予定の GPU で CUDA バージョンがサポートされていることを確認してください）
提供するアクセラレータバージョンと ML アルゴリズムにインストールされているパッケージとの互換性
ハードウェアとの互換性を設定するために追加の手順が必要なインストール済みパッケージ

TensorFlow で GPU を使用する方法

TensorFlow が GPU を適切に利用していることを確認します。これを実現するには、キューリソース設定で builder.accelerator.base_image キーの Docker イメージとそのイメージタグを指定します。

たとえば、tensorflow/tensorflow:latest-gpu ベースイメージは、TensorFlow が GPU を適切に使用することを保証します。これは、キュー内のリソース設定を使用して構成できます。

次の JSON スニペットは、キュー設定で TensorFlow ベースイメージを指定する方法を示しています。

{
    "builder": {
        "accelerator": {
            "base_image": "tensorflow/tensorflow:latest-gpu"
        }
    }
}

[i18n] feedback_title

[i18n] feedback_question

Glad to hear it! Please tell us how we can improve.

Sorry to hear that. Please tell us how we can improve.

最終更新 April 3, 2025

ページの編集ドキュメントのissueを作成セクション全体を印刷