Tune hyperparameters with sweeps

4 minute read

望ましいメトリクス（モデルの精度など）を満たす機械学習モデルを見つけることは、通常、複数の反復を必要とする冗長な作業です。さらに悪いことに、特定のトレーニング run にどのハイパーパラメーターの組み合わせを使用するか不明確な場合があります。

W&B Sweeps を使用すると、学習率、バッチサイズ、隠れ層の数、オプティマイザーの種類など、ハイパーパラメーターの値の組み合わせを自動的に検索するための、組織化され効率的な方法を作成し、目的のメトリクスに基づいてモデルを最適化する値を見つけることができます。

このチュートリアルでは、W&B PyTorch インテグレーションを使用してハイパーパラメーター探索を作成します。ビデオチュートリアルをご覧ください。

Sweeps：概要

Weights & Biases でハイパーパラメーター sweep を実行するのは非常に簡単です。簡単な3つのステップがあります。

sweep を定義する： 検索するパラメータ、検索戦略、最適化メトリクスなどを指定する辞書または YAML ファイルを作成することにより、これを行います。
sweep を初期化する： 1行のコードで sweep を初期化し、sweep 設定の辞書を渡します。 sweep_id = wandb.sweep(sweep_config)
sweep agent を実行する： 1行のコードでも実行でき、wandb.agent() を呼び出し、実行する sweep_id と、モデルアーキテクチャーを定義してトレーニングする関数を渡します。 wandb.agent(sweep_id, function=train)

始める前に

W&B をインストールし、W&B Python SDK をノートブックにインポートします。

!pip install でインストール：

!pip install wandb -Uq

W&B をインポート：

import wandb

W&B にログインし、プロンプトが表示されたら APIキーを入力します。

wandb.login()

ステップ1️：sweep を定義する

W&B Sweep は、多数のハイパーパラメーター値を試すための戦略と、それらを評価するコードを組み合わせたものです。 sweep を開始する前に、 sweep 設定 で sweep 戦略を定義する必要があります。

Jupyter Notebook で sweep を開始する場合、sweep 用に作成する sweep 設定は、ネストされた辞書にする必要があります。

コマンドライン内で sweep を実行する場合は、YAML ファイルで sweep 設定を指定する必要があります。

検索方法を選択

まず、設定辞書内でハイパーパラメーター検索方法を指定します。グリッド、ランダム検索、ベイズ探索の3つのハイパーパラメーター検索戦略から選択できます。

このチュートリアルでは、ランダム検索を使用します。ノートブック内で、辞書を作成し、method キーに random を指定します。

sweep_config = {
    'method': 'random'
    }

最適化するメトリクスを指定します。ランダム検索方法を使用する sweep のメトリクスと目標を指定する必要はありません。ただし、後で参照できるように、sweep の目標を追跡することをお勧めします。

metric = {
    'name': 'loss',
    'goal': 'minimize'   
    }

sweep_config['metric'] = metric

検索するハイパーパラメーターを指定する

これで、sweep 設定で検索方法が指定されたので、検索するハイパーパラメーターを指定します。

これを行うには、1つ以上のハイパーパラメーター名を parameter キーに指定し、value キーに1つ以上のハイパーパラメーター値を指定します。

特定のハイパーパラメーターで検索する値は、調査しているハイパーパラメーターの種類によって異なります。

たとえば、機械学習オプティマイザーを選択する場合は、Adam オプティマイザーや確率的勾配降下など、1つ以上の有限オプティマイザー名を指定する必要があります。

parameters_dict = {
    'optimizer': {
        'values': ['adam', 'sgd']
        },
    'fc_layer_size': {
        'values': [128, 256, 512]
        },
    'dropout': {
          'values': [0.3, 0.4, 0.5]
        },
    }

sweep_config['parameters'] = parameters_dict

ハイパーパラメーターを追跡したいが、その値を変更したくない場合があります。この場合、ハイパーパラメーターを sweep 設定に追加し、使用する正確な値を指定します。たとえば、次のコードセルでは、epochs が1に設定されています。

parameters_dict.update({
    'epochs': {
        'value': 1}
    })

random 検索の場合、パラメータのすべての values は、特定の run で選択される可能性が等しくなります。

または、名前付きの distribution と、そのパラメータ（normal 分布の平均 mu や標準偏差 sigma など）を指定できます。

parameters_dict.update({
    'learning_rate': {
        # 0〜0.1のフラットな分布
        'distribution': 'uniform',
        'min': 0,
        'max': 0.1
      },
    'batch_size': {
        # 32〜256の整数
        # 対数が均等に分布
        'distribution': 'q_log_uniform_values',
        'q': 8,
        'min': 32,
        'max': 256,
      }
    })

完了すると、sweep_config はネストされた辞書になります。これは、試してみたい parameters と、それらを試すために使用する method を正確に指定します。

sweep 設定がどのように見えるかを見てみましょう。

import pprint
pprint.pprint(sweep_config)

設定オプションの完全なリストについては、sweep 設定オプションを参照してください。

無限のオプションを持つ可能性のあるハイパーパラメーターの場合、通常、いくつかの選択された values を試してみるのが理にかなっています。たとえば、前の sweep 設定には、layer_size および dropout パラメータキーに指定された有限値のリストがあります。

ステップ2️：Sweep を初期化する

検索戦略を定義したら、それを実装するためのものをセットアップします。

W&B は、Sweep Controller を使用して、クラウド上またはローカルで1つ以上のマシンにわたって sweep を管理します。このチュートリアルでは、W&B によって管理される sweep コントローラを使用します。

sweep コントローラが sweep を管理している間、実際に sweep を実行するコンポーネントは sweep agent と呼ばれます。

デフォルトでは、 sweep コントローラコンポーネントは W&B のサーバー上で開始され、 sweep を作成するコンポーネントである sweep agent はローカルマシンでアクティブ化されます。

ノートブック内では、wandb.sweep メソッドを使用して sweep コントローラをアクティブ化できます。以前に定義した sweep 設定辞書を sweep_config フィールドに渡します。

sweep_id = wandb.sweep(sweep_config, project="pytorch-sweeps-demo")

wandb.sweep 関数は、後で sweep をアクティブ化するために使用する sweep_id を返します。

コマンドラインでは、この関数は次のように置き換えられます

wandb sweep config.yaml

ターミナルで W&B Sweeps を作成する方法の詳細については、W&B Sweep チュートリアルを参照してください。

ステップ3：機械学習コードを定義する

sweep を実行する前に、試してみたいハイパーパラメーター値を使用するトレーニングプロシージャを定義します。W&B Sweeps をトレーニングコードに統合するための鍵は、各トレーニング実験で、トレーニングロジックが sweep 設定で定義したハイパーパラメーター値にアクセスできるようにすることです。

次のコード例では、ヘルパー関数 build_dataset、build_network、build_optimizer、および train_epoch が sweep ハイパーパラメーター設定辞書にアクセスします。

次の機械学習トレーニングコードをノートブックで実行します。これらの関数は、PyTorch で基本的な完全接続ニューラルネットワークを定義します。

import torch
import torch.optim as optim
import torch.nn.functional as F
import torch.nn as nn
from torchvision import datasets, transforms

device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

def train(config=None):
    # Initialize a new wandb run
    with wandb.init(config=config):
        # If called by wandb.agent, as below,
        # this config will be set by Sweep Controller
        config = wandb.config

        loader = build_dataset(config.batch_size)
        network = build_network(config.fc_layer_size, config.dropout)
        optimizer = build_optimizer(network, config.optimizer, config.learning_rate)

        for epoch in range(config.epochs):
            avg_loss = train_epoch(network, loader, optimizer)
            wandb.log({"loss": avg_loss, "epoch": epoch})

train 関数内では、次の W&B Python SDK メソッドに注意してください。

wandb.init(): 新しい W&B run を初期化します。各 run は、トレーニング関数の単一の実行です。
wandb.config: 実験するハイパーパラメーターを使用して sweep 設定を渡します。
wandb.log(): 各エポックのトレーニング損失をログに記録します。

次のセルは、4つの関数（build_dataset、build_network、build_optimizer、および train_epoch）を定義します。これらの関数は、基本的な PyTorch パイプラインの標準的な部分であり、その実装は W&B の使用による影響を受けません。

def build_dataset(batch_size):
   
    transform = transforms.Compose(
        [transforms.ToTensor(),
         transforms.Normalize((0.1307,), (0.3081,))])
    # download MNIST training dataset
    dataset = datasets.MNIST(".", train=True, download=True,
                             transform=transform)
    sub_dataset = torch.utils.data.Subset(
        dataset, indices=range(0, len(dataset), 5))
    loader = torch.utils.data.DataLoader(sub_dataset, batch_size=batch_size)

    return loader


def build_network(fc_layer_size, dropout):
    network = nn.Sequential(  # fully connected, single hidden layer
        nn.Flatten(),
        nn.Linear(784, fc_layer_size), nn.ReLU(),
        nn.Dropout(dropout),
        nn.Linear(fc_layer_size, 10),
        nn.LogSoftmax(dim=1))

    return network.to(device)
        

def build_optimizer(network, optimizer, learning_rate):
    if optimizer == "sgd":
        optimizer = optim.SGD(network.parameters(),
                              lr=learning_rate, momentum=0.9)
    elif optimizer == "adam":
        optimizer = optim.Adam(network.parameters(),
                               lr=learning_rate)
    return optimizer


def train_epoch(network, loader, optimizer):
    cumu_loss = 0
    for _, (data, target) in enumerate(loader):
        data, target = data.to(device), target.to(device)
        optimizer.zero_grad()

        # ➡ Forward pass
        loss = F.nll_loss(network(data), target)
        cumu_loss += loss.item()

        # ⬅ Backward pass + weight update
        loss.backward()
        optimizer.step()

        wandb.log({"batch loss": loss.item()})

    return cumu_loss / len(loader)

PyTorch で W&B を使用した計測の詳細については、この Colab を参照してください。

ステップ4： sweep agent をアクティブ化する

sweep 設定を定義し、インタラクティブな方法でこれらのハイパーパラメーターを利用できるトレーニングスクリプトを作成したので、 sweep agent をアクティブ化する準備ができました。 Sweep agent は、 sweep 設定で定義したハイパーパラメーター値のセットを使用して実験を実行する役割を担います。

wandb.agent メソッドを使用して sweep agent を作成します。以下を指定してください。

agent が属する sweep (sweep_id)
sweep が実行することになっている関数。この例では、 sweep は train 関数を使用します。
(オプション) sweep コントローラに要求する設定の数 (count)

異なるコンピューティングリソース上で、同じ sweep_id を持つ複数の sweep agent を開始できます。 sweep コントローラは、定義した sweep 設定に従って連携するようにします。

次のセルは、トレーニング関数 (train) を5回実行する sweep agent をアクティブ化します。

wandb.agent(sweep_id, train, count=5)

random 検索方法が sweep 設定で指定されているため、 sweep コントローラはランダムに生成されたハイパーパラメーター値を提供します。

ターミナルで W&B Sweeps を作成する方法の詳細については、W&B Sweep チュートリアルを参照してください。

Sweep の結果を可視化する

並列座標プロット

このプロットは、ハイパーパラメーター値をモデルメトリクスにマッピングします。これは、最高のモデルパフォーマンスにつながったハイパーパラメーターの組み合わせを調整するのに役立ちます。

ハイパーパラメーターインポータンスプロット

ハイパーパラメーターインポータンスプロットは、どのハイパーパラメーターがメトリクスの最良の予測因子であるかを表面化します。特徴量の重要度（ランダムフォレストモデルから）と相関関係（暗黙的に線形モデル）を報告します。

これらの可視化は、最も重要なパラメータ（および値の範囲）を絞り込むことで、高価なハイパーパラメーター最適化を実行する時間とリソースを節約するのに役立ち、それによってさらに調査する価値があります。

W&B Sweeps の詳細

単純なトレーニングスクリプトと、試せるいくつかの種類の sweep 設定を作成しました。これらを試してみることを強くお勧めします。

そのリポジトリには、ベイズ Hyperband や Hyperopt などの、より高度な sweep 機能を試すのに役立つ例もあります。

[i18n] feedback_title

[i18n] feedback_question

Glad to hear it! Please tell us how we can improve.

Sorry to hear that. Please tell us how we can improve.

最終更新 April 3, 2025

ページの編集ドキュメントのissueを作成セクション全体を印刷