TensorFlow Sweeps

4 minute read

Try in Colab

機械学習の実験管理、データセットのバージョン管理、プロジェクトのコラボレーションに W&B を使用します。

W&B Sweeps を使用してハイパーパラメーターの最適化を自動化し、インタラクティブなダッシュボードでモデルの可能性を探ります。

Sweeps を使用する理由

クイックセットアップ: 数行のコードで W&B sweeps を実行します。
透明性: プロジェクトでは使用されているすべてのアルゴリズムが引用されており、コードはオープンソースです。
強力: Sweeps はカスタマイズオプションを提供し、複数のマシンまたはラップトップで簡単に実行できます。

詳細については、 Sweep のドキュメントを参照してください。

このノートブックで説明する内容

TensorFlow で W&B Sweep とカスタムトレーニングループを開始する手順。
画像分類タスクに最適なハイパーパラメーターを見つける。

注: Step で始まるセクションは、ハイパーパラメーター sweep を実行するために必要なコードを示しています。残りの部分は簡単な例を設定します。

インストール、インポート、ログイン

W&B のインストール

pip install wandb

W&B のインポートとログイン

import tqdm
import tensorflow as tf
from tensorflow import keras
from tensorflow.keras.datasets import cifar10

import os
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

import wandb
from wandb.integration.keras import WandbMetricsLogger

wandb.login()

W&B を初めて使用する場合、またはログインしていない場合、wandb.login() を実行した後のリンクはサインアップ / ログインページに移動します。

データセットの準備

# トレーニングデータセット の 準備
(x_train, y_train), (x_test, y_test) = keras.datasets.mnist.load_data()

x_train = x_train / 255.0
x_test = x_test / 255.0
x_train = np.reshape(x_train, (-1, 784))
x_test = np.reshape(x_test, (-1, 784))

分類器 MLP の構築

def Model():
    inputs = keras.Input(shape=(784,), name="digits")
    x1 = keras.layers.Dense(64, activation="relu")(inputs)
    x2 = keras.layers.Dense(64, activation="relu")(x1)
    outputs = keras.layers.Dense(10, name="predictions")(x2)

    return keras.Model(inputs=inputs, outputs=outputs)


def train_step(x, y, model, optimizer, loss_fn, train_acc_metric):
    with tf.GradientTape() as tape:
        logits = model(x, training=True)
        loss_value = loss_fn(y, logits)

    grads = tape.gradient(loss_value, model.trainable_weights)
    optimizer.apply_gradients(zip(grads, model.trainable_weights))

    train_acc_metric.update_state(y, logits)

    return loss_value


def test_step(x, y, model, loss_fn, val_acc_metric):
    val_logits = model(x, training=False)
    loss_value = loss_fn(y, val_logits)
    val_acc_metric.update_state(y, val_logits)

    return loss_value

トレーニングループの作成

def train(
    train_dataset,
    val_dataset,
    model,
    optimizer,
    loss_fn,
    train_acc_metric,
    val_acc_metric,
    epochs=10,
    log_step=200,
    val_log_step=50,
):

    for epoch in range(epochs):
        print("\nStart of epoch %d" % (epoch,))

        train_loss = []
        val_loss = []

        # データセット の バッチ を 反復処理します
        for step, (x_batch_train, y_batch_train) in tqdm.tqdm(
            enumerate(train_dataset), total=len(train_dataset)
        ):
            loss_value = train_step(
                x_batch_train,
                y_batch_train,
                model,
                optimizer,
                loss_fn,
                train_acc_metric,
            )
            train_loss.append(float(loss_value))

        # 各 エポック の 最後に 検証 ループ を 実行します
        for step, (x_batch_val, y_batch_val) in enumerate(val_dataset):
            val_loss_value = test_step(
                x_batch_val, y_batch_val, model, loss_fn, val_acc_metric
            )
            val_loss.append(float(val_loss_value))

        # 各 エポック の 最後に メトリクス を 表示します
        train_acc = train_acc_metric.result()
        print("Training acc over epoch: %.4f" % (float(train_acc),))

        val_acc = val_acc_metric.result()
        print("Validation acc: %.4f" % (float(val_acc),))

        # 各 エポック の 最後に メトリクス を リセットします
        train_acc_metric.reset_states()
        val_acc_metric.reset_states()

        # 3️⃣ wandb.log を 使用して メトリクス を ログ に 記録します
        wandb.log(
            {
                "epochs": epoch,
                "loss": np.mean(train_loss),
                "acc": float(train_acc),
                "val_loss": np.mean(val_loss),
                "val_acc": float(val_acc),
            }
        )

sweep の設定

sweep を設定する手順:

最適化するハイパーパラメーターを定義します
最適化 method を選択します: random、grid、または bayes
bayes の目標とメトリクスを設定します (例: val_loss の最小化)
実行を早期に終了させるには、hyperband を使用します

詳細については、 W&B Sweeps のドキュメントを参照してください。

sweep_config = {
    "method": "random",
    "metric": {"name": "val_loss", "goal": "minimize"},
    "early_terminate": {"type": "hyperband", "min_iter": 5},
    "parameters": {
        "batch_size": {"values": [32, 64, 128, 256]},
        "learning_rate": {"values": [0.01, 0.005, 0.001, 0.0005, 0.0001]},
    },
}

トレーニングループのラップ

train を呼び出す前に wandb.config を使用してハイパーパラメーターを設定する sweep_train のような関数を作成します。

def sweep_train(config_defaults=None):
    # デフォルト値 の 設定
    config_defaults = {"batch_size": 64, "learning_rate": 0.01}
    # サンプル プロジェクト名 で wandb を 初期化します
    wandb.init(config=config_defaults)  # これは Sweep で 上書きされます

    # 他の ハイパーパラメーター を 設定 (存在する場合)
    wandb.config.epochs = 2
    wandb.config.log_step = 20
    wandb.config.val_log_step = 50
    wandb.config.architecture_name = "MLP"
    wandb.config.dataset_name = "MNIST"

    # tf.data を 使用して 入力 パイプライン を 構築します
    train_dataset = tf.data.Dataset.from_tensor_slices((x_train, y_train))
    train_dataset = (
        train_dataset.shuffle(buffer_size=1024)
        .batch(wandb.config.batch_size)
        .prefetch(buffer_size=tf.data.AUTOTUNE)
    )

    val_dataset = tf.data.Dataset.from_tensor_slices((x_test, y_test))
    val_dataset = val_dataset.batch(wandb.config.batch_size).prefetch(
        buffer_size=tf.data.AUTOTUNE
    )

    # モデル の 初期化
    model = Model()

    # モデル を トレーニング する ため に オプティマイザー を インスタンス化します。
    optimizer = keras.optimizers.SGD(learning_rate=wandb.config.learning_rate)
    # 損失関数 を インスタンス化します。
    loss_fn = keras.losses.SparseCategoricalCrossentropy(from_logits=True)

    # メトリクス を 準備します。
    train_acc_metric = keras.metrics.SparseCategoricalAccuracy()
    val_acc_metric = keras.metrics.SparseCategoricalAccuracy()

    train(
        train_dataset,
        val_dataset,
        model,
        optimizer,
        loss_fn,
        train_acc_metric,
        val_acc_metric,
        epochs=wandb.config.epochs,
        log_step=wandb.config.log_step,
        val_log_step=wandb.config.val_log_step,
    )

sweep の初期化とパーソナルデジタルアシスタントの実行

sweep_id = wandb.sweep(sweep_config, project="sweeps-tensorflow")

count パラメータで実行の数を制限します。クイック実行の場合は 10 に設定します。必要に応じて増やします。

wandb.agent(sweep_id, function=sweep_train, count=10)

結果の可視化

ライブ結果を表示するには、前の Sweep URL リンクをクリックします。

例のギャラリー

ギャラリーで W&B でトラッキングおよび可視化されたプロジェクトを探索します。

ベストプラクティス

Projects: 複数の run をプロジェクトに記録して比較します。 wandb.init(project="project-name")
Groups: 複数のプロセスまたは交差検証フォールドの run として各プロセスをログに記録し、それらをグループ化します。 wandb.init(group='experiment-1')
Tags: タグを使用して、ベースラインまたはプロダクションモデルを追跡します。
Notes: テーブルにノートを入力して、run 間の変更を追跡します。
Reports: Reports を使用して、進捗状況のメモ、同僚との共有、ML プロジェクトのダッシュボードとスナップショットの作成を行います。

高度な設定

環境変数: 管理対象クラスターでトレーニングするために APIキーを設定します。
オフラインモード
オンプレミス: インフラストラクチャ内のプライベートクラウドまたはエアギャップサーバーに W&B をインストールします。ローカルインストールは、学術チームとエンタープライズチームに適しています。

[i18n] feedback_title

[i18n] feedback_question

Glad to hear it! Please tell us how we can improve.

Sorry to hear that. Please tell us how we can improve.

最終更新 April 3, 2025

ページの編集ドキュメントのissueを作成セクション全体を印刷

TensorFlow Sweeps

Sweeps を 使用する 理由

この ノートブック で 説明する 内容

インストール、インポート、ログイン

W&B の インストール

W&B の インポート と ログイン

データセット の 準備

分類器 MLP の 構築

トレーニング ループ の 作成

sweep の 設定

トレーニング ループ の ラップ

sweep の 初期化 と パーソナル デジタル アシスタント の 実行

結果 の 可視化

例 の ギャラリー