これは、このセクションの複数ページの印刷可能なビューです。印刷するには、ここをクリックしてください.

fastai

1: fastai v1

fastai を使用してモデルをトレーニングする場合、W&B には WandbCallback を使用した簡単なインテグレーションがあります。インタラクティブなドキュメントと例はこちら →

サインアップして API キーを作成する

API キーは、W&B に対してお客様のマシンを認証します。API キーは、ユーザープロフィールから生成できます。

より効率的なアプローチとして、https://wandb.ai/authorize に直接アクセスして API キーを生成できます。表示された API キーをコピーして、パスワードマネージャーなどの安全な場所に保存してください。

右上隅にあるユーザープロフィールアイコンをクリックします。
ユーザー設定 を選択し、API キー セクションまでスクロールします。
表示をクリックします。表示された API キーをコピーします。API キーを非表示にするには、ページをリロードします。

`wandb` ライブラリをインストールしてログインする

wandb ライブラリをローカルにインストールしてログインするには:

WANDB_API_KEY 環境変数を API キーに設定します。
```
export WANDB_API_KEY=<your_api_key>
```
wandb ライブラリをインストールしてログインします。
```
pip install wandb

wandb login
```

pip install wandb

import wandb
wandb.login()

!pip install wandb

import wandb
wandb.login()

`learner` または `fit` メソッドに `WandbCallback` を追加する

import wandb
from fastai.callback.wandb import *

# start logging a wandb run
wandb.init(project="my_project")

# To log only during one training phase
learn.fit(..., cbs=WandbCallback())

# To log continuously for all training phases
learn = learner(..., cbs=WandbCallback())

Fastai のバージョン 1 を使用する場合は、Fastai v1 ドキュメントを参照してください。

WandbCallback 引数

WandbCallback は、次の引数を受け入れます。

Args	Description
log	モデルのログを記録するかどうか: `gradients` 、`parameters`、`all` または `None` (デフォルト)。損失とメトリクスは常にログに記録されます。
log_preds	予測サンプルをログに記録するかどうか (デフォルトは `True`)。
log_preds_every_epoch	エポックごとに予測をログに記録するか、最後にログに記録するか (デフォルトは `False`)
log_model	モデルをログに記録するかどうか (デフォルトは False)。これには `SaveModelCallback` も必要です
model_name	保存する `file` の名前。`SaveModelCallback` をオーバーライドします
log_dataset	`False` (デフォルト) `True` は、learn.dls.path で参照されるフォルダーをログに記録します。パスを明示的に定義して、ログに記録するフォルダーを参照できます。注: サブフォルダー “models” は常に無視されます。
dataset_name	ログに記録されたデータセットの名前 (デフォルトは `folder name`)。
valid_dl	予測サンプルに使用されるアイテムを含む `DataLoaders` (デフォルトは `learn.dls.valid` からのランダムなアイテム。
n_preds	ログに記録された予測の数 (デフォルトは 36)。
seed	ランダムサンプルを定義するために使用されます。

カスタムワークフローでは、データセットとモデルを手動でログに記録できます。

log_dataset(path, name=None, metadata={})
log_model(path, name=None, metadata={})

注: サブフォルダー “models” はすべて無視されます。

分散トレーニング

fastai は、コンテキストマネージャー distrib_ctx を使用して分散トレーニングをサポートします。W&B はこれを自動的にサポートし、すぐに使える Multi-GPU の Experiments を追跡できるようにします。

この最小限の例を確認してください。

import wandb
from fastai.vision.all import *
from fastai.distributed import *
from fastai.callback.wandb import WandbCallback

wandb.require(experiment="service")
path = rank0_first(lambda: untar_data(URLs.PETS) / "images")

def train():
    dls = ImageDataLoaders.from_name_func(
        path,
        get_image_files(path),
        valid_pct=0.2,
        label_func=lambda x: x[0].isupper(),
        item_tfms=Resize(224),
    )
    wandb.init("fastai_ddp", entity="capecape")
    cb = WandbCallback()
    learn = vision_learner(dls, resnet34, metrics=error_rate, cbs=cb).to_fp16()
    with learn.distrib_ctx(sync_bn=False):
        learn.fit(1)

if __name__ == "__main__":
    train()

次に、ターミナルで次を実行します。

$ torchrun --nproc_per_node 2 train.py

この場合、マシンには 2 つの GPU があります。

ノートブック内で分散トレーニングを直接実行できるようになりました。

import wandb
from fastai.vision.all import *

from accelerate import notebook_launcher
from fastai.distributed import *
from fastai.callback.wandb import WandbCallback

wandb.require(experiment="service")
path = untar_data(URLs.PETS) / "images"

def train():
    dls = ImageDataLoaders.from_name_func(
        path,
        get_image_files(path),
        valid_pct=0.2,
        label_func=lambda x: x[0].isupper(),
        item_tfms=Resize(224),
    )
    wandb.init("fastai_ddp", entity="capecape")
    cb = WandbCallback()
    learn = vision_learner(dls, resnet34, metrics=error_rate, cbs=cb).to_fp16()
    with learn.distrib_ctx(in_notebook=True, sync_bn=False):
        learn.fit(1)

notebook_launcher(train, num_processes=2)

メインプロセスでのみログを記録する

上記の例では、wandb はプロセスごとに 1 つの run を起動します。トレーニングの最後に、2 つの run が作成されます。これは混乱を招く可能性があるため、メインプロセスでのみログに記録したい場合があります。そのためには、どのプロセスに手動でいるかを検出し、他のすべてのプロセスで run を作成 ( wandb.init を呼び出す) しないようにする必要があります。

import wandb
from fastai.vision.all import *
from fastai.distributed import *
from fastai.callback.wandb import WandbCallback

wandb.require(experiment="service")
path = rank0_first(lambda: untar_data(URLs.PETS) / "images")

def train():
    cb = []
    dls = ImageDataLoaders.from_name_func(
        path,
        get_image_files(path),
        valid_pct=0.2,
        label_func=lambda x: x[0].isupper(),
        item_tfms=Resize(224),
    )
    if rank_distrib() == 0:
        run = wandb.init("fastai_ddp", entity="capecape")
        cb = WandbCallback()
    learn = vision_learner(dls, resnet34, metrics=error_rate, cbs=cb).to_fp16()
    with learn.distrib_ctx(sync_bn=False):
        learn.fit(1)

if __name__ == "__main__":
    train()

ターミナルで次を呼び出します。

$ torchrun --nproc_per_node 2 train.py

import wandb
from fastai.vision.all import *

from accelerate import notebook_launcher
from fastai.distributed import *
from fastai.callback.wandb import WandbCallback

wandb.require(experiment="service")
path = untar_data(URLs.PETS) / "images"

def train():
    cb = []
    dls = ImageDataLoaders.from_name_func(
        path,
        get_image_files(path),
        valid_pct=0.2,
        label_func=lambda x: x[0].isupper(),
        item_tfms=Resize(224),
    )
    if rank_distrib() == 0:
        run = wandb.init("fastai_ddp", entity="capecape")
        cb = WandbCallback()
    learn = vision_learner(dls, resnet34, metrics=error_rate, cbs=cb).to_fp16()
    with learn.distrib_ctx(in_notebook=True, sync_bn=False):
        learn.fit(1)

notebook_launcher(train, num_processes=2)

例

Fastai モデルの可視化、追跡、比較: 完全に文書化されたチュートリアル
CamVid での画像セグメンテーション: インテグレーションのサンプルユースケース

1 - fastai v1

このドキュメントは fastai v1 用です。現在のバージョンの fastai を使用している場合は、fastai のページを参照してください。

fastai v1 を使用するスクリプトの場合、モデルのトポロジー、損失、メトリクス、重み、勾配、サンプル予測、および最高のトレーニング済みモデルを自動的にログに記録できるコールバックがあります。

import wandb
from wandb.fastai import WandbCallback

wandb.init()

learn = cnn_learner(data, model, callback_fns=WandbCallback)
learn.fit(epochs)

リクエストされたログデータは、コールバックコンストラクターを通じて設定可能です。

from functools import partial

learn = cnn_learner(
    data, model, callback_fns=partial(WandbCallback, input_type="images")
)

トレーニングの開始時にのみ WandbCallback を使用することも可能です。この場合、インスタンス化する必要があります。

learn.fit(epochs, callbacks=WandbCallback(learn))

カスタムパラメータは、その段階で指定することもできます。

learn.fit(epochs, callbacks=WandbCallback(learn, input_type="images"))

コード例

このインテグレーションの動作を確認するためのいくつかの例を作成しました。

Fastai v1

シンプソンズのキャラクターを分類 : Fastai モデルを追跡および比較するための簡単なデモ
Fastai を使用したセマンティックセグメンテーション: 自動運転車でニューラルネットワークを最適化する

オプション

WandbCallback() クラスは、多数のオプションをサポートしています。

キーワード引数	デフォルト	説明
learn	N/A	フックする fast.ai の学習器。
save_model	True	各ステップで改善された場合、モデルを保存します。トレーニングの最後に最高のモデルもロードします。
mode	auto	`min`、`max`、または `auto`: `monitor` で指定されたトレーニングメトリクスをステップ間で比較する方法。
monitor	None	最高のモデルを保存するためにパフォーマンスを測定するために使用されるトレーニングメトリクス。None は、検証損失をデフォルトにします。
log	gradients	`gradients`、`parameters`、`all`、または None。損失とメトリクスは常にログに記録されます。
input_type	None	`images` または `None`。サンプル予測を表示するために使用されます。
validation_data	None	`input_type` が設定されている場合、サンプル予測に使用されるデータ。
predictions	36	`input_type` が設定され、`validation_data` が `None` の場合に行う予測の数。
seed	12345	`input_type` が設定され、`validation_data` が `None` の場合、サンプル予測のために乱数ジェネレーターを初期化します。