MosaicML Composer

最先端のアルゴリズムでニューラルネットワークをトレーニング

2 minute read

Composer は、ニューラルネットワークのトレーニングをより良く、より速く、より安価にするためのライブラリです。ニューラルネットワークのトレーニングを加速させ、汎化性能を向上させるための多くの最先端のメソッドが含まれています。また、オプションの Trainer APIを使用すると、さまざまな拡張機能を簡単に構成できます。

Weights & Biases は、ML 実験のログを記録するための軽量なラッパーを提供します。ただし、2つを自分で組み合わせる必要はありません。Weights & Biases は、WandBLogger を介して Composer ライブラリに直接組み込まれています。

Weights & Biases へのログの記録を開始する

from composer import Trainer
from composer.loggers import WandBLogger

trainer = Trainer(..., logger=WandBLogger())

Composer の `WandBLogger` の使用

Composer ライブラリは、Trainer の WandBLogger クラスを使用して、メトリクスを Weights & Biases にログします。ロガーをインスタンス化して Trainer に渡すのと同じくらい簡単です。

wandb_logger = WandBLogger(project="gpt-5", log_artifacts=True)
trainer = Trainer(logger=wandb_logger)

ロガーの引数

WandbLogger のパラメータについては、完全なリストと説明について Composer のドキュメントを参照してください。

パラメータ	説明
`project`	Weights & Biases のプロジェクト名 (str, optional)
`group`	Weights & Biases のグループ名 (str, optional)
`name`	Weights & Biases の run 名。指定されていない場合、State.run_name が使用されます (str, optional)
`entity`	Weights & Biases のエンティティ名 ( ユーザー名または Weights & Biases の Teams 名など) (str, optional)
`tags`	Weights & Biases のタグ (List[str], optional)
`log_artifacts`	チェックポイントを wandb にログするかどうか、デフォルト: `false` (bool, optional)
`rank_zero_only`	ランク 0 のプロセスでのみログを記録するかどうか。Artifacts をログに記録する場合は、すべてのランクでログに記録することを強くお勧めします。ランク ≥1 からの Artifacts は保存されず、関連情報が破棄される可能性があります。たとえば、Deepspeed ZeRO を使用する場合、すべてのランクからの Artifacts がないとチェックポイントから復元することは不可能です。デフォルト: `True` (bool, optional)
`init_kwargs`	wandb `config` などの `wandb.init` に渡すパラメータ完全なリストについては、こちら `wandb.init` が受け入れます

一般的な使用法は次のとおりです。

init_kwargs = {"notes":"この 実験 でより高い学習率をテストする", 
               "config":{"arch":"Llama",
                         "use_mixed_precision":True
                         }
               }

wandb_logger = WandBLogger(log_artifacts=True, init_kwargs=init_kwargs)

予測サンプルのログ

Composer の Callbacks システムを使用して、WandBLogger 経由で Weights & Biases にログを記録するタイミングを制御できます。この例では、検証画像と予測のサンプルがログに記録されます。

import wandb
from composer import Callback, State, Logger

class LogPredictions(Callback):
    def __init__(self, num_samples=100, seed=1234):
        super().__init__()
        self.num_samples = num_samples
        self.data = []
        
    def eval_batch_end(self, state: State, logger: Logger):
        """バッチ ごとに 予測 を計算し、self.data に保存します"""
        
        if state.timer.epoch == state.max_duration: #最後の val エポック で
            if len(self.data) < self.num_samples:
                n = self.num_samples
                x, y = state.batch_pair
                outputs = state.outputs.argmax(-1)
                data = [[wandb.Image(x_i), y_i, y_pred] for x_i, y_i, y_pred in list(zip(x[:n], y[:n], outputs[:n]))]
                self.data += data
            
    def eval_end(self, state: State, logger: Logger):
        "wandb.Table を作成して ログ に記録します"
        columns = ['image', 'ground truth', 'prediction']
        table = wandb.Table(columns=columns, data=self.data[:self.num_samples])
        wandb.log({'sample_table':table}, step=int(state.timer.batch))         
...

trainer = Trainer(
    ...
    loggers=[WandBLogger()],
    callbacks=[LogPredictions()]
)

[i18n] feedback_title

[i18n] feedback_question

Glad to hear it! Please tell us how we can improve.

Sorry to hear that. Please tell us how we can improve.

最終更新 April 3, 2025

ページの編集ドキュメントのissueを作成セクション全体を印刷

MosaicML Composer

Weights & Biases への ログ の記録を開始する

Composer の WandBLogger の使用

ロガーの 引数

予測 サンプル の ログ

[i18n] feedback_title

Weights & Biases へのログの記録を開始する

Composer の `WandBLogger` の使用

ロガーの引数

予測サンプルのログ