spaCy
2 minute read
spaCy は、人気のある「産業用強度」の NLP ライブラリであり、高速かつ正確なモデルを最小限の手間で実現します。spaCy v3 以降、Weights & Biases を spacy train と共に使用して、spaCy モデルのトレーニング メトリクスを追跡したり、モデルとデータセットを保存およびバージョン管理したりできるようになりました。必要な作業は、設定に数行追加するだけです。
サインアップして APIキー を作成する
APIキー は、お使いのマシンを W&B に対して認証します。APIキー は、ユーザープロフィールから生成できます。
- 右上隅にあるユーザープロフィールアイコンをクリックします。
- ユーザー設定 を選択し、APIキー セクションまでスクロールします。
- 公開 をクリックします。表示された APIキー をコピーします。APIキー を非表示にするには、ページをリロードしてください。
wandb ライブラリをインストールしてログインする
ローカルに wandb ライブラリをインストールしてログインするには:
- 
WANDB_API_KEY環境変数 を APIキー に設定します。export WANDB_API_KEY=<your_api_key>
- 
wandbライブラリをインストールしてログインします。pip install wandb wandb login
pip install wandb
import wandb
wandb.login()
!pip install wandb
import wandb
wandb.login()
WandbLogger を spaCy 設定ファイルに追加する
spaCy の設定ファイルは、ロギングだけでなく、トレーニングのあらゆる側面(GPU 割り当て、オプティマイザー の選択、データセット のパスなど)を指定するために使用されます。最小限の構成として、[training.logger] の下に、キー @loggers に値 "spacy.WandbLogger.v3" と project_name を指定する必要があります。
[training.logger]
@loggers = "spacy.WandbLogger.v3"
project_name = "my_spacy_project"
remove_config_values = ["paths.train", "paths.dev", "corpora.train.path", "corpora.dev.path"]
log_dataset_dir = "./corpus"
model_log_interval = 1000
| Name | Description | 
|---|---|
| project_name | str。W&B の Project の名前。まだ存在しない場合、Project は自動的に作成されます。 | 
| remove_config_values | List[str]。W&B にアップロードする前に、設定から除外する値のリスト。デフォルトは[]です。 | 
| model_log_interval | Optional int。デフォルトはNone。設定すると、モデルのバージョン管理が Artifacts で有効になります。モデルのチェックポイントのロギング間隔までのステップ数を渡します。デフォルトはNoneです。 | 
| log_dataset_dir | Optional str。パスを渡すと、トレーニングの開始時にデータセット が Artifacts としてアップロードされます。デフォルトはNoneです。 | 
| entity | Optional str。渡された場合、run は指定された entity に作成されます | 
| run_name | Optional str。指定された場合、run は指定された名前で作成されます。 | 
トレーニングを開始する
WandbLogger を spaCy トレーニング設定に追加したら、通常どおり spacy train を実行できます。
python -m spacy train \
    config.cfg \
    --output ./output \
    --paths.train ./train \
    --paths.dev ./dev
python -m spacy train \
    config.cfg \
    --output ./output \
    --paths.train ./train \
    --paths.dev ./dev
!python -m spacy train \
    config.cfg \
    --output ./output \
    --paths.train ./train \
    --paths.dev ./dev
トレーニングが開始されると、トレーニング run の W&B ページへのリンクが出力されます。このリンクをクリックすると、Weights & Biases Web UI で、この run の 実験管理 ダッシュボードに移動します。
[i18n] feedback_title
[i18n] feedback_question
Glad to hear it! Please tell us how we can improve.
Sorry to hear that. Please tell us how we can improve.