W&B Artifacts を使用して、W&B Runs の入力および出力としてデータを追跡およびバージョン管理します。たとえば、モデルトレーニング run は、データセットを入力として受け取り、トレーニング済みのモデルを出力として生成する場合があります。ハイパーパラメーター、メタデータ、およびメトリクスを run に記録できます。また、artifact を使用して、モデルのトレーニングに使用されるデータセットを入力として、結果のモデルチェックポイントを別の artifact として、ログ記録、追跡、およびバージョン管理できます。

ユースケース

Artifact は、runs の入力および出力として、ML ワークフロー全体で使用できます。データセット、モデル、またはその他の artifact を、処理の入力として使用できます。

ユースケース	入力	出力
モデルトレーニング	データセット (トレーニングおよび検証データ)	トレーニング済みモデル
データセットの前処理	データセット (未加工データ)	データセット (前処理済みデータ)
モデルの評価	モデル + データセット (テストデータ)	W&B Table
モデルの最適化	モデル	最適化されたモデル

以降のコードスニペットは、順番に実行することを目的としています。

artifact を作成する

4 行のコードで artifact を作成します。

W&B run を作成します。
wandb.Artifact API を使用して、artifact オブジェクトを作成します。
モデルファイルやデータセットなど、1 つ以上のファイルを artifact オブジェクトに追加します。
artifact を W&B に記録します。

たとえば、次のコードスニペットは、dataset.h5 というファイルを example_artifact という artifact に記録する方法を示しています。

import wandb

run = wandb.init(project="artifacts-example", job_type="add-dataset")
artifact = wandb.Artifact(name="example_artifact", type="dataset")
artifact.add_file(local_path="./dataset.h5", name="training_dataset")
artifact.save()

# artifact バージョン "my_data" を dataset.h5 のデータを持つデータセットとして記録します

Amazon S3 バケットなどの外部オブジェクトストレージに保存されているファイルまたはディレクトリーへの参照を追加する方法については、外部ファイルの追跡ページを参照してください。

artifact をダウンロードする

use_artifact メソッドを使用して、run への入力としてマークする artifact を示します。

上記のコードスニペットに従って、次のコードブロックは training_dataset artifact の使用方法を示しています。

artifact = run.use_artifact(
    "training_dataset:latest"
)  # "my_data" artifact を使用して run オブジェクトを返します

これにより、artifact オブジェクトが返されます。

次に、返されたオブジェクトを使用して、artifact のすべてのコンテンツをダウンロードします。

datadir = (
    artifact.download()
)  # `my_data` artifact 全体をデフォルトのディレクトリーにダウンロードします。

カスタムパスを root parameter に渡して、artifact を特定のディレクトリーにダウンロードできます。artifact をダウンロードする別の方法、および追加のパラメータについては、artifact のダウンロードと使用のガイドを参照してください。

次のステップ

artifact をバージョン管理および更新する方法を学びます。
オートメーションを使用して、artifact の変更に応じてダウンストリームワークフローをトリガーしたり、Slack channel に通知したりする方法を学びます。
トレーニング済みモデルを格納するスペースであるレジストリについて学びます。
Python SDK および CLI リファレンスガイドをご覧ください。

1.1 - Create an artifact

W&B の Artifact を作成、構築します。1 つまたは複数のファイル、または URI 参照を Artifact に追加する方法を学びます。

W&B Python SDK を使用して、W&B Runs から Artifacts を構築します。ファイル、ディレクトリー、URI、および並列 run からのファイルを Artifacts に追加できます。ファイルを Artifacts に追加したら、Artifacts を W&B サーバーまたは独自のプライベートサーバーに保存します。

Amazon S3 に保存されているファイルなど、外部ファイルを追跡する方法については、外部ファイルを追跡のページを参照してください。

Artifacts を構築する方法

W&B Artifactは、次の3つのステップで構築します。

1. `wandb.Artifact()` で Artifacts Python オブジェクトを作成する

wandb.Artifact() クラスを初期化して、Artifacts オブジェクトを作成します。次のパラメータを指定します。

Name: Artifacts の名前を指定します。名前は、一意で記述的で、覚えやすいものにする必要があります。Artifacts 名を使用して、W&B App UI で Artifacts を識別したり、その Artifacts を使用する場合に使用したりします。
Type: タイプを指定します。タイプは、シンプルで記述的で、機械学習パイプラインの単一のステップに対応している必要があります。一般的な Artifacts タイプには、'dataset' または 'model' があります。

指定する「name」と「type」は、有向非巡回グラフの作成に使用されます。つまり、W&B App で Artifacts のリネージを表示できます。

詳細については、Artifacts グラフを探索およびトラバースを参照してください。

タイプパラメータに別のタイプを指定した場合でも、Artifacts は同じ名前にすることはできません。つまり、タイプ dataset の cats という名前の Artifacts と、タイプ model の同じ名前の別の Artifacts を作成することはできません。

Artifacts オブジェクトを初期化するときに、オプションで説明とメタデータを指定できます。利用可能な属性とパラメータの詳細については、Python SDK リファレンスガイドの wandb.Artifact クラス定義を参照してください。

次の例は、データセット Artifacts を作成する方法を示しています。

import wandb

artifact = wandb.Artifact(name="<replace>", type="<replace>")

上記のコードスニペットの文字列引数を、自分の名前とタイプに置き換えます。

2. 1つ以上のファイルを Artifacts に追加する

Artifacts メソッドを使用して、ファイル、ディレクトリー、外部 URI 参照 (Amazon S3 など) などを追加します。たとえば、単一のテキストファイルを追加するには、add_file メソッドを使用します。

artifact.add_file(local_path="hello_world.txt", name="optional-name")

add_dir メソッドを使用して、複数のファイルを追加することもできます。ファイルを追加する方法の詳細については、Artifacts を更新を参照してください。

3. Artifacts を W&B サーバーに保存する

最後に、Artifacts を W&B サーバーに保存します。Artifacts は run に関連付けられています。したがって、run オブジェクトの log_artifact() メソッドを使用して、Artifacts を保存します。

# W&B Run を作成します。'job-type' を置き換えます。
run = wandb.init(project="artifacts-example", job_type="job-type")

run.log_artifact(artifact)

オプションで、W&B run の外部で Artifacts を構築できます。詳細については、外部ファイルを追跡を参照してください。

log_artifact の呼び出しは、パフォーマンスの高いアップロードのために非同期的に実行されます。これにより、ループで Artifacts をログ記録するときに、予期しない振る舞いが発生する可能性があります。次に例を示します。

for i in range(10):
    a = wandb.Artifact(
        "race",
        type="dataset",
        metadata={
            "index": i,
        },
    )
    # ... Artifacts a にファイルを追加 ...
    run.log_artifact(a)

Artifacts バージョン v0 は、Artifacts が任意の順序でログ記録される可能性があるため、メタデータに 0 のインデックスを持つことは保証されません。

Artifacts にファイルを追加する

次のセクションでは、さまざまなファイルタイプと並列 run から Artifacts を構築する方法について説明します。

次の例では、複数のファイルとディレクトリー構造を持つプロジェクトディレクトリーがあると仮定します。

project-directory
|-- images
|   |-- cat.png
|   +-- dog.png
|-- checkpoints
|   +-- model.h5
+-- model.h5

単一のファイルを追加する

上記のコードスニペットは、単一のローカルファイルを Artifacts に追加する方法を示しています。

# 単一のファイルを追加
artifact.add_file(local_path="path/file.format")

たとえば、作業ローカルディレクトリーに 'file.txt' という名前のファイルがあるとします。

artifact.add_file("path/file.txt")  # `file.txt' として追加されました

Artifacts には、次のコンテンツが含まれるようになりました。

file.txt

オプションで、name パラメータに Artifacts 内の目的のパスを渡します。

artifact.add_file(local_path="path/file.format", name="new/path/file.format")

Artifacts は次のように保存されます。

new/path/file.txt

API 呼び出し	結果の Artifacts
`artifact.add_file('model.h5')`	model.h5
`artifact.add_file('checkpoints/model.h5')`	model.h5
`artifact.add_file('model.h5', name='models/mymodel.h5')`	models/mymodel.h5

複数のファイルを追加する

上記のコードスニペットは、ローカルディレクトリー全体を Artifacts に追加する方法を示しています。

# ディレクトリー を再帰的に追加
artifact.add_dir(local_path="path/file.format", name="optional-prefix")

上記の API 呼び出しは、上記の Artifacts コンテンツを生成します。

API 呼び出し結果の Artifacts

API 呼び出し	結果の Artifacts
`artifact.add_dir('images')`	`cat.png` `dog.png`
`artifact.add_dir('images', name='images')`	`images/cat.png` `images/dog.png`
`artifact.new_file('hello.txt')`	`hello.txt`

artifact.add_dir('images')

cat.png

dog.png

artifact.add_dir('images', name='images')

images/cat.png

images/dog.png

artifact.new_file('hello.txt') hello.txt

URI 参照を追加する

Artifacts は、W&B ライブラリが処理する方法を知っているスキームを URI が持つ場合、再現性のためにチェックサムやその他の情報を追跡します。

add_reference メソッドを使用して、外部 URI 参照を Artifacts に追加します。'uri' 文字列を自分の URI に置き換えます。オプションで、name パラメータに Artifacts 内の目的のパスを渡します。

# URI 参照を追加
artifact.add_reference(uri="uri", name="optional-name")

Artifacts は現在、次の URI スキームをサポートしています。

http(s)://: HTTP 経由でアクセス可能なファイルへのパス。Artifacts は、HTTP サーバーが ETag および Content-Length レスポンスヘッダーをサポートしている場合、etag およびサイズメタデータの形式でチェックサムを追跡します。
s3://: S3 内のオブジェクトまたはオブジェクトプレフィックスへのパス。Artifacts は、参照されているオブジェクトのチェックサムおよびバージョン管理情報 ( バケットでオブジェクトのバージョン管理が有効になっている場合) を追跡します。オブジェクトプレフィックスは、プレフィックスの下のオブジェクトを含むように拡張され、最大 10,000 個のオブジェクトが含まれます。
gs://: GCS 内のオブジェクトまたはオブジェクトプレフィックスへのパス。Artifacts は、参照されているオブジェクトのチェックサムおよびバージョン管理情報 ( バケットでオブジェクトのバージョン管理が有効になっている場合) を追跡します。オブジェクトプレフィックスは、プレフィックスの下のオブジェクトを含むように拡張され、最大 10,000 個のオブジェクトが含まれます。

上記の API 呼び出しは、上記の Artifacts を生成します。

API 呼び出し	結果の Artifacts コンテンツ
`artifact.add_reference('s3://my-bucket/model.h5')`	`model.h5`
`artifact.add_reference('s3://my-bucket/checkpoints/model.h5')`	`model.h5`
`artifact.add_reference('s3://my-bucket/model.h5', name='models/mymodel.h5')`	`models/mymodel.h5`
`artifact.add_reference('s3://my-bucket/images')`	`cat.png` `dog.png`
`artifact.add_reference('s3://my-bucket/images', name='images')`	`images/cat.png` `images/dog.png`

並列 run から Artifacts にファイルを追加する

大規模なデータセットまたは分散トレーニングの場合、複数の並列 run が単一の Artifacts に貢献する必要がある場合があります。

import wandb
import time

# デモ の目的で、ray を使用して並列で run を 起動 します。
# ただし、並列 run は、どのように編成してもかまいません。
import ray

ray.init()

artifact_type = "dataset"
artifact_name = "parallel-artifact"
table_name = "distributed_table"
parts_path = "parts"
num_parallel = 5

# 並列 ライター の各 バッチ には、独自の
# 一意の グループ 名が必要です。
group_name = "writer-group-{}".format(round(time.time()))


@ray.remote
def train(i):
    """
    ライター ジョブ 。各 ライター は、1つの画像を Artifacts に追加します。
    """
    with wandb.init(group=group_name) as run:
        artifact = wandb.Artifact(name=artifact_name, type=artifact_type)

        # データを wandb テーブル に追加します。この場合、サンプル データ を使用します
        table = wandb.Table(columns=["a", "b", "c"], data=[[i, i * 2, 2**i]])

        # テーブル を Artifacts 内の フォルダ に追加します
        artifact.add(table, "{}/table_{}".format(parts_path, i))

        # Artifacts を アップサート すると、Artifacts のデータ が作成または追加されます
        run.upsert_artifact(artifact)


# 並列で run を 起動 します
result_ids = [train.remote(i) for i in range(num_parallel)]

# すべての ライター に 参加 して、ファイル が
# Artifacts を終了する前に追加されていることを確認します。
ray.get(result_ids)

# すべての ライター が終了したら、Artifacts を終了して、
# 準備完了にします。
with wandb.init(group=group_name) as run:
    artifact = wandb.Artifact(artifact_name, type=artifact_type)

    # テーブル の フォルダ を指す "PartitionTable" を作成します
    # Artifacts に追加します。
    artifact.add(wandb.data_types.PartitionedTable(parts_path), table_name)

    # Finish artifact は Artifacts を確定し、この バージョン への将来の "upsert" を許可しません
    run.finish_artifact(artifact)

1.2 - Download and use artifacts

複数のプロジェクトから Artifacts をダウンロードして使用します。

W&B サーバーにすでに保存されている Artifacts をダウンロードして使用するか、必要に応じて重複排除のために Artifacts オブジェクトを構築して渡します。

表示専用のシートを持つチームメンバーは、Artifacts をダウンロードできません。

W&B に保存されている Artifacts のダウンロードと使用

W&B Run の内部または外部で、W&B に保存されている Artifacts をダウンロードして使用します。Public API (wandb.Api) を使用して、W&B にすでに保存されているデータをエクスポート (または更新) します。詳細については、W&B のPublic API Reference guideを参照してください。

まず、W&B Python SDK をインポートします。次に、W&B Runを作成します。

import wandb

run = wandb.init(project="<example>", job_type="<job-type>")

use_artifact メソッドを使用して、使用する Artifacts を指定します。これにより、run オブジェクトが返されます。次のコードスニペットでは、エイリアス 'latest' を持つ 'bike-dataset' という Artifacts を指定します。

artifact = run.use_artifact("bike-dataset:latest")

返されたオブジェクトを使用して、Artifacts のすべてのコンテンツをダウンロードします。

datadir = artifact.download()

オプションで、ルートパラメータにパスを渡して、Artifacts のコンテンツを特定のディレクトリーにダウンロードできます。詳細については、Python SDK Reference Guideを参照してください。

get_path メソッドを使用して、ファイルのサブセットのみをダウンロードします。

path = artifact.get_path(name)

これは、パス name にあるファイルのみをフェッチします。これは、次のメソッドを持つ Entry オブジェクトを返します。

Entry.download: パス name にある Artifacts からファイルをダウンロードします
Entry.ref: add_reference がエントリをリファレンスとして保存した場合、URI を返します

W&B が処理する方法を知っているスキームを持つリファレンスは、Artifacts ファイルとまったく同じようにダウンロードされます。詳細については、Track external filesを参照してください。

まず、W&B SDK をインポートします。次に、Public API クラスから Artifacts を作成します。その Artifacts に関連付けられたエンティティ、プロジェクト、Artifacts、エイリアスを指定します。

import wandb

api = wandb.Api()
artifact = api.artifact("entity/project/artifact:alias")

返されたオブジェクトを使用して、Artifacts のコンテンツをダウンロードします。

artifact.download()

オプションで、root パラメータにパスを渡して、Artifacts のコンテンツを特定のディレクトリーにダウンロードできます。詳細については、API Reference Guideを参照してください。

wandb artifact get コマンドを使用して、W&B サーバーから Artifacts をダウンロードします。

$ wandb artifact get project/artifact:alias --root mnist/

Artifacts の部分的なダウンロード

オプションで、プレフィックスに基づいて Artifacts の一部をダウンロードできます。path_prefix パラメータを使用すると、単一のファイルまたはサブフォルダーのコンテンツをダウンロードできます。

artifact = run.use_artifact("bike-dataset:latest")

artifact.download(path_prefix="bike.png") # bike.png のみをダウンロードします

または、特定のディレクトリーからファイルをダウンロードすることもできます。

artifact.download(path_prefix="images/bikes/") # images/bikes ディレクトリー内のファイルをダウンロードします

別のプロジェクトの Artifacts の使用

Artifacts の名前をプロジェクト名とともに指定して、Artifacts を参照します。エンティティ名とともに Artifacts の名前を指定することで、エンティティ間で Artifacts を参照することもできます。

次のコード例は、別のプロジェクトから Artifacts をクエリして、現在の W&B run への入力として使用する方法を示しています。

import wandb

run = wandb.init(project="<example>", job_type="<job-type>")
# 別のプロジェクトから Artifacts の W&B をクエリして、それをマークします
# この run への入力として。
artifact = run.use_artifact("my-project/artifact:alias")

# 別のエンティティからの Artifacts を使用して、入力としてマークします
# この run に。
artifact = run.use_artifact("my-entity/my-project/artifact:alias")

Artifacts の同時構築と使用

Artifacts を同時に構築して使用します。Artifacts オブジェクトを作成し、それを use_artifact に渡します。これにより、Artifacts がまだ存在しない場合は W&B に作成されます。use_artifact API はべき等であるため、必要な回数だけ呼び出すことができます。

import wandb

artifact = wandb.Artifact("reference model")
artifact.add_file("model.h5")
run.use_artifact(artifact)

Artifacts の構築の詳細については、Construct an artifactを参照してください。

1.3 - Update an artifact

W&B Run の内外で既存の Artifact を更新します。

Artifact の description、metadata、および alias を更新するために希望する value を渡します。W&B サーバー上の Artifact を更新するには、save() メソッドを呼び出します。W&B の Run 中または Run の外部で Artifact を更新できます。

Run の外部で Artifact を更新するには、W&B Public API（wandb.Api）を使用します。Run 中に Artifact を更新するには、Artifact API（wandb.Artifact）を使用します。

モデルレジストリ内のモデルにリンクされている Artifact のエイリアスを更新することはできません。

次のコード例は、wandb.Artifact API を使用して、Artifact の description を更新する方法を示しています。

import wandb

run = wandb.init(project="<example>")
artifact = run.use_artifact("<artifact-name>:<alias>")
artifact.description = "<description>"
artifact.save()

次のコード例は、wandb.Api API を使用して、Artifact の description を更新する方法を示しています。

import wandb

api = wandb.Api()

artifact = api.artifact("entity/project/artifact:alias")

# description を更新
artifact.description = "My new description"

# 選択的に metadata の キー を更新
artifact.metadata["oldKey"] = "new value"

# metadata を完全に置き換え
artifact.metadata = {"newKey": "new value"}

# エイリアス を追加
artifact.aliases.append("best")

# エイリアス を削除
artifact.aliases.remove("latest")

# エイリアス を完全に置き換え
artifact.aliases = ["replaced"]

# すべての Artifact の変更を永続化
artifact.save()

詳細については、Weights and Biases Artifact API を参照してください。

単一の Artifact と同じ方法で、Artifact のコレクションを更新することもできます。

import wandb
run = wandb.init(project="<example>")
api = wandb.Api()
artifact = api.artifact_collection(type="<type-name>", collection="<collection-name>")
artifact.name = "<new-collection-name>"
artifact.description = "<This is where you'd describe the purpose of your collection.>"
artifact.save()

詳細については、Artifacts Collection のリファレンスを参照してください。

1.4 - Create an artifact alias

W&B Artifacts のカスタムエイリアスを作成します。

エイリアスを使用して、特定のバージョンへのポインタとして使用します。デフォルトでは、Run.log_artifact はログに記録されたバージョンに latest エイリアスを追加します。

アーティファクトのバージョン v0 は、初めてアーティファクトをログに記録する際に作成され、アーティファクトにアタッチされます。W&B は、同じアーティファクトに再度ログを記録する際に、コンテンツのチェックサムを計算します。アーティファクトが変更された場合、W&B は新しいバージョン v1 を保存します。

たとえば、トレーニングスクリプトでデータセットの最新バージョンを取得したい場合は、そのアーティファクトを使用する際に latest を指定します。次のコード例は、latest というエイリアスを持つ bike-dataset という名前の最新のデータセットアーティファクトをダウンロードする方法を示しています。

import wandb

run = wandb.init(project="<example-project>")

artifact = run.use_artifact("bike-dataset:latest")

artifact.download()

カスタムエイリアスをアーティファクトバージョンに適用することもできます。たとえば、モデルのチェックポイントがメトリック AP-50 で最高であることを示したい場合は、モデルアーティファクトをログに記録する際に、'best-ap50' という文字列をエイリアスとして追加できます。

artifact = wandb.Artifact("run-3nq3ctyy-bike-model", type="model")
artifact.add_file("model.h5")
run.log_artifact(artifact, aliases=["latest", "best-ap50"])

1.5 - Create an artifact version

単一の run 、または分散されたプロセスから新しいアーティファクトのバージョンを作成します。

単一の run で、または分散されたrunと共同で、新しいアーティファクトのバージョンを作成します。オプションで、インクリメンタルアーティファクトとして知られる、以前のバージョンから新しいアーティファクトのバージョンを作成できます。

元のアーティファクトのサイズが著しく大きい場合に、アーティファクト内のファイルのサブセットに変更を適用する必要がある場合は、インクリメンタルアーティファクトを作成することをお勧めします。

新しいアーティファクトのバージョンをゼロから作成する

新しいアーティファクトのバージョンを作成する方法は2つあります。単一のrunから作成する方法と、分散されたrunから作成する方法です。それらは次のように定義されます。

単一のrun: 単一のrunは、新しいバージョンのすべてのデータを提供します。これは最も一般的なケースであり、runが必要なデータを完全に再作成する場合に最適です。例：分析のために保存されたモデルまたはモデルの予測をテーブルに出力するなど。
分散されたrun: runのセットが集合的に新しいバージョンのすべてのデータを提供します。これは、多くの場合並行してデータを生成する複数のrunを持つ分散ジョブに最適です。例：分散方式でモデルを評価し、予測を出力するなど。

W&B は、プロジェクトに存在しない名前を wandb.Artifact API に渡すと、新しいアーティファクトを作成し、v0 エイリアスを割り当てます。同じアーティファクトに再度ログを記録すると、W&B はコンテンツのチェックサムを計算します。アーティファクトが変更された場合、W&B は新しいバージョン v1 を保存します。

wandb.Artifact API に名前とアーティファクトのタイプを渡し、それがプロジェクト内の既存のアーティファクトと一致する場合、W&B は既存のアーティファクトを取得します。取得されたアーティファクトのバージョンは1より大きくなります。

単一のrun

アーティファクト内のすべてのファイルを生成する単一のrunで、Artifactの新しいバージョンをログに記録します。このケースは、単一のrunがアーティファクト内のすべてのファイルを生成する場合に発生します。

ユースケースに基づいて、以下のタブのいずれかを選択して、runの内側または外側に新しいアーティファクトのバージョンを作成します。

W&B run内でアーティファクトのバージョンを作成します。

wandb.init でrunを作成します。
wandb.Artifact で新しいアーティファクトを作成するか、既存のアーティファクトを取得します。
.add_file でアーティファクトにファイルを追加します。
.log_artifact でアーティファクトをrunにログ記録します。

with wandb.init() as run:
    artifact = wandb.Artifact("artifact_name", "artifact_type")

    # `.add`、`.add_file`、`.add_dir`、および `.add_reference` を使用して、
    # ファイルとアセットをアーティファクトに追加します
    artifact.add_file("image1.png")
    run.log_artifact(artifact)

W&B runの外側でアーティファクトのバージョンを作成します。

wanb.Artifact で新しいアーティファクトを作成するか、既存のアーティファクトを取得します。
.add_file でアーティファクトにファイルを追加します。
.save でアーティファクトを保存します。

artifact = wandb.Artifact("artifact_name", "artifact_type")
# `.add`、`.add_file`、`.add_dir`、および `.add_reference` を使用して、
# ファイルとアセットをアーティファクトに追加します
artifact.add_file("image1.png")
artifact.save()

分散されたrun

コミットする前に、runのコレクションがバージョンで共同作業できるようにします。これは、1つのrunが新しいバージョンのすべてのデータを提供する上記の単一runモードとは対照的です。

コレクション内の各runは、同じバージョンで共同作業するために、同じ一意のID（distributed_id と呼ばれます）を認識している必要があります。デフォルトでは、存在する場合、W&B は wandb.init(group=GROUP) によって設定されたrunの group を distributed_id として使用します。
バージョンの状態を永続的にロックする、バージョンを「コミット」する最終的なrunが必要です。
共同アーティファクトに追加するには upsert_artifact を使用し、コミットを完了するには finish_artifact を使用します。

次の例を検討してください。異なるrun（以下では Run 1、Run 2、および Run 3 としてラベル付け）は、upsert_artifact で同じアーティファクトに異なる画像ファイルを追加します。

Run 1:

with wandb.init() as run:
    artifact = wandb.Artifact("artifact_name", "artifact_type")
    # `.add`、`.add_file`、`.add_dir`、および `.add_reference` を使用して、
    # ファイルとアセットをアーティファクトに追加します
    artifact.add_file("image1.png")
    run.upsert_artifact(artifact, distributed_id="my_dist_artifact")

Run 2:

with wandb.init() as run:
    artifact = wandb.Artifact("artifact_name", "artifact_type")
    # `.add`、`.add_file`、`.add_dir`、および `.add_reference` を使用して、
    # ファイルとアセットをアーティファクトに追加します
    artifact.add_file("image2.png")
    run.upsert_artifact(artifact, distributed_id="my_dist_artifact")

Run 3

Run 1とRun 2が完了した後に実行する必要があります。finish_artifact を呼び出すRunはアーティファクトにファイルを含めることができますが、必須ではありません。

with wandb.init() as run:
    artifact = wandb.Artifact("artifact_name", "artifact_type")
    # ファイルとアセットをアーティファクトに追加します
    # `.add`、`.add_file`、`.add_dir`、および `.add_reference`
    artifact.add_file("image3.png")
    run.finish_artifact(artifact, distributed_id="my_dist_artifact")

既存のバージョンから新しいアーティファクトのバージョンを作成する

変更されていないファイルを再インデックスする必要なく、以前のアーティファクトのバージョンからファイルのサブセットを追加、変更、または削除します。以前のアーティファクトのバージョンからファイルのサブセットを追加、変更、または削除すると、インクリメンタルアーティファクトとして知られる新しいアーティファクトのバージョンが作成されます。

発生する可能性のあるインクリメンタルな変更のタイプごとのシナリオを次に示します。

add: 新しいバッチを収集した後、データセットに新しいファイルのサブセットを定期的に追加します。
remove: 複数の重複ファイルを発見し、アーティファクトから削除したいとします。
update: ファイルのサブセットのアノテーションを修正し、古いファイルを正しいファイルに置き換えたいとします。

インクリメンタルアーティファクトと同じ機能を実行するために、アーティファクトをゼロから作成できます。ただし、アーティファクトをゼロから作成する場合、アーティファクトのすべてのコンテンツをローカルディスクに用意する必要があります。インクリメンタルな変更を行う場合、以前のアーティファクトのバージョンからファイルを変更せずに、単一のファイルを追加、削除、または変更できます。

インクリメンタルアーティファクトは、単一のrun内またはrunのセット（分散モード）で作成できます。

以下の手順に従って、アーティファクトをインクリメンタルに変更します。

インクリメンタルな変更を実行するアーティファクトのバージョンを取得します。

saved_artifact = run.use_artifact("my_artifact:latest")

client = wandb.Api()
saved_artifact = client.artifact("my_artifact:latest")

次を使用してドラフトを作成します。

draft_artifact = saved_artifact.new_draft()

次のバージョンで表示したいインクリメンタルな変更を実行します。既存のエントリを追加、削除、または変更できます。

これらの変更を実行する方法の例については、以下のタブのいずれかを選択してください。

add_file メソッドを使用して、既存のアーティファクトのバージョンにファイルを追加します。

draft_artifact.add_file("file_to_add.txt")

add_dir メソッドを使用してディレクトリーを追加することで、複数のファイルを追加することもできます。

remove メソッドを使用して、既存のアーティファクトのバージョンからファイルを削除します。

draft_artifact.remove("file_to_remove.txt")

ディレクトリーパスを渡すことで、remove メソッドを使用して複数のファイルを削除することもできます。

ドラフトから古いコンテンツを削除し、新しいコンテンツを再度追加して、コンテンツを変更または置き換えます。

draft_artifact.remove("modified_file.txt")
draft_artifact.add_file("modified_file.txt")

最後に、変更をログに記録または保存します。以下のタブは、W&B runの内側と外側で変更を保存する方法を示しています。ユースケースに合ったタブを選択してください。

run.log_artifact(draft_artifact)

draft_artifact.save()

まとめると、上記のコード例は次のようになります。

with wandb.init(job_type="データセットの変更") as run:
    saved_artifact = run.use_artifact(
        "my_artifact:latest"
    )  # アーティファクトをフェッチしてrunに入力します
    draft_artifact = saved_artifact.new_draft()  # ドラフトバージョンを作成します

    # ドラフトバージョン内のファイルのサブセットを変更します
    draft_artifact.add_file("file_to_add.txt")
    draft_artifact.remove("dir_to_remove/")
    run.log_artifact(
        artifact
    )  # 変更をログに記録して新しいバージョンを作成し、runへの出力としてマークします

client = wandb.Api()
saved_artifact = client.artifact("my_artifact:latest")  # アーティファクトをロードします
draft_artifact = saved_artifact.new_draft()  # ドラフトバージョンを作成します

# ドラフトバージョン内のファイルのサブセットを変更します
draft_artifact.remove("deleted_file.txt")
draft_artifact.add_file("modified_file.txt")
draft_artifact.save()  # ドラフトへの変更をコミットします

1.6 - Track external files

W&B の外部に保存されたファイル (Amazon S3 バケット、GCS バケット、HTTP ファイルサーバー、NFS 共有など) を追跡します。

参照 Artifacts を使用して、W&Bシステム外に保存されたファイル（例えば、Amazon S3 バケット、GCS バケット、Azure Blob、HTTP ファイルサーバー、あるいは NFS 共有など）を追跡します。W&B CLIを使用し、W&B Runの外で Artifacts をログ記録します。

run の外で Artifacts をログ記録する

run の外で Artifact をログ記録すると、W&B は run を作成します。各 Artifact は run に属し、その run はプロジェクトに属します。Artifact（バージョン）はコレクションにも属し、タイプを持ちます。

wandb artifact put コマンドを使用すると、W&B run の外で Artifact を W&B サーバーにアップロードできます。Artifact が属するプロジェクトの名前と Artifact の名前（project/artifact_name）を指定します。オプションで、タイプ（TYPE）を指定します。以下のコードスニペットの PATH を、アップロードする Artifact のファイルパスに置き換えます。

$ wandb artifact put --name project/artifact_name --type TYPE PATH

指定したプロジェクトが存在しない場合、W&B は新しいプロジェクトを作成します。Artifact のダウンロード方法については、Artifacts のダウンロードと使用を参照してください。

W&B の外で Artifacts を追跡する

W&B Artifacts を使用して、データセットのバージョン管理とモデルリネージを行い、参照 Artifacts を使用して W&B サーバーの外に保存されたファイルを追跡します。このモードでは、Artifact は URL、サイズ、チェックサムなどのファイルに関するメタデータのみを保存します。基になるデータがシステムから離れることはありません。ファイルを W&B サーバーに保存する方法については、クイックスタートを参照してください。

以下では、参照 Artifacts を構築する方法と、ワークフローに組み込む最適な方法について説明します。

Amazon S3 / GCS / Azure Blob Storage 参照

W&B Artifacts を使用して、データセットとモデルのバージョン管理を行い、クラウドストレージバケット内の参照を追跡します。Artifact の参照を使用すると、既存のストレージレイアウトを変更することなく、シームレスに追跡をバケットの上に重ねることができます。

Artifacts は、基盤となるクラウドストレージベンダー（AWS、GCP、Azure など）を抽象化します。以下のセクションで説明する情報は、Amazon S3、Google Cloud Storage、Azure Blob Storage に均一に適用されます。

W&B Artifacts は、MinIO を含む、Amazon S3 互換のインターフェースをサポートします。AWS_S3_ENDPOINT_URL 環境変数を MinIO サーバーを指すように設定すると、以下のスクリプトはそのまま動作します。

次の構造のバケットがあると仮定します。

s3://my-bucket
+-- datasets/
| +-- mnist/
+-- models/
 +-- cnn/

mnist/ の下には、画像のコレクションであるデータセットがあります。これを Artifact で追跡してみましょう。

import wandb

run = wandb.init()
artifact = wandb.Artifact("mnist", type="dataset")
artifact.add_reference("s3://my-bucket/datasets/mnist")
run.log_artifact(artifact)

デフォルトでは、W&B はオブジェクトプレフィックスを追加する際に 10,000 オブジェクトの制限を課します。この制限は、add_reference の呼び出しで max_objects= を指定することで調整できます。

新しい参照 Artifact mnist:latest は、通常の Artifact と同様に見え、動作します。唯一の違いは、Artifact が S3/GCS/Azure オブジェクトに関するメタデータ（ETag、サイズ、オブジェクトのバージョン管理がバケットで有効になっている場合はバージョン ID など）のみで構成されていることです。

W&B は、使用しているクラウドプロバイダーに基づいて、認証情報を検索するためのデフォルトのメカニズムを使用します。使用する認証情報の詳細については、クラウドプロバイダーのドキュメントを参照してください。

クラウドプロバイダー	認証情報のドキュメント
AWS	Boto3 documentation
GCP	Google Cloud documentation
Azure	Azure documentation

AWS の場合、バケットが設定されたユーザーのデフォルトリージョンにない場合は、AWS_REGION 環境変数をバケットリージョンと一致するように設定する必要があります。

この Artifact は、通常の Artifact と同様に操作します。App UI では、ファイルブラウザーを使用して参照 Artifact のコンテンツを調べたり、完全な依存関係グラフを調べたり、Artifact のバージョン管理された履歴をスキャンしたりできます。

画像、オーディオ、ビデオ、ポイントクラウドなどのリッチメディアは、バケットの CORS 設定によっては、App UI でレンダリングされない場合があります。バケットの CORS 設定で app.wandb.ai のリストを許可すると、App UI でそのようなリッチメディアを適切にレンダリングできます。

会社の VPN がある場合、プライベートバケットのパネルが App UI でレンダリングされない場合があります。VPN 内の IP をホワイトリストに登録するようにバケットのアクセスポリシーを更新できます。

参照 Artifact をダウンロードする

import wandb

run = wandb.init()
artifact = run.use_artifact("mnist:latest", type="dataset")
artifact_dir = artifact.download()

W&B は、参照 Artifact をダウンロードする際に、Artifact がログ記録されたときに記録されたメタデータを使用して、基盤となるバケットからファイルを取得します。バケットでオブジェクトのバージョン管理が有効になっている場合、W&B は Artifact がログ記録された時点でのファイルの状態に対応するオブジェクトバージョンを取得します。これは、バケットのコンテンツを進化させても、特定のモデルがトレーニングされたデータの正確なイテレーションを指すことができることを意味します。Artifact はトレーニング時のバケットのスナップショットとして機能するためです。

ワークフローの一部としてファイルを上書きする場合は、ストレージバケットで「オブジェクトのバージョン管理」を有効にすることをお勧めします。バケットでバージョン管理が有効になっている場合、上書きされたファイルへの参照を持つ Artifacts は、古いオブジェクトバージョンが保持されるため、そのまま残ります。

ユースケースに基づいて、オブジェクトのバージョン管理を有効にする手順を読んでください：AWS, GCP, Azure.

統合する

次のコード例は、Amazon S3、GCS、または Azure でデータセットを追跡するために使用できる簡単なワークフローを示しています。

import wandb

run = wandb.init()

artifact = wandb.Artifact("mnist", type="dataset")
artifact.add_reference("s3://my-bucket/datasets/mnist")

# Artifact を追跡し、この run への入力としてマークします。
# バケット 内のファイル が変更された場合にのみ、新しい Artifact バージョン がログ記録されます。
run.use_artifact(artifact)

artifact_dir = artifact.download()

# ここで トレーニング を実行します...

モデルを追跡するために、トレーニングスクリプトがモデルファイルをバケットにアップロードした後、モデル Artifact をログ記録できます。

import boto3
import wandb

run = wandb.init()

# トレーニング はこちら...

s3_client = boto3.client("s3")
s3_client.upload_file("my_model.h5", "my-bucket", "models/cnn/my_model.h5")

model_artifact = wandb.Artifact("cnn", type="model")
model_artifact.add_reference("s3://my-bucket/models/cnn/")
run.log_artifact(model_artifact)

GCP または Azure の参照によって Artifacts を追跡する方法のエンドツーエンドのチュートリアルについては、次のレポートを参照してください。

ファイルシステム参照

データセットに高速にアクセスするためのもう 1 つの一般的なパターンは、すべてのトレーニングジョブを実行しているマシンでリモートファイルシステムに NFS マウントポイントを公開することです。トレーニングスクリプトの観点から見ると、ファイルがローカルファイルシステムにあるように見えるため、これはクラウドストレージバケットよりもさらに簡単なソリューションになる可能性があります。幸いなことに、その使いやすさは、ファイルシステムへの参照を追跡するために Artifacts を使用することにも拡張されます（マウントされているかどうかに関係なく）。

次の構造のファイルシステムが /mount にマウントされていると仮定します。

mount
+-- datasets/
| +-- mnist/
+-- models/
 +-- cnn/

mnist/ の下には、画像のコレクションであるデータセットがあります。これを Artifact で追跡してみましょう。

import wandb

run = wandb.init()
artifact = wandb.Artifact("mnist", type="dataset")
artifact.add_reference("file:///mount/datasets/mnist/")
run.log_artifact(artifact)

デフォルトでは、W&B はディレクトリーへの参照を追加する際に 10,000 ファイルの制限を課します。この制限は、add_reference の呼び出しで max_objects= を指定することで調整できます。

URL には 3 つのスラッシュがあることに注意してください。最初のコンポーネントは、ファイルシステム参照の使用を示す file:// プレフィックスです。2 番目のコンポーネントは、データセットへのパス /mount/datasets/mnist/ です。

結果として得られる Artifact mnist:latest は、通常の Artifact と同じように見え、動作します。唯一の違いは、Artifact がファイルに関するメタデータ（サイズや MD5 チェックサムなど）のみで構成されていることです。ファイル自体がシステムから離れることはありません。

この Artifact は、通常の Artifact と同じように操作できます。UI では、ファイルブラウザーを使用して参照 Artifact のコンテンツを参照したり、完全な依存関係グラフを調べたり、Artifact のバージョン管理された履歴をスキャンしたりできます。ただし、データ自体が Artifact に含まれていないため、UI は画像やオーディオなどのリッチメディアをレンダリングできません。

参照 Artifact のダウンロードは簡単です。

import wandb

run = wandb.init()
artifact = run.use_artifact("entity/project/mnist:latest", type="dataset")
artifact_dir = artifact.download()

ファイルシステム参照の場合、download() 操作は参照されたパスからファイルをコピーして Artifact ディレクトリーを構築します。上記の例では、/mount/datasets/mnist のコンテンツがディレクトリー artifacts/mnist:v0/ にコピーされます。Artifact に上書きされたファイルへの参照が含まれている場合、Artifact を再構築できなくなるため、download() はエラーをスローします。

すべてをまとめると、マウントされたファイルシステムの下にあるデータセットを追跡するために使用できる簡単なワークフローを次に示します。

import wandb

run = wandb.init()

artifact = wandb.Artifact("mnist", type="dataset")
artifact.add_reference("file:///mount/datasets/mnist/")

# Artifact を追跡し、この run への入力としてマークします。
# ディレクトリー の下のファイル が変更された場合にのみ、新しい Artifact バージョン がログ記録されます。
run.use_artifact(artifact)

artifact_dir = artifact.download()

# ここで トレーニング を実行します...

モデルを追跡するために、トレーニングスクリプトがモデルファイルをマウントポイントに書き込んだ後、モデル Artifact をログ記録できます。

import wandb

run = wandb.init()

# トレーニング はこちら...

# モデル を ディスク に書き込みます

model_artifact = wandb.Artifact("cnn", type="model")
model_artifact.add_reference("file:///mount/cnn/my_model.h5")
run.log_artifact(model_artifact)

1.7 - Manage data

1.7.1 - Delete an artifact

App UI を使用してインタラクティブに、または W&B SDK を使用してプログラム的に Artifacts を削除します。

App UIまたは W&B SDK を使用して、アーティファクトをインタラクティブに、またはプログラムで削除できます。アーティファクトを削除すると、W&B はそのアーティファクトを 論理削除 としてマークします。つまり、アーティファクトは削除対象としてマークされますが、ファイルはストレージからすぐに削除されるわけではありません。

アーティファクトの内容は、論理削除、つまり削除保留状態のままとなり、定期的に実行されるガベージコレクションプロセスが、削除対象としてマークされたすべてのアーティファクトを確認します。ガベージコレクションプロセスは、アーティファクトとその関連ファイルが、以前または以降のアーティファクトバージョンで使用されていない場合、ストレージから関連ファイルを削除します。

このページのセクションでは、特定のアーティファクトバージョンを削除する方法、アーティファクトコレクションを削除する方法、エイリアスを使用または使用せずにアーティファクトを削除する方法などについて説明します。アーティファクトが W&B から削除されるタイミングは、TTL ポリシーでスケジュールできます。詳細については、アーティファクト TTL ポリシーによるデータ保持の管理を参照してください。

TTL ポリシーで削除がスケジュールされているアーティファクト、W&B SDK で削除されたアーティファクト、または W&B App UI で削除されたアーティファクトは、最初に論理削除されます。論理削除されたアーティファクトは、完全に削除される前にガベージコレクションの対象となります。

アーティファクトバージョンを削除する

アーティファクトバージョンを削除するには:

アーティファクトの名前を選択します。これにより、アーティファクトビューが展開され、そのアーティファクトに関連付けられているすべてのアーティファクトバージョンが一覧表示されます。
アーティファクトのリストから、削除するアーティファクトバージョンを選択します。
ワークスペースの右側にあるケバブドロップダウンを選択します。
削除を選択します。

アーティファクトバージョンは、delete() メソッドを使用してプログラムで削除することもできます。以下の例を参照してください。

エイリアスを持つ複数のアーティファクトバージョンを削除する

次のコード例は、エイリアスが関連付けられているアーティファクトを削除する方法を示しています。アーティファクトを作成したエンティティ、プロジェクト名、run ID を指定します。

import wandb

run = api.run("entity/project/run_id")

for artifact in run.logged_artifacts():
    artifact.delete()

アーティファクトに1つ以上のエイリアスがある場合にエイリアスを削除するには、delete_aliases パラメータをブール値 True に設定します。

import wandb

run = api.run("entity/project/run_id")

for artifact in run.logged_artifacts():
    # 1つ以上エイリアスを持つ
    # アーティファクトを削除するには
    # delete_aliases=True を設定します
    artifact.delete(delete_aliases=True)

特定のエイリアスを持つ複数のアーティファクトバージョンを削除する

次のコードは、特定のエイリアスを持つ複数のアーティファクトバージョンを削除する方法を示しています。アーティファクトを作成したエンティティ、プロジェクト名、run ID を指定します。削除ロジックを独自のものに置き換えます。

import wandb

runs = api.run("entity/project_name/run_id")

# エイリアス 'v3' と 'v4' を持つアーティファクトを削除します
for artifact_version in runs.logged_artifacts():
    # 独自の削除ロジックに置き換えます。
    if artifact_version.name[-2:] == "v3" or artifact_version.name[-2:] == "v4":
        artifact.delete(delete_aliases=True)

エイリアスを持たないアーティファクトのすべてのバージョンを削除する

次のコードスニペットは、エイリアスを持たないアーティファクトのすべてのバージョンを削除する方法を示しています。wandb.Api の project および entity キーに、プロジェクトとエンティティの名前をそれぞれ指定します。<> をアーティファクトの名前に置き換えます。

import wandb

# wandb.Api メソッドを使用する場合は、
# エンティティとプロジェクト名を指定してください。
api = wandb.Api(overrides={"project": "project", "entity": "entity"})

artifact_type, artifact_name = "<>"  # タイプと名前を指定
for v in api.artifact_versions(artifact_type, artifact_name):
    # 'latest' などのエイリアスを持たないバージョンをクリーンアップします。
    # 注: ここには、必要な削除ロジックを入れることができます。
    if len(v.aliases) == 0:
        v.delete()

アーティファクトコレクションを削除する

アーティファクトコレクションを削除するには:

削除するアーティファクトコレクションに移動し、その上にカーソルを置きます。
アーティファクトコレクション名の横にあるケバブドロップダウンを選択します。
削除を選択します。

delete() メソッドを使用して、プログラムでアーティファクトコレクションを削除することもできます。wandb.Api の project および entity キーに、プロジェクトとエンティティの名前をそれぞれ指定します。

import wandb

# wandb.Api メソッドを使用する場合は、
# エンティティとプロジェクト名を指定してください。
api = wandb.Api(overrides={"project": "project", "entity": "entity"})
collection = api.artifact_collection(
    "<artifact_type>", "entity/project/artifact_collection_name"
)
collection.delete()

W&B のホスト方法に基づいてガベージコレクションを有効にする方法

W&B の共有クラウドを使用している場合、ガベージコレクションはデフォルトで有効になっています。W&B のホスト方法によっては、ガベージコレクションを有効にするために追加の手順が必要になる場合があります。これには以下が含まれます。

GORILLA_ARTIFACT_GC_ENABLED 環境変数を true に設定します: GORILLA_ARTIFACT_GC_ENABLED=true
AWS、GCP 、または Minio などの他のストレージプロバイダーを使用する場合は、バケットのバージョン管理を有効にします。Azure を使用する場合は、論理削除を有効にします。
Azure の論理削除は、他のストレージプロバイダーのバケットのバージョン管理と同等です。

次の表は、デプロイメントの種類に基づいてガベージコレクションを有効にするための要件を満たす方法を示しています。

X は、要件を満たす必要があることを示します。

	環境変数	バージョン管理を有効にする
共有クラウド
セキュアストレージコネクタを使用した共有クラウド		X
専用クラウド
セキュアストレージコネクタを使用した専用クラウド		X
顧客管理クラウド	X	X
顧客管理オンプレミス	X	X

note セキュアストレージコネクタは、現在 Google Cloud Platform および Amazon Web Services でのみ利用可能です。

1.7.2 - Manage artifact data retention

Time to live ポリシー (TTL)

Try in Colab

W&B Artifact time-to-live（TTL）ポリシーを使用して、Artifacts が W&B から削除されるタイミングをスケジュールします。アーティファクトを削除すると、W&B はそのアーティファクトを ソフト削除 としてマークします。つまり、アーティファクトは削除対象としてマークされますが、ファイルはストレージからすぐに削除されるわけではありません。W&B が Artifacts を削除する方法の詳細については、Artifacts の削除ページを参照してください。

W&B アプリで Artifacts TTL を使用してデータ保持を管理する方法については、こちらのビデオチュートリアルをご覧ください。

W&B は、モデルレジストリにリンクされたモデル Artifacts の TTL ポリシーを設定するオプションを無効にします。これは、リンクされたモデルがプロダクションワークフローで使用されている場合に誤って期限切れにならないようにするためです。

チーム管理者のみがチームの設定を表示し、（1）TTL ポリシーを設定または編集できるユーザーを許可するか、（2）チームのデフォルト TTL を設定するなど、チームレベルの TTL 設定にアクセスできます。
W&B アプリ UI のアーティファクトの詳細で TTL ポリシーを設定または編集するオプションが表示されない場合、またはプログラムで TTL を設定してもアーティファクトの TTL プロパティが正常に変更されない場合は、チーム管理者がそのための権限を付与していません。

自動生成された Artifacts

ユーザーが生成した Artifacts のみ、TTL ポリシーを使用できます。W&B によって自動生成された Artifacts は、TTL ポリシーを設定できません。

次の Artifact の種類は、自動生成された Artifact を示します。

run_table
code
job
wandb-* で始まる任意の Artifact の種類

W&B プラットフォームで、またはプログラムで Artifact の種類を確認できます。

import wandb

run = wandb.init(project="<my-project-name>")
artifact = run.use_artifact(artifact_or_name="<my-artifact-name>")
print(artifact.type)

<> で囲まれた値を独自の値に置き換えます。

TTL ポリシーを編集および設定できるユーザーを定義する

チーム内で TTL ポリシーを設定および編集できるユーザーを定義します。TTL 権限をチーム管理者のみに付与するか、チーム管理者とチームメンバーの両方に TTL 権限を付与できます。

チーム管理者のみが、TTL ポリシーを設定または編集できるユーザーを定義できます。

チームのプロファイルページに移動します。
[設定] タブを選択します。
[Artifacts time-to-live (TTL) section] に移動します。
[TTL permissions dropdown] で、TTL ポリシーを設定および編集できるユーザーを選択します。
[Review and save settings] をクリックします。
変更を確認し、[Save settings] を選択します。

TTL ポリシーを作成する

アーティファクトを作成するとき、またはアーティファクトの作成後に遡及的に、アーティファクトの TTL ポリシーを設定します。

以下のすべてのコードスニペットについて、<> で囲まれたコンテンツを自分の情報に置き換えて、コードスニペットを使用します。

アーティファクトを作成するときに TTL ポリシーを設定する

W&B Python SDK を使用して、アーティファクトを作成するときに TTL ポリシーを定義します。TTL ポリシーは通常、日数で定義されます。

アーティファクトを作成するときに TTL ポリシーを定義することは、通常アーティファクトを作成する方法と似ています。ただし、アーティファクトの ttl 属性に時間デルタを渡す点が異なります。

手順は次のとおりです。

アーティファクトを作成します。
ファイル、ディレクトリー、参照など、アーティファクトにコンテンツを追加します。
Python の標準ライブラリの一部である datetime.timedelta データ型を使用して、TTL 制限時間を定義します。
アーティファクトをログに記録します。

次のコードスニペットは、アーティファクトを作成し、TTL ポリシーを設定する方法を示しています。

import wandb
from datetime import timedelta

run = wandb.init(project="<my-project-name>", entity="<my-entity>")
artifact = wandb.Artifact(name="<artifact-name>", type="<type>")
artifact.add_file("<my_file>")

artifact.ttl = timedelta(days=30)  # TTL ポリシーを設定
run.log_artifact(artifact)

上記のコードスニペットは、アーティファクトの TTL ポリシーを 30 日に設定します。つまり、W&B は 30 日後にアーティファクトを削除します。

アーティファクトを作成した後で TTL ポリシーを設定または編集する

W&B アプリ UI または W&B Python SDK を使用して、既に存在するアーティファクトの TTL ポリシーを定義します。

アーティファクトの TTL を変更すると、アーティファクトが期限切れになるまでの時間は、アーティファクトの createdAt タイムスタンプを使用して計算されます。

アーティファクトを取得します。
時間デルタをアーティファクトの ttl 属性に渡します。
saveメソッドを使用してアーティファクトを更新します。

次のコードスニペットは、アーティファクトの TTL ポリシーを設定する方法を示しています。

import wandb
from datetime import timedelta

artifact = run.use_artifact("<my-entity/my-project/my-artifact:alias>")
artifact.ttl = timedelta(days=365 * 2)  # 2 年後に削除
artifact.save()

上記のコード例では、TTL ポリシーを 2 年に設定しています。

W&B アプリ UI で W&B プロジェクトに移動します。
左側のパネルでアーティファクトアイコンを選択します。
アーティファクトのリストから、TTL ポリシーを編集するアーティファクトの種類を展開します。
TTL ポリシーを編集するアーティファクトバージョンを選択します。
[バージョン] タブをクリックします。
ドロップダウンから [TTL ポリシーの編集] を選択します。
表示されるモーダル内で、TTL ポリシードロップダウンから [カスタム] を選択します。
[TTL 期間] フィールドに、TTL ポリシーを日数単位で設定します。
[TTL の更新] ボタンを選択して、変更を保存します。

チームのデフォルト TTL ポリシーを設定する

チーム管理者のみが、チームのデフォルト TTL ポリシーを設定できます。

チームのデフォルト TTL ポリシーを設定します。デフォルト TTL ポリシーは、それぞれの作成日に基づいて、既存および将来のすべてのアーティファクトに適用されます。既存のバージョンレベルの TTL ポリシーを持つアーティファクトは、チームのデフォルト TTL の影響を受けません。

チームのプロファイルページに移動します。
[設定] タブを選択します。
[Artifacts time-to-live (TTL) section] に移動します。
[チームのデフォルト TTL ポリシーを設定] をクリックします。
[期間] フィールドに、TTL ポリシーを日数単位で設定します。
[Review and save settings] をクリックします。
変更を確認し、[Save settings] を選択します。

run の外部で TTL ポリシーを設定する

パブリック API を使用して、run を取得せずにアーティファクトを取得し、TTL ポリシーを設定します。TTL ポリシーは通常、日数で定義されます。

次のコードサンプルは、パブリック API を使用してアーティファクトを取得し、TTL ポリシーを設定する方法を示しています。

api = wandb.Api()

artifact = api.artifact("entity/project/artifact:alias")

artifact.ttl = timedelta(days=365)  # 1 年後に削除

artifact.save()

TTL ポリシーを無効化する

W&B Python SDK または W&B アプリ UI を使用して、特定のアーティファクトバージョンの TTL ポリシーを無効化します。

アーティファクトを取得します。
アーティファクトの ttl 属性を None に設定します。
saveメソッドを使用してアーティファクトを更新します。

次のコードスニペットは、アーティファクトの TTL ポリシーをオフにする方法を示しています。

artifact = run.use_artifact("<my-entity/my-project/my-artifact:alias>")
artifact.ttl = None
artifact.save()

W&B アプリ UI で W&B プロジェクトに移動します。
左側のパネルでアーティファクトアイコンを選択します。
アーティファクトのリストから、TTL ポリシーを編集するアーティファクトの種類を展開します。
TTL ポリシーを編集するアーティファクトバージョンを選択します。
[バージョン] タブをクリックします。
[レジストリへのリンク] ボタンの横にあるミートボール UI アイコンをクリックします。
ドロップダウンから [TTL ポリシーの編集] を選択します。
表示されるモーダル内で、TTL ポリシードロップダウンから [非アクティブ化] を選択します。
[TTL の更新] ボタンを選択して、変更を保存します。

TTL ポリシーを表示する

Python SDK または W&B アプリ UI でアーティファクトの TTL ポリシーを表示します。

print ステートメントを使用して、アーティファクトの TTL ポリシーを表示します。次の例は、アーティファクトを取得し、その TTL ポリシーを表示する方法を示しています。

artifact = run.use_artifact("<my-entity/my-project/my-artifact:alias>")
print(artifact.ttl)

W&B アプリ UI でアーティファクトの TTL ポリシーを表示します。

https://wandb.ai で W&B アプリに移動します。
W&B プロジェクトに移動します。
プロジェクト内で、左側のサイドバーにある [Artifacts] タブを選択します。
コレクションをクリックします。

コレクションビュー内では、選択したコレクション内のすべてのアーティファクトを表示できます。[Time to Live] 列には、そのアーティファクトに割り当てられた TTL ポリシーが表示されます。

1.7.3 - Manage artifact storage and memory allocation

W&B Artifacts のストレージ、メモリアロケーションを管理します。

W&B は artifact ファイルを、デフォルトで米国にあるプライベートな Google Cloud Storage バケットに保存します。すべてのファイルは、保存時および転送時に暗号化されます。

機密性の高いファイルについては、Private Hosting をセットアップするか、reference artifacts を使用することをお勧めします。

トレーニング中、W&B はログ、アーティファクト、および設定ファイルを次のローカルディレクトリーにローカルに保存します。

ファイル	デフォルトの場所	デフォルトの場所を変更するには、以下を設定します：
ログ	`./wandb`	`wandb.init` の `dir` 、または `WANDB_DIR` 環境変数を設定
artifacts	`~/.cache/wandb`	`WANDB_CACHE_DIR` 環境変数
configs	`~/.config/wandb`	`WANDB_CONFIG_DIR` 環境変数
アップロード用に artifacts をステージング	`~/.cache/wandb-data/`	`WANDB_DATA_DIR` 環境変数
ダウンロードされた artifacts	`./artifacts`	`WANDB_ARTIFACT_DIR` 環境変数

環境変数を使用して W&B を構成するための完全なガイドについては、環境変数のリファレンスを参照してください。

wandb が初期化されるマシンによっては、これらのデフォルトフォルダーがファイルシステムの書き込み可能な場所に配置されていない場合があります。これにより、エラーが発生する可能性があります。

ローカル artifact キャッシュのクリーンアップ

W&B は artifact ファイルをキャッシュして、ファイルを共有するバージョン間でのダウンロードを高速化します。時間の経過とともに、このキャッシュディレクトリーが大きくなる可能性があります。wandb artifact cache cleanup コマンドを実行して、キャッシュを削除し、最近使用されていないファイルを削除します。

次のコードスニペットは、キャッシュのサイズを 1GB に制限する方法を示しています。コードスニペットをコピーしてターミナルに貼り付けます。

$ wandb artifact cache cleanup 1GB

1.8 - Explore artifact graphs

自動的に作成された有向非巡回 W&B Artifact グラフをトラバースします。

W&B は、特定の run がログに記録した Artifacts と、特定の run が使用する Artifacts を自動的に追跡します。これらの Artifacts には、データセット、モデル、評価結果などが含まれます。Artifacts のリネージを調べることで、機械学習のライフサイクル全体で生成されるさまざまな Artifacts を追跡および管理できます。

リネージ

Artifacts のリネージを追跡することには、いくつかの重要な利点があります。

再現性: すべての Artifacts のリネージを追跡することで、チームは Experiments、モデル、および結果を再現できます。これは、デバッグ、実験、および機械学習モデルの検証に不可欠です。
バージョン管理: Artifacts のリネージには、Artifacts のバージョン管理と、時間の経過に伴う変更の追跡が含まれます。これにより、チームは必要に応じてデータまたはモデルの以前のバージョンにロールバックできます。
監査: Artifacts とその変換の詳細な履歴を持つことで、組織は規制およびガバナンスの要件を遵守できます。
コラボレーションと知識の共有: Artifacts のリネージは、試行錯誤の明確な記録を提供することにより、チームメンバー間のより良いコラボレーションを促進します。これは、努力の重複を回避し、開発プロセスを加速するのに役立ちます。

Artifacts のリネージの検索

[Artifacts] タブで Artifacts を選択すると、Artifacts のリネージを確認できます。このグラフビューには、パイプラインの概要が表示されます。

Artifacts グラフを表示するには:

W&B App UI でプロジェクトに移動します。
左側のパネルで Artifacts アイコンを選択します。
[Lineage] を選択します。

リネージグラフのナビゲート

指定した Artifacts またはジョブタイプが名前の前に表示され、Artifacts は青いアイコンで、runs は緑のアイコンで表示されます。矢印は、グラフ上の run または Artifacts の入出力を詳細に示します。

Artifacts のタイプと名前は、左側のサイドバーと [Lineage] タブの両方で確認できます。

より詳細なビューを表示するには、個々の Artifacts または run をクリックして、特定のオブジェクトに関する詳細情報を取得します。

Artifacts クラスター

グラフのレベルに 5 つ以上の runs または Artifacts がある場合、クラスターが作成されます。クラスターには、runs または Artifacts の特定のバージョンを検索するための検索バーがあり、クラスターから個々のノードをプルして、クラスター内のノードのリネージの調査を続行します。

ノードをクリックすると、ノードの概要を示すプレビューが開きます。矢印をクリックすると、個々の run または Artifacts が抽出され、抽出されたノードのリネージを調べることができます。

API を使用してリネージを追跡する

W&B APIを使用してグラフをナビゲートすることもできます。

Artifacts を作成します。まず、wandb.init で run を作成します。次に、wandb.Artifact で新しい Artifacts を作成するか、既存の Artifacts を取得します。次に、.add_file で Artifacts にファイルを追加します。最後に、.log_artifact で Artifacts を run にログします。完成したコードは次のようになります。

with wandb.init() as run:
    artifact = wandb.Artifact("artifact_name", "artifact_type")

    # Add Files and Assets to the artifact using
    # `.add`, `.add_file`, `.add_dir`, and `.add_reference`
    artifact.add_file("image1.png")
    run.log_artifact(artifact)

Artifacts オブジェクトの logged_by メソッドと used_by メソッドを使用して、Artifacts からグラフをたどります。

# Walk up and down the graph from an artifact:
producer_run = artifact.logged_by()
consumer_runs = artifact.used_by()

次のステップ

1.9 - Artifact data privacy and compliance

W&B のファイルがデフォルトでどこに保存されるかについて学びましょう。機密情報の保存、保存方法について説明します。

ファイルを Artifacts としてログに記録すると、ファイルは W&B が管理する Google Cloud バケットにアップロードされます。バケットの内容は、保存時も転送時も暗号化されます。Artifact ファイルは、対応するプロジェクトへのアクセス権を持つユーザーのみに表示されます。

Artifact のバージョンを削除すると、データベース内でソフト削除としてマークされ、ストレージコストから削除されます。Artifact 全体を削除すると、完全に削除されるようにキューに入れられ、そのすべてのコンテンツが W&B バケットから削除されます。ファイルの削除に関して特別なニーズがある場合は、カスタマーサポートまでご連絡ください。

マルチテナント環境に存在できない機密性の高いデータセットの場合、クラウドバケットに接続されたプライベート W&B サーバー、または reference artifacts を使用できます。Reference artifacts は、ファイルの内容を W&B に送信せずに、プライベートバケットへの参照を追跡します。Reference artifacts は、バケットまたはサーバー上のファイルへのリンクを保持します。つまり、W&B はファイル自体ではなく、ファイルに関連付けられたメタデータのみを追跡します。

Reference artifact は、非 Reference artifact を作成するのと同じように作成します。

import wandb

run = wandb.init()
artifact = wandb.Artifact("animals", type="dataset")
artifact.add_reference("s3://my-bucket/animals")

代替案については、contact@wandb.com までお問い合わせいただき、プライベートクラウドおよびオンプレミスのインストールについてご相談ください。

1.10 - Tutorial: Create, track, and use a dataset artifact

Artifacts クイックスタートでは、W&B でデータセット artifact を作成、追跡、使用する方法を紹介します。

このチュートリアルでは、W&B Runsからデータセット Artifactsを作成、追跡、および使用する方法を示します。

1. W&Bにログイン

W&Bライブラリをインポートし、W&Bにログインします。まだお持ちでない場合は、無料のW&Bアカウントにサインアップする必要があります。

import wandb

wandb.login()

2. runを初期化

wandb.init() APIを使用して、W&B Runとしてデータを同期および記録するためのバックグラウンドプロセスを生成します。 project名とジョブタイプを指定します。

# W&B Runを作成します。この例では、データセット Artifactsの作成方法を示すため、ジョブタイプとして「dataset」を指定します。
run = wandb.init(project="artifacts-example", job_type="upload-dataset")

3. artifact オブジェクトを作成

wandb.Artifact() APIを使用して、artifact オブジェクトを作成します。 artifactの名前とファイルタイプの記述を、それぞれname パラメータと type パラメータに指定します。

たとえば、次のコードスニペットは、‘bicycle-dataset’ という名前で ‘dataset’ というラベルの artifact を作成する方法を示しています。

artifact = wandb.Artifact(name="bicycle-dataset", type="dataset")

artifact の構成方法の詳細については、Artifactsの構築を参照してください。

データセットを artifact に追加

artifact にファイルを追加します。一般的なファイルタイプには、Models や Datasets などがあります。次の例では、マシンにローカルに保存されている dataset.h5 という名前のデータセットを artifact に追加します。

# ファイルをartifactのコンテンツに追加します。
artifact.add_file(local_path="dataset.h5")

上記のコードスニペットのファイル名 dataset.h5 を、artifact に追加するファイルへのパスに置き換えます。

4. データセットをログに記録

W&B run オブジェクトの log_artifact() メソッドを使用して、artifact のバージョンを保存し、artifact を run の出力として宣言します。

# artifact のバージョンを W&B に保存し、この run の出力としてマークします。
run.log_artifact(artifact)

artifact をログに記録すると、デフォルトで 'latest' エイリアスが作成されます。 artifact のエイリアスとバージョンの詳細については、カスタムエイリアスを作成すると新しい artifact バージョンを作成するをそれぞれ参照してください。

5. artifact をダウンロードして使用する

次のコード例は、W&B サーバーにログして保存した artifact を使用するために実行できる手順を示しています。

まず、wandb.init() を使用して新しい run オブジェクトを初期化します。
次に、run オブジェクトの use_artifact() メソッドを使用して、使用する artifact を W&B に指示します。これにより、artifact オブジェクトが返されます。
3 番目に、artifact の download() メソッドを使用して、artifact のコンテンツをダウンロードします。

# W&B Runを作成します。ここでは、この run をトレーニングの追跡に使用するため、'type' に 'training' を指定します。
run = wandb.init(project="artifacts-example", job_type="training")

# W&B に artifact を照会し、この run への入力としてマークします。
artifact = run.use_artifact("bicycle-dataset:latest")

# artifact のコンテンツをダウンロードします
artifact_dir = artifact.download()

または、パブリック API（wandb.Api）を使用して、Run の外部にある W&B にすでに保存されているデータをエクスポート（または更新）できます。詳細については、外部ファイルを追跡するを参照してください。

2 - Secrets

W&B secrets の概要、その仕組み、およびその使用を開始する方法について説明します。

W&B Secret Manager を使用すると、アクセストークン、ベアラートークン、API キー、パスワードなどの機密性の高い文字列である secrets（シークレット） を安全かつ一元的に保存、管理、および挿入できます。W&B Secret Manager を使用すると、機密性の高い文字列をコードに直接追加したり、Webhook のヘッダーまたはペイロードを構成したりする必要がなくなります。

シークレットは、各 Teams の Secret Manager の、Team Settings（チーム設定）の Team secrets（チームシークレット） セクションに保存および管理されます。

W&B の管理者のみが、シークレットの作成、編集、または削除を実行できます。
シークレットは、Azure、GCP、または AWS でホストする W&B Server deployments を含め、W&B のコア部分として含まれています。別の種類のデプロイメントを使用している場合は、W&B アカウントチームに連絡して、W&B でシークレットを使用する方法について話し合ってください。
W&B Server では、セキュリティニーズを満たすセキュリティ対策を構成する必要があります。
- W&B は、高度なセキュリティ機能で構成された、AWS、GCP、または Azure が提供するクラウドプロバイダーのシークレットマネージャーの W&B インスタンスにシークレットを保存することを強くお勧めします。
- クラウドシークレットマネージャー (AWS、GCP、または Azure) の W&B インスタンスを使用できない場合、およびクラスターを使用した場合に発生する可能性のあるセキュリティ脆弱性を防ぐ方法を理解している場合を除き、Kubernetes クラスターをシークレットストアのバックエンドとして使用しないことをお勧めします。

Add a secret（シークレットの追加）

シークレットを追加するには:

受信サービスで受信 Webhook の認証が必要な場合は、必要なトークンまたは API キーを生成します。必要に応じて、パスワードマネージャーなどを使用して、機密性の高い文字列を安全に保存します。
W&B にログインし、チームの Settings（設定） ページに移動します。
Team Secrets（チームシークレット） セクションで、New secret（新しいシークレット） をクリックします。
文字、数字、およびアンダースコア (_) を使用して、シークレットの名前を指定します。
機密性の高い文字列を Secret（シークレット） フィールドに貼り付けます。
Add secret（シークレットの追加） をクリックします。

Webhook を構成するときに、Webhook オートメーションに使用するシークレットを指定します。詳細については、Webhook の構成セクションを参照してください。

シークレットを作成すると、${SECRET_NAME} という形式を使用して、Webhook オートメーションのペイロードでそのシークレットにアクセスできます。

Rotate a secret（シークレットのローテーション）

シークレットをローテーションしてその値を更新するには:

シークレットの行にある鉛筆アイコンをクリックして、シークレットの詳細を開きます。
Secret（シークレット） を新しい値に設定します。必要に応じて、Reveal secret（シークレットを表示） をクリックして新しい値を確認します。
Add secret（シークレットの追加） をクリックします。シークレットの値が更新され、以前の値に解決されなくなります。

シークレットを作成または更新した後は、その現在の値を表示できなくなります。代わりに、シークレットを新しい値にローテーションします。

Delete a secret（シークレットの削除）

シークレットを削除するには:

シークレットの行にあるゴミ箱アイコンをクリックします。
確認ダイアログを読み、Delete（削除） をクリックします。シークレットはすぐに完全に削除されます。

Manage access to secrets（シークレットへのアクセス管理）

チームのオートメーションは、チームのシークレットを使用できます。シークレットを削除する前に、それを使用するオートメーションが動作を停止しないように、更新または削除してください。

3 - Registry

Try in Colab

W&B Registry は現在パブリックプレビュー中です。こちらのセクションで、デプロイメントタイプに対して有効にする方法を学んでください。

W&B Registry は、組織内の artifact バージョンの厳選された中央リポジトリです。組織内で許可を持っているユーザーは、所属する Teams に関係なく、すべての artifact のライフサイクルをダウンロード、共有、および共同で管理できます。

Registry を使用して、artifact のバージョンを追跡し、artifact の使用状況と変更の履歴を監査し、artifact のガバナンスとコンプライアンスを確保し、モデル CI/CD などのダウンストリームプロセスを自動化できます。

要約すると、W&B Registry を使用して以下を行います。

機械学習タスクを満たす artifact バージョンを組織内の他のユーザーにプロモートします。
特定の artifact を見つけたり参照したりできるように、タグを使用して artifact を整理します。
artifact のリネージを追跡し、変更の履歴を監査します。
モデル CI/CD などのダウンストリームプロセスを自動化します。
組織内で誰が各 registry 内の artifact にアクセスできるかを制限します。

上の図は、“Model” および “Dataset” コア registry とカスタム registry を含む Registry App を示しています。

基本を学ぶ

各組織には、モデルおよびデータセット artifact を整理するために使用できる Models および Datasets という 2 つの registry が最初から含まれています。組織のニーズに基づいて他の artifact タイプを整理するために、追加の registry を作成できます。

各registryは、1 つ以上のコレクションで構成されています。各コレクションは、明確なタスクまたはユースケースを表します。

artifact を registry に追加するには、まず特定の artifact バージョンを W&B にログします。artifact をログするたびに、W&B はその artifact にバージョンを自動的に割り当てます。artifact バージョンは 0 からインデックスを開始するため、最初のバージョンは v0、2 番目のバージョンは v1 のようになります。

artifact を W&B にログしたら、その特定の artifact バージョンを registry 内のコレクションにリンクできます。

「リンク」という用語は、W&B が artifact を保存する場所と、registry 内で artifact にアクセスできる場所とを接続するポインタを指します。artifact をコレクションにリンクしても、W&B は artifact を複製しません。

例として、次のコード例は、“my_model.txt” という名前のモデル artifact をコア registryの “first-collection” という名前のコレクションにログしてリンクする方法を示しています。

W&B run を初期化します。
artifact を W&B にログします。
artifact バージョンをリンクするコレクションと registry の名前を指定します。
artifact をコレクションにリンクします。

この Python コードをスクリプトに保存して実行します。W&B Python SDK バージョン 0.18.6 以降が必要です。

import wandb
import random

# Artifact を追跡するために W&B run を初期化します。
run = wandb.init(project="registry_quickstart") 

# ログ できるようにシミュレートされたモデルファイルを作成します
with open("my_model.txt", "w") as f:
   f.write("Model: " + str(random.random()))

# Artifact を W&B に ログ します
logged_artifact = run.log_artifact(
    artifact_or_path="./my_model.txt", 
    name="gemma-finetuned", 
    type="model" # artifact タイプを指定します
)

# artifact を公開するコレクションと registry の名前を指定します
COLLECTION_NAME = "first-collection"
REGISTRY_NAME = "model"

# artifact を registry にリンクします
run.link_artifact(
    artifact=logged_artifact, 
    target_path=f"wandb-registry-{REGISTRY_NAME}/{COLLECTION_NAME}"
)

返された run オブジェクトの link_artifact(target_path = "") メソッドで指定したコレクションが、指定した registry 内に存在しない場合、W&B は自動的にコレクションを作成します。

ターミナルに表示される URL は、W&B が artifact を保存するプロジェクトに移動します。

Registry App に移動して、ユーザーと組織の他のメンバーが公開する artifact バージョンを表示します。これを行うには、まず W&B に移動します。[アプリケーション] の下の左側のサイドバーで Registry を選択します。“Model” registry を選択します。registry 内に、リンクされた artifact バージョンを持つ “first-collection” コレクションが表示されます。

artifact バージョンを registry 内のコレクションにリンクすると、組織のメンバーは、適切な権限を持っている場合、artifact バージョンの表示、ダウンロード、管理、ダウンストリームオートメーションの作成などを行うことができます。

artifact バージョンが (たとえば、run.log_artifact() を使用して) メトリクスをログする場合、詳細ページからそのバージョンのメトリクスを表示したり、コレクションのページから artifact バージョン全体でメトリクスを比較したりできます。registry でリンクされた artifact を表示を参照してください。

W&B Registry を有効にする

デプロイメントタイプに基づいて、次の条件を満たして W&B Registry を有効にします。

デプロイメントタイプ	有効にする方法
Multi-tenant Cloud	アクションは不要です。W&B Registry は W&B App で利用できます。
専用クラウド	アカウントチームにお問い合わせください。ソリューションアーキテクト (SA) チームが、インスタンスのオペレーターコンソール内で W&B Registry を有効にします。インスタンスがサーバーリリースバージョン 0.59.2 以降であることを確認してください。
Self-Managed	`ENABLE_REGISTRY_UI` という名前の環境変数を有効にします。サーバーで環境変数を有効にする方法の詳細については、これらのドキュメントを参照してください。セルフマネージドインスタンスでは、インフラストラクチャ管理者がこの環境変数を有効にして `true` に設定する必要があります。インスタンスがサーバーリリースバージョン 0.59.2 以降であることを確認してください。

開始するためのリソース

ユースケースに応じて、W&B Registry を開始するための次のリソースをご覧ください。

チュートリアルビデオをご覧ください。
- Weights & Biases から Registry を開始する
W&B の Model CI/CD コースを受講して、次の方法を学びましょう。
- W&B Registry を使用して、artifact の管理とバージョン管理、リネージの追跡、さまざまなライフサイクルステージでのモデルのプロモーションを行います。
- Webhook を使用して、モデル管理ワークフローを自動化します。
- registry を外部 ML システムおよびツールと統合して、モデルの評価、監視、およびデプロイメントを行います。

レガシー Model Registry から W&B Registry への移行

レガシー Model Registry は、正確な日付はまだ決定されていませんが、廃止が予定されています。レガシー Model Registry を廃止する前に、W&B はレガシー Model Registry のコンテンツを W&B Registry に移行します。

レガシー Model Registry から W&B Registry への移行プロセスの詳細については、レガシー Model Registry からの移行を参照してください。

移行が行われるまで、W&B はレガシー Model Registry と新しい Registry の両方をサポートします。

レガシー Model Registry を表示するには、W&B App の Model Registry に移動します。ページの上部に、レガシー Model Registry App UI の使用を有効にするバナーが表示されます。

ご質問がある場合、または移行に関する懸念について W&B Product Team と話したい場合は、support@wandb.com までご連絡ください。

3.1 - Registry types

W&B は、コアレジストリとカスタムレジストリの2種類のレジストリをサポートしています。

コアレジストリ

コアレジストリは、特定のユースケース ( Models と Datasets ) のためのテンプレートです。

デフォルトでは、Models レジストリは "model" artifact タイプを受け入れるように設定され、Dataset レジストリは "dataset" artifact タイプを受け入れるように設定されています。管理者は、追加の受け入れ可能な artifact タイプを追加できます。

上の図は、W&B Registry App UI の Models と Dataset コアレジストリと、Fine_Tuned_Models というカスタムレジストリを示しています。

コアレジストリは、組織の可視性を持っています。レジストリ管理者は、コアレジストリの可視性を変更できません。

カスタムレジストリ

カスタムレジストリは、"model" artifact タイプまたは "dataset" artifact タイプに制限されません。

初期のデータ収集から最終的なモデルのデプロイメントまで、機械学習パイプラインの各ステップに対してカスタムレジストリを作成できます。

たとえば、トレーニングされたモデルのパフォーマンスを評価するために、キュレーションされたデータセットを整理するために「Benchmark_Datasets」というレジストリを作成できます。このレジストリ内には、「User_Query_Insurance_Answer_Test_Data」というコレクションがあり、トレーニング中にモデルが見たことのないユーザーの質問と、対応する専門家によって検証された回答のセットが含まれている場合があります。

カスタムレジストリは、組織または制限付きの可視性を持つことができます。レジストリ管理者は、カスタムレジストリの可視性を組織から制限付きに変更できます。ただし、レジストリ管理者は、カスタムレジストリの可視性を制限付きから組織の可視性には変更できません。

カスタムレジストリの作成方法については、カスタムレジストリの作成を参照してください。

まとめ

次の表は、コアレジストリとカスタムレジストリの違いをまとめたものです。

	Core	Custom
可視性	組織の可視性のみ。可視性は変更できません。	組織または制限付き。可視性は組織から制限付きの可視性へ変更できます。
メタデータ	事前設定されており、ユーザーは編集できません。	ユーザーが編集できます。
Artifact タイプ	事前設定されており、受け入れられた artifact タイプは削除できません。ユーザーは追加の受け入れられた artifact タイプを追加できます。	管理者は、受け入れられたタイプを定義できます。
カスタマイズ	既存のリストにタイプを追加できます。	レジストリ名、説明、可視性、および受け入れられた artifact タイプを編集します。

3.2 - Create a custom registry

カスタムレジストリは、使用できるアーティファクトのタイプに対する柔軟性と制御を提供し、レジストリの可視性を制限できます。

コアレジストリとカスタムレジストリの完全な比較については、レジストリの種類の概要表を参照してください。

カスタムレジストリの作成

カスタムレジストリを作成するには:

https://wandb.ai/registry/ にある Registry App に移動します。
Custom registry 内で、Create registry ボタンをクリックします。
Name フィールドにレジストリの名前を入力します。
必要に応じて、レジストリに関する説明を入力します。
Registry visibility ドロップダウンから、レジストリを表示できるユーザーを選択します。レジストリの可視性オプションの詳細については、レジストリの可視性の種類を参照してください。
Accepted artifacts type ドロップダウンから、All types または Specify types を選択します。
(Specify types を選択した場合) レジストリが受け入れる1つ以上のアーティファクトタイプを追加します。
Create registry ボタンをクリックします。

アーティファクトタイプは、レジストリの設定に保存されると、レジストリから削除できません。

たとえば、次の図は、ユーザーが作成しようとしている Fine_Tuned_Models という名前のカスタムレジストリを示しています。レジストリは、レジストリに手動で追加されたメンバーのみに Restricted されています。

可視性の種類

レジストリの可視性は、誰がそのレジストリにアクセスできるかを決定します。カスタムレジストリの可視性を制限すると、指定されたメンバーのみがレジストリにアクセスできるようになります。

カスタムレジストリには、次の2つのタイプのレジストリ可視性オプションがあります。

可視性	説明
Restricted	招待された組織メンバーのみがレジストリにアクセスできます。
Organization	組織内のすべてのユーザーがレジストリにアクセスできます。

チーム管理者またはレジストリ管理者は、カスタムレジストリの可視性を設定できます。

Restricted の可視性でカスタムレジストリを作成したユーザーは、レジストリ管理者として自動的にレジストリに追加されます。

カスタムレジストリの可視性の構成

チーム管理者またはレジストリ管理者は、カスタムレジストリの作成中または作成後に、カスタムレジストリの可視性を割り当てることができます。

既存のカスタムレジストリの可視性を制限するには:

https://wandb.ai/registry/ にある Registry App に移動します。
レジストリを選択します。
右上隅にある歯車アイコンをクリックします。
Registry visibility ドロップダウンから、目的のレジストリ可視性を選択します。
Restricted visibility を選択した場合:
1. このレジストリへのアクセスを許可する組織のメンバーを追加します。Registry members and roles セクションまでスクロールし、Add member ボタンをクリックします。
2. Member フィールドに、追加するメンバーのメールアドレスまたはユーザー名を追加します。
3. Add new member をクリックします。

チーム管理者がカスタムレジストリを作成するときに、カスタムレジストリの可視性を割り当てる方法の詳細については、カスタムレジストリの作成を参照してください。

3.3 - Configure registry access

Registry の管理者は、Registry の設定を構成することで、Registry のロールを設定、ユーザーを追加、またはユーザーを削除できます。

ユーザーの管理

ユーザーまたは Teams の追加

Registry の管理者は、個々のユーザーまたは Teams 全体を Registry に追加できます。ユーザーまたは Teams を Registry に追加するには:

Registry (https://wandb.ai/registry/) に移動します。
ユーザーまたは Teams を追加する Registry を選択します。
右上隅にある歯車アイコンをクリックして、Registry の設定にアクセスします。
Registry access セクションで、Add access をクリックします。
Include users and teams フィールドに、1 つ以上のユーザー名、メールアドレス、または Teams 名を指定します。
Add access をクリックします。

Animation of using the UI to add teams and individual users to a registry

Registry でのユーザーロールの設定、または Registry ロールの権限について詳細をご覧ください。

ユーザーまたは Teams の削除

Registry の管理者は、個々のユーザーまたは Teams 全体を Registry から削除できます。ユーザーまたは Teams を Registry から削除するには:

Registry (https://wandb.ai/registry/) に移動します。
ユーザーを削除する Registry を選択します。
右上隅にある歯車アイコンをクリックして、Registry の設定にアクセスします。
Registry access セクションに移動し、削除するユーザー名、メールアドレス、または Teams を入力します。
Delete ボタンをクリックします。

Teams からユーザーを削除すると、そのユーザーの Registry へのアクセス権も削除されます。

Registry ロール

Registry 内の各ユーザーは、その Registry で何ができるかを決定する Registry ロール を持っています。

W&B は、ユーザーまたは Teams が Registry に追加されると、デフォルトの Registry ロールを自動的に割り当てます。

エンティティ	デフォルトの Registry ロール
Teams	Viewer
ユーザー (管理者以外)	Viewer
組織の管理者	Admin

Registry の管理者は、Registry 内のユーザーおよび Teams のロールを割り当てまたは変更できます。詳細については、Registry でのユーザーロールの設定を参照してください。

W&B ロールの種類

W&B には、2 種類のロールがあります。Teams ロールと Registry ロールです。

Teams でのロールは、Registry でのロールに影響を与えたり、関係したりすることはありません。

次の表に、ユーザーが持つことができるさまざまなロールと、その権限を示します。

権限	権限グループ	Viewer	Member	Admin
コレクションの詳細を表示する	Read	X	X	X
リンクされた Artifact の詳細を表示する	Read	X	X	X
使用法: use_artifact を使用して Registry 内の Artifact を消費する	Read	X	X	X
リンクされた Artifact をダウンロードする	Read	X	X	X
Artifact のファイルビューアーからファイルをダウンロードする	Read	X	X	X
Registry を検索する	Read	X	X	X
Registry の設定とユーザーリストを表示する	Read	X	X	X
コレクションの新しい自動化を作成する	Create		X	X
新しいバージョンが追加されたときに Slack 通知をオンにする	Create		X	X
新しいコレクションを作成する	Create		X	X
新しいカスタム Registry を作成する	Create		X	X
コレクションカード (説明) を編集する	Update		X	X
リンクされた Artifact の説明を編集する	Update		X	X
コレクションのタグを追加または削除する	Update		X	X
リンクされた Artifact からエイリアスを追加または削除する	Update		X	X
新しい Artifact をリンクする	Update		X	X
Registry で許可されている種類のリストを編集する	Update		X	X
カスタム Registry 名を編集する	Update		X	X
コレクションを削除する	Delete		X	X
自動化を削除する	Delete		X	X
Registry から Artifact のリンクを解除する	Delete		X	X
Registry で許可されている Artifact の種類を編集する	Admin			X
Registry の表示設定 (Organization または Restricted) を変更する	Admin			X
Registry にユーザーを追加する	Admin			X
Registry でユーザーのロールを割り当てるか変更する	Admin			X

継承された権限

Registry でのユーザーの権限は、個人または Teams メンバーシップによって割り当てられた、そのユーザーに割り当てられた最高の特権レベルによって異なります。

たとえば、Registry の管理者が Nico というユーザーを Registry A に追加し、Viewer Registry ロールを割り当てるとします。次に、Registry の管理者が Foundation Model Team という Teams を Registry A に追加し、Foundation Model Team に Member Registry ロールを割り当てます。

Nico は Foundation Model Team のメンバーであり、Member は Registry のメンバーです。Member は Viewer よりも多くの権限を持っているため、W&B は Nico に Member ロールを付与します。

次の表は、ユーザーの個々の Registry ロールと、メンバーである Teams の Registry ロールとの間で競合が発生した場合の、最高の権限レベルを示しています。

Teams Registry ロール	個々の Registry ロール	継承された Registry ロール
Viewer	Viewer	Viewer
Member	Viewer	Member
Admin	Viewer	Admin

競合がある場合、W&B はユーザーの名前の横に最高の権限レベルを表示します。

たとえば、次の画像では、Alex は smle-reg-team-1 Teams のメンバーであるため、Member ロールの特権を継承しています。

A user inherits a Member role because they are part of a team.

Registry ロールの構成

Registry (https://wandb.ai/registry/) に移動します。
構成する Registry を選択します。
右上隅にある歯車アイコンをクリックします。
Registry members and roles セクションまでスクロールします。
Member フィールド内で、権限を編集するユーザーまたは Teams を検索します。
Registry role 列で、ユーザーのロールをクリックします。
ドロップダウンから、ユーザーに割り当てるロールを選択します。

3.4 - Create a collection

コレクション とは、レジストリ内のリンクされた artifact バージョンのセットです。各コレクションは、明確なタスクまたはユースケースを表します。

たとえば、コア Dataset レジストリ内には複数のコレクションが存在する場合があります。各コレクションには、MNIST、CIFAR-10、ImageNet など、異なるデータセットが含まれています。

別の例として、「chatbot」というレジストリがあり、モデル artifact のコレクション、データセット artifact の別のコレクション、ファインチューンされたモデル artifact の別のコレクションが含まれている場合があります。

レジストリとそのコレクションをどのように編成するかは、あなた次第です。

W&B Model Registry に精通している場合は、登録済みモデルをご存知かもしれません。Model Registry の登録済みモデルは、W&B Registry ではコレクションと呼ばれるようになりました。

コレクションタイプ

各コレクションは、1 つ、かつ 1 つのみの artifact の タイプ を受け入れます。指定するタイプは、あなたと組織の他のメンバーがそのコレクションにリンクできる artifact の種類を制限します。

artifact のタイプは、Python などのプログラミング言語のデータ型に似ていると考えることができます。このアナロジーでは、コレクションは文字列、整数、または浮動小数点数を格納できますが、これらのデータ型の組み合わせは格納できません。

たとえば、「データセット」 artifact タイプを受け入れるコレクションを作成するとします。これは、タイプ「データセット」を持つ将来の artifact バージョンのみをこのコレクションにリンクできることを意味します。同様に、モデル artifact タイプのみを受け入れるコレクションには、タイプ「model」の artifact のみをリンクできます。

artifact オブジェクトを作成するときに、artifact のタイプを指定します。wandb.Artifact() の type フィールドに注意してください。

import wandb

# Initialize a run
run = wandb.init(
  entity = "<team_entity>",
  project = "<project>"
  )

# Create an artifact object
artifact = wandb.Artifact(
    name="<artifact_name>", 
    type="<artifact_type>"
    )

コレクションを作成するときは、定義済みの artifact タイプのリストから選択できます。利用可能な artifact タイプは、コレクションが属するレジストリによって異なります。

artifact をコレクションにリンクする、または新しいコレクションを作成する前に、コレクションが受け入れる artifact のタイプを調べてください。

コレクションが受け入れる artifact のタイプを確認する

コレクションにリンクする前に、コレクションが受け入れる artifact タイプを調べてください。コレクションが受け入れる artifact タイプは、W&B Python SDK を使用してプログラムで、または W&B App を使用してインタラクティブに調べることができます。

その artifact タイプを受け入れないコレクションに artifact をリンクしようとすると、エラーメッセージが表示されます。

受け入れられる artifact タイプは、ホームページのレジストリカード、またはレジストリの設定ページにあります。

どちらの方法でも、まず W&B Registry App に移動します。

Registry App のホームページ内で、そのレジストリのレジストリカードまでスクロールすると、受け入れられる artifact タイプを表示できます。レジストリカード内の灰色の水平方向の楕円は、そのレジストリが受け入れる artifact タイプを示しています。

たとえば、上記の画像は、Registry App ホームページの複数のレジストリカードを示しています。Model レジストリカード内には、model と model-new の 2 つの artifact タイプが表示されています。

レジストリの設定ページ内で受け入れられる artifact タイプを表示するには：

設定を表示するレジストリカードをクリックします。
右上隅にある歯車アイコンをクリックします。
受け入れられる artifact タイプ フィールドまでスクロールします。

W&B Python SDK を使用して、レジストリが受け入れる artifact タイプをプログラムで表示します。

import wandb

registry_name = "<registry_name>"
artifact_types = wandb.Api().project(name=f"wandb-registry-{registry_name}").artifact_types()
print(artifact_type.name for artifact_type in artifact_types)

上記のコードスニペットでは run を初期化しないことに注意してください。これは、W&B API をクエリするだけで、experiment、artifact などを追跡しない場合は、run を作成する必要がないためです。

コレクションが受け入れる artifact のタイプがわかったら、コレクションを作成できます。

コレクションを作成する

レジストリ内にインタラクティブまたはプログラムでコレクションを作成します。コレクションの作成後に、コレクションが受け入れる artifact のタイプを変更することはできません。

プログラムでコレクションを作成する

wandb.init.link_artifact() メソッドを使用して、artifact をコレクションにリンクします。target_path フィールドに、コレクションとレジストリの両方を次の形式のパスとして指定します。

f"wandb-registry-{registry_name}/{collection_name}"

ここで、registry_name はレジストリの名前、collection_name はコレクションの名前です。プレフィックス wandb-registry- をレジストリ名に必ず追加してください。

存在しないコレクションに artifact をリンクしようとすると、W&B は自動的にコレクションを作成します。存在するコレクションを指定すると、W&B は artifact を既存のコレクションにリンクします。

上記のコードスニペットは、プログラムでコレクションを作成する方法を示しています。<> で囲まれた他の値を必ず独自の値に置き換えてください。

import wandb

# Initialize a run
run = wandb.init(entity = "<team_entity>", project = "<project>")

# Create an artifact object
artifact = wandb.Artifact(
  name = "<artifact_name>",
  type = "<artifact_type>"
  )

registry_name = "<registry_name>"
collection_name = "<collection_name>"
target_path = f"wandb-registry-{registry_name}/{collection_name}"

# Link the artifact to a collection
run.link_artifact(artifact = artifact, target_path = target_path)

run.finish()

インタラクティブにコレクションを作成する

次の手順では、W&B Registry App UI を使用してレジストリ内にコレクションを作成する方法について説明します。

W&B App UI の Registry App に移動します。
レジストリを選択します。
右上隅にある コレクションを作成 ボタンをクリックします。
名前フィールドにコレクションの名前を入力します。
タイプ ドロップダウンからタイプを選択します。または、レジストリがカスタム artifact タイプを有効にする場合は、このコレクションが受け入れる 1 つまたは複数の artifact タイプを入力します。
必要に応じて、説明フィールドにコレクションの説明を入力します。
必要に応じて、タグフィールドに 1 つまたは複数のタグを追加します。
バージョンのリンク をクリックします。
プロジェクト ドロップダウンから、artifact が保存されているプロジェクトを選択します。
Artifact コレクションドロップダウンから、artifact を選択します。
バージョン ドロップダウンから、コレクションにリンクする artifact バージョンを選択します。
コレクションを作成 ボタンをクリックします。

3.5 - Link an artifact version to a registry

Artifact のバージョンをコレクションにリンクして、組織内の他のメンバーが利用できるようにします。

Artifact をレジストリにリンクすると、その Artifact がそのレジストリに「公開」されます。そのレジストリへのアクセス権を持つユーザーは、コレクション内のリンクされた Artifact のバージョンにアクセスできます。

言い換えれば、Artifact をレジストリコレクションにリンクすると、その Artifact のバージョンがプライベートなプロジェクトレベルのスコープから、共有の組織レベルのスコープに移行します。

「type」という用語は、Artifact オブジェクトの type を指します。Artifact オブジェクト (wandb.Artifact) を作成するか、Artifact (wandb.init.log_artifact) をログに記録する場合、type パラメータの type を指定します。

Artifact をコレクションにリンクする

Artifact のバージョンを、インタラクティブまたはプログラムでコレクションにリンクします。

Artifact をレジストリにリンクする前に、そのコレクションが許可する Artifact の type を確認してください。コレクションの type について詳しくは、コレクションを作成するの「コレクションの type」をご覧ください。

ユースケースに基づいて、以下のタブに記載されている手順に従って、Artifact のバージョンをリンクしてください。

Artifact のバージョンがメトリクスをログに記録している場合 (たとえば、run.log_artifact() を使用するなど)、そのバージョンの詳細ページからそのバージョンのメトリクスを表示したり、Artifact のページから Artifact のバージョン全体のメトリクスを比較したりできます。レジストリ内のリンクされた Artifact を表示するを参照してください。

バージョンのリンクを示す動画 (8 分) をご覧ください。

wandb.init.Run.link_artifact() を使用して、プログラムで Artifact のバージョンをコレクションにリンクします。

Artifact をコレクションにリンクする前に、コレクションが属するレジストリがすでに存在することを確認してください。レジストリが存在することを確認するには、W&B App UI の Registry アプリに移動し、レジストリの名前を検索します。

target_path パラメータを使用して、Artifact のバージョンのリンク先となるコレクションとレジストリを指定します。ターゲットパスは、プレフィックス「wandb-registry」、レジストリの名前、およびフォワードスラッシュで区切られたコレクションの名前で構成されます。

wandb-registry-{REGISTRY_NAME}/{COLLECTION_NAME}

以下のコードスニペットをコピーして貼り付け、既存のレジストリ内のコレクションに Artifact のバージョンをリンクします。「<>」で囲まれた値を自分の値に置き換えます。

import wandb

# Run を初期化する
run = wandb.init(
  entity = "<team_entity>",
  project = "<project_name>"
)

# Artifact オブジェクトを作成する
# type パラメータ は、Artifact オブジェクト の type と
# コレクション の type の両方を指定します
artifact = wandb.Artifact(name = "<name>", type = "<type>")

# Artifact オブジェクト にファイルを追加します。
# ローカルマシン 上のファイルへの パス を指定します。
artifact.add_file(local_path = "<local_path_to_artifact>")

# Artifact のリンク先のコレクションとレジストリを指定します
REGISTRY_NAME = "<registry_name>"
COLLECTION_NAME = "<collection_name>"
target_path=f"wandb-registry-{REGISTRY_NAME}/{COLLECTION_NAME}"

# Artifact をコレクションにリンクする
run.link_artifact(artifact = artifact, target_path = target_path)

Artifact のバージョンを Model Registry または Dataset registry にリンクする場合は、Artifact の type をそれぞれ "model" または "dataset" に設定します。

Registry App に移動します。
Artifact のバージョンをリンクするコレクションの名前の横にマウスを合わせます。
詳細を表示 の横にあるミートボールメニューアイコン (3 つの水平ドット) を選択します。
ドロップダウンから、新しいバージョンをリンク を選択します。
表示されるサイドバーから、Team ドロップダウンからチームの名前を選択します。
Project ドロップダウンから、Artifact を含むプロジェクトの名前を選択します。
Artifact ドロップダウンから、Artifact の名前を選択します。
バージョン ドロップダウンから、コレクションにリンクする Artifact のバージョンを選択します。

W&B App のプロジェクトの Artifact ブラウザ (https://wandb.ai/<entity>/<project>/artifacts) に移動します。
左側のサイドバーにある Artifact アイコンを選択します。
レジストリにリンクする Artifact のバージョンをクリックします。
バージョンの概要 セクション内で、レジストリにリンク ボタンをクリックします。
画面の右側に表示されるモーダルから、レジストリモデルを選択 メニュードロップダウンから Artifact を選択します。
次のステップ をクリックします。
(オプション) エイリアス ドロップダウンからエイリアスを選択します。
レジストリにリンク をクリックします。

Registry アプリで、リンクされた Artifact のメタデータ、バージョンデータ、使用状況、リネージ情報を表示します。

レジストリ内のリンクされた Artifact を表示する

Registry アプリで、メタデータ、リネージ、使用状況情報など、リンクされた Artifact に関する情報を表示します。

Registry アプリに移動します。
Artifact をリンクしたレジストリの名前を選択します。
コレクションの名前を選択します。
コレクションの Artifact がメトリクスをログに記録する場合は、メトリクスの表示 をクリックしてバージョン全体のメトリクスを比較します。
Artifact のバージョンのリストから、アクセスするバージョンを選択します。バージョン番号は、v0 から始まるリンクされた各 Artifact のバージョンにインクリメントに割り当てられます。
Artifact のバージョンに関する詳細を表示するには、バージョンをクリックします。このページのタブから、そのバージョンのメタデータ (ログに記録されたメトリクスを含む)、リネージ、および使用状況情報を表示できます。

バージョン タブ内の フルネーム フィールドに注意してください。リンクされた Artifact のフルネームは、レジストリ、コレクション名、および Artifact のバージョンのエイリアスまたはインデックスで構成されます。

wandb-registry-{REGISTRY_NAME}/{COLLECTION_NAME}:v{INTEGER}

プログラムで Artifact のバージョンにアクセスするには、リンクされた Artifact のフルネームが必要です。

トラブルシューティング

Artifact をリンクできない場合は、以下に示す一般的な確認事項を再確認してください。

個人のアカウントから Artifact をログに記録する

個人の Entity で W&B にログに記録された Artifact は、レジストリにリンクできません。組織内のチーム Entity を使用して Artifact をログに記録していることを確認してください。組織のチーム内でログに記録された Artifact のみ、組織のレジストリにリンクできます。

Artifact をレジストリにリンクする場合は、チーム Entity で Artifact をログに記録していることを確認してください。

チーム Entity を検索する

W&B は、チームの名前をチームの Entity として使用します。たとえば、チームの名前が team-awesome の場合、チーム Entity は team-awesome です。

次の方法でチームの名前を確認できます。

チームの W&B プロファイルページに移動します。
サイトの URL をコピーします。これは https://wandb.ai/<team> の形式です。<team> はチームの名前とチームの Entity の両方です。

チーム Entity からログに記録する

wandb.init() で run を初期化するときに、Entity としてチームを指定します。run を初期化するときに entity を指定しない場合、run はデフォルトの Entity を使用します。これはチーム Entity である場合とそうでない場合があります。

import wandb

run = wandb.init(
  entity='<team_entity>',
  project='<project_name>'
  )

run.log_artifact を使用して、または Artifact オブジェクトを作成し、次にファイルを Artifact オブジェクトに追加して、Artifact を run にログに記録します。
```
artifact = wandb.Artifact(name="<artifact_name>", type="<type>")
```
Artifact のログ方法について詳しくは、Artifact を構築するをご覧ください。
Artifact が個人の Entity にログに記録されている場合は、組織内の Entity に再度ログに記録する必要があります。

W&B App UI でレジストリのパスを確認する

UI を使用してレジストリのパスを確認するには、空のコレクションを作成してコレクションの詳細を表示するか、コレクションのホームページで自動生成されたコードをコピーして貼り付けます。

自動生成されたコードをコピーして貼り付けます

https://wandb.ai/registry/ で Registry アプリに移動します。
Artifact をリンクするレジストリをクリックします。
ページの上部に、自動生成されたコードブロックが表示されます。
これをコードにコピーして貼り付け、パスの最後の部分をコレクションの名前に置き換えてください。

空のコレクションを作成する

https://wandb.ai/registry/ で Registry アプリに移動します。
Artifact をリンクするレジストリをクリックします。
空のコレクションをクリックします。空のコレクションが存在しない場合は、新しいコレクションを作成します。
表示されるコードスニペット内で、.link_artifact() 内の target_path フィールドを特定します。
(オプション) コレクションを削除します。

たとえば、概説されている手順を完了した後、target_path パラメータを使用してコードブロックを見つけます。

target_path =
      "smle-registries-bug-bash/wandb-registry-Golden Datasets/raw_images"

これをコンポーネントに分解すると、プログラムで Artifact をリンクするためのパスを作成するために使用する必要があるものを確認できます。

ORG_ENTITY_NAME = "smle-registries-bug-bash"
REGISTRY_NAME = "Golden Datasets"
COLLECTION_NAME = "raw_images"

一時コレクションのコレクションの名前を、Artifact のリンク先のコレクションの名前に置き換えてください。

```

3.6 - Download an artifact from a registry

W&B Python SDK を使用して、レジストリにリンクされた artifact をダウンロードします。artifact をダウンロードして使用するには、レジストリの名前、コレクションの名前、およびダウンロードする artifact バージョンのエイリアスまたはインデックスを知っておく必要があります。

artifact のプロパティがわかったら、リンクされた artifact へのパスを構築して artifact をダウンロードできます。または、W&B App UI から事前生成されたコードスニペットをコピーして貼り付けて、レジストリにリンクされた artifact をダウンロードすることもできます。

リンクされた artifact へのパスを構築

レジストリにリンクされた artifact をダウンロードするには、そのリンクされた artifact のパスを知っておく必要があります。パスは、レジストリ名、コレクション名、およびアクセスする artifact バージョンのエイリアスまたはインデックスで構成されます。

レジストリ、コレクション、および artifact バージョンのエイリアスまたはインデックスを取得したら、次の文字列テンプレートを使用して、リンクされた artifact へのパスを構築できます。

# バージョンインデックスが指定された Artifact 名
f"wandb-registry-{REGISTRY}/{COLLECTION}:v{INDEX}"

# エイリアスが指定された Artifact 名
f"wandb-registry-{REGISTRY}/{COLLECTION}:{ALIAS}"

中かっこ{}内の値を、アクセスするレジストリ、コレクション、および artifact バージョンのエイリアスまたはインデックスの名前に置き換えます。

artifact バージョンをコア Model Registry またはコア Dataset Registry にそれぞれリンクするには、modelまたはdatasetを指定します。

リンクされた artifact のパスを取得したら、wandb.init.use_artifact メソッドを使用して artifact にアクセスし、そのコンテンツをダウンロードします。次のコードスニペットは、W&B Registry にリンクされた artifact を使用およびダウンロードする方法を示しています。<>内の値を自分の値に置き換えてください。

import wandb

REGISTRY = '<registry_name>'
COLLECTION = '<collection_name>'
ALIAS = '<artifact_alias>'

run = wandb.init(
   entity = '<team_name>',
   project = '<project_name>'
   )  

artifact_name = f"wandb-registry-{REGISTRY}/{COLLECTION}:{ALIAS}"
# artifact_name = '<artifact_name>' # Registry App で指定されたフルネームをコピーして貼り付けます
fetched_artifact = run.use_artifact(artifact_or_name = artifact_name)  
download_path = fetched_artifact.download()

.use_artifact() メソッドは、runを作成し、ダウンロードした artifact をその run への入力としてマークします。artifact を run への入力としてマークすると、W&B はその artifact のリネージを追跡できます。

run を作成したくない場合は、wandb.Api() オブジェクトを使用して artifact にアクセスできます。

import wandb

REGISTRY = "<registry_name>"
COLLECTION = "<collection_name>"
VERSION = "<version>"

api = wandb.Api()
artifact_name = f"wandb-registry-{REGISTRY}/{COLLECTION}:{VERSION}"
artifact = api.artifact(name = artifact_name)

例：W&B Registry にリンクされた Artifact を使用およびダウンロードする

次のコード例は、ユーザーが Fine-tuned Models レジストリの phi3-finetuned というコレクションにリンクされた artifact をダウンロードする方法を示しています。artifact バージョンのエイリアスは production に設定されています。

import wandb

TEAM_ENTITY = "product-team-applications"
PROJECT_NAME = "user-stories"

REGISTRY = "Fine-tuned Models"
COLLECTION = "phi3-finetuned"
ALIAS = 'production'

# 指定された Team と Project 内で Run を初期化します
run = wandb.init(entity=TEAM_ENTITY, project = PROJECT_NAME)

artifact_name = f"wandb-registry-{REGISTRY}/{COLLECTION}:{ALIAS}"

# Artifact にアクセスし、リネージ追跡のために Run への入力としてマークします
fetched_artifact = run.use_artifact(artifact_or_name = name)  

# Artifact をダウンロードします。ダウンロードしたコンテンツへのパスを返します
downloaded_path = fetched_artifact.download()

可能なパラメータと戻り値の型の詳細については、API Reference ガイドの use_artifact および Artifact.download() を参照してください。

複数の組織に属する個人 Entity を持つ Users

複数の組織に属する個人 Entity を持つ Users は、レジストリにリンクされた artifact にアクセスする際に、組織の名前を指定するか、Team Entity を使用する必要があります。

import wandb

REGISTRY = "<registry_name>"
COLLECTION = "<collection_name>"
VERSION = "<version>"

# API をインスタンス化するために、Team Entity を使用していることを確認してください
api = wandb.Api(overrides={"entity": "<team-entity>"})
artifact_name = f"wandb-registry-{REGISTRY}/{COLLECTION}:{VERSION}"
artifact = api.artifact(name = artifact_name)

# パスで組織の表示名または組織 Entity を使用します
api = wandb.Api()
artifact_name = f"{ORG_NAME}/wandb-registry-{REGISTRY}/{COLLECTION}:{VERSION}"
artifact = api.artifact(name = artifact_name)

ORG_NAME は、組織の表示名です。マルチテナント SaaS ユーザーは、組織の設定ページ（https://wandb.ai/account-settings/）で組織の名前を見つけることができます。Dedicated Cloud および Self-Managed ユーザーは、アカウント管理者に連絡して、組織の表示名を確認してください。

事前生成されたコードスニペットをコピーして貼り付け

W&B は、Python スクリプト、notebook、またはターミナルにコピーして貼り付けて、レジストリにリンクされた artifact をダウンロードできるコードスニペットを作成します。

Registry App に移動します。
artifact が含まれているレジストリの名前を選択します。
コレクションの名前を選択します。
artifact バージョンのリストから、アクセスするバージョンを選択します。
Usage タブを選択します。
Usage API セクションに表示されているコードスニペットをコピーします。
コードスニペットを Python スクリプト、notebook、またはターミナルに貼り付けます。

3.7 - Find registry items

W&B Registry App のグローバル検索バーを使用して、レジストリ、コレクション、アーティファクトバージョンタグ、コレクションタグ、またはエイリアスを検索します。MongoDB スタイルのクエリを使用して、W&B Python SDK を使用して特定の条件に基づいてレジストリ、コレクション、およびアーティファクトバージョンをフィルタリングできます。

表示する権限を持つアイテムのみが検索結果に表示されます。

レジストリアイテムの検索

レジストリアイテムを検索するには:

W&B Registry App に移動します。
ページ上部の検索バーに検索語句を指定します。Enter キーを押して検索します。

指定した用語が既存のレジストリ、コレクション名、アーティファクトバージョンタグ、コレクションタグ、またはエイリアスと一致する場合、検索結果は検索バーの下に表示されます。

レジストリ検索バーにテキストを入力してレジストリアイテムをフィルタリングするユーザーの.gif

MongoDB スタイルのクエリでレジストリアイテムをクエリする

wandb.Api().registries() とクエリ述語を使用して、1 つ以上の MongoDB スタイルのクエリに基づいて、レジストリ、コレクション、およびアーティファクトバージョンをフィルタリングします。

次の表に、フィルタリングするアイテムのタイプに基づいて使用できるクエリ名を示します。

	クエリ名
registries	`name`, `description`, `created_at`, `updated_at`
collections	`name`, `tag`, `description`, `created_at`, `updated_at`
versions	`tag`, `alias`, `created_at`, `updated_at`, `metadata`

次のコードスニペットは、一般的な検索シナリオを示しています。

wandb.Api().registries() メソッドを使用するには、まず W&B Python SDK (wandb) ライブラリをインポートします。

import wandb

# (オプション) 可読性を高めるために wandb.Api() クラスのインスタンスを作成します
api = wandb.Api()

文字列 model を含むすべての registries をフィルタリングします。

# 文字列 `model` を含むすべての registries をフィルタリングします
registry_filters = {
    "name": {"$regex": "model"}
}

# フィルタに一致するすべての registries のイテラブルを返します
registries = api.registries(filter=registry_filters)

コレクション名に文字列 yolo を含む、registry に関係なく、すべての collections をフィルタリングします。

# コレクション名に文字列 `yolo` を含む、registry に関係なく、
# すべての collections をフィルタリングします
collection_filters = {
    "name": {"$regex": "yolo"}
}

# フィルタに一致するすべての collections のイテラブルを返します
collections = api.registries().collections(filter=collection_filters)

コレクション名に文字列 yolo を含み、cnn をタグとして持つ、registry に関係なく、すべての collections をフィルタリングします。

# コレクション名に文字列 `yolo` を含み、
# `cnn` をタグとして持つ、registry に関係なく、すべての collections をフィルタリングします
collection_filters = {
    "name": {"$regex": "yolo"},
    "tag": "cnn"
}

# フィルタに一致するすべての collections のイテラブルを返します
collections = api.registries().collections(filter=collection_filters)

文字列 model を含み、タグ image-classification または latest エイリアスのいずれかを持つすべてのアーティファクトバージョンを検索します。

# 文字列 `model` を含み、
# タグ `image-classification` または `latest` エイリアス のいずれかを持つすべてのアーティファクト バージョンを検索します
registry_filters = {
    "name": {"$regex": "model"}
}

# 論理 $or 演算子を使用してアーティファクト バージョンをフィルタリングします
version_filters = {
    "$or": [
        {"tag": "image-classification"},
        {"alias": "production"}
    ]
}

# フィルタに一致するすべてのアーティファクト バージョンのイテラブルを返します
artifacts = api.registries(filter=registry_filters).collections().versions(filter=version_filters)

論理クエリオペレーターの詳細については、MongoDB のドキュメントを参照してください。

前のコードスニペットの artifacts イテラブルの各アイテムは、Artifact クラスのインスタンスです。つまり、各アーティファクトの属性 ( name 、 collection 、 aliases 、 tags 、 created_at など) にアクセスできます。

for art in artifacts:
    print(f"artifact name: {art.name}")
    print(f"collection artifact belongs to: { art.collection.name}")
    print(f"artifact aliases: {art.aliases}")
    print(f"tags attached to artifact: {art.tags}")
    print(f"artifact created at: {art.created_at}\n")

アーティファクトオブジェクトの属性の完全なリストについては、API Reference ドキュメントの Artifacts Class を参照してください。

2024-01-08 から 2025-03-04 の 13:10 UTC の間に作成された、registry または collection に関係なく、すべてのアーティファクトバージョンをフィルタリングします。

# 2024-01-08 から 2025-03-04 の 13:10 UTC の間に作成されたすべてのアーティファクト バージョンを検索します。

artifact_filters = {
    "alias": "latest",
    "created_at" : {"$gte": "2024-01-08", "$lte": "2025-03-04 13:10:00"},
}

# フィルタに一致するすべてのアーティファクト バージョンのイテラブルを返します
artifacts = api.registries().collections().versions(filter=artifact_filters)

日付と時刻を YYYY-MM-DD HH:MM:SS 形式で指定します。日付のみでフィルタリングする場合は、時間、分、秒を省略できます。

クエリ比較の詳細については、MongoDB のドキュメントを参照してください。

3.8 - Organize versions with tags

タグを使用して、コレクションまたはコレクション内のアーティファクトのバージョンを整理します。タグの追加、削除、編集は、Python SDK または W&B App UI で行えます。

レジストリ内のコレクションまたは Artifacts バージョンを整理するために、タグを作成して追加します。W&B App UIまたは W&B Python SDK を使用して、コレクションまたは Artifacts バージョンにタグを追加、変更、表示、または削除します。

タグとエイリアスの使い分け

特定の Artifacts バージョンを一意に参照する必要がある場合は、エイリアスを使用します。たとえば、artifact_name:alias が常に単一の特定のバージョンを指すようにするために、‘production’ や ’latest’ などのエイリアスを使用します。

グループ化や検索の柔軟性を高めたい場合は、タグを使用します。タグは、複数のバージョンまたはコレクションが同じラベルを共有でき、特定の識別子に1つのバージョンのみが関連付けられているという保証が不要な場合に最適です。

コレクションにタグを追加する

W&B App UIまたは Python SDK を使用して、コレクションにタグを追加します。

W&B App UIを使用して、コレクションにタグを追加します。

W&B Registry（https://wandb.ai/registry）に移動します。
レジストリカードをクリックします。
コレクションの名前の横にある [詳細を表示] をクリックします。
コレクションカード内で、[タグ] フィールドの横にあるプラスアイコン（+）をクリックし、タグの名前を入力します。
キーボードの Enter キーを押します。

import wandb

COLLECTION_TYPE = "<collection_type>"
ORG_NAME = "<org_name>"
REGISTRY_NAME = "<registry_name>"
COLLECTION_NAME = "<collection_name>"

full_name = f"{ORG_NAME}/wandb-registry-{REGISTRY_NAME}/{COLLECTION_NAME}"

collection = wandb.Api().artifact_collection(
  type_name = COLLECTION_TYPE, 
  name = full_name
  )

collection.tags = ["your-tag"]
collection.save()

コレクションに属するタグを更新する

tags 属性を再割り当てするか、変更することで、プログラムでタグを更新します。W&B は、インプレースミューテーションではなく、tags 属性を再割り当てすることを推奨しており、これは良い Python のプラクティスです。

たとえば、次のコードスニペットは、再割り当てでリストを更新する一般的な方法を示しています。簡潔にするために、コレクションにタグを追加するセクションのコード例を続けます。

collection.tags = [*collection.tags, "new-tag", "other-tag"]
collection.tags = collection.tags + ["new-tag", "other-tag"]

collection.tags = set(collection.tags) - set(tags_to_delete)
collection.tags = []  # deletes all tags

次のコードスニペットは、インプレースミューテーションを使用して、Artifacts バージョンに属するタグを更新する方法を示しています。

collection.tags += ["new-tag", "other-tag"]
collection.tags.append("new-tag")

collection.tags.extend(["new-tag", "other-tag"])
collection.tags[:] = ["new-tag", "other-tag"]
collection.tags.remove("existing-tag")
collection.tags.pop()
collection.tags.clear()

コレクションに属するタグを表示する

W&B App UIを使用して、コレクションに追加されたタグを表示します。

W&B Registry（https://wandb.ai/registry）に移動します。
レジストリカードをクリックします。
コレクションの名前の横にある [詳細を表示] をクリックします。

コレクションに1つ以上のタグがある場合、[タグ] フィールドの横にあるコレクションカード内でそれらのタグを表示できます。

コレクションに追加されたタグは、そのコレクションの名前の横にも表示されます。

たとえば、上記の画像では、「tag1」というタグが「zoo-dataset-tensors」コレクションに追加されました。

コレクションからタグを削除する

W&B App UIを使用して、コレクションからタグを削除します。

W&B Registry（https://wandb.ai/registry）に移動します。
レジストリカードをクリックします。
コレクションの名前の横にある [詳細を表示] をクリックします。
コレクションカード内で、削除するタグの名前にマウスを合わせます。
キャンセルボタン（X アイコン）をクリックします。

Artifacts バージョンにタグを追加する

W&B App UIまたは Python SDK を使用して、コレクションにリンクされた Artifacts バージョンにタグを追加します。

W&B Registry（https://wandb.ai/registry）に移動します。
レジストリカードをクリックします。
タグを追加するコレクションの名前の横にある [詳細を表示] をクリックします。
[バージョン] までスクロールダウンします。
Artifacts バージョンの横にある [表示] をクリックします。
[バージョン] タブ内で、[タグ] フィールドの横にあるプラスアイコン（+）をクリックし、タグの名前を入力します。
キーボードの Enter キーを押します。

タグを追加または更新する Artifacts バージョンをフェッチします。Artifacts バージョンを取得したら、Artifacts オブジェクトの tag 属性にアクセスして、その Artifacts にタグを追加または変更できます。Artifacts の tag 属性に1つまたは複数のタグをリストとして渡します。

他の Artifacts と同様に、run を作成せずに W&B から Artifacts をフェッチするか、run を作成してその run 内で Artifacts をフェッチできます。いずれの場合も、Artifacts オブジェクトの save メソッドを呼び出して、W&B サーバー上の Artifacts を更新してください。

以下の適切なコードセルをコピーして貼り付け、Artifacts バージョンのタグを追加または変更します。<> の値を自分の値に置き換えます。

次のコードスニペットは、新しい run を作成せずに Artifacts をフェッチしてタグを追加する方法を示しています。

import wandb

ARTIFACT_TYPE = "<TYPE>"
ORG_NAME = "<org_name>"
REGISTRY_NAME = "<registry_name>"
COLLECTION_NAME = "<collection_name>"
VERSION = "<artifact_version>"

artifact_name = f"{ORG_NAME}/wandb-registry-{REGISTRY_NAME}/{COLLECTION_NAME}:v{VERSION}"

artifact = wandb.Api().artifact(name = artifact_name, type = ARTIFACT_TYPE)
artifact.tags = ["tag2"] # リストで1つ以上のタグを提供します
artifact.save()

次のコードスニペットは、新しい run を作成して Artifacts をフェッチし、タグを追加する方法を示しています。

import wandb

ORG_NAME = "<org_name>"
REGISTRY_NAME = "<registry_name>"
COLLECTION_NAME = "<collection_name>"
VERSION = "<artifact_version>"

run = wandb.init(entity = "<entity>", project="<project>")

artifact_name = f"{ORG_NAME}/wandb-registry-{REGISTRY_NAME}/{COLLECTION_NAME}:v{VERSION}"

artifact = run.use_artifact(artifact_or_name = artifact_name)
artifact.tags = ["tag2"] # リストで1つ以上のタグを提供します
artifact.save()

Artifacts バージョンに属するタグを更新する

たとえば、次のコードスニペットは、再割り当てでリストを更新する一般的な方法を示しています。簡潔にするために、Artifacts バージョンにタグを追加するセクションのコード例を続けます。

artifact.tags = [*artifact.tags, "new-tag", "other-tag"]
artifact.tags = artifact.tags + ["new-tag", "other-tag"]

artifact.tags = set(artifact.tags) - set(tags_to_delete)
artifact.tags = []  # deletes all tags

次のコードスニペットは、インプレースミューテーションを使用して、Artifacts バージョンに属するタグを更新する方法を示しています。

artifact.tags += ["new-tag", "other-tag"]
artifact.tags.append("new-tag")

artifact.tags.extend(["new-tag", "other-tag"])
artifact.tags[:] = ["new-tag", "other-tag"]
artifact.tags.remove("existing-tag")
artifact.tags.pop()
artifact.tags.clear()

Artifacts バージョンに属するタグを表示する

W&B App UIまたは Python SDK を使用して、レジストリにリンクされている Artifacts バージョンに属するタグを表示します。

W&B Registry（https://wandb.ai/registry）に移動します。
レジストリカードをクリックします。
タグを追加するコレクションの名前の横にある [詳細を表示] をクリックします。
[バージョン] セクションまでスクロールダウンします。

Artifacts バージョンに1つ以上のタグがある場合、[タグ] 列内でそれらのタグを表示できます。

タグを表示する Artifacts バージョンをフェッチします。Artifacts バージョンを取得したら、Artifacts オブジェクトの tag 属性を表示して、その Artifacts に属するタグを表示できます。

他の Artifacts と同様に、run を作成せずに W&B から Artifacts をフェッチするか、run を作成してその run 内で Artifacts をフェッチできます。

以下の適切なコードセルをコピーして貼り付け、Artifacts バージョンのタグを追加または変更します。<> の値を自分の値に置き換えます。

次のコードスニペットは、新しい run を作成せずに Artifacts バージョンのタグをフェッチして表示する方法を示しています。

import wandb

ARTIFACT_TYPE = "<TYPE>"
ORG_NAME = "<org_name>"
REGISTRY_NAME = "<registry_name>"
COLLECTION_NAME = "<collection_name>"
VERSION = "<artifact_version>"

artifact_name = f"{ORG_NAME}/wandb-registry-{REGISTRY_NAME}/{COLLECTION_NAME}:v{VERSION}"

artifact = wandb.Api().artifact(name = artifact_name, type = artifact_type)
print(artifact.tags)

次のコードスニペットは、新しい run を作成して Artifacts バージョンのタグをフェッチして表示する方法を示しています。

import wandb

ORG_NAME = "<org_name>"
REGISTRY_NAME = "<registry_name>"
COLLECTION_NAME = "<collection_name>"
VERSION = "<artifact_version>"

run = wandb.init(entity = "<entity>", project="<project>")

artifact_name = f"{ORG_NAME}/wandb-registry-{REGISTRY_NAME}/{COLLECTION_NAME}:v{VERSION}"

artifact = run.use_artifact(artifact_or_name = artifact_name)
print(artifact.tags)

Artifacts バージョンからタグを削除する

W&B Registry（https://wandb.ai/registry）に移動します。
レジストリカードをクリックします。
タグを追加するコレクションの名前の横にある [詳細を表示] をクリックします。
[バージョン] までスクロールダウンします。
Artifacts バージョンの横にある [表示] をクリックします。
[バージョン] タブ内で、タグの名前にマウスを合わせます。
キャンセルボタン（X アイコン）をクリックします。

既存のタグを検索する

W&B App UIを使用して、コレクションおよび Artifacts バージョンで既存のタグを検索します。

W&B Registry（https://wandb.ai/registry）に移動します。
レジストリカードをクリックします。
検索バーにタグの名前を入力します。

特定のタグを持つ Artifacts バージョンを検索する

W&B Python SDK を使用して、タグのセットを持つ Artifacts バージョンを検索します。

import wandb

api = wandb.Api()
tagged_artifact_versions = api.artifacts(
    type_name = "<artifact_type>",
    name = "<artifact_name>",
    tags = ["<tag_1>", "<tag_2>"]
)

for artifact_version in tagged_artifact_versions:
    print(artifact_version.tags)

3.9 - Annotate collections

コレクションに人に優しいテキストを追加して、ユーザーがコレクションの目的とそれに含まれる Artifacts を理解できるようにします。

コレクションによっては、トレーニングデータ、モデルアーキテクチャー、タスク、ライセンス、参考文献、およびデプロイメントに関する情報を含めることをお勧めします。以下に、コレクションでドキュメント化する価値のあるトピックをいくつか示します。

W&B は、少なくとも以下の詳細を含めることを推奨します。

Summary : コレクションの目的。機械学習実験に使用される機械学習フレームワーク。
License: 機械学習モデルの使用に関連する法的条件と許可。これにより、モデルのユーザーは、モデルを利用できる法的枠組みを理解できます。一般的なライセンスには、Apache 2.0、MIT、GPL などがあります。
References: 関連する研究論文、データセット、または外部リソースへの引用または参照。

コレクションにトレーニングデータが含まれている場合は、次の詳細を含めることを検討してください。

Training data: 使用されるトレーニングデータを記述します。
Processing: トレーニングデータセットに対して行われた処理。
Data storage: そのデータはどこに保存され、どのようにアクセスするか。

コレクションに機械学習モデルが含まれている場合は、次の詳細を含めることを検討してください。

Architecture: モデルアーキテクチャー、レイヤー、および特定の設計の選択に関する情報。
Task: コレクションモデルが実行するように設計されているタスクまたは問題の特定のタイプ。これは、モデルの意図された機能を分類したものです。
Deserialize the model: チームの誰かがモデルをメモリーにロードする方法に関する情報を提供します。
Task: 機械学習モデルが実行するように設計されているタスクまたは問題の特定のタイプ。これは、モデルの意図された機能を分類したものです。
Deployment: モデルがどのように、どこにデプロイされるかの詳細、およびワークフローオーケストレーションプラットフォームなどの他のエンタープライズシステムにモデルを統合する方法に関するガイダンス。

コレクションに説明を追加する

W&B Registry UI または Python SDK を使用して、コレクションにインタラクティブまたはプログラムで説明を追加します。

https://wandb.ai/registry/ で W&B Registry に移動します。
コレクションをクリックします。
コレクション名の横にある [詳細を表示] を選択します。
[Description] フィールドに、コレクションに関する情報を入力します。Markdown markup language でテキストの書式を設定します。

wandb.Api().artifact_collection() メソッドを使用して、コレクションの説明にアクセスします。返されたオブジェクトの description プロパティを使用して、コレクションに説明を追加または更新します。

type_name パラメータにコレクションのタイプを指定し、name パラメータにコレクションのフルネームを指定します。コレクションの名前は、プレフィックス “wandb-registry”、レジストリの名前、およびフォワードスラッシュで区切られたコレクションの名前で構成されます。

wandb-registry-{REGISTRY_NAME}/{COLLECTION_NAME}

次のコードスニペットを Python スクリプトまたはノートブックにコピーして貼り付けます。山かっこ (<>) で囲まれた値を独自の値に置き換えます。

import wandb

api = wandb.Api()

collection = api.artifact_collection(
  type_name = "<collection_type>", 
  name = "<collection_name>"
  )


collection.description = "This is a description."
collection.save()

たとえば、次の画像は、モデルのアーキテクチャー、意図された使用法、パフォーマンス情報などを文書化したコレクションを示しています。

モデルのアーキテクチャー、意図された使用法、パフォーマンス情報などに関する情報を含むコレクションカード。

3.10 - Create and view lineage maps

W&B Registry でリネージマップを作成します。

W&B Registry内のコレクションでは、ML 実験で使用される Artifacts の履歴を表示できます。この履歴は リネージグラフ と呼ばれます。

コレクションの一部ではない、W&B に記録した Artifacts のリネージグラフも表示できます。

リネージグラフは、Artifacts を記録する特定の run を示すことができます。さらに、リネージグラフは、どの run が Artifacts を入力として使用したかを示すこともできます。言い換えれば、リネージグラフは run の入力と出力を示すことができます。

たとえば、以下の画像は、ML 実験全体で作成および使用された Artifacts を示しています。

左から右へ、画像は以下を示しています。

複数の runs が split_zoo_dataset:v4 アーティファクトを記録します。
“rural-feather-20” run は、トレーニングに split_zoo_dataset:v4 アーティファクトを使用します。
“rural-feather-20” run の出力は、zoo-ylbchv20:v0 というモデルアーティファクトです。
“northern-lake-21” という run は、モデルアーティファクト zoo-ylbchv20:v0 を使用してモデルを評価します。

run の入力を追跡する

wandb.init.use_artifact API を使用して、Artifacts を run の入力または依存関係としてマークします。

以下のコードスニペットは、use_artifact の使用方法を示しています。山括弧 (< >) で囲まれた値を自分の値に置き換えてください。

import wandb

# Initialize a run
run = wandb.init(project="<project>", entity="<entity>")

# Get artifact, mark it as a dependency
artifact = run.use_artifact(artifact_or_name="<name>", aliases="<alias>")

run の出力を追跡する

Artifacts を run の出力として宣言するには、(wandb.init.log_artifact) を使用します。

以下のコードスニペットは、wandb.init.log_artifact API の使用方法を示しています。山括弧 (< >) で囲まれた値を必ず自分の値に置き換えてください。

import wandb

# Initialize a run
run = wandb.init(entity  "<entity>", project = "<project>",)
artifact = wandb.Artifact(name = "<artifact_name>", type = "<artifact_type>")
artifact.add_file(local_path = "<local_filepath>", name="<optional-name>")

# Log the artifact as an output of the run
run.log_artifact(artifact_or_path = artifact)

Artifacts の作成に関する詳細については、Artifacts の作成を参照してください。

コレクションでリネージグラフを表示する

W&B Registry でコレクションにリンクされた Artifacts のリネージを表示します。

W&B Registry に移動します。
Artifacts を含むコレクションを選択します。
ドロップダウンから、リネージグラフを表示する Artifacts のバージョンをクリックします。
「リネージ」タブを選択します。

Artifacts のリネージグラフページにアクセスすると、そのリネージグラフ内の任意のノードに関する追加情報を表示できます。

run の ID、run の名前、run の状態など、その run の詳細を表示するには、run ノードを選択します。例として、以下の画像は rural-feather-20 run に関する情報を示しています。

Artifacts のフルネーム、タイプ、作成時間、および関連するエイリアスなど、その Artifacts の詳細を表示するには、Artifacts ノードを選択します。

3.11 - Migrate from legacy Model Registry

W&B は、レガシーな W&B Model Registry から新しい W&B Registry へとアセットを移行します。この移行は完全に W&B によって管理およびトリガーされ、ユーザーからの介入は必要ありません。このプロセスは、既存のワークフローを最小限に中断するように、可能な限りシームレスになるように設計されています。

移行は、新しい W&B Registry が Model Registry で現在利用可能なすべての機能を含むと実行されます。W&B は、現在のワークフロー、コードベース、および参照を保持しようとします。

このガイドは生きたドキュメントであり、より多くの情報が利用可能になるにつれて定期的に更新されます。ご質問やサポートについては、support@wandb.com までお問い合わせください。

W&B Registry は、従来の Model Registry とどのように異なりますか

W&B Registry は、モデル、データセット、およびその他のアーティファクトを管理するための、より堅牢で柔軟な環境を提供するように設計された、さまざまな新機能と拡張機能を紹介します。

レガシー Model Registry を表示するには、W&B アプリの Model Registry に移動します。ページの上部にバナーが表示され、レガシー Model Registry アプリ UI を使用できます。

組織の可視性

レガシー Model Registry にリンクされた Artifacts は、チームレベルの可視性を持ちます。これは、チームのメンバーのみがレガシー W&B Model Registry で Artifacts を表示できることを意味します。W&B Registry は、組織レベルの可視性を持ちます。これは、適切な権限を持つ組織全体のメンバーが、レジストリにリンクされた Artifacts を表示できることを意味します。

レジストリへの可視性を制限する

カスタムレジストリを表示およびアクセスできるユーザーを制限します。カスタムレジストリを作成するとき、またはカスタムレジストリを作成した後に、レジストリへの可視性を制限できます。制限されたレジストリでは、選択されたメンバーのみコンテンツにアクセスでき、プライバシーと制御を維持します。レジストリの可視性の詳細については、レジストリの可視性タイプを参照してください。

カスタムレジストリを作成する

従来の Model Registry とは異なり、W&B Registry はモデルまたはデータセットレジストリに限定されません。特定のワークフローまたはプロジェクトのニーズに合わせて調整されたカスタムレジストリを作成でき、任意のオブジェクトタイプを保持できます。この柔軟性により、チームは独自の要件に従って Artifacts を整理および管理できます。カスタムレジストリの作成方法の詳細については、カスタムレジストリを作成するを参照してください。

カスタムアクセス制御

各レジストリは詳細なアクセス制御をサポートしており、メンバーには管理者、メンバー、または閲覧者などの特定のロールを割り当てることができます。管理者は、メンバーの追加または削除、ロールの設定、可視性の構成など、レジストリの設定を管理できます。これにより、チームはレジストリ内の Artifacts を表示、管理、および操作できるユーザーを確実に制御できます。

用語の更新

登録済みモデルは、コレクションと呼ばれるようになりました。

変更の概要

	レガシー W&B Model Registry	W&B Registry
Artifact の可視性	チームのメンバーのみ Artifacts を表示またはアクセスできます	組織内のメンバーは、適切な権限を持っていれば、レジストリにリンクされた Artifacts を表示またはアクセスできます
カスタムアクセス制御	利用不可	利用可能
カスタムレジストリ	利用不可	利用可能
用語の更新	モデルバージョンへのポインター（リンク）のセットは、登録済みモデルと呼ばれます。	アーティファクトバージョンへのポインター（リンク）のセットは、コレクションと呼ばれます。
`wandb.init.link_model`	Model Registry 固有の API	現在、レガシー Model Registry とのみ互換性があります

移行の準備

W&B は、登録済みのモデル（現在はコレクションと呼ばれています）と、関連する Artifacts バージョンを、レガシー Model Registry から W&B Registry に移行します。このプロセスは自動的に実行され、ユーザーからのアクションは必要ありません。

チームの可視性から組織の可視性へ

移行後、モデルレジストリは組織レベルの可視性を持つようになります。ロールを割り当てることで、レジストリへのアクセス権を持つユーザーを制限できます。これにより、特定のメンバーのみが特定のレジストリにアクセスできるようになります。

移行により、レガシー W&B Model Registry 内の現在のチームレベルの登録済みモデル（まもなくコレクションと呼ばれるようになります）の既存の権限境界が保持されます。レガシー Model Registry で現在定義されている権限は、新しい Registry で保持されます。これは、現在特定のチームメンバーに制限されているコレクションが、移行中および移行後も保護された状態を維持することを意味します。

Artifacts パスの継続性

現在、アクションは必要ありません。

移行中

W&B は移行プロセスを開始します。移行は、W&B サービスの中断を最小限に抑える時間帯に実行されます。レガシー Model Registry は、移行が開始されると読み取り専用状態に移行し、参照用にアクセス可能な状態を維持します。

移行後

移行後、コレクション、 Artifacts バージョン、および関連する属性は、新しい W&B Registry 内で完全にアクセス可能になります。焦点は、現在のワークフローが確実にそのまま残るようにすることであり、変更をナビゲートするのに役立つ継続的なサポートが利用可能です。

新しいレジストリを使用する

ユーザーは、W&B Registry で利用可能な新機能と性能を調査することをお勧めします。Registry は、現在依存している機能をサポートするだけでなく、カスタムレジストリ、可視性の向上、柔軟なアクセス制御などの拡張機能も導入します。

早期に W&B Registry を試してみたい場合、または新しいユーザーがレガシー W&B Model Registry ではなく Registry から開始したい場合は、サポートをご利用いただけます。この機能を有効にするには、support@wandb.com またはセールス MLE までご連絡ください。早期移行は BETA バージョンに移行することに注意してください。BETA バージョンの W&B Registry は、レガシー Model Registry のすべての機能または特徴を備えていない可能性があります。

詳細および W&B Registry のすべての機能の詳細については、W&B Registry ガイドを参照してください。

よくある質問

W&B が Model Registry から W&B Registry にアセットを移行するのはなぜですか？

W&B は、新しい Registry でより高度な機能と性能を提供するために、プラットフォームを進化させています。この移行は、モデル、データセット、およびその他の Artifacts を管理するための、より統合された強力なツールセットを提供するためのステップです。

移行前に何をする必要がありますか？

移行前にユーザーが行う必要のあるアクションはありません。W&B が移行を処理し、ワークフローと参照が確実に保持されるようにします。

モデル Artifacts へのアクセスは失われますか？

いいえ、モデル Artifacts へのアクセスは移行後も保持されます。レガシー Model Registry は読み取り専用状態のままになり、関連するすべてのデータが新しい Registry に移行されます。

Artifacts に関連するメタデータは保持されますか？

はい、 Artifacts の作成、リネージ、およびその他の属性に関連する重要なメタデータは、移行中に保持されます。ユーザーは、移行後も関連するすべてのメタデータに引き続きアクセスでき、 Artifacts の整合性とトレーサビリティが確実に維持されるようにします。

ヘルプが必要な場合は誰に連絡すればよいですか？

ご質問やご不明な点がございましたら、サポートをご利用いただけます。サポートが必要な場合は、support@wandb.com までご連絡ください。

3.12 - Model registry

モデルレジストリを使用して、トレーニングからプロダクションまでのモデルのライフサイクルを管理します。

W&B は最終的に W&B Model Registry のサポートを停止します。ユーザーは、代わりにモデルアーティファクトのバージョンをリンクおよび共有するために、W&B Registry を使用することをお勧めします。 W&B Registry は、従来の W&B Model Registry の機能を拡張します。 W&B Registry の詳細については、Registry のドキュメントを参照してください。

W&B は、従来の Model Registry にリンクされている既存のモデルアーティファクトを、近い将来、新しい W&B Registry に移行します。移行プロセスの詳細については、従来の Model Registry からの移行を参照してください。

W&B Model Registry には、 ML 実践者がプロダクション用の候補を公開し、ダウンストリームのチームや関係者が利用できる、チームがトレーニングしたモデルが格納されています。これは、ステージングされたモデル/候補モデルを格納し、ステージングに関連するワークフローを管理するために使用されます。

W&B Model Registry では、次のことが可能です。

各機械学習タスクに最適なモデルバージョンをブックマークします。
ダウンストリームプロセスとモデル CI/CD をオートメーションします。
モデルバージョンを ML ライフサイクル (ステージングからプロダクションへ) で移行します。
モデルのリネージを追跡し、プロダクションモデルへの変更の履歴を監査します。

仕組み

いくつかの簡単なステップで、ステージングされたモデルを追跡および管理します。

モデルバージョンをログに記録する: トレーニングスクリプトで、数行のコードを追加して、モデルファイルを Artifacts として W&B に保存します。
パフォーマンスを比較する: ライブチャートをチェックして、モデルトレーニングと検証からのメトリクスとサンプル予測を比較します。どのモデルバージョンが最も優れたパフォーマンスを発揮したかを特定します。
Registry にリンクする: Python でプログラムで、または W&B UI でインタラクティブに、登録されたモデルにリンクして、最適なモデルバージョンをブックマークします。

次のコードスニペットは、モデルをログに記録して Model Registry にリンクする方法を示しています。

import wandb
import random

# Start a new W&B run
run = wandb.init(project="models_quickstart")

# Simulate logging model metrics
run.log({"acc": random.random()})

# Create a simulated model file
with open("my_model.h5", "w") as f:
    f.write("Model: " + str(random.random()))

# Log and link the model to the Model Registry
run.link_model(path="./my_model.h5", registered_model_name="MNIST")

run.finish()

モデルの移行を CI/CD ワークフローに接続する: 候補モデルをワークフローステージを介して移行し、Webhooks でダウンストリームアクションを自動化します。

開始方法

ユースケースに応じて、次のリソースを調べて W&B Models の使用を開始してください。

2 部構成のビデオシリーズをご覧ください。
1. モデルのログ記録と登録
2. Model Registry でのモデルの消費とダウンストリームプロセスの自動化。
W&B Python SDK コマンドのステップごとの概要については、モデルのウォークスルーを読んで、データセット Artifacts の作成、追跡、および使用に使用できます。
以下について学びます。
- 保護されたモデルとアクセス制御。
- Registry を CI/CD プロセスに接続する方法。
- 新しいモデルバージョンが登録済みモデルにリンクされたときの Slack 通知を設定します。
Model Registry が ML ワークフローにどのように適合し、モデル管理にそれを使用する利点については、こちらのレポートを確認してください。
W&B Enterprise Model Management コースを受講して、以下を学びます。
- W&B Model Registry を使用して、モデルの管理とバージョン管理、リネージの追跡、およびさまざまなライフサイクルステージでのモデルのプロモーションを行います。
- Webhooks を使用して、モデル管理ワークフローを自動化します。
- Model Registry が、モデルの評価、モニタリング、およびデプロイメントのためのモデル開発ライフサイクルにおいて、外部 ML システムおよびツールとどのように統合されるかを確認します。

3.12.1 - Tutorial: Use W&B for model management

W&B を使用して Model Management を行う方法について説明します。

以下のチュートリアルでは、モデルを W&B に記録する方法を紹介します。このチュートリアルを終えるまでに、以下のことができるようになります。

MNIST データセットと Keras フレームワークを使用してモデルを作成し、トレーニングする。
トレーニングしたモデルを W&B の project に記録する
使用したデータセットを作成したモデルへの依存関係としてマークする
モデルを W&B モデルレジストリにリンクする。
レジストリにリンクするモデルのパフォーマンスを評価する
モデルの version を production 用としてマークする。

このガイドに記載されている順序でコードスニペットをコピーしてください。
モデルレジストリに固有ではないコードは、折りたたみ可能なセルに隠されています。

セットアップ

始める前に、このチュートリアルに必要な Python の依存関係をインポートします。

import wandb
import numpy as np
from tensorflow import keras
from tensorflow.keras import layers
from wandb.integration.keras import WandbMetricsLogger
from sklearn.model_selection import train_test_split

W&B の entity を entity 変数に指定します。

entity = "<entity>"

データセット Artifact を作成する

まず、データセットを作成します。次のコードスニペットは、MNIST データセットをダウンロードする関数を作成します。

def generate_raw_data(train_size=6000):
    eval_size = int(train_size / 6)
    (x_train, y_train), (x_eval, y_eval) = keras.datasets.mnist.load_data()

    x_train = x_train.astype("float32") / 255
    x_eval = x_eval.astype("float32") / 255
    x_train = np.expand_dims(x_train, -1)
    x_eval = np.expand_dims(x_eval, -1)

    print("Generated {} rows of training data.".format(train_size))
    print("Generated {} rows of eval data.".format(eval_size))

    return (x_train[:train_size], y_train[:train_size]), (
        x_eval[:eval_size],
        y_eval[:eval_size],
    )

# データセットを作成します
(x_train, y_train), (x_eval, y_eval) = generate_raw_data()

次に、データセットを W&B にアップロードします。これを行うには、アーティファクトオブジェクトを作成し、そのアーティファクトにデータセットを追加します。

project = "model-registry-dev"

model_use_case_id = "mnist"
job_type = "build_dataset"

# W&B の run を初期化します
run = wandb.init(entity=entity, project=project, job_type=job_type)

# トレーニングデータ用の W&B テーブルを作成します
train_table = wandb.Table(data=[], columns=[])
train_table.add_column("x_train", x_train)
train_table.add_column("y_train", y_train)
train_table.add_computed_columns(lambda ndx, row: {"img": wandb.Image(row["x_train"])})

# 評価データ用の W&B テーブルを作成します
eval_table = wandb.Table(data=[], columns=[])
eval_table.add_column("x_eval", x_eval)
eval_table.add_column("y_eval", y_eval)
eval_table.add_computed_columns(lambda ndx, row: {"img": wandb.Image(row["x_eval"])})

# Artifact オブジェクトを作成します
artifact_name = "{}_dataset".format(model_use_case_id)
artifact = wandb.Artifact(name=artifact_name, type="dataset")

# wandb.WBValue オブジェクトを Artifact に追加します。
artifact.add(train_table, "train_table")
artifact.add(eval_table, "eval_table")

# Artifact に加えられた変更を永続化します。
artifact.save()

# W&B にこの run が完了したことを伝えます。
run.finish()

データセットなどのファイルを Artifact に保存すると、モデルの依存関係を追跡できるため、モデルのログを記録する際に役立ちます。

モデルをトレーニングする

前のステップで作成した Artifact データセットを使用してモデルをトレーニングします。

データセット Artifact を run への入力として宣言する

前のステップで作成したデータセット Artifact を W&B の run への入力として宣言します。Artifact を run への入力として宣言すると、特定のモデルのトレーニングに使用されたデータセット (およびデータセットの version) を追跡できるため、モデルのログを記録する際に特に役立ちます。W&B は、収集された情報を使用して、リネージマップを作成します。

use_artifact API を使用して、データセット Artifact を run の入力として宣言し、Artifact 自体を取得します。

job_type = "train_model"
config = {
    "optimizer": "adam",
    "batch_size": 128,
    "epochs": 5,
    "validation_split": 0.1,
}

# W&B の run を初期化します
run = wandb.init(project=project, job_type=job_type, config=config)

# データセット Artifact を取得します
version = "latest"
name = "{}:{}".format("{}_dataset".format(model_use_case_id), version)
artifact = run.use_artifact(artifact_or_name=name)

# データフレームから特定の内容を取得します
train_table = artifact.get("train_table")
x_train = train_table.get_column("x_train", convert_to="numpy")
y_train = train_table.get_column("y_train", convert_to="numpy")

モデルの入力と出力を追跡する方法の詳細については、モデルリネージマップの作成を参照してください。

モデルを定義してトレーニングする

このチュートリアルでは、Keras を使用して MNIST データセットから画像を分類する 2D Convolutional Neural Network (CNN) を定義します。

MNIST データで CNN をトレーニングする

# 設定ディクショナリの値を簡単にアクセスできるように変数に格納します
num_classes = 10
input_shape = (28, 28, 1)
loss = "categorical_crossentropy"
optimizer = run.config["optimizer"]
metrics = ["accuracy"]
batch_size = run.config["batch_size"]
epochs = run.config["epochs"]
validation_split = run.config["validation_split"]

# モデルアーキテクチャを作成します
model = keras.Sequential(
    [
        layers.Input(shape=input_shape),
        layers.Conv2D(32, kernel_size=(3, 3), activation="relu"),
        layers.MaxPooling2D(pool_size=(2, 2)),
        layers.Conv2D(64, kernel_size=(3, 3), activation="relu"),
        layers.MaxPooling2D(pool_size=(2, 2)),
        layers.Flatten(),
        layers.Dropout(0.5),
        layers.Dense(num_classes, activation="softmax"),
    ]
)
model.compile(loss=loss, optimizer=optimizer, metrics=metrics)

# トレーニングデータのラベルを生成します
y_train = keras.utils.to_categorical(y_train, num_classes)

# トレーニングセットとテストセットを作成します
x_t, x_v, y_t, y_v = train_test_split(x_train, y_train, test_size=0.33)

次に、モデルをトレーニングします。

# モデルをトレーニングします
model.fit(
    x=x_t,
    y=y_t,
    batch_size=batch_size,
    epochs=epochs,
    validation_data=(x_v, y_v),
    callbacks=[WandbCallback(log_weights=True, log_evaluation=True)],
)

最後に、モデルをローカルマシンに保存します。

# モデルをローカルに保存します
path = "model.h5"
model.save(path)

モデルをログに記録してモデルレジストリにリンクする

link_model API を使用して、モデルの 1 つ以上のファイルを W&B の run に記録し、W&B モデルレジストリにリンクします。

path = "./model.h5"
registered_model_name = "MNIST-dev"

run.link_model(path=path, registered_model_name=registered_model_name)
run.finish()

registered-model-name に指定した名前がまだ存在しない場合、W&B は登録済みモデルを作成します。

オプションのパラメータの詳細については、API リファレンスガイドのlink_model を参照してください。

モデルのパフォーマンスを評価する

1 つ以上のモデルのパフォーマンスを評価するのは一般的な方法です。

まず、前のステップで W&B に保存された評価データセット Artifact を取得します。

job_type = "evaluate_model"

# run を初期化します
run = wandb.init(project=project, entity=entity, job_type=job_type)

model_use_case_id = "mnist"
version = "latest"

# データセット Artifact を取得し、依存関係としてマークします
artifact = run.use_artifact(
    "{}:{}".format("{}_dataset".format(model_use_case_id), version)
)

# 目的のデータフレームを取得します
eval_table = artifact.get("eval_table")
x_eval = eval_table.get_column("x_eval", convert_to="numpy")
y_eval = eval_table.get_column("y_eval", convert_to="numpy")

評価する W&B からモデル version をダウンロードします。use_model API を使用して、モデルにアクセスしてダウンロードします。

alias = "latest"  # エイリアス
name = "mnist_model"  # モデル Artifact の名前

# モデルにアクセスしてダウンロードします。ダウンロードした Artifact へのパスを返します
downloaded_model_path = run.use_model(name=f"{name}:{alias}")

Keras モデルをロードし、損失を計算します。

model = keras.models.load_model(downloaded_model_path)

y_eval = keras.utils.to_categorical(y_eval, 10)
(loss, _) = model.evaluate(x_eval, y_eval)
score = (loss, _)

最後に、損失メトリクスを W&B の run に記録します。

# # メトリクス、画像、テーブル、または評価に役立つデータを記録します。
run.log(data={"loss": (loss, _)})

モデル version を昇格させる

モデルエイリアス を使用して、機械学習ワークフローの次の段階に向けてモデル version を準備完了としてマークします。各登録済みモデルには、1 つ以上のモデルエイリアスを設定できます。モデルエイリアスは、一度に 1 つのモデル version にのみ属することができます。

たとえば、モデルのパフォーマンスを評価した後、そのモデルが production の準備ができていると確信したとします。そのモデル version を昇格させるには、production エイリアスをその特定のモデル version に追加します。

production エイリアスは、モデルを production 準備完了としてマークするために使用される最も一般的なエイリアスの 1 つです。

W&B アプリ UI を使用してインタラクティブに、または Python SDK を使用してプログラムで、モデル version にエイリアスを追加できます。次の手順では、W&B モデルレジストリアプリでエイリアスを追加する方法を示します。

https://wandb.ai/registry/model でモデルレジストリアプリに移動します。
登録済みモデルの名前の横にある [詳細を表示] をクリックします。
[バージョン] セクション内で、昇格させるモデル version の名前の横にある [表示] ボタンをクリックします。
[エイリアス] フィールドの横にあるプラスアイコン ([+]) をクリックします。
表示されるフィールドに production と入力します。
キーボードの Enter キーを押します。

3.12.2 - Model Registry Terms and Concepts

モデルレジストリの用語と概念

W&B のモデルレジストリの主要コンポーネントは、以下の用語で説明されます。モデルバージョン, モデル artifact, そして registered model。

モデルバージョン

モデルバージョンは、単一のモデルチェックポイントを表します。モデルバージョンは、実験内におけるモデルとそのファイルの特定時点でのスナップショットです。

モデルバージョンは、トレーニングされたモデルを記述するデータとメタデータの不変のディレクトリーです。W&B は、モデルのアーキテクチャーと学習済みパラメータを後で保存（および復元）できるように、モデルバージョンにファイルを追加することをお勧めします。

モデルバージョンは、1つのモデル artifact にのみ属します。モデルバージョンは、ゼロまたは複数の registered model に属することができます。モデルバージョンは、モデル artifact にログされた順にモデル artifact に保存されます。W&B は、(同じモデル artifact に) ログするモデルの内容が以前のモデルバージョンと異なる場合、新しいモデルバージョンを自動的に作成します。

モデリングライブラリ (たとえば、PyTorch や Keras) によって提供されるシリアル化プロセスから生成されたファイルをモデルバージョン内に保存します。

モデルエイリアス

モデルエイリアスは、 registered model 内のモデルバージョンを、セマンティックに関連する識別子で一意に識別または参照できる、変更可能な文字列です。エイリアスは、 registered model の 1 つのバージョンにのみ割り当てることができます。これは、エイリアスがプログラムで使用される場合に一意のバージョンを参照する必要があるためです。また、エイリアスを使用してモデルの状態 (チャンピオン、候補、本番) をキャプチャすることもできます。

"best"、"latest"、"production"、"staging" などのエイリアスを使用して、特別な目的を持つモデルバージョンをマークするのが一般的な方法です。

たとえば、モデルを作成し、それに "best" エイリアスを割り当てるとします。run.use_model でその特定のモデルを参照できます。

import wandb
run = wandb.init()
name = f"{entity/project/model_artifact_name}:{alias}"
run.use_model(name=name)

モデルタグ

モデルタグは、1 つまたは複数の registered model に属するキーワードまたはラベルです。

モデルタグを使用して、 registered model をカテゴリに整理し、モデルレジストリの検索バーでそれらのカテゴリを検索します。モデルタグは、 Registered Model Card の上部に表示されます。これらを使用して、 registered model を ML タスク、所有チーム、または優先度でグループ化することもできます。同じモデルタグを複数の registered model に追加して、グループ化できます。

モデルタグは、グループ化と発見可能性のために registered model に適用されるラベルであり、モデルエイリアスとは異なります。モデルエイリアスは、プログラムでモデルバージョンを取得するために使用する一意の識別子またはニックネームです。タグを使用してモデルレジストリ内のタスクを整理する方法の詳細については、モデルの整理を参照してください。

モデル artifact

モデル artifact は、ログされたモデルバージョンのコレクションです。モデルバージョンは、モデル artifact にログされた順にモデル artifact に保存されます。

モデル artifact には、1 つ以上のモデルバージョンを含めることができます。モデルバージョンがログされていない場合、モデル artifact は空になる可能性があります。

たとえば、モデル artifact を作成するとします。モデルトレーニング中に、チェックポイント中にモデルを定期的に保存します。各チェックポイントは、独自のモデルバージョンに対応します。モデルトレーニング中に作成され、チェックポイントの保存されたすべてのモデルバージョンは、トレーニングスクリプトの開始時に作成した同じモデル artifact に保存されます。

次の図は、v0、v1、v2 の 3 つのモデルバージョンを含むモデル artifact を示しています。

モデル artifact の例はこちらでご覧ください。

Registered model

Registered model は、モデルバージョンへのポインタ (リンク) のコレクションです。registered model は、同じ ML タスクの候補モデルの「ブックマーク」のフォルダーと考えることができます。registered model の各「ブックマーク」は、モデル artifact に属するモデルバージョンへのポインタです。モデルタグを使用して、 registered model をグループ化できます。

Registered model は、多くの場合、単一のモデリングユースケースまたはタスクの候補モデルを表します。たとえば、使用するモデルに基づいて、さまざまな画像分類タスクの registered model を作成する場合があります:ImageClassifier-ResNet50、ImageClassifier-VGG16、DogBreedClassifier-MobileNetV2 など。モデルバージョンには、 registered model にリンクされた順にバージョン番号が割り当てられます。

Registered Model の例はこちらでご覧ください。

3.12.3 - Track a model

W&B Python SDK で、モデル、モデルの依存関係、およびそのモデルに関連するその他の情報を追跡します。

W&B Python SDKで、モデル、モデルの依存関係、およびそのモデルに関連するその他の情報を追跡します。

W&Bは内部で、モデル Artifact のリネージを作成します。これは、W&B App UIで表示したり、W&B Python SDKでプログラム的に表示したりできます。詳細については、モデルリネージマップの作成を参照してください。

モデルをログに記録する方法

モデルをログに記録するには、run.log_model APIを使用します。モデルファイルが保存されているパスを path パラメータに指定します。パスは、ローカルファイル、ディレクトリー、または s3://bucket/path などの外部バケットへの参照URI にすることができます。

オプションで、name パラメータにモデル Artifactの名前を指定します。name が指定されていない場合、W&Bはrun IDを先頭に付加した入力パスのベース名を使用します。

以下のコードスニペットをコピーして貼り付けます。<> で囲まれた値は、ご自身の値に置き換えてください。

import wandb

# W&B runを初期化する
run = wandb.init(project="<project>", entity="<entity>")

# モデルをログに記録する
run.log_model(path="<path-to-model>", name="<name>")

例: Keras モデルをW&Bにログする

以下のコード例は、畳み込みニューラルネットワーク (CNN) モデルをW&Bにログする方法を示しています。

import os
import wandb
from tensorflow import keras
from tensorflow.keras import layers

config = {"optimizer": "adam", "loss": "categorical_crossentropy"}

# W&B runを初期化する
run = wandb.init(entity="charlie", project="mnist-project", config=config)

# トレーニングアルゴリズム
loss = run.config["loss"]
optimizer = run.config["optimizer"]
metrics = ["accuracy"]
num_classes = 10
input_shape = (28, 28, 1)

model = keras.Sequential(
    [
        layers.Input(shape=input_shape),
        layers.Conv2D(32, kernel_size=(3, 3), activation="relu"),
        layers.MaxPooling2D(pool_size=(2, 2)),
        layers.Conv2D(64, kernel_size=(3, 3), activation="relu"),
        layers.MaxPooling2D(pool_size=(2, 2)),
        layers.Flatten(),
        layers.Dropout(0.5),
        layers.Dense(num_classes, activation="softmax"),
    ]
)

model.compile(loss=loss, optimizer=optimizer, metrics=metrics)

# モデルを保存
model_filename = "model.h5"
local_filepath = "./"
full_path = os.path.join(local_filepath, model_filename)
model.save(filepath=full_path)

# モデルをログに記録する
run.log_model(path=full_path, name="MNIST")

# W&B に run を終了することを明示的に伝える。
run.finish()

3.12.4 - Create a registered model

モデリングタスクのすべての候補モデルを保持するために、登録済みモデルを作成します。

モデリングタスクのすべての候補モデルを保持するために、registered modelを作成します。 registered model は、Model Registry 内でインタラクティブに、または Python SDK でプログラム的に作成できます。

プログラムで registered model を作成する

W&B Python SDK でモデルをプログラム的に登録します。 registered model が存在しない場合、W&B は自動的に registered model を作成します。

必ず、<> で囲まれた値を独自の値に置き換えてください。

import wandb

run = wandb.init(entity="<entity>", project="<project>")
run.link_model(path="<path-to-model>", registered_model_name="<registered-model-name>")
run.finish()

registered_model_name に指定した名前は、Model Registry App に表示される名前です。

インタラクティブに registered model を作成する

Model Registry App 内でインタラクティブに registered model を作成します。

https://wandb.ai/registry/model で Model Registry App に移動します。
Model Registry ページの右上にある New registered model ボタンをクリックします。
表示されるパネルで、registered model が属する Entities を Owning Entity ドロップダウンから選択します。
Name フィールドにモデルの名前を入力します。
Type ドロップダウンから、registered model にリンクする Artifacts のタイプを選択します。
（オプション）Description フィールドにモデルに関する説明を追加します。
（オプション）Tags フィールドに、1 つ以上のタグを追加します。
Register model をクリックします。

モデルを Model Registry に手動でリンクすることは、1 回限りのモデルに役立ちます。ただし、多くの場合、プログラムでモデルバージョンを Model Registry にリンクすることが役立ちます。

たとえば、毎晩のジョブがあるとします。毎晩作成されるモデルを手動でリンクするのは面倒です。代わりに、モデルを評価するスクリプトを作成し、モデルのパフォーマンスが向上した場合、W&B Python SDK を使用してそのモデルを Model Registry にリンクすることができます。

3.12.5 - Link a model version

W&B App を使用するか、Python SDK でプログラム的に モデル の バージョン を Registered Model にリンクします。

W&B Appまたは Python SDK で、モデルのバージョンを登録済みモデルにリンクします。

プログラムでモデルをリンクする

link_model メソッドを使用して、モデルファイルをプログラムで W&B の run にログし、それをW&B モデルレジストリにリンクします。

必ず <> で囲まれた値を独自の値に置き換えてください。

import wandb

run = wandb.init(entity="<entity>", project="<project>")
run.link_model(path="<path-to-model>", registered_model_name="<登録済みモデル名>")
run.finish()

registered-model-name パラメータに指定した名前がまだ存在しない場合、W&B によって登録済みモデルが作成されます。

たとえば、モデルレジストリに「Fine-Tuned-Review-Autocompletion 」(registered-model-name="Fine-Tuned-Review-Autocompletion") という名前の既存の登録済みモデルがあるとします。また、いくつかのモデルバージョンがそれ(v0、v1、v2)にリンクされているとします。新しいモデルをプログラムでリンクし、同じ登録済みモデル名 (registered-model-name="Fine-Tuned-Review-Autocompletion") を使用すると、W&B はこのモデルを既存の登録済みモデルにリンクし、モデルバージョン v3 を割り当てます。この名前の登録済みモデルが存在しない場合は、新しい登録済みモデルが作成され、モデルバージョン v0 が割り当てられます。

“Fine-Tuned-Review-Autocompletion” 登録済みモデルの例はこちらをご覧ください。

インタラクティブにモデルをリンクする

モデルレジストリまたは Artifact ブラウザを使用して、インタラクティブにモデルをリンクします。

https://wandb.ai/registry/model のモデルレジストリ App に移動します。
新しいモデルをリンクする登録済みモデルの名前の横にマウスを置きます。
詳細を表示 の横にあるミートボールメニューアイコン (3 つの水平ドット) を選択します。
ドロップダウンから、新しいバージョンをリンク を選択します。
Project ドロップダウンから、モデルを含む project の名前を選択します。
モデル Artifact ドロップダウンから、モデル artifact の名前を選択します。
バージョン ドロップダウンから、登録済みモデルにリンクするモデルバージョンを選択します。

W&B App の project の Artifact ブラウザに移動します: https://wandb.ai/<entity>/<project>/artifacts
左側のサイドバーにある Artifacts アイコンを選択します。
レジストリにリンクするモデルバージョンをクリックします。
バージョンの概要 セクション内で、レジストリにリンク ボタンをクリックします。
画面の右側に表示されるモーダルから、登録済みモデルを選択 メニューのドロップダウンから登録済みモデルを選択します。
次のステップ をクリックします。
(オプション) エイリアス ドロップダウンからエイリアスを選択します。
レジストリにリンク をクリックします。

リンクされたモデルのソースを表示する

リンクされたモデルのソースを表示する方法は 2 つあります。モデルがログされている project 内の Artifact ブラウザと W&B モデルレジストリです。

ポインタは、モデルレジストリ内の特定のモデルバージョンをソースモデル artifact (モデルがログされている project 内にある) に接続します。ソースモデル artifact には、モデルレジストリへのポインタもあります。

https://wandb.ai/registry/model でモデルレジストリに移動します。
登録済みモデルの名前の横にある 詳細を表示 を選択します。
バージョン セクション内で、調査するモデルバージョンの横にある表示を選択します。
右側のパネル内の バージョン タブをクリックします。
バージョンの概要 セクション内に、ソースバージョン フィールドを含む行があります。ソースバージョン フィールドには、モデルの名前とモデルのバージョンの両方が表示されます。

たとえば、次の図は、MNIST-dev という名前の登録済みモデルにリンクされた mnist_model という名前の v0 モデルバージョンを示しています (ソースバージョン フィールド mnist_model:v0 を参照)。

W&B App の project の Artifact ブラウザに移動します: https://wandb.ai/<entity>/<project>/artifacts
左側のサイドバーにある Artifacts アイコンを選択します。
Artifacts パネルから モデル ドロップダウンメニューを展開します。
モデルレジストリにリンクされているモデルの名前とバージョンを選択します。
右側のパネル内の バージョン タブをクリックします。
バージョンの概要 セクション内に、リンク先 フィールドを含む行があります。リンク先 フィールドには、登録済みモデルの名前と、それが持つバージョン (registered-model-name:version) の両方が表示されます。

たとえば、次の図では、MNIST-dev という名前の登録済みモデルがあります (リンク先 フィールドを参照)。バージョン v0 (mnist_model:v0) を持つ mnist_model という名前のモデルバージョンは、MNIST-dev 登録済みモデルを指しています。

3.12.6 - Organize models

モデルタグを使用すると、登録されたモデルをカテゴリに分類し、それらのカテゴリを検索できます。

https://wandb.ai/registry/model の W&B Model Registry アプリケーションに移動します。
モデルタグを追加する登録済みモデルの名前の横にある View details（詳細を見る） を選択します。
Model card（モデルカード） セクションまでスクロールします。
Tags（タグ） フィールドの横にあるプラスボタン（+）をクリックします。
タグの名前を入力するか、既存のモデルタグを検索します。たとえば、次の図は、FineTuned-Review-Autocompletion という登録済みモデルに追加された複数のモデルタグを示しています。

3.12.7 - Create model lineage map

このページでは、従来の W&B Model Registry でリネージグラフを作成する方法について説明します。W&B Registry のリネージグラフについては、リネージマップの作成と表示を参照してください。

W&B は、従来の W&B Model Registry から新しい W&B Registry にアセットを移行します。この移行は完全に管理され、W&B によってトリガーされるため、ユーザーによる介入は必要ありません。このプロセスは、既存のワークフローを可能な限り中断することなく、シームレスに行われるように設計されています。従来の Model Registry からの移行を参照してください。

モデルアーティファクトを W&B にログ記録する便利な機能は、リネージグラフです。リネージグラフは、 run によってログ記録されたアーティファクトと、特定の run で使用されたアーティファクトを示します。

つまり、モデルアーティファクトをログ記録すると、少なくともモデルアーティファクトを使用または生成した W&B の run を表示できます。依存関係を追跡する場合、モデルアーティファクトで使用される入力も表示されます。

たとえば、次の図は、ML 実験全体で作成および使用されたアーティファクトを示しています。

左から右へ、画像は以下を示しています。

jumping-monkey-1 W&B run は、mnist_dataset:v0 データセットアーティファクトを作成しました。
vague-morning-5 W&B run は、mnist_dataset:v0 データセットアーティファクトを使用してモデルをトレーニングしました。この W&B run の出力は、mnist_model:v0 というモデルアーティファクトでした。
serene-haze-6 という run は、モデルアーティファクト ( mnist_model:v0) を使用してモデルを評価しました。

アーティファクトの依存関係を追跡する

use_artifact API を使用して、データセットアーティファクトを W&B run への入力として宣言し、依存関係を追跡します。

次のコードスニペットは、use_artifact API の使用方法を示しています。

# run を初期化する
run = wandb.init(project=project, entity=entity)

# アーティファクト を取得し、依存関係としてマークします
artifact = run.use_artifact(artifact_or_name="name", aliases="<alias>")

アーティファクトを取得したら、そのアーティファクトを使用して (たとえば) モデルのパフォーマンスを評価できます。

例: モデルをトレーニングし、データセットをモデルの入力として追跡します

job_type = "train_model"

config = {
    "optimizer": "adam",
    "batch_size": 128,
    "epochs": 5,
    "validation_split": 0.1,
}

run = wandb.init(project=project, job_type=job_type, config=config)

version = "latest"
name = "{}:{}".format("{}_dataset".format(model_use_case_id), version)

artifact = run.use_artifact(name)

train_table = artifact.get("train_table")
x_train = train_table.get_column("x_train", convert_to="numpy")
y_train = train_table.get_column("y_train", convert_to="numpy")

# config 辞書 からの値を簡単にアクセスできるように変数に格納します
num_classes = 10
input_shape = (28, 28, 1)
loss = "categorical_crossentropy"
optimizer = run.config["optimizer"]
metrics = ["accuracy"]
batch_size = run.config["batch_size"]
epochs = run.config["epochs"]
validation_split = run.config["validation_split"]

# モデル アーキテクチャ を作成する
model = keras.Sequential(
    [
        layers.Input(shape=input_shape),
        layers.Conv2D(32, kernel_size=(3, 3), activation="relu"),
        layers.MaxPooling2D(pool_size=(2, 2)),
        layers.Conv2D(64, kernel_size=(3, 3), activation="relu"),
        layers.MaxPooling2D(pool_size=(2, 2)),
        layers.Flatten(),
        layers.Dropout(0.5),
        layers.Dense(num_classes, activation="softmax"),
    ]
)
model.compile(loss=loss, optimizer=optimizer, metrics=metrics)

# トレーニング データ のラベルを生成する
y_train = keras.utils.to_categorical(y_train, num_classes)

# トレーニング セット と テスト セット を作成する
x_t, x_v, y_t, y_v = train_test_split(x_train, y_train, test_size=0.33)

# モデルをトレーニングする
model.fit(
    x=x_t,
    y=y_t,
    batch_size=batch_size,
    epochs=epochs,
    validation_data=(x_v, y_v),
    callbacks=[WandbCallback(log_weights=True, log_evaluation=True)],
)

# モデルをローカルに保存する
path = "model.h5"
model.save(path)

path = "./model.h5"
registered_model_name = "MNIST-dev"
name = "mnist_model"

run.link_model(path=path, registered_model_name=registered_model_name, name=name)
run.finish()

3.12.8 - Document machine learning model

モデルカードに説明を追加して、モデルを文書化します。

登録済みモデルのモデルカードに説明を追加して、機械学習モデルの側面を文書化します。文書化する価値のあるトピックには、次のものがあります。

概要: モデルの概要。モデルの目的。モデルが使用する機械学習フレームワークなど。
トレーニングデータ: 使用したトレーニングデータ、トレーニングデータセットで実行された処理、そのデータの保存場所などを記述します。
アーキテクチャー: モデルアーキテクチャー、レイヤー、および特定の設計の選択に関する情報。
モデルのデシリアライズ: チームの誰かがモデルをメモリーにロードする方法に関する情報を提供します。
タスク: 機械学習モデルが実行するように設計されている特定のタイプのタスクまたは問題。モデルの意図された機能の分類です。
ライセンス: 機械学習モデルの使用に関連する法的条件と許可。モデルユーザーがモデルを利用できる法的枠組みを理解するのに役立ちます。
参考文献: 関連する研究論文、データセット、または外部リソースへの引用または参考文献。
デプロイメント: モデルのデプロイ方法と場所の詳細、およびワークフローオーケストレーションプラットフォームなどの他のエンタープライズシステムへのモデルの統合方法に関するガイダンス。

モデルカードに説明を追加する

https://wandb.ai/registry/model にある W&B Model Registry アプリケーションに移動します。
モデルカードを作成する登録済みモデルの名前の横にある [詳細を表示] を選択します。
[モデルカード] セクションに移動します。
[説明] フィールドに、機械学習モデルに関する情報を提供します。Markdown マークアップ言語を使用して、モデルカード内のテキストの書式を設定します。

たとえば、次の図は、Credit-card Default Prediction 登録済みモデルのモデルカードを示しています。

3.12.9 - Download a model version

W&B Python SDK でモデルをダウンロードする方法

W&B Python SDK を使用して、Model Registry にリンクしたモデル artifact をダウンロードします。

モデルを再構築し、デシリアライズして、操作できる形式にするための追加の Python 関数、API 呼び出しはお客様の責任で提供する必要があります。

W&B では、モデルをメモリにロードする方法に関する情報をモデルカードに記載することをお勧めします。詳細については、機械学習モデルのドキュメントページを参照してください。

<> 内の values はお客様ご自身のものに置き換えてください。

import wandb

# run を初期化する
run = wandb.init(project="<project>", entity="<entity>")

# モデルにアクセスしてダウンロードします。ダウンロードした artifact への path を返します
downloaded_model_path = run.use_model(name="<your-model-name>")

以下のいずれかの形式でモデル version を参照してください。

latest - 最新の latest エイリアスを使用して、最も新しくリンクされたモデル version を指定します。
v# - v0、v1、v2 などを使用して、Registered Model 内の特定の version を取得します
alias - ユーザーと Teams がモデル version に割り当てたカスタム alias を指定します

可能なパラメータと戻り値の型について詳しくは、API Reference ガイドのuse_model を参照してください。

例: ログに記録されたモデルをダウンロードして使用する

たとえば、次のコード snippet では、ユーザーが use_model API を呼び出しました。フェッチするモデル artifact の名前を指定し、version/alias も指定しました。次に、API から返された path を downloaded_model_path 変数に格納しました。

import wandb

entity = "luka"
project = "NLP_Experiments"
alias = "latest"  # モデル version のセマンティックなニックネームまたは識別子
model_artifact_name = "fine-tuned-model"

# run を初期化する
run = wandb.init()
# モデルにアクセスしてダウンロードします。ダウンロードした artifact への path を返します

downloaded_model_path = run.use_model(name=f"{entity/project/model_artifact_name}:{alias}")

2024 年に予定されている W&B Model Registry の廃止

次のタブは、まもなく廃止される Model Registry を使用してモデル artifact を消費する方法を示しています。

W&B Registry を使用して、モデル artifact を追跡、整理、消費します。詳細については、Registry docsを参照してください。

<> 内の values はお客様ご自身のものに置き換えてください。

import wandb
# run を初期化する
run = wandb.init(project="<project>", entity="<entity>")
# モデルにアクセスしてダウンロードします。ダウンロードした artifact への path を返します
downloaded_model_path = run.use_model(name="<your-model-name>")

以下のいずれかの形式でモデル version を参照してください。

latest - 最新の latest エイリアスを使用して、最も新しくリンクされたモデル version を指定します。
v# - v0、v1、v2 などを使用して、Registered Model 内の特定の version を取得します
alias - ユーザーと Teams がモデル version に割り当てたカスタム alias を指定します

可能なパラメータと戻り値の型について詳しくは、API Reference ガイドのuse_model を参照してください。

https://wandb.ai/registry/model にある Model Registry App に移動します。
ダウンロードするモデルが含まれている登録済みモデルの名前の横にある詳細を表示を選択します。
[Versions] セクションで、ダウンロードするモデル version の横にある [View] ボタンを選択します。
ファイル タブを選択します。
ダウンロードするモデルファイルの横にあるダウンロードボタンをクリックします。

3.12.10 - Create alerts and notifications

新しいモデルバージョンがモデルレジストリにリンクされたときに Slack 通知を受け取ります。

新しいモデルバージョンがモデルレジストリにリンクされたときに、Slack通知を受信します。

W&B モデルレジストリのアプリ（https://wandb.ai/registry/model）に移動します。
通知を受信したい Registered Model を選択します。
[Connect Slack] ボタンをクリックします。
OAuth ページに表示される手順に従って、Slack workspace で W&B を有効にします。

チームの Slack 通知を設定すると、通知を受信する Registered Model を選択できます。

チームの Slack 通知が設定されている場合、[Connect Slack] ボタンの代わりに、[New model version linked to…] と表示されるトグルが表示されます。

以下のスクリーンショットは、Slack 通知が設定されている FMNIST 分類器の Registered Model を示しています。

新しいモデルバージョンが FMNIST 分類器の Registered Model にリンクされるたびに、メッセージが接続された Slack チャンネルに自動的に投稿されます。

3.12.11 - Manage data governance and access control

モデルレジストリのロールベースアクセス制御（RBAC）を使用して、保護されたエイリアスを更新できるユーザーを制御します。

モデル開発パイプラインの主要な段階を表すために、 保護されたエイリアス を使用します。 モデルレジストリ管理者 のみが、保護されたエイリアスを追加、変更、または削除できます。モデルレジストリ管理者は、保護されたエイリアスを定義して使用できます。W&B は、管理者以外のユーザーがモデルバージョンから保護されたエイリアスを追加または削除することをブロックします。

Team 管理者または現在のレジストリ管理者のみが、レジストリ管理者のリストを管理できます。

たとえば、 staging と production を保護されたエイリアスとして設定するとします。Team のメンバーは誰でも新しいモデルバージョンを追加できます。ただし、管理者のみが staging または production エイリアスを追加できます。

アクセス制御の設定

次の手順では、Team のモデルレジストリのアクセス制御を設定する方法について説明します。

W&B モデルレジストリアプリ ( https://wandb.ai/registry/model ) に移動します。
ページの右上にある歯車ボタンを選択します。
[レジストリ管理者の管理] ボタンを選択します。
[メンバー] タブで、モデルバージョンから保護されたエイリアスを追加および削除するアクセス権を付与するユーザーを選択します。

保護されたエイリアスの追加

W&B モデルレジストリアプリ ( https://wandb.ai/registry/model ) に移動します。
ページの右上にある歯車ボタンを選択します。
[保護されたエイリアス] セクションまで下にスクロールします。
プラスアイコン ( + ) アイコンをクリックして、新しいエイリアスを追加します。

4 - Reports

機械学習プロジェクトのためのプロジェクト管理とコラボレーションツール

Try in Colab Try in W&B

W&B Reports の用途:

Runs の整理。
可視化の埋め込みと自動化。
学びの記述。
コラボレーターとの更新情報の共有（LaTeX zip ファイルまたは PDF として）。

次の画像は、トレーニングの過程で W&B にログされたメトリクスから作成されたレポートのセクションを示しています。

上記の画像が取得されたレポートはこちらからご覧ください。

仕組み

数回クリックするだけで、コラボレーティブなレポートを作成できます。

W&B App で W&B project workspace に移動します。
workspace の右上隅にある [Create report] (レポートの作成) ボタンをクリックします。

[Create Report] (レポートの作成) というタイトルのモーダルが表示されます。レポートに追加するグラフとパネルを選択します (グラフとパネルは後で追加または削除できます)。
[Create report] (レポートの作成) をクリックします。
レポートを希望の状態に編集します。
[Publish to project] (project に公開) をクリックします。
[Share] (共有) ボタンをクリックして、コラボレーターとレポートを共有します。

W&B Python SDK を使用してインタラクティブおよびプログラムでレポートを作成する方法の詳細については、レポートの作成ページを参照してください。

開始方法

ユースケースに応じて、次のリソースを調べて W&B Reports を開始してください。

W&B Reports の概要については、ビデオデモをご覧ください。
ライブレポートの例については、Reports gallery をご覧ください。
Programmatic Workspaces チュートリアルを試して、workspace の作成方法とカスタマイズ方法を学んでください。
W&B Fully Connected で厳選された Reports を読んでください。

推奨されるベストプラクティスとヒント

Experiments とログのベストプラクティスとヒントについては、Best Practices: Reports を参照してください。

4.1 - Create a report

W&B の App UI を使用するか、Weights & Biases SDK を使用してプログラムで W&B Report を作成します。

W&B App UI または W&B Python SDK を使用して、プログラムでインタラクティブに report を作成します。

例については、こちらの Google Colab をご覧ください。

W&B App で project の workspace に移動します。
workspace の右上隅にある [Create report] をクリックします。
モーダルが表示されます。最初に表示するグラフを選択します。グラフは report インターフェイスから後で追加または削除できます。
[Filter run sets] オプションを選択して、新しい run が report に追加されないようにします。このオプションはオン/オフを切り替えることができます。[Create report] をクリックすると、下書き report が report タブで使用できるようになり、作業を続けることができます。

W&B App で project の workspace に移動します。
project の [Reports] タブ (クリップボードの画像) を選択します。
report ページで [Create Report] ボタンを選択します。

wandb ライブラリを使用して、プログラムで report を作成します。

W&B SDK と Workspaces API をインストールします。
```
pip install wandb wandb-workspaces
```

次に、ワークスペースをインポートします。

import wandb
import wandb_workspaces.reports.v2 as wr

wandb_workspaces.reports.v2.Report を使用して report を作成します。Report Class Public API (wandb.apis.reports) を使用して report インスタンスを作成します。 project の名前を指定します。
```
report = wr.Report(project="report_standard")
```
report を保存します。Reports は、.save() メソッドを呼び出すまで W&B サーバーにアップロードされません。
```
report.save()
```

App UI またはプログラムで report をインタラクティブに編集する方法については、Edit a report を参照してください。

4.2 - Edit a report

App UI を使用してインタラクティブに、または W&B SDK を使用してプログラム的にレポートを編集します。

App UIまたは W&B SDKでプログラム的に、インタラクティブにレポートを編集できます。

Reports は ブロック で構成されています。ブロックはレポートの本文を構成します。これらのブロック内には、テキスト、画像、埋め込み可視化、実験からのプロットと run、およびパネルグリッドを追加できます。

パネルグリッド は、パネルと run sets を保持する特定のタイプのブロックです。Run sets は、W&B のプロジェクトに記録された runs の集合です。パネルは run set データの可視化です。

保存されたワークスペースビューを作成およびカスタマイズする方法のステップバイステップの例については、プログラムによるワークスペースのチュートリアルをご覧ください。

レポートをプログラムで編集する場合は、W&B Python SDKに加えて wandb-workspaces がインストールされていることを確認してください。

pip install wandb wandb-workspaces

プロットを追加する

各パネルグリッドには、run sets のセットとパネルのセットがあります。セクションの下部にある run sets は、グリッド内のパネルに表示されるデータを制御します。異なる runs のセットからデータを取得するグラフを追加する場合は、新しいパネルグリッドを作成します。

レポートにスラッシュ (/) を入力して、ドロップダウンメニューを表示します。[パネルを追加] を選択して、パネルを追加します。折れ線グラフ、散布図、平行座標グラフなど、W&B でサポートされている任意のパネルを追加できます。

SDKを使用して、プログラムでプロットをレポートに追加します。1つ以上のプロットまたはグラフオブジェクトのリストを PanelGrid Public API Classの panels パラメータに渡します。関連するPythonクラスを使用してプロットまたはグラフオブジェクトを作成します。

次の例は、折れ線グラフと散布図を作成する方法を示しています。

import wandb
import wandb_workspaces.reports.v2 as wr

report = wr.Report(
    project="report-editing",
    title="An amazing title",
    description="A descriptive description.",
)

blocks = [
    wr.PanelGrid(
        panels=[
            wr.LinePlot(x="time", y="velocity"),
            wr.ScatterPlot(x="time", y="acceleration"),
        ]
    )
]

report.blocks = blocks
report.save()

プログラムでレポートに追加できる利用可能なプロットとグラフの詳細については、wr.panels を参照してください。

Run sets を追加する

App UIまたは W&B SDKを使用して、プロジェクトからrun setsをインタラクティブに追加します。

レポートにスラッシュ (/) を入力して、ドロップダウンメニューを表示します。ドロップダウンから、[パネルグリッド] を選択します。これにより、レポートが作成されたプロジェクトから run set が自動的にインポートされます。

wr.Runset() および wr.PanelGrid クラスを使用して、プロジェクトから run sets を追加します。次の手順では、run set を追加する方法について説明します。

wr.Runset() オブジェクトインスタンスを作成します。プロジェクトの run sets が含まれるプロジェクトの名前を project パラメータに、プロジェクトを所有するエンティティを entity パラメータに指定します。
wr.PanelGrid() オブジェクトインスタンスを作成します。1つ以上の run set オブジェクトのリストを runsets パラメータに渡します。
1つ以上の wr.PanelGrid() オブジェクトインスタンスをリストに格納します。
パネルグリッドインスタンスのリストで report インスタンスブロック属性を更新します。

import wandb
import wandb_workspaces.reports.v2 as wr

report = wr.Report(
    project="report-editing",
    title="An amazing title",
    description="A descriptive description.",
)

panel_grids = wr.PanelGrid(
    runsets=[wr.RunSet(project="<project-name>", entity="<entity-name>")]
)

report.blocks = [panel_grids]
report.save()

オプションで、SDKへの1回の呼び出しで run sets とパネルを追加できます。

import wandb

report = wr.Report(
    project="report-editing",
    title="An amazing title",
    description="A descriptive description.",
)

panel_grids = wr.PanelGrid(
    panels=[
        wr.LinePlot(
            title="line title",
            x="x",
            y=["y"],
            range_x=[0, 100],
            range_y=[0, 100],
            log_x=True,
            log_y=True,
            title_x="x axis title",
            title_y="y axis title",
            ignore_outliers=True,
            groupby="hyperparam1",
            groupby_aggfunc="mean",
            groupby_rangefunc="minmax",
            smoothing_factor=0.5,
            smoothing_type="gaussian",
            smoothing_show_original=True,
            max_runs_to_show=10,
            plot_type="stacked-area",
            font_size="large",
            legend_position="west",
        ),
        wr.ScatterPlot(
            title="scatter title",
            x="y",
            y="y",
            # z='x',
            range_x=[0, 0.0005],
            range_y=[0, 0.0005],
            # range_z=[0,1],
            log_x=False,
            log_y=False,
            # log_z=True,
            running_ymin=True,
            running_ymean=True,
            running_ymax=True,
            font_size="small",
            regression=True,
        ),
    ],
    runsets=[wr.RunSet(project="<project-name>", entity="<entity-name>")],
)


report.blocks = [panel_grids]
report.save()

Run set を固定する

レポートは、プロジェクトからの最新のデータを表示するために、run sets を自動的に更新します。Run set を固定することで、レポート内の run set を保持できます。Run set を固定すると、ある時点でのレポート内の run set の状態が保持されます。

レポートの表示中に run set を固定するには、[フィルタ] ボタンの近くにあるパネルグリッド内の雪のアイコンをクリックします。

コードブロックを追加する

App UIまたは W&B SDKを使用して、インタラクティブにコードブロックをレポートに追加します。

レポートにスラッシュ (/) を入力して、ドロップダウンメニューを表示します。ドロップダウンから [コード] を選択します。

コードブロックの右側にあるプログラミング言語の名前を選択します。これにより、ドロップダウンが展開されます。ドロップダウンから、プログラミング言語の構文を選択します。Javascript、Python、CSS、JSON、HTML、Markdown、および YAML から選択できます。

wr.CodeBlock クラスを使用して、プログラムでコードブロックを作成します。それぞれ言語パラメータとコードパラメータに表示する言語の名前とコードを指定します。

たとえば、次の例は YAML ファイルのリストを示しています。

import wandb
import wandb_workspaces.reports.v2 as wr

report = wr.Report(project="report-editing")

report.blocks = [
    wr.CodeBlock(
        code=["this:", "- is", "- a", "cool:", "- yaml", "- file"], language="yaml"
    )
]

report.save()

これにより、次のようなコードブロックがレンダリングされます。

this:
- is
- a
cool:
- yaml
- file

次の例は、Pythonコードブロックを示しています。

report = wr.Report(project="report-editing")


report.blocks = [wr.CodeBlock(code=["Hello, World!"], language="python")]

report.save()

これにより、次のようなコードブロックがレンダリングされます。

Hello, World!

Markdown を追加する

App UIまたは W&B SDKを使用して、インタラクティブに Markdown をレポートに追加します。

レポートにスラッシュ (/) を入力して、ドロップダウンメニューを表示します。ドロップダウンから [Markdown] を選択します。

wandb.apis.reports.MarkdownBlock クラスを使用して、プログラムで Markdown ブロックを作成します。文字列を text パラメータに渡します。

import wandb
import wandb_workspaces.reports.v2 as wr

report = wr.Report(project="report-editing")

report.blocks = [
    wr.MarkdownBlock(text="Markdown cell with *italics* and **bold** and $e=mc^2$")
]

これにより、次のような Markdown ブロックがレンダリングされます。

HTML 要素を追加する

App UIまたは W&B SDKを使用して、インタラクティブに HTML 要素をレポートに追加します。

レポートにスラッシュ (/) を入力して、ドロップダウンメニューを表示します。ドロップダウンからテキストブロックのタイプを選択します。たとえば、H2 見出しブロックを作成するには、[見出し 2] オプションを選択します。

1つ以上のHTML要素のリストを wandb.apis.reports.blocks 属性に渡します。次の例は、H1、H2、および順序なしリストを作成する方法を示しています。

import wandb
import wandb_workspaces.reports.v2 as wr

report = wr.Report(project="report-editing")

report.blocks = [
    wr.H1(text="How Programmatic Reports work"),
    wr.H2(text="Heading 2"),
    wr.UnorderedList(items=["Bullet 1", "Bullet 2"]),
]

report.save()

これにより、HTML要素が次のようにレンダリングされます。

リッチメディアリンクを埋め込む

App UIまたは W&B SDKを使用して、レポート内にリッチメディアを埋め込みます。

URLをコピーしてレポートに貼り付け、レポート内にリッチメディアを埋め込みます。次のアニメーションは、Twitter、YouTube、および SoundCloud から URL をコピーして貼り付ける方法を示しています。

Twitter

ツイートリンクの URL をコピーしてレポートに貼り付け、レポート内でツイートを表示します。

Youtube

YouTube ビデオの URL リンクをコピーして貼り付け、ビデオをレポートに埋め込みます。

SoundCloud

SoundCloud リンクをコピーして貼り付け、オーディオファイルをレポートに埋め込みます。

1つ以上の埋め込みメディアオブジェクトのリストを wandb.apis.reports.blocks 属性に渡します。次の例は、ビデオと Twitter メディアをレポートに埋め込む方法を示しています。

import wandb
import wandb_workspaces.reports.v2 as wr

report = wr.Report(project="report-editing")

report.blocks = [
    wr.Video(url="https://www.youtube.com/embed/6riDJMI-Y8U"),
    wr.Twitter(
        embed_html='<blockquote class="twitter-tweet"><p lang="en" dir="ltr">The voice of an angel, truly. <a href="https://twitter.com/hashtag/MassEffect?src=hash&amp;ref_src=twsrc%5Etfw">#MassEffect</a> <a href="https://t.co/nMev97Uw7F">pic.twitter.com/nMev97Uw7F</a></p>&mdash; Mass Effect (@masseffect) <a href="https://twitter.com/masseffect/status/1428748886655569924?ref_src=twsrc%5Etfw">August 20, 2021</a></blockquote>\n'
    ),
]
report.save()

パネルグリッドを複製および削除する

再利用したいレイアウトがある場合は、パネルグリッドを選択してコピーして貼り付け、同じレポートに複製したり、別のレポートに貼り付けたりすることもできます。

右上隅にあるドラッグハンドルを選択して、パネルグリッドセクション全体を強調表示します。クリックしてドラッグして、パネルグリッド、テキスト、見出しなどのレポート内の領域を強調表示して選択します。

パネルグリッドを選択し、キーボードの delete を押してパネルグリッドを削除します。

ヘッダーを折りたたんで Reports を整理する

Report のヘッダーを折りたたんで、テキストブロック内のコンテンツを非表示にします。レポートが読み込まれると、展開されているヘッダーのみがコンテンツを表示します。レポートでヘッダーを折りたたむと、コンテンツを整理し、過剰なデータ読み込みを防ぐことができます。次の gif は、そのプロセスを示しています。

複数の次元にわたる関係を可視化する

複数の次元にわたる関係を効果的に可視化するには、カラーグラデーションを使用して変数の1つを表します。これにより、明瞭さが向上し、パターンが解釈しやすくなります。

カラーグラデーションで表す変数を選択します (例: ペナルティスコア、学習率など)。これにより、トレーニング時間 (x軸) にわたって、ペナルティ (色) が報酬/副作用 (y軸) とどのように相互作用するかをより明確に理解できます。
主要な傾向を強調表示します。特定の runs のグループにカーソルを合わせると、可視化でそれらが強調表示されます。

4.3 - Collaborate on reports

W&B Reports を同僚、共同作業者、およびチームと共有してコラボレーションできます。

レポートを保存したら、Shareボタンを選択して共同作業ができます。Editボタンを選択すると、レポートのドラフトコピーが作成されます。ドラフトレポートは自動保存されます。変更を共有レポートに公開するには、Save to reportを選択します。

編集の競合が発生した場合、警告通知が表示されます。これは、あなたと別の共同作業者が同じレポートを同時に編集した場合に発生する可能性があります。警告通知は、潜在的な編集の競合を解決するのに役立ちます。

Report sharing modal for a report in a 'Public' project

レポートにコメントする

レポートのパネルにコメントボタンをクリックすると、そのパネルに直接コメントを追加できます。

4.4 - Clone and export reports

W&B のレポートを PDF または LaTeX としてエクスポートします。

レポートのエクスポート

レポートをPDFまたは LaTeXとしてエクスポートします。レポート内で、ケバブアイコンを選択してドロップダウンメニューを展開します。[Download] を選択し、PDFまたは LaTeX出力形式を選択します。

レポートの複製

レポート内で、ケバブアイコンを選択してドロップダウンメニューを展開します。[Clone this report] ボタンを選択します。モーダルで、複製されたレポートの宛先を選択します。[Clone report] を選択します。

レポートを複製して、プロジェクトのテンプレートと形式を再利用します。チームのアカウント内でプロジェクトを複製すると、複製されたプロジェクトはチームに表示されます。個人のアカウント内で複製されたプロジェクトは、そのユーザーにのみ表示されます。

URLから Report をロードして、テンプレートとして使用します。

report = wr.Report(
    project=PROJECT, title="Quickstart Report", description="That was easy!"
)  # 作成
report.save()  # 保存
new_report = wr.Report.from_url(report.url)  # ロード

new_report.blocks内のコンテンツを編集します。

pg = wr.PanelGrid(
    runsets=[
        wr.Runset(ENTITY, PROJECT, "First Run Set"),
        wr.Runset(ENTITY, PROJECT, "Elephants Only!", query="elephant"),
    ],
    panels=[
        wr.LinePlot(x="Step", y=["val_acc"], smoothing_factor=0.8),
        wr.BarPlot(metrics=["acc"]),
        wr.MediaBrowser(media_keys="img", num_columns=1),
        wr.RunComparer(diff_only="split", layout={"w": 24, "h": 9}),
    ],
)
new_report.blocks = (
    report.blocks[:1] + [wr.H1("Panel Grid Example"), pg] + report.blocks[1:]
)
new_report.save()

4.5 - Embed a report

W&B Reports を Notion に直接埋め込んだり、HTML IFrame 要素で埋め込んだりできます。

HTML iframe 要素

レポートの右上隅にある [共有] ボタンを選択します。モーダルウィンドウが表示されます。モーダルウィンドウ内で、[埋め込みコードをコピー] を選択します。コピーされたコードは、インラインフレーム (IFrame) HTML 要素内にレンダリングされます。コピーしたコードを、選択した iframe HTML 要素に貼り付けます。

公開レポートのみが埋め込み時に表示可能です。

Confluence

次のアニメーションは、Confluence の IFrame セル内にレポートへの直接リンクを挿入する方法を示しています。

Notion

次のアニメーションは、Notion の Embed ブロックとレポートの埋め込みコードを使用して、レポートを Notion ドキュメントに挿入する方法を示しています。

Gradio

gr.HTML 要素を使用すると、Gradio Apps 内に W&B Reports を埋め込み、Hugging Face Spaces 内で使用できます。

import gradio as gr


def wandb_report(url):
    iframe = f'<iframe src={url} style="border:none;height:1024px;width:100%">'
    return gr.HTML(iframe)


with gr.Blocks() as demo:
    report = wandb_report(
        "https://wandb.ai/_scott/pytorch-sweeps-demo/reports/loss-22-10-07-16-00-17---VmlldzoyNzU2NzAx"
    )
demo.launch()

4.6 - Compare runs across projects

異なるプロジェクトのrunを、プロジェクトを跨いだReportsで比較します。

プロジェクトを跨いだrunの比較を示す動画（2分）をご覧ください。

クロスプロジェクトレポートを使用して、2 つの異なるプロジェクトの run を比較します。run セットテーブルのプロジェクトセレクターを使用して、プロジェクトを選択します。

セクション内の可視化は、最初のアクティブな runset から列をプルします。ラインプロットで探しているメトリクスが見つからない場合は、セクションで最初にチェックされた run セットにその列があることを確認してください。

この機能は、時系列ラインの履歴データをサポートしていますが、異なるプロジェクトから異なるサマリーメトリクスをプルすることはサポートしていません。つまり、別のプロジェクトでのみログに記録される列から散布図を作成することはできません。

2 つのプロジェクトの run を比較する必要があり、列が機能しない場合は、一方のプロジェクトの run にタグを追加し、それらの run をもう一方のプロジェクトに移動します。各プロジェクトの run のみをフィルタリングできますが、レポートには両方の run セットのすべての列が含まれます。

表示専用のレポートリンク

プライベートプロジェクトまたは Team プロジェクトにあるレポートへの表示専用リンクを共有します。

表示専用のレポートリンクは、URL に秘密のアクセストークンを追加するため、リンクを開いた人は誰でもページを表示できます。誰でもマジックリンクを使用して、最初にログインしなくてもレポートを表示できます。W&B Local プライベートクラウドインストールをご利用のお客様の場合、これらのリンクはファイアウォールの内側に保持されるため、プライベートインスタンスへのアクセス権と表示専用リンクへのアクセス権を持つチームのメンバーのみがレポートを表示できます。

表示専用モード では、ログインしていない人は、チャートを表示したり、マウスオーバーして値のツールチップを表示したり、チャートを拡大/縮小したり、テーブル内の列をスクロールしたりできます。表示モードの場合、新しいチャートや新しいテーブルクエリを作成してデータを探索することはできません。表示専用のレポートリンクの訪問者は、run をクリックして run ページに移動することはできません。また、表示専用の訪問者には共有モーダルは表示されませんが、代わりにホバーすると、次のようなツールチップが表示されます: 表示専用アクセスでは共有は利用できません。

マジックリンクは、「プライベート」および「Team」プロジェクトでのみ使用できます。「パブリック」（誰でも表示可能）または「オープン」（誰でもrunを表示および投稿可能）プロジェクトの場合、このプロジェクトはパブリックであり、すでにリンクを持っている人なら誰でも利用できるため、リンクをオン/オフにすることはできません。

グラフをレポートに送信する

ワークスペースからグラフをレポートに送信して、進捗状況を追跡します。レポートにコピーするチャートまたはパネルのドロップダウンメニューをクリックし、Add to report をクリックして宛先のレポートを選択します。

4.7 - Example reports

Reports ギャラリー

Notes: 素早い要約で可視化を追加

プロジェクトの開発で重要な観察、将来の作業のためのアイデア、または達成されたマイルストーンを記録します。 Report 内のすべての実験 run は、パラメータ、メトリクス、ログ、およびコードにリンクされるため、作業の完全なコンテキストを保存できます。

テキストを書き留め、関連するグラフを取り込んで、洞察を説明します。

トレーニング時間の比較を共有する方法の例については、Inception-ResNet-V2 が遅すぎる場合の対処法 W&B Report を参照してください。

参照と将来のインタラクションのために、複雑なコードベースから最良の例を保存します。 Lyft dataset からの LIDAR ポイントクラウドを可視化し、3D バウンディングボックスで注釈を付ける方法の例については、LIDAR ポイントクラウド W&B Report を参照してください。

Collaboration: 同僚と学びを共有

プロジェクトの開始方法を説明し、これまでに観察した内容を共有し、最新の学びをまとめます。同僚は、 Report の任意の panel または最後にコメントを使用して、提案をしたり、詳細を議論したりできます。

同僚が自分で探索し、追加の洞察を得て、次のステップをより適切に計画できるように、動的な settings を含めます。この例では、3 種類の experiments を個別に可視化、比較、または平均化できます。

ベンチマークの最初の run と観察を共有する方法の例については、SafeLife ベンチマーク experiments W&B Report を参照してください。

スライダーと構成可能なメディア panel を使用して、 model の結果または training の進捗状況を紹介します。スライダー付きの W&B Report の例については、かわいい動物とポストモダンのスタイル転送: マルチドメイン画像合成のための StarGAN v2 report をご覧ください。

Work log: 試したことを追跡し、次のステップを計画

プロジェクトを進める際に、 experiments、学び、注意点、および次のステップに関する考えを書き留め、すべてを 1 か所に整理します。これにより、スクリプト以外の重要な部分をすべて「文書化」できます。学びを report する方法の例については、Who Is Them? Text Disambiguation With Transformers W&B Report を参照してください。

model がどのように、そしてなぜ開発されたのかを理解するために、あなたと他の人が後で参照できるプロジェクトのストーリーを語ります。学びを report する方法については、運転席からの眺め W&B Report を参照してください。

OpenAI Robotics チームが W&B Reports を使用して大規模な machine learning プロジェクトをどのように実行したかを調査するために W&B Reports がどのように使用されたかの例については、W&B Reports を使用したエンドツーエンドの Learning Dexterityを参照してください。

5 - Automations

This feature requires a Pro or Enterprise plan.

このページでは、W&B の automations について説明します。W&B のイベント（artifact Artifacts のバージョンが作成されたときなど）に基づいて、自動モデルテストやデプロイメントなどのワークフローステップをトリガーするオートメーションの作成を行います。

たとえば、新しいバージョンが作成されたときに Slack チャンネルに投稿したり、production エイリアスが Artifacts に追加されたときに webhook を実行して自動テストをトリガーしたりできます。

Overview

Automation は、特定の event が Registry または Project で発生したときに実行できます。

Registry 内の Artifacts の場合、Automation の実行を次のように設定できます。

新しい Artifacts バージョンがコレクションにリンクされたとき。たとえば、新しい候補 Models のテストと検証のワークフローをトリガーします。
エイリアスが Artifacts バージョンに追加されたとき。たとえば、エイリアスが Model バージョンに追加されたときに、デプロイメントワークフローをトリガーします。

Project 内の Artifacts の場合、Automation の実行を次のように設定できます。

新しいバージョンが Artifacts に追加されたとき。たとえば、Dataset Artifacts の新しいバージョンが特定のコレクションに追加されたときに、Training ジョブを開始します。
エイリアスが Artifacts バージョンに追加されたとき。たとえば、エイリアス「redaction」が Dataset Artifacts に追加されたときに、PII 編集ワークフローをトリガーします。

詳細については、オートメーションイベントとスコープを参照してください。

オートメーションを作成するには、次の手順を実行します。

必要に応じて、アクセストークン、パスワード、または機密性の高い設定の詳細など、Automation で必要な機密文字列の secrets を設定します。Secrets は、Team Settings で定義されます。Secrets は、webhook Automation で最も一般的に使用され、認証情報またはトークンをプレーンテキストで公開したり、webhook のペイロードにハードコーディングしたりすることなく、webhook の外部サービスに安全に渡すために使用されます。
W&B が Slack に投稿したり、ユーザーに代わって webhook を実行したりすることを承認するように、webhook または Slack 通知を設定します。単一の Automation アクション（webhook または Slack 通知）を複数の Automation で使用できます。これらのアクションは、Team Settings で定義されます。
Project または Registry で、Automation を作成します。
1. 監視する event （新しい Artifacts バージョンが追加されたときなど）を定義します。
2. イベントが発生したときに実行するアクション（Slack チャンネルへの投稿または webhook の実行）を定義します。Webhook の場合は、アクセストークンに使用する secret、および必要に応じてペイロードとともに送信する secret を指定します。

次のステップ

5.1 - Create an automation

This feature requires a Pro or Enterprise plan.

このページでは、W&B のオートメーションの作成と管理の概要について説明します。詳細な手順については、Slack オートメーションの作成またはWebhook オートメーションの作成を参照してください。

オートメーションに関するチュートリアルをお探しですか？

モデルの評価とデプロイメントのために Github Action を自動的にトリガーする方法をご覧ください。
モデルを Sagemaker エンドポイントに自動的にデプロイするデモビデオをご覧ください。
オートメーションを紹介するビデオシリーズをご覧ください。

要件

Team admin は、チームの Projects のオートメーション、および Webhook、シークレット、Slack 接続などのオートメーションのコンポーネントを作成および管理できます。Team settingsを参照してください。
Registry automation を作成するには、Registry へのアクセス権が必要です。Registry アクセスの設定を参照してください。
Slack オートメーションを作成するには、選択した Slack インスタンスと channel に投稿する権限が必要です。

オートメーションの作成

Project または Registry の [Automations] タブからオートメーションを作成します。大まかに言って、オートメーションを作成するには、次の手順に従います。

必要に応じて、アクセス・トークン、パスワード、SSH キーなど、オートメーションに必要な機密文字列ごとにW&B シークレットを作成します。シークレットは [Team Settings] で定義します。シークレットは、Webhook オートメーションで最も一般的に使用されます。
W&B が Slack に投稿したり、代わりに Webhook を実行したりできるように、Webhook または Slack 通知を設定して W&B を承認します。1 つのオートメーションアクション（Webhook または Slack 通知）を複数のオートメーションで使用できます。これらのアクションは [Team Settings] で定義します。
Project または Registry で、監視するイベントと実行するアクション（Slack への投稿や Webhook の実行など）を指定するオートメーションを作成します。Webhook オートメーションを作成する場合は、送信するペイロードを設定します。

詳細については、以下を参照してください。

オートメーションの表示と管理

Project または Registry の [Automations] タブからオートメーションを表示および管理します。

オートメーションの詳細を表示するには、その名前をクリックします。
オートメーションを編集するには、そのアクション ... メニューをクリックし、[Edit automation] をクリックします。
オートメーションを削除するには、そのアクション ... メニューをクリックし、[Delete automation] をクリックします。

次のステップ

5.1.1 - Create a Slack automation

This feature requires a Pro or Enterprise plan.

このページでは、Slack オートメーションの作成方法について説明します。Webhook オートメーションを作成するには、代わりに Webhook オートメーションの作成を参照してください。

大まかに言うと、Slack オートメーションを作成するには、次の手順を実行します。

Slack インテグレーションの追加。これにより、Weights & Biases が Slack インスタンスと channel に投稿することを承認します。
Slack オートメーションの作成。これにより、監視する event と投稿先の channel が定義されます。

Slack に接続する

Team の管理者は、Team に Slack の送信先を追加できます。

Weights & Biases にログインして、Team Settings ページに移動します。
[Slack channel integrations] セクションで、[Connect Slack] をクリックして新しい Slack インスタンスを追加します。既存の Slack インスタンスに channel を追加するには、[New integration] をクリックします。

必要に応じて、ブラウザで Slack にサインインします。プロンプトが表示されたら、選択した Slack channel に投稿する権限を Weights & Biases に付与します。ページを読んでから、[Search for a channel] をクリックして、channel 名を入力します。リストから channel を選択し、[Allow] をクリックします。
Slack で、選択した channel に移動します。[Your Slack handle] added an integration to this channel: Weights & Biases のような投稿が表示された場合、インテグレーションは正しく構成されています。

これで、構成した Slack channel に通知するオートメーションの作成ができます。

Slack 接続の表示と管理

Team の管理者は、Team の Slack インスタンスと channel を表示および管理できます。

Weights & Biases にログインして、[Team Settings] に移動します。
[Slack channel integrations] セクションで、各 Slack の送信先を表示します。
送信先を削除するには、ゴミ箱アイコンをクリックします。

オートメーションの作成

Weights & Biases Team を Slack に接続したら、[Registry] または [Project] を選択し、次の手順に従って Slack channel に通知するオートメーションを作成します。

Registry の管理者は、その Registry でオートメーションを作成できます。

Weights & Biases にログインします。
Registry の名前をクリックして、詳細を表示します。
Registry を対象範囲とするオートメーションを作成するには、[Automations] タブをクリックし、[Create automation] をクリックします。Registry を対象範囲とするオートメーションは、そのすべてのコレクション (将来作成されるコレクションを含む) に自動的に適用されます。

Registry 内の特定のコレクションのみを対象範囲とするオートメーションを作成するには、コレクションのアクション ... メニューをクリックし、[Create automation] をクリックします。または、コレクションを表示しているときに、コレクションの詳細ページの [Automations] セクションにある [Create automation] ボタンを使用して、コレクションのオートメーションを作成します。
監視する Event を選択します。

表示される追加フィールドに入力します。これは、イベントによって異なります。たとえば、[An artifact alias is added] を選択した場合は、[Alias regex] を指定する必要があります。

[Next step] をクリックします。
Slack インテグレーションを所有する Team を選択します。
[Action type] を [Slack notification] に設定します。Slack channel を選択し、[Next step] をクリックします。
オートメーションの名前を入力します。必要に応じて、説明を入力します。
[Create automation] をクリックします。

Weights & Biases の管理者は、Project でオートメーションを作成できます。

Weights & Biases にログインします。
Project ページに移動し、[Automations] タブをクリックします。
[Create automation] をクリックします。
監視する Event を選択します。

表示される追加フィールドに入力します。これは、イベントによって異なります。たとえば、[An artifact alias is added] を選択した場合は、[Alias regex] を指定する必要があります。

[Next step] をクリックします。
Slack インテグレーションを所有する Team を選択します。
[Action type] を [Slack notification] に設定します。Slack channel を選択し、[Next step] をクリックします。
オートメーションの名前を入力します。必要に応じて、説明を入力します。
[Create automation] をクリックします。

オートメーションの表示と管理

Registry のオートメーションは、Registry の [Automations] タブから管理します。
コレクションのオートメーションは、コレクションの詳細ページの [Automations] セクションから管理します。

これらのページのいずれかから、Registry の管理者は既存のオートメーションを管理できます。

オートメーションの詳細を表示するには、その名前をクリックします。
オートメーションを編集するには、アクション ... メニューをクリックし、[Edit automation] をクリックします。
オートメーションを削除するには、アクション ... メニューをクリックし、[Delete automation] をクリックします。確認が必要です。

Weights & Biases の管理者は、Project の [Automations] タブから Project のオートメーションを表示および管理できます。

オートメーションの詳細を表示するには、その名前をクリックします。
オートメーションを編集するには、アクション ... メニューをクリックし、[Edit automation] をクリックします。
オートメーションを削除するには、アクション ... メニューをクリックし、[Delete automation] をクリックします。確認が必要です。

5.1.2 - Create a webhook automation

This feature requires a Pro or Enterprise plan.

このページでは、webhook オートメーションの作成方法について説明します。Slack オートメーションを作成するには、代わりに Slack オートメーションの作成を参照してください。

大まかに言うと、webhook オートメーションを作成するには、次の手順を実行します。

必要に応じて、アクセストークン、パスワード、SSH キーなど、オートメーションに必要な機密文字列ごとに W&B シークレットを作成します。シークレットは、 Team の設定で定義されます。
webhook を作成して、エンドポイントと認証の詳細を定義し、インテグレーションに必要なシークレットへのアクセスを許可します。
オートメーションを作成して、監視するイベントと、Weights & Biases が送信するペイロードを定義します。ペイロードに必要なシークレットへのオートメーションアクセスを許可します。

webhook を作成する

Team の管理者は、 Team に webhook を追加できます。

webhook に Bearer トークンが必要な場合、またはそのペイロードに機密文字列が必要な場合は、webhook を作成する前にそれを含むシークレットを作成してください。webhook に対して設定できるアクセストークンとその他のシークレットは、それぞれ最大 1 つです。webhook の認証および認可の要件は、webhook のサービスによって決まります。

Weights & Biases にログインし、Team の Settings ページに移動します。
Webhooks セクションで、New webhook をクリックします。
webhook の名前を入力します。
webhook のエンドポイント URL を入力します。
webhook に Bearer トークンが必要な場合は、Access token をそれを含むシークレットに設定します。webhook オートメーションを使用すると、Weights & Biases は Authorization: Bearer HTTP ヘッダーをアクセストークンに設定し、${ACCESS_TOKEN} ペイロード変数でトークンにアクセスできます。
webhook のペイロードにパスワードまたはその他の機密文字列が必要な場合は、Secret をそれを含むシークレットに設定します。webhook を使用するオートメーションを設定すると、名前の先頭に $ を付けることで、ペイロード変数としてシークレットにアクセスできます。

webhook のアクセストークンがシークレットに保存されている場合は、次の手順も完了して、シークレットをアクセストークンとして指定する必要があります。
Weights & Biases がエンドポイントに接続して認証できることを確認するには：
1. 必要に応じて、テストするペイロードを指定します。ペイロードで webhook がアクセスできるシークレットを参照するには、名前の先頭に $ を付けます。このペイロードはテスト専用であり、保存されません。オートメーションのペイロードは、オートメーションを作成するときに設定します。シークレットとアクセストークンが POST リクエストのどこに指定されているかを確認するには、webhook のトラブルシューティングを参照してください。
2. Test をクリックします。Weights & Biases は、設定した資格情報を使用して webhook のエンドポイントへの接続を試みます。ペイロードを指定した場合は、Weights & Biases がそれを送信します。
テストが成功しない場合は、webhook の設定を確認して、もう一度お試しください。必要に応じて、webhook のトラブルシューティングを参照してください。

これで、webhook を使用するオートメーションを作成できます。

オートメーションを作成する

webhook を設定したら、Registry または Project を選択し、次の手順に従って webhook をトリガーするオートメーションを作成します。

Registry 管理者は、その Registry でオートメーションを作成できます。Registry オートメーションは、今後追加されるものを含め、Registry 内のすべてのコレクションに適用されます。

Weights & Biases にログインします。
Registry の名前をクリックして詳細を表示します。
Registry の範囲に設定されたオートメーションを作成するには、Automations タブをクリックし、Create automation をクリックします。Registry の範囲に設定されたオートメーションは、そのすべてのコレクション（今後作成されるものを含む）に自動的に適用されます。

Registry 内の特定のコレクションのみを範囲とするオートメーションを作成するには、コレクションのアクション ... メニューをクリックし、Create automation をクリックします。または、コレクションを表示しながら、コレクションの詳細ページの Automations セクションにある Create automation ボタンを使用して、コレクションのオートメーションを作成します。
監視する Event を選択します。イベントに応じて表示される追加フィールドに入力します。たとえば、An artifact alias is added を選択した場合は、Alias regex を指定する必要があります。Next step をクリックします。
webhook を所有する Team を選択します。
Action type を Webhooks に設定し、使用する webhook を選択します。
webhook のアクセストークンを設定した場合は、${ACCESS_TOKEN} ペイロード変数でトークンにアクセスできます。webhook のシークレットを設定した場合は、名前の先頭に $ を付けることで、ペイロードでアクセスできます。webhook の要件は、webhook のサービスによって決まります。
Next step をクリックします。
オートメーションの名前を入力します。必要に応じて、説明を入力します。Create automation をクリックします。

Weights & Biases 管理者は、Project でオートメーションを作成できます。

Weights & Biases にログインし、Project ページに移動します。
サイドバーで、Automations をクリックします。
Create automation をクリックします。
監視する Event を選択します。
1. イベントに応じて表示される追加フィールドに入力します。たとえば、An artifact alias is added を選択した場合は、Alias regex を指定する必要があります。
2. 必要に応じて、コレクションフィルターを指定します。それ以外の場合、オートメーションは、今後追加されるものを含め、Project 内のすべてのコレクションに適用されます。
Next step をクリックします。
webhook を所有する Team を選択します。
Action type を Webhooks に設定し、使用する webhook を選択します。
webhook にペイロードが必要な場合は、ペイロードを作成して Payload フィールドに貼り付けます。webhook のアクセストークンを設定した場合は、${ACCESS_TOKEN} ペイロード変数でトークンにアクセスできます。webhook のシークレットを設定した場合は、名前の先頭に $ を付けることで、ペイロードでアクセスできます。webhook の要件は、webhook のサービスによって決まります。
Next step をクリックします。
オートメーションの名前を入力します。必要に応じて、説明を入力します。Create automation をクリックします。

オートメーションの表示と管理

Registry のオートメーションは、Registry の Automations タブから管理します。
コレクションのオートメーションは、コレクションの詳細ページの Automations セクションから管理します。

これらのページのいずれかから、Registry 管理者は既存のオートメーションを管理できます。

オートメーションの詳細を表示するには、その名前をクリックします。
オートメーションを編集するには、アクション ... メニューをクリックし、Edit automation をクリックします。
オートメーションを削除するには、アクション ... メニューをクリックし、Delete automation をクリックします。確認が必要です。

Weights & Biases 管理者は、Project の Automations タブから Project のオートメーションを表示および管理できます。

オートメーションの詳細を表示するには、その名前をクリックします。
オートメーションを編集するには、アクション ... メニューをクリックし、Edit automation をクリックします。
オートメーションを削除するには、アクション ... メニューをクリックし、Delete automation をクリックします。確認が必要です。

ペイロードリファレンス

これらのセクションを使用して、webhook のペイロードを作成します。webhook とそのペイロードのテストの詳細については、webhook のトラブルシューティングを参照してください。

ペイロード変数

このセクションでは、webhook のペイロードの作成に使用できる変数について説明します。

変数	詳細
`${project_name}`	アクションをトリガーした変更を所有する Project の名前。
`${entity_name}`	アクションをトリガーした変更を所有する Entity または Team の名前。
`${event_type}`	アクションをトリガーしたイベントのタイプ。
`${event_author}`	アクションをトリガーしたユーザー。
`${artifact_collection_name}`	Artifact バージョンがリンクされている Artifact コレクションの名前。
`${artifact_metadata.<KEY>}`	アクションをトリガーした Artifact バージョンからの任意のトップレベルメタデータキーの値。`<KEY>` をトップレベルメタデータキーの名前に置き換えます。トップレベルメタデータキーのみが、webhook のペイロードで使用できます。
`${artifact_version}`	アクションをトリガーした Artifact バージョンの `Wandb.Artifact` 表現。
`${artifact_version_string}`	アクションをトリガーした Artifact バージョンの `string` 表現。
`${ACCESS_TOKEN}`	アクセストークンが設定されている場合は、webhook で設定されたアクセストークンの値。アクセストークンは、`Authorization: Bearer` HTTP ヘッダーで自動的に渡されます。
`${SECRET_NAME}`	設定されている場合は、webhook で設定されたシークレットの値。`SECRET_NAME` をシークレットの名前に置き換えます。

ペイロードの例

このセクションには、一般的なユースケースの webhook ペイロードの例が含まれています。この例では、ペイロード変数の使用方法を示します。

アクセストークンに、GHA ワークフローをトリガーするために必要な権限セットがあることを確認してください。詳細については、GitHub ドキュメントを参照してください。

Weights & Biases からリポジトリディスパッチを送信して、GitHub アクションをトリガーします。たとえば、on キーのトリガーとしてリポジトリディスパッチを受け入れる GitHub ワークフローファイルがあるとします。

on:
repository_dispatch:
  types: BUILD_AND_DEPLOY

リポジトリのペイロードは、次のようになります。

{
  "event_type": "BUILD_AND_DEPLOY",
  "client_payload": 
  {
    "event_author": "${event_author}",
    "artifact_version": "${artifact_version}",
    "artifact_version_string": "${artifact_version_string}",
    "artifact_collection_name": "${artifact_collection_name}",
    "project_name": "${project_name}",
    "entity_name": "${entity_name}"
    }
}

webhook ペイロードの event_type キーは、GitHub ワークフロー YAML ファイルの types フィールドと一致する必要があります。

レンダリングされたテンプレート文字列の内容と配置は、オートメーションが設定されているイベントまたはモデルバージョンによって異なります。${event_type} は、LINK_ARTIFACT または ADD_ARTIFACT_ALIAS のいずれかとしてレンダリングされます。以下に、マッピングの例を示します。

${event_type} --> "LINK_ARTIFACT" or "ADD_ARTIFACT_ALIAS"
${event_author} --> "<wandb-user>"
${artifact_version} --> "wandb-artifact://_id/QXJ0aWZhY3Q6NTE3ODg5ODg3""
${artifact_version_string} --> "<entity>/model-registry/<registered_model_name>:<alias>"
${artifact_collection_name} --> "<registered_model_name>"
${project_name} --> "model-registry"
${entity_name} --> "<entity>"

テンプレート文字列を使用して、Weights & Biases から GitHub Actions およびその他のツールにコンテキストを動的に渡します。これらのツールが Python スクリプトを呼び出すことができる場合は、Weights & Biases API を使用して、登録されたモデル Artifacts を利用できます。

リポジトリディスパッチの詳細については、GitHub Marketplace の公式ドキュメントを参照してください。
モデル評価の Webhook オートメーションおよびモデルデプロイメントの Webhook オートメーションのビデオをご覧ください。これらのビデオでは、モデル評価およびデプロイメントのオートメーションを作成する方法を説明しています。
Weights & Biases レポートを確認してください。このレポートでは、モデル CI に Github Actions webhook オートメーションを使用する方法を示しています。この GitHub リポジトリをチェックして、Modal Labs webhook でモデル CI を作成する方法を学んでください。

このペイロードの例は、webhook を使用して Teams チャンネルに通知する方法を示しています。

{
"@type": "MessageCard",
"@context": "http://schema.org/extensions",
"summary": "New Notification",
"sections": [
  {
    "activityTitle": "Notification from WANDB",
    "text": "This is an example message sent via Teams webhook.",
    "facts": [
      {
        "name": "Author",
        "value": "${event_author}"
      },
      {
        "name": "Event Type",
        "value": "${event_type}"
      }
    ],
    "markdown": true
  }
]
}

テンプレート文字列を使用して、実行時に Weights & Biases データをペイロードに挿入できます（上記の Teams の例に示すように）。

このセクションは、履歴を目的として提供されています。現在 webhook を使用して Slack と統合している場合は、[新しい Slack インテグレーション]({{ relref “#create-a-slack-automation”}}) を使用するように構成を更新することをお勧めします。

Slack API ドキュメントで強調表示されている手順に従って、Slack アプリを設定し、受信 webhook インテグレーションを追加します。Bot User OAuth Token で指定されたシークレットが、Weights & Biases webhook のアクセストークンであることを確認してください。

以下は、ペイロードの例です。

{
    "text": "New alert from WANDB!",
"blocks": [
    {
            "type": "section",
        "text": {
            "type": "mrkdwn",
            "text": "Registry event: ${event_type}"
        }
    },
        {
            "type":"section",
            "text": {
            "type": "mrkdwn",
            "text": "New version: ${artifact_version_string}"
        }
        },
        {
        "type": "divider"
    },
        {
            "type": "section",
        "text": {
            "type": "mrkdwn",
            "text": "Author: ${event_author}"
        }
        }
    ]
}

webhook のトラブルシューティング

Weights & Biases App UI を使用してインタラクティブに、または Bash スクリプトを使用してプログラムで webhook のトラブルシューティングを行います。新しい webhook を作成するとき、または既存の webhook を編集するときに、webhook のトラブルシューティングを行うことができます。

Team 管理者は、Weights & Biases App UI を使用して webhook をインタラクティブにテストできます。

Weights & Biases Team の Settings ページに移動します。
Webhooks セクションまでスクロールします。
webhook の名前の横にある水平方向の 3 つのドキュメント（ミートボールアイコン）をクリックします。
Test を選択します。
表示される UI パネルから、表示されるフィールドに POST リクエストを貼り付けます。
Test webhook をクリックします。Weights & Biases App UI 内で、Weights & Biases はエンドポイントからの応答を投稿します。

デモンストレーションについては、ビデオ Weights & Biases での Webhook のテストをご覧ください。

このシェルスクリプトは、トリガーされたときに Weights & Biases が webhook オートメーションに送信するリクエストと同様の POST リクエストを生成する 1 つの方法を示しています。

以下のコードをコピーしてシェルスクリプトに貼り付け、webhook のトラブルシューティングを行います。次の独自の値（バリュー）を指定します。

ACCESS_TOKEN
SECRET
PAYLOAD
API_ENDPOINT

webhook_test.sh

5.2 - Automation events and scopes

This feature requires a Pro or Enterprise plan.

オートメーションは、特定のイベントが project または registry のスコープ内で発生したときに開始できます。 project の スコープ は、[スコープの技術的な定義を挿入] を指します。このページでは、各スコープ内でオートメーションをトリガーできるイベントについて説明します。

オートメーションの詳細については、オートメーションの概要またはオートメーションの作成を参照してください。

Registry

このセクションでは、Registry 内のオートメーションのスコープとイベントについて説明します。

https://wandb.ai/registry/ で Registry App に移動します。
registry の名前をクリックし、Automations タブでオートメーションを表示および作成します。

オートメーションの作成の詳細について説明します。

スコープ

次のスコープで Registry オートメーションを作成できます。

Registry レベル: オートメーションは、特定の registry 内のコレクション (今後追加されるコレクションを含む) で発生するイベントを監視します。
コレクションレベル: 特定の registry 内の単一のコレクション。

イベント

Registry オートメーションは、次のイベントを監視できます。

新しい Artifact をコレクションにリンクする: registry に追加された新しい Models または Datasets をテストおよび検証します。
新しいエイリアスを Artifact のバージョンに追加する: 新しい Artifact バージョンに特定のエイリアスが適用されたときに、ワークフローの特定のステップをトリガーします。たとえば、production エイリアスが適用されたときに model をデプロイします。

Project

このセクションでは、project 内のオートメーションのスコープとイベントについて説明します。

W&B App ( https://wandb.ai/<team>/<project-name> ) で W&B project に移動します。
Automations タブでオートメーションを表示および作成します。

オートメーションの作成の詳細について説明します。

スコープ

次のスコープで project オートメーションを作成できます。

Project レベル: オートメーションは、 project 内のコレクションで発生するイベントを監視します。
コレクションレベル: 指定したフィルターに一致する project 内のすべてのコレクション。

イベント

project オートメーションは、次のイベントを監視できます。

Artifact の新しいバージョンがコレクションに作成される: Artifact の各バージョンに定期的なアクションを適用します。コレクションの指定はオプションです。たとえば、新しい dataset Artifact バージョンが作成されたときに training ジョブを開始します。
Artifact エイリアスが追加される: project またはコレクション内の新しい Artifact バージョンに特定のエイリアスが適用されたときに、ワークフローの特定のステップをトリガーします。たとえば、Artifact に test-set-quality-check エイリアスが適用されたときに、一連のダウンストリームプロセッシングステップを実行します。

W&B Core

1 - Artifacts

ユースケース

artifact を作成する

artifact をダウンロードする

次のステップ

1.1 - Create an artifact

Artifacts を構築する方法

1. wandb.Artifact() で Artifacts Python オブジェクトを作成する

2. 1つ以上のファイルを Artifacts に追加する

3. Artifacts を W&B サーバー に保存する

Artifacts にファイルを追加する

単一のファイルを追加する

複数のファイルを追加する

URI 参照を追加する

並列 run から Artifacts にファイルを追加する

1.2 - Download and use artifacts

W&B に保存されている Artifacts のダウンロードと使用

Artifacts の部分的なダウンロード

別のプロジェクトの Artifacts の使用

Artifacts の同時構築と使用

1.3 - Update an artifact

1.4 - Create an artifact alias

1.5 - Create an artifact version

新しいアーティファクトのバージョンをゼロから作成する

単一のrun

分散されたrun

Run 1:

Run 2:

Run 3

既存のバージョンから新しいアーティファクトのバージョンを作成する

1.6 - Track external files

run の外で Artifacts をログ記録する

W&B の外で Artifacts を追跡する

Amazon S3 / GCS / Azure Blob Storage 参照

参照 Artifact をダウンロードする

統合する

ファイルシステム 参照

1.7 - Manage data

1.7.1 - Delete an artifact

アーティファクト バージョンを削除する

エイリアスを持つ複数のアーティファクト バージョンを削除する

特定のエイリアスを持つ複数のアーティファクト バージョンを削除する

エイリアスを持たないアーティファクトのすべてのバージョンを削除する

アーティファクト コレクションを削除する

W&B のホスト方法に基づいてガベージコレクションを有効にする方法

1.7.2 - Manage artifact data retention

自動生成された Artifacts

TTL ポリシーを編集および設定できるユーザーを定義する

TTL ポリシーを作成する

アーティファクトを作成するときに TTL ポリシーを設定する

アーティファクトを作成した後で TTL ポリシーを設定または編集する

チームのデフォルト TTL ポリシーを設定する

run の外部で TTL ポリシーを設定する

TTL ポリシーを無効化する

TTL ポリシーを表示する

1.7.3 - Manage artifact storage and memory allocation

ローカル artifact キャッシュのクリーンアップ

1.8 - Explore artifact graphs

リネージ

Artifacts のリネージの検索

リネージグラフのナビゲート

Artifacts クラスター

API を使用してリネージを追跡する

次のステップ

1.9 - Artifact data privacy and compliance

1.10 - Tutorial: Create, track, and use a dataset artifact

1. W&Bにログイン

2. runを初期化

3. artifact オブジェクトを作成

データセットを artifact に追加

4. データセットをログに記録

5. artifact をダウンロードして使用する

2 - Secrets

Add a secret（シークレットの追加）

Rotate a secret（シークレットのローテーション）

Delete a secret（シークレットの削除）

Manage access to secrets（シークレットへのアクセス管理）

3 - Registry

基本を学ぶ

1. `wandb.Artifact()` で Artifacts Python オブジェクトを作成する

3. Artifacts を W&B サーバーに保存する

ファイルシステム参照

アーティファクトバージョンを削除する

エイリアスを持つ複数のアーティファクトバージョンを削除する

特定のエイリアスを持つ複数のアーティファクトバージョンを削除する

アーティファクトコレクションを削除する

ユーザーまたは Teams の削除

個人のアカウントから Artifact をログに記録する

チーム Entity からログに記録する

W&B App UI でレジストリのパスを確認する

自動生成されたコードをコピーして貼り付けます

レジストリアイテムの検索

MongoDB スタイルのクエリでレジストリアイテムをクエリする

レジストリへの可視性を制限する

カスタムレジストリを作成する

カスタムアクセス制御

チームの可視性から組織の可視性へ