Visualize and analyze tables

W&B Tables を可視化、分析します。

W&B Tables をカスタマイズして、 機械学習 モデルの性能に関する質問に答えたり、 データを分析したりできます。

インタラクティブにデータを探索して、以下を実現します。

  • モデル、 エポック、 個々のサンプル間で、 変更を正確に比較する
  • データにおけるより高レベルのパターンを理解する
  • 可視化 サンプルでインサイトを捉え、 伝達する

2つのテーブルを表示する方法

マージされたビュー または 並べて表示するビュー で2つのテーブルを比較します。 例えば、 下の図はMNIST データのテーブル比較を示しています。

左: 1 トレーニング エポック後の間違い、 右: 5 エポック後の間違い

次の手順に従って、 2つのテーブルを比較します。

  1. W&B App で Project に移動します。
  2. 左側の パネル で Artifacts アイコンを選択します。
  3. Artifacts バージョンを選択します。

次の図では、 5 エポック (インタラクティブな例はこちら) の後、 MNIST 検証データに対するモデルの 予測 を示します。

[予測] をクリックしてテーブルを表示します
  1. サイドバー で比較する2番目の Artifacts バージョンにマウスを合わせ、 表示されたら [比較] をクリックします。 例えば、 下の図では、 トレーニング の5 エポック後に同じモデルによって行われたMNIST の 予測 と比較するために、 「v4」 というラベルの バージョン を選択します。
1 エポック (ここに表示) 対 5 エポック (v4) の トレーニング 後にモデルの 予測 を比較する準備

マージされたビュー

最初は、 両方のテーブルがマージされて表示されます。 最初に選択されたテーブルのインデックスは0で青色で強調表示され、 2番目のテーブルのインデックスは1で黄色で強調表示されます。マージされたテーブルのライブ例はこちら をご覧ください。

マージされたビューでは、 数値列はデフォルトでヒストグラムとして表示されます

マージされたビューからは、 以下が可能です。

  • 結合キーを選択する: 左上のドロップダウンを使用して、 2つのテーブルの結合キーとして使用する列を設定します。 通常、 これは データセット 内の特定の例のファイル名や、 生成されたサンプル のインクリメント インデックスなど、 各行の一意の識別子です。 現在、 任意の 列を選択できますが、 判読できないテーブルやクエリの速度低下が発生する可能性があることに注意してください。
  • 結合する代わりに連結する: このドロップダウンで [すべてのテーブルを連結する] を選択すると、 列全体を結合する代わりに、 両方のテーブルから すべての行を結合 して、 より大きなテーブルにすることができます。
  • 各テーブルを明示的に参照する: フィルター式で0、 1、 * を使用して、 1つまたは両方のテーブル インスタンス の列を明示的に指定します。
  • 詳細な数値の差をヒストグラムとして可視化する: 任意のセルの値を一目で比較できます。

並べて表示するビュー

2つのテーブルを並べて表示するには、 最初のドロップダウンを [テーブルをマージ: テーブル] から [リスト: テーブル] に変更し、 それぞれ [ページ サイズ] を更新します。 ここで、 最初に選択したテーブルは左側にあり、 2番目のテーブルは右側にあります。 また、 [垂直] チェックボックスをクリックして、 これらのテーブルを垂直方向に比較することもできます。

並べて表示するビューでは、 テーブルの行は互いに独立しています。
  • テーブルを一目で比較する: 任意の操作 (ソート、 フィルタリング、 グループ化) を両方のテーブルにまとめて適用し、 変更や違いをすばやく見つけます。 例えば、 推測でグループ化された不正な 予測 、 全体で最も難しいネガティブ、 真のラベル ごとの信頼度スコア分布などを表示します。
  • 2つのテーブルを個別に探索する: スクロールして、 目的の側面/行に焦点を当てます。

Artifacts を比較する

時間の経過とともにテーブルを比較 したり、 モデル バリアント を比較 したりすることもできます。

時間の経過とともにテーブルを比較する

トレーニング の意味のあるステップごとに Artifacts にテーブルを記録して、 トレーニング 時間中のモデルの性能を分析します。 例えば、 すべての検証ステップの終了時、 トレーニング の50 エポックごと、 または パイプライン に適した頻度でテーブルを記録できます。 並べて表示するビューを使用して、 モデル 予測 の変化を可視化します。

ラベルごとに、 モデルは1 (L) よりも5 (R) トレーニング エポック後に間違いが少なくなります

トレーニング 時間中の 予測 の可視化に関するより詳細なウォークスルーについては、 この Report およびこのインタラクティブな ノートブック の例 を参照してください。

モデル バリアント 全体でテーブルを比較する

2つの異なるモデルに対して同じステップで記録された2つの Artifacts バージョンを比較して、 異なる 設定 (ハイパーパラメーター 、 ベース アーキテクチャー など) 全体でモデルの性能を分析します。

例えば、 baseline と新しいモデル バリアント である 2x_layers_2x_lr の間で 予測 を比較します。この場合、 最初の畳み込みレイヤーは32から64に、 2番目のレイヤーは128から256に、 学習率は0.001から0.002に倍増します。このライブ例 から、 並べて表示するビューを使用して、 1 (左側のタブ) 対 5 トレーニング エポック (右側のタブ) 後の不正な 予測 に絞り込みます。

1 エポック後、 性能は混合しています: 精度は一部のクラスでは向上し、 他のクラスでは悪化します。
5 エポック後、 [ダブル] バリアント は ベースライン に追いついています。

ビューを保存

run Workspace 、 Project Workspace 、 または Report で操作するテーブルは、 ビューの状態を自動的に保存します。 テーブル操作を適用して ブラウザ を閉じると、 次にテーブルに移動したときに、 テーブルには最後に表示された 設定 が保持されます。

特定の状態で Workspace からテーブルを保存するには、 W&B Report にエクスポートします。 テーブルを Report にエクスポートするには、 次の手順を実行します。

  1. Workspace 可視化 パネル の右上隅にあるケバブ アイコン (3つの垂直ドット) を選択します。
  2. [パネルを共有] または [レポートに追加] を選択します。
[パネルを共有] を選択すると新しい Report が作成され、 [レポートに追加] を選択すると既存の Report に追加できます。

これらの Reports は、 W&B Tables のさまざまな ユースケース を示しています。