Keras

8 minute read

Try in Colab

Keras 콜백

W&B는 wandb v0.13.4부터 사용할 수 있는 Keras용 콜백 세 가지를 제공합니다. 기존 WandbCallback은 아래로 스크롤하세요.

WandbMetricsLogger : Experiment 추적에 이 콜백을 사용하세요. 트레이닝 및 검증 메트릭과 시스템 메트릭을 Weights & Biases에 기록합니다.
WandbModelCheckpoint : 모델 체크포인트를 Weight and Biases Artifacts에 기록하려면 이 콜백을 사용하세요.
WandbEvalCallback: 이 기본 콜백은 모델 예측값을 대화형 시각화를 위해 Weights and Biases Tables에 기록합니다.

이 새로운 콜백은 다음과 같은 특징이 있습니다.

Keras 디자인 철학을 준수합니다.
모든 작업에 단일 콜백(WandbCallback)을 사용하는 데 따른 인지적 부담을 줄입니다.
Keras 사용자가 콜백을 서브클래싱하여 특정 유스 케이스를 지원하도록 수정하기 쉽습니다.

`WandbMetricsLogger`로 Experiments 추적

Try in Colab

WandbMetricsLogger는 on_epoch_end, on_batch_end 등과 같은 콜백 메서드가 인수로 사용하는 Keras의 logs 사전을 자동으로 기록합니다.

다음 항목을 추적합니다.

model.compile에 정의된 트레이닝 및 검증 메트릭.
시스템(CPU/GPU/TPU) 메트릭.
학습률(고정값 및 학습률 스케줄러 모두).

import wandb
from wandb.integration.keras import WandbMetricsLogger

# 새로운 W&B run 초기화
wandb.init(config={"bs": 12})

# WandbMetricsLogger를 model.fit에 전달
model.fit(
    X_train, y_train, validation_data=(X_test, y_test), callbacks=[WandbMetricsLogger()]
)

`WandbMetricsLogger` 참조

파라미터	설명
`log_freq`	(`epoch`, `batch` 또는 `int`): `epoch`인 경우 각 에포크가 끝날 때 메트릭을 기록합니다. `batch`인 경우 각 배치가 끝날 때 메트릭을 기록합니다. `int`인 경우 해당 배치 수만큼 끝날 때 메트릭을 기록합니다. 기본값은 `epoch`입니다.
`initial_global_step`	(int): 학습률 스케줄러가 사용되고 일부 initial_epoch에서 트레이닝을 재개할 때 학습률을 올바르게 기록하려면 이 인수를 사용하세요. 이는 step_size * initial_step으로 계산할 수 있습니다. 기본값은 0입니다.

`WandbModelCheckpoint`를 사용하여 모델 체크포인트

Try in Colab

WandbModelCheckpoint 콜백을 사용하여 Keras 모델(SavedModel 형식) 또는 모델 가중치를 주기적으로 저장하고 모델 버전 관리를 위해 wandb.Artifact로 W&B에 업로드합니다.

이 콜백은 tf.keras.callbacks.ModelCheckpoint에서 서브클래싱되므로 체크포인트 로직은 상위 콜백에서 처리합니다.

이 콜백은 다음을 저장합니다.

모니터에 따라 최상의 성능을 달성한 모델.
성능에 관계없이 모든 에포크가 끝날 때의 모델.
에포크가 끝날 때 또는 고정된 수의 트레이닝 배치 후의 모델.
모델 가중치만 또는 전체 모델.
SavedModel 형식 또는 .h5 형식의 모델.

WandbMetricsLogger와 함께 이 콜백을 사용하세요.

import wandb
from wandb.integration.keras import WandbMetricsLogger, WandbModelCheckpoint

# 새로운 W&B run 초기화
wandb.init(config={"bs": 12})

# WandbModelCheckpoint를 model.fit에 전달
model.fit(
    X_train,
    y_train,
    validation_data=(X_test, y_test),
    callbacks=[
        WandbMetricsLogger(),
        WandbModelCheckpoint("models"),
    ],
)

`WandbModelCheckpoint` 참조

파라미터	설명
`filepath`	(str): 모드 파일을 저장할 경로입니다.
`monitor`	(str): 모니터링할 메트릭 이름입니다.
`verbose`	(int): 상세 모드, 0 또는 1. 모드 0은 자동이고 모드 1은 콜백이 작업을 수행할 때 메시지를 표시합니다.
`save_best_only`	(Boolean): `save_best_only=True`인 경우 `monitor` 및 `mode` 속성으로 정의된 대로 최신 모델 또는 가장 적합하다고 간주되는 모델만 저장합니다.
`save_weights_only`	(Boolean): True인 경우 모델의 가중치만 저장합니다.
`mode`	(`auto`, `min` 또는 `max`): `val_acc`의 경우 `max`로 설정하고 `val_loss`의 경우 `min`으로 설정하는 식입니다.
`save_freq`	(“epoch” 또는 int): ‘epoch’를 사용하는 경우 콜백은 각 에포크 후에 모델을 저장합니다. 정수를 사용하는 경우 콜백은 이만큼의 배치가 끝날 때 모델을 저장합니다. `val_acc` 또는 `val_loss`와 같은 검증 메트릭을 모니터링할 때 이러한 메트릭은 에포크가 끝날 때만 사용할 수 있으므로 `save_freq`를 “epoch"로 설정해야 합니다.
`options`	(str): `save_weights_only`가 true인 경우 선택적 `tf.train.CheckpointOptions` 오브젝트이거나 `save_weights_only`가 false인 경우 선택적 `tf.saved_model.SaveOptions` 오브젝트입니다.
`initial_value_threshold`	(float): 모니터링할 메트릭의 부동 소수점 초기 “최상” 값입니다.

N 에포크 후에 체크포인트 기록

기본적으로(save_freq="epoch") 콜백은 각 에포크 후에 체크포인트를 만들고 아티팩트로 업로드합니다. 특정 수의 배치 후에 체크포인트를 만들려면 save_freq를 정수로 설정합니다. N 에포크 후에 체크포인트를 만들려면 train 데이터 로더의 카디널리티를 계산하여 save_freq에 전달합니다.

WandbModelCheckpoint(
    filepath="models/",
    save_freq=int((trainloader.cardinality()*N).numpy())
)

TPU 아키텍처에서 체크포인트를 효율적으로 기록

TPU에서 체크포인트를 만드는 동안 UnimplementedError: File system scheme '[local]' not implemented 오류 메시지가 발생할 수 있습니다. 이는 모델 디렉토리(filepath)가 클라우드 스토리지 버킷 경로(gs://bucket-name/...)를 사용해야 하고 이 버킷에 TPU 서버에서 엑세스할 수 있어야 하기 때문에 발생합니다. 그러나 체크포인트를 만드는 데 로컬 경로를 사용할 수 있으며, 이는 Artifacts로 업로드됩니다.

checkpoint_options = tf.saved_model.SaveOptions(experimental_io_device="/job:localhost")

WandbModelCheckpoint(
    filepath="models/,
    options=checkpoint_options,
)

`WandbEvalCallback`을 사용하여 모델 예측 시각화

Try in Colab

WandbEvalCallback은 주로 모델 예측을 위해, 그리고 부차적으로 데이터셋 시각화를 위해 Keras 콜백을 빌드하는 데 사용되는 추상 기본 클래스입니다.

이 추상 콜백은 데이터셋 및 작업과 관련하여 독립적입니다. 이를 사용하려면 이 기본 WandbEvalCallback 콜백 클래스에서 상속하고 add_ground_truth 및 add_model_prediction 메서드를 구현합니다.

WandbEvalCallback은 다음과 같은 메서드를 제공하는 유틸리티 클래스입니다.

데이터 및 예측 wandb.Table 인스턴스를 만듭니다.
데이터 및 예측 Tables를 wandb.Artifact로 기록합니다.
on_train_begin에 데이터 테이블을 기록합니다.
on_epoch_end에 예측 테이블을 기록합니다.

다음 예제에서는 이미지 분류 작업에 WandbClfEvalCallback을 사용합니다. 이 예제 콜백은 검증 데이터(data_table)를 W&B에 기록하고 추론을 수행한 다음 모든 에포크가 끝날 때 예측(pred_table)을 W&B에 기록합니다.

import wandb
from wandb.integration.keras import WandbMetricsLogger, WandbEvalCallback


# 모델 예측 시각화 콜백 구현
class WandbClfEvalCallback(WandbEvalCallback):
    def __init__(
        self, validation_data, data_table_columns, pred_table_columns, num_samples=100
    ):
        super().__init__(data_table_columns, pred_table_columns)

        self.x = validation_data[0]
        self.y = validation_data[1]

    def add_ground_truth(self, logs=None):
        for idx, (image, label) in enumerate(zip(self.x, self.y)):
            self.data_table.add_data(idx, wandb.Image(image), label)

    def add_model_predictions(self, epoch, logs=None):
        preds = self.model.predict(self.x, verbose=0)
        preds = tf.argmax(preds, axis=-1)

        table_idxs = self.data_table_ref.get_index()

        for idx in table_idxs:
            pred = preds[idx]
            self.pred_table.add_data(
                epoch,
                self.data_table_ref.data[idx][0],
                self.data_table_ref.data[idx][1],
                self.data_table_ref.data[idx][2],
                pred,
            )


# ...

# 새로운 W&B run 초기화
wandb.init(config={"hyper": "parameter"})

# 콜백을 Model.fit에 추가
model.fit(
    X_train,
    y_train,
    validation_data=(X_test, y_test),
    callbacks=[
        WandbMetricsLogger(),
        WandbClfEvalCallback(
            validation_data=(X_test, y_test),
            data_table_columns=["idx", "image", "label"],
            pred_table_columns=["epoch", "idx", "image", "label", "pred"],
        ),
    ],
)

W&B Artifact 페이지에는 Workspace 페이지가 아닌 Table 로그가 기본적으로 포함되어 있습니다.

`WandbEvalCallback` 참조

파라미터	설명
`data_table_columns`	(list) `data_table`의 열 이름 목록입니다.
`pred_table_columns`	(list) `pred_table`의 열 이름 목록입니다.

메모리 공간 세부 정보

on_train_begin 메서드가 호출되면 data_table을 W&B에 기록합니다. W&B Artifact로 업로드되면 data_table_ref 클래스 변수를 사용하여 엑세스할 수 있는 이 테이블에 대한 참조가 생성됩니다. data_table_ref는 self.data_table_ref[idx][n]과 같이 인덱싱할 수 있는 2D 목록이며, 여기서 idx는 행 번호이고 n은 열 번호입니다. 아래 예에서 사용법을 살펴보겠습니다.

콜백 사용자 정의

on_train_begin 또는 on_epoch_end 메서드를 재정의하여 더 세분화된 제어를 할 수 있습니다. N 배치 후에 샘플을 기록하려면 on_train_batch_end 메서드를 구현하면 됩니다.

💡 WandbEvalCallback을 상속하여 모델 예측 시각화를 위한 콜백을 구현하고 있으며 설명이 필요하거나 수정해야 할 사항이 있는 경우 문제를 열어 알려주시기 바랍니다.

`WandbCallback` [기존]

W&B 라이브러리 WandbCallback 클래스를 사용하여 model.fit에서 추적된 모든 메트릭 및 손실 값을 자동으로 저장합니다.

import wandb
from wandb.integration.keras import WandbCallback

wandb.init(config={"hyper": "parameter"})

...  # Keras에서 모델을 설정하는 코드

# 콜백을 model.fit에 전달
model.fit(
    X_train, y_train, validation_data=(X_test, y_test), callbacks=[WandbCallback()]
)

짧은 비디오 1분 이내에 Keras 및 Weights & Biases 시작하기를 시청할 수 있습니다.

자세한 내용은 비디오 Weights & Biases를 Keras와 통합하기를 시청하세요. Colab Jupyter Notebook을 검토할 수 있습니다.

스크립트(예: Fashion MNIST 예제) 및 생성되는 W&B 대시보드를 보려면 예제 리포지토리를 참조하세요.

WandbCallback 클래스는 모니터링할 메트릭 지정, 가중치 및 그레이디언트 추적, training_data 및 validation_data에 대한 예측 기록 등 다양한 로깅 구성 옵션을 지원합니다.

자세한 내용은 keras.WandbCallback에 대한 참조 문서를 확인하세요.

WandbCallback

Keras에서 수집한 모든 메트릭(손실 및 keras_model.compile()에 전달된 항목)에서 기록 데이터를 자동으로 기록합니다.
monitor 및 mode 속성으로 정의된 대로 “최상” 트레이닝 단계와 연결된 run에 대한 요약 메트릭을 설정합니다. 기본값은 최소 val_loss가 있는 에포크입니다. WandbCallback은 기본적으로 최상의 epoch와 연결된 모델을 저장합니다.
선택적으로 그레이디언트 및 파라미터 히스토그램을 기록합니다.
선택적으로 시각화를 위해 트레이닝 및 검증 데이터를 wandb에 저장합니다.

`WandbCallback` 참조

인수
`monitor`	(str) 모니터링할 메트릭 이름입니다. 기본값은 `val_loss`입니다.
`mode`	(str) {`auto`, `min`, `max`} 중 하나입니다. `min` - 모니터가 최소화될 때 모델 저장 `max` - 모니터가 최대화될 때 모델 저장 `auto` - 모델을 저장할 시기를 추측하려고 시도합니다(기본값).
`save_model`	True - 모니터가 이전의 모든 에포크보다 나을 때 모델 저장 False - 모델을 저장하지 않음
`save_graph`	(boolean) True인 경우 모델 그래프를 wandb에 저장합니다(기본값은 True).
`save_weights_only`	(boolean) True인 경우 모델의 가중치(`model.save_weights(filepath)`)만 저장합니다. 그렇지 않으면 전체 모델을 저장합니다.
`log_weights`	(boolean) True인 경우 모델 레이어의 가중치 히스토그램을 저장합니다.
`log_gradients`	(boolean) True인 경우 트레이닝 그레이디언트의 히스토그램을 기록합니다.
`training_data`	(tuple) `model.fit`에 전달된 것과 동일한 형식 `(X,y)`입니다. 그레이디언트 계산에 필요합니다. `log_gradients`가 `True`인 경우 필수입니다.
`validation_data`	(tuple) `model.fit`에 전달된 것과 동일한 형식 `(X,y)`입니다. wandb가 시각화할 데이터 세트입니다. 이 필드를 설정하면 모든 에포크에서 wandb는 적은 수의 예측을 수행하고 나중에 시각화할 수 있도록 결과를 저장합니다.
`generator`	(generator) wandb가 시각화할 검증 데이터를 반환하는 생성기입니다. 이 생성기는 튜플 `(X,y)`를 반환해야 합니다. wandb가 특정 데이터 예제를 시각화하려면 `validate_data` 또는 생성기를 설정해야 합니다.
`validation_steps`	(int) `validation_data`가 생성기인 경우 전체 검증 세트에 대해 생성기를 실행할 단계 수입니다.
`labels`	(list) wandb로 데이터를 시각화하는 경우 이 레이블 목록은 여러 클래스로 분류기를 빌드하는 경우 숫자 출력을 이해하기 쉬운 문자열로 변환합니다. 이진 분류기의 경우 두 개의 레이블 목록([`false 레이블`, `true 레이블`])을 전달할 수 있습니다. `validate_data` 및 `generator`가 모두 false인 경우 아무 작업도 수행하지 않습니다.
`predictions`	(int) 각 에포크에서 시각화를 위해 수행할 예측 수이며, 최대값은 100입니다.
`input_type`	(string) 시각화를 돕기 위한 모델 입력 유형입니다. (`image`, `images`, `segmentation_mask`) 중 하나일 수 있습니다.
`output_type`	(string) 시각화를 돕기 위한 모델 출력 유형입니다. (`image`, `images`, `segmentation_mask`) 중 하나일 수 있습니다.
`log_evaluation`	(boolean) True인 경우 각 에포크에서 검증 데이터와 모델의 예측을 포함하는 Table을 저장합니다. 자세한 내용은 `validation_indexes`, `validation_row_processor` 및 `output_row_processor`를 참조하세요.
`class_colors`	([float, float, float]) 입력 또는 출력이 분할 마스크인 경우 각 클래스에 대한 rgb 튜플(범위 0-1)을 포함하는 배열입니다.
`log_batch_frequency`	(integer) None인 경우 콜백은 모든 에포크를 기록합니다. 정수로 설정된 경우 콜백은 `log_batch_frequency` 배치마다 트레이닝 메트릭을 기록합니다.
`log_best_prefix`	(string) None인 경우 추가 요약 메트릭을 저장하지 않습니다. 문자열로 설정된 경우 모니터링된 메트릭과 에포크 앞에 접두사를 붙이고 결과를 요약 메트릭으로 저장합니다.
`validation_indexes`	([wandb.data_types._TableLinkMixin]) 각 검증 예제와 연결할 인덱스 키의 정렬된 목록입니다. `log_evaluation`이 True이고 `validation_indexes`를 제공하는 경우 검증 데이터 Table을 만들지 않습니다. 대신 각 예측을 `TableLinkMixin`으로 표시된 행과 연결합니다. 행 키 목록을 가져오려면 `Table.get_index()`를 사용하세요.
`validation_row_processor`	(Callable) 검증 데이터에 적용할 함수로, 일반적으로 데이터를 시각화하는 데 사용됩니다. 이 함수는 `ndx`(int)와 `row`(dict)를 받습니다. 모델에 입력이 하나 있는 경우 `row["input"]`에 행에 대한 입력 데이터가 포함됩니다. 그렇지 않으면 입력 슬롯의 이름이 포함됩니다. 적합 함수가 대상이 하나인 경우 `row["target"]`에 행에 대한 대상 데이터가 포함됩니다. 그렇지 않으면 출력 슬롯의 이름이 포함됩니다. 예를 들어 입력 데이터가 단일 배열인 경우 데이터를 이미지로 시각화하려면 `lambda ndx, row: {"img": wandb.Image(row["input"])}`를 프로세서로 제공합니다. `log_evaluation`이 False이거나 `validation_indexes`가 있는 경우 무시됩니다.
`output_row_processor`	(Callable) `validation_row_processor`와 동일하지만 모델의 출력에 적용됩니다. `row["output"]`에 모델 출력 결과가 포함됩니다.
`infer_missing_processors`	(Boolean) 누락된 경우 `validation_row_processor` 및 `output_row_processor`를 유추할지 여부를 결정합니다. 기본값은 True입니다. `labels`를 제공하는 경우 W&B는 적절한 분류 유형 프로세서를 유추하려고 시도합니다.
`log_evaluation_frequency`	(int) 평가 결과를 기록하는 빈도를 결정합니다. 기본값은 트레이닝이 끝날 때만 기록하는 `0`입니다. 모든 에포크를 기록하려면 1로 설정하고, 다른 모든 에포크를 기록하려면 2로 설정하는 식입니다. `log_evaluation`이 False인 경우 아무런 효과가 없습니다.

자주 묻는 질문

`wandb`로 `Keras` 멀티프로세싱을 어떻게 사용합니까?

use_multiprocessing=True를 설정하면 다음 오류가 발생할 수 있습니다.

Error("You must call wandb.init() before wandb.config.batch_size")

해결 방법:

Sequence 클래스 구성에서 wandb.init(group='...')를 추가합니다.
main에서 if __name__ == "__main__":를 사용하고 있는지 확인하고 스크립트 로직의 나머지 부분을 그 안에 넣습니다.

[i18n] feedback_title

[i18n] feedback_question

Glad to hear it! Please tell us how we can improve.

Sorry to hear that. Please tell us how we can improve.

최종 수정 April 3, 2025

페이지 편집 문서에 이슈 생성 전체 섹션 프린트

Keras

Keras 콜백

WandbMetricsLogger로 Experiments 추적

WandbMetricsLogger 참조

WandbModelCheckpoint를 사용하여 모델 체크포인트

WandbModelCheckpoint 참조

N 에포크 후에 체크포인트 기록

TPU 아키텍처에서 체크포인트를 효율적으로 기록

WandbEvalCallback을 사용하여 모델 예측 시각화

WandbEvalCallback 참조

메모리 공간 세부 정보

콜백 사용자 정의

WandbCallback [기존]

WandbCallback 참조

자주 묻는 질문

wandb로 Keras 멀티프로세싱을 어떻게 사용합니까?

[i18n] feedback_title

`WandbMetricsLogger`로 Experiments 추적

`WandbMetricsLogger` 참조

`WandbModelCheckpoint`를 사용하여 모델 체크포인트

`WandbModelCheckpoint` 참조

`WandbEvalCallback`을 사용하여 모델 예측 시각화

`WandbEvalCallback` 참조

`WandbCallback` [기존]

`WandbCallback` 참조

`wandb`로 `Keras` 멀티프로세싱을 어떻게 사용합니까?