TRC와 함께한 MaxText 후기

TPU v4-64에서 Gemma3 파인튜닝을 위해서 Keras3 대신 MaxText를 새롭게 사용해본 경험을 공유해보고자 한다.

GCP에서 TPU Queued Resources를 생성한다.

이후 worker 0 (GCP에서 나오는 TPU ip address)에 ssh를 연결해준다.
(앞으로 특별한 말이 없다면 tpu node worker 0에서 실행한다)

maxtext를 git에서 clone 해준다.

git clone https://github.com/AI-Hypercomputer/maxtext && cd maxtext

이후에는 공식문서의 내용에 따라준다.

ZONE=<zone>
gcloud config set compute/zone $ZONE

ssh-keygen -f ~/.ssh/google_compute_engine
TPU_PREFIX=$YOUR_TPU_NAME
python3 multihost_runner.py --TPU_PREFIX=$TPU_PREFIX --COMMAND="bash setup.sh" --INTERNAL_IP=true

MaxText는 기본적으로 Gemma 1-3 Series를 지원한다.

Gemma3를 사용하기 위해서는 이 파일을 참고하면 된다.

Kaggle에 올라와 있는 Flax모델을 MaxText를 위해서 Checkpoint Conversion을 진행해줘야 한다. Kagglehub를 이용해서 Gemma3 Flax 체크포인트 파일을 받아준다.

import kagglehub
path = kagglehub.model_download("google/gemma-3/flax/gemma3-4b-it")
print("Path to model files:", path)

모델은 ~/.cache/kagglehub/models/google/gemma-3/flax/gemma3-4b-it/1 폴더에 다운로드가 된다.

이후 convert_gemma3_chkpt.py를 이용해 Conversion해준다.

다만, TPU multihost 환경이기에 cpu 플랫폼으로 제한해야 한다. (아니면, 그냥 다른 호스트에서 해도 된다)

JAX_PLATFORMS=cpu python3 -m MaxText.convert_gemma3_chkpt --base_model_path ~/.cache/kagglehub/models/google/gemma-3/flax/gemma3-4b-it/1/gemma3-4b-it/ --maxtext_model_path gs://<bucket-name-1> --model_size 4b

마지막으로 MaxText/configs/base.yml를 수정해야 한다.

model_name: "gemma3-4b"
base_output_directory: "gs://<bucket-name-2>"
load_parameters_path: "gs://<bucket-name-1>/0/items"
tokenizer_path: "google/gemma-3-4b-it"
dataset_type: hf
hf_path: '<hf-dataset-path>'

이제 시작해보자

RUN_NAME="<unique-run-name>"
python3 multihost_runner.py --TPU_PREFIX=$TPU_PREFIX --COMMAND="bash preflight.sh PLATFORM=GCE && numactl --membind 0 --cpunodebind=0 python3 -m MaxText.train MaxText/configs/base.yml run_name=$RUN_NAME" --INTERNAL_IP=true

... (작성중)

Read more

RTX5090 체험 후기 (하) | Gcube 지큐브

이 글은 저번 체험에 대한 후기와 이어진다. RTX5090을 사용해 Gemma3를 튜닝했었는데, 그 결과가 소실된 것을 Gcube 측에서 안타까워 하셔 체험 기회를 한번 더 제공해주셨다. 그래서 RTX5090을 3일 더 사용해볼 수 있게 되었다! 이전과 동일한 환경(Axolotl, torch On docker: ghcr.io/deveworld/gpu-dev)에서 튜닝을 진행했다. 물론 이전과 다른 점은

By Dev. World

RTX5090 체험 후기 (상) | Gcube 지큐브

최근 gcube RTX 5090 체험 테스트에 선정되어 무상으로 체험해보게 되었다. 그 논란의 물량도 얼마 없어 돈이 있어도 구하기 어려운 RTX 5090을, 심지어 무료로 말이다! 게다가 5090뿐만 아니라 4090, 5080도 함께 제공받았다. 모두 현시점에서 가장 성능이 좋은 소비자용 그래픽카드 3종류이다. 메모리가 작고 대역폭 병목을 제외한 성능만 본다면 현존 최고 성능이다. 이들

By Dev. World