ML
TRC와 함께한 MaxText 후기
TPU v4-64에서 Gemma3 파인튜닝을 위해서 Keras3 대신 MaxText를 새롭게 사용해본 경험을 공유해보고자 한다. GCP에서 TPU Queued Resources를 생성한다. 이후 worker 0 (GCP에서 나오는 TPU ip address)에 ssh를 연결해준다. (앞으로 특별한 말이 없다면 tpu node worker 0에서 실행한다) maxtext를 git에서 clone 해준다. git clone https://github.com/AI-Hypercomputer/maxtext &