RTX5090 체험 후기 (하) | Gcube 지큐브

Dev. World

30 5월 2025 — 3 min read

이 글은 저번 체험에 대한 후기와 이어진다.

RTX5090을 사용해 Gemma3를 튜닝했었는데, 그 결과가 소실된 것을 Gcube 측에서 안타까워 하셔 체험 기회를 한번 더 제공해주셨다.

그래서 RTX5090을 3일 더 사용해볼 수 있게 되었다!

이전과 동일한 환경(Axolotl, torch On docker: ghcr.io/deveworld/gpu-dev)에서 튜닝을 진행했다.

물론 이전과 다른 점은 자체 데이터셋을 이용했다는 점이다.

AIHUB에서 제공하는 여러 한국어 코퍼스를 묶어 1차 데이터셋을 만든 후 google의 Gemini Flash 2.5 Preview를 이용해서 영어로 번역했다.

이후 원본 한국어와 영어 번역본을 합쳐 한국어-영어 데이터셋을 만들었다.

샘플링하여 확인해본 결과 AIHUB의 자체 한-영 병렬 데이터셋보다는 품질이 높았다.

물론 그렇게 고품질은 아니다. 더 정제할 시간이 부족하기도 하고 이정도면 충분하다는 생각이 들어 우선 Gemma3-1b-text에 이 데이터셋으로 파인튜닝을 진행해보았다.

(참고로 AIHUB의 자체 라이선스로 인해 데이터셋의 공개는 불가능 하다...)

잘 학습이 되었다.

1b 모델이기에 원래 한국어 성능이 낮기도 해서 결과가 우려스러웠다. 그러나 잠깐 추론 시켜보았는데, 생각보다 성능이 괜찮아 놀랐다.

(width 이슈로 강제 개행됨)

원문	번역
나라의 말이 중국과 달라 문자와 서로 통하지 아니하므로, 이런 까닭으로 어리석은 백성이 이르고자 하는 바가 있어도 마침내 제 뜻을 능히 펴지 못하는 사람이 많으니라. 내가 이를 위하여 가엾게 여겨 새로 스물여덟 자를 만드니 사람마다 하여금 쉽게 익혀 날로 쓰기 편하게 하고자 할 따름이니라.	Because the words of the country are different from those of China, and they do not communicate with each other, there are many people who, even if they have their own desires, cannot finally put their will into practice. I made twenty-eight characters to do this, so that each person can easily learn them and make them convenient to use every day.
Mr. and Mrs. Dursley, of number four, Privet Drive, were proud to say that they were perfectly normal, thank you very much.	프리비트 드라이브 4번지, 두르슬리 부부가 완벽한 정상이라고 자랑스럽게 말했습니다.

원문

번역

나라의 말이 중국과 달라 문자와 서로 통하지 아니하므로,
이런 까닭으로 어리석은 백성이 이르고자 하는 바가 있어도
마침내 제 뜻을 능히 펴지 못하는 사람이 많으니라.
내가 이를 위하여 가엾게 여겨 새로 스물여덟 자를 만드니
사람마다 하여금 쉽게 익혀 날로 쓰기 편하게 하고자 할 따름이니라.

Because the words of the country
are different from those of China,
and they do not communicate with each other,
there are many people who,
even if they have their own desires,
cannot finally put their will into practice.
I made twenty-eight characters to do this,
so that each person can easily learn them and make them convenient to use every day.

Mr. and Mrs. Dursley, of number four, Privet Drive,
were proud to say that they were perfectly normal, thank you very much.

프리비트 드라이브 4번지, 두르슬리 부부가 완벽한 정상이라고 자랑스럽게 말했습니다.

물론 가엾게 여겨나 thank you very much같은 부분을 살리지 못한 아쉬운 부분이 있지만,

파파고같은 다른 서비스에 비해서 온디바이스라는 큰 이점이 있다.

게다가 1b로 이정도 성능이고, 데이터셋도 충분히 발전할 수 있기에 많은 가능성을 열어준 테스트인 것 같다.

RTX5090에서 3일만에 1b 모델을 이렇게 파인튜닝 시킬 수 있는 것은 놀랍다고 생각한다.

이러한 실험적 테스트를 가능하게 해준 Gcube에 다시 감사의 인사를 전한다.

TRC와 함께한 MaxText 후기

TPU v4-64에서 Gemma3 파인튜닝을 위해서 Keras3 대신 MaxText를 새롭게 사용해본 경험을 공유해보고자 한다. GCP에서 TPU Queued Resources를 생성한다. 이후 worker 0 (GCP에서 나오는 TPU ip address)에 ssh를 연결해준다. (앞으로 특별한 말이 없다면 tpu node worker 0에서 실행한다) maxtext를 git에서 clone 해준다. git clone https://github.com/AI-Hypercomputer/maxtext &

RTX5090 체험 후기 (상) | Gcube 지큐브

최근 gcube RTX 5090 체험 테스트에 선정되어 무상으로 체험해보게 되었다. 그 논란의 물량도 얼마 없어 돈이 있어도 구하기 어려운 RTX 5090을, 심지어 무료로 말이다! 게다가 5090뿐만 아니라 4090, 5080도 함께 제공받았다. 모두 현시점에서 가장 성능이 좋은 소비자용 그래픽카드 3종류이다. 메모리가 작고 대역폭 병목을 제외한 성능만 본다면 현존 최고 성능이다. 이들

KorT: LLM이 평가하는 한국어 번역 벤치마크

한국어 번역 품질 벤치마크 KorT를 출시했습니다! 최근 한강 작가님의 작품이 노벨 문학상을 수상하며 전 세계의 주목을 받았던 일을 기억하시나요? 사실, 상을 수상한 배경 뒤에는 좋은 번역이 있었습니다. 좋은 번역은 단순한 언어 변환을 넘어, 우리의 문화와 이야기를 세계 무대에 성공적으로 선보이는 데 결정적인 역할을 합니다. 이처럼 번역의 중요성은 점점 더 커지고

TPU Pods Gemma3 파인튜닝 정리

최근 구글이 출시한 Gemma3를 TPU Pods에서 파인튜닝해보기 위해 삽질중이다. 이 포스트는 삽질을 정리하기 위해 작성하고 있다. 요약 2025-03-20 gemma-llm으로 시도해보았지만 실패했다. 2025-03-21 Google Deepmind gemma-3 report 팀에 이메일을 보냈다. 답변이 없다 2025-03-22 🤗 Optimum TPU에서 파인튜닝이 되는 것을 확인했다. EasyDeL 프로젝트 또한 사용 가능하다. 2025-03-26 keras-hub에 gemma3가 merged되었다. jax를 백엔드로 keras3를

Read more

TRC와 함께한 MaxText 후기

RTX5090 체험 후기 (상) | Gcube 지큐브

KorT: LLM이 평가하는 한국어 번역 벤치마크

TPU Pods Gemma3 파인튜닝 정리