벤치마크
Gemma 4 벤치마크
MMMU, LiveCodeBench, GPQA 및 AIME 전반에 걸친 Gemma 4 성능 벤치마크 — 경쟁 오픈 및 클로즈드 모델과의 직접 비교 포함.
Gemma 4 벤치마크란 무엇인가요?
벤치마크는 추론, 코딩, 수학, 과학 및 멀티모달 작업에 대한 모델 성능을 측정하는 표준화된 테스트입니다. Gemma 4 결과는 공식 Google DeepMind 모델 카드 및 제3자 평가에서 발췌되었습니다.
왜 Gemma 4 벤치마크를 확인해야 하나요?
1
실제 성능 측정
프로젝트에 선택하기 전에 표준화된 작업에서 Gemma 4가 어떤 점수를 받았는지 확인하세요
2
모델 간 비교
Gemma 4가 대안 모델보다 뛰어난 부분과 트레이드오프가 존재하는 부분을 이해하세요
3
강점에 맞는 작업 매칭
코딩, 추론, 수학 또는 멀티모달 작업에 어떤 Gemma 4 변체 모델이 적합한지 파악하세요