벤치마크

Gemma 4 벤치마크

MMMU, LiveCodeBench, GPQA 및 AIME 전반에 걸친 Gemma 4 성능 벤치마크 — 경쟁 오픈 및 클로즈드 모델과의 직접 비교 포함.

Gemma 4 벤치마크란 무엇인가요?

벤치마크는 추론, 코딩, 수학, 과학 및 멀티모달 작업에 대한 모델 성능을 측정하는 표준화된 테스트입니다. Gemma 4 결과는 공식 Google DeepMind 모델 카드 및 제3자 평가에서 발췌되었습니다.

왜 Gemma 4 벤치마크를 확인해야 하나요?

1

실제 성능 측정

프로젝트에 선택하기 전에 표준화된 작업에서 Gemma 4가 어떤 점수를 받았는지 확인하세요

2

모델 간 비교

Gemma 4가 대안 모델보다 뛰어난 부분과 트레이드오프가 존재하는 부분을 이해하세요

3

강점에 맞는 작업 매칭

코딩, 추론, 수학 또는 멀티모달 작업에 어떤 Gemma 4 변체 모델이 적합한지 파악하세요

주요 및 필수 가이드

모든 Gemma 4 벤치마크 가이드