본문 바로가기
경제

구글, 역대 최고 성능 AI '제미나이 2.5' 공개! OpenAI를 넘어서다!

by 핀노 2025. 3. 26.
반응형

구글이 또 한 번 AI 기술의 혁신을 이끌어낼 야심찬 모델을 선보였습니다. 바로 지금까지 공개된 구글 AI 중 가장 뛰어난 지능을 자랑하는 '제미나이 2.5'인데요, 그 놀라운 성능을 함께 알아볼까요?

🔥 구글, 최강 AI '제미나이 2.5 프로' 전격 공개!

지난 3월 25일(현지시간), 구글은 공식 블로그를 통해 차세대 AI 모델인 '제미나이 2.5 프로(Gemini 2.5 Pro)'의 실험 버전을 처음으로 공개했습니다. 이는 작년 12월에 제미나이 2.0을 선보인 지 불과 3개월 만에 이루어진 놀라운 발전인데요.

구글은 "제미나이 2.5는 우리의 가장 지능적인 모델"이라며, "점점 더 복잡해지는 문제를 해결하기 위해 설계된 사고력이 있는 모델"이라고 자신 있게 소개했습니다. 이는 마치 오픈AI의 o1 시리즈처럼 인간과 유사한 사고 능력을 갖춘 모델임을 시사합니다.

🏆 챗봇 아레나 1위 석권, 압도적인 성능 입증

제미나이 2.5 프로 실험 버전은 챗봇 성능 평가의 권위 있는 지표인 챗봇 아레나 LLM 리더보드에 출시 직후 1443점을 기록하며 단숨에 1위에 등극했습니다. 이는 2위인 xAI의 그록(Grok)과의 격차를 무려 39점이나 벌린 압도적인 결과입니다.

거대언어모델(LLM) 연구 분야의 석학인 크리스토퍼 매닝 교수는 자신의 X 계정을 통해 "구글이 돌아왔다!"라며 극찬을 아끼지 않았습니다. 그는 "구글의 새로운 모델이 챗봇 아레나에서 새로운 가능성을 열었다"고 평가하며 제미나이 2.5에 대한 기대감을 높였습니다.

🥇 벤치마크 압도, 수학·과학·코딩 능력 모두 최고

구글은 제미나이 2.5 프로 실험 모델이 자사의 이전 최첨단 AI 모델은 물론, 경쟁사의 주요 AI 모델들을 다양한 벤치마크에서 뛰어넘는 성능을 보였다고 밝혔습니다.

  • 수학 능력 (AIME2024): 86.7%를 기록하며 오픈AI의 o3미니(87.3%)에 근소하게 뒤처졌지만, xAI의 그록3 베타(83.9%), 딥시크 R1(79.8%)을 월등히 앞섰습니다.
  • 과학 능력: 과학 능력을 평가하는 모델에서도 주요 경쟁사들을 압도하는 결과를 보여주었습니다.
  • 코드 편집: 코드 편집 능력 테스트에서는 74%를 기록하며 오픈AI(60.4%), 앤스로픽 클로드 3.7 소넷(64.9%), 딥시크 R1(56.9%)을 모두 넘어섰습니다.

🤖 AGI에 한 걸음 더? '인류의 마지막 시험'에서도 높은 점수

특히 주목할 만한 점은 인공일반지능(AGI) 달성 여부를 가늠하기 위해 만들어진 '인류의 마지막 시험(Human-Level Intelligence)' 벤치마크에서 높은 점수를 기록했다는 것입니다. 제미나이 2.5 프로는 18.8%를 달성하며 오픈AI o3미니(14%), 클로드 3.7 소넷(8.9%), 딥시크R1(8.6%)을 큰 차이로 따돌렸습니다.

✨ 더욱 강력해진 기능, 200만 토큰 컨텍스트 윈도우 지원 예정

구글은 제미나이 2.5 프로가 출시 시점에는 100만 토큰의 컨텍스트 윈도우를 지원하며, 향후 200만 토큰까지 처리할 수 있도록 확장할 예정이라고 밝혔습니다. 이는 방대한 양의 정보를 한 번에 처리하고 이해할 수 있는 능력이 크게 향상되었음을 의미합니다.

제미나이 2.5 프로 실험 모델은 현재 구글의 개발자 플랫폼인 구글 AI 스튜디오와 월 20달러의 구독 서비스인 제미나이 어드밴스드에서 이용 가능합니다.

이번 제미나이 2.5 공개는 구글이 AI 분야에서 다시 한번 강력한 존재감을 드러낸 사건으로 평가받고 있습니다. 압도적인 성능과 혁신적인 기능을 통해 AI 기술의 새로운 시대를 열어갈 제미나이의 활약을 앞으로도 기대해 봅니다.

#구글 #제미나이2.5 #인공지능 #AI #챗봇 #LLM #오픈AI #그록 #기술뉴스 #AI모델

반응형