본문 바로가기
신기술동향

xAI, Grok-2(그록2) 출시 - 기능, 논란, 이용방법, 성능 비교

by 미래진행형 2024. 8. 18.
반응형

일론 머스크의 xAI가 Grok-2(그록2)를 공개했습니다. 채팅, 코딩, 추론, 이미지 생성 기능에서 향상된 능력을 선보입니다. 이 최신 버전은 콘텐츠 생성에 대한 제한을 줄여, 윤리적 논쟁이 있습니다.

 

Grok-2의 고급 기능

xAI의 AI 어시스턴트 최신 버전은 자연어 처리, 자율적 의사 결정, 복잡한 추론 능력에서 상당한 개선을 보여줍니다. 개선된 사항은 다음과 같습니다:

  • 일상 및 전문적 의사소통을 위한 향상된 대화 능력
  • 다양한 프로그래밍 언어와 프레임워크에 걸친 우수한 코딩 능력
  • 복잡한 작업을 해결하기 위한 고급 문제 해결 및 분석 기술
  • 최신 응답을 위한 X 플랫폼의 실시간 정보 통합

Grok-2 mini는 간소화된 버전으로, 정확성을 유지하면서도 더 빠른 응답 시간을 제공하여 효율성을 중시하는 사용자들을 위해 설계되었습니다. 내부 테스트에서 Grok-2는 Large Model Systems Organization (LMSYS) 리더보드의 코딩 및 수학 분야에서 Claude 2.5 Sonnet과 GPT-4 Turbo와 같은 경쟁자들을 능가했습니다.

이미지 생성 논란

 

이런 이미지도 생성 가능하다

 

Grok-2의 이미지 생성 기능은 명백한 제한이 없어 논란을 일으켰습니다. DALL-E, Gemini, Midjourney와 같은 경쟁자들과 달리, Grok-2는 정치인과 저작권이 있는 캐릭터를 포함한 광범위한 이미지를 생성할 수 있습니다. 이 기능으로 인해 사용자들은 총기를 든 도널드 트럼프 전 대통령의 이미지나 현직 정치 지도자들이 관련된 가상 시나리오와 같은 잠재적으로 민감하거나 논란의 여지가 있는 콘텐츠를 만들어내고 있습니다. 명확한 안전장치의 부재로 인해 잠재적 오용, 저작권 침해, 그리고 특히 다가오는 미국 대선과 관련하여 허위 정보 확산에 대한 우려가 제기되고 있습니다.

Grok-2 이용 방법

현재 베타 버전인 Grok-2와 Grok-2 mini는 X 프리미엄 및 프리미엄+ 구독자들에게만 제공됩니다. 이 모델들은 이달 말 기업용 API를 통해 개발자들에게도 제공될 예정입니다.

Grok-2 전망

xAI가 올해 말까지 Grok-3을 출시할 계획이어서 Grok-2의 미래는 밝아 보입니다. 이 버전은 100,000대의 Nvidia H100 GPU로 학습될 예정이며, 잠재적으로 GPT-5와 경쟁하거나 능가할 수 있는 위치에 있을 것으로 예상됩니다.

빠른 발전에도 불구하고, Grok-2는 여전히 GPT-4와 같은 선두 모델들의 전반적인 능력을 따라잡는 데 어려움을 겪고 있습니다. xAI가 AI 기술 개발을 계속함에 따라, 회사는 최근 60억 달러 규모의 시리즈 B 자금 조달을 완료했으며, 이는 회사 가치를 240억 달러로 평가하고 그 방향성에 대한 투자자들의 강한 신뢰를 보여줍니다.

Grok-2 벤치마크 비교

다음은 주요 벤치마크에서 Grok-2의 성능을 주요 AI 모델들과 비교한 것입니다:

벤치마크 Grok-2 GPT-4 Claude 3.5 Sonnet Llama 3 405B
MMLU 87.5% 88.7% 85.5% 87.9%
MMLU-Pro 75.5% 72.6% 77.3% N/A
MATH 76.1% 84.3% 78.2% 71.7%
HumanEval 88.4% 90.2% 90.2% 87.8%
GPQA 56.0% 54.9% 57.3% 55.0%

 

Grok-2는 MMLU-Pro와 GPQA 벤치마크에서 GPT-4를 능가하며 고급 추론 작업에서 강력한 능력을 보여줍니다.
그러나 GPT-4와 Claude 3.5 Sonnet은 여러 영역, 특히 수학과 코딩 작업에서 여전히 우위를 유지하고 있습니다.

Grok-2 mini는 성능은 떨어지지만 빠른 응답 시간과 낮은 비용으로 속도가 중요한 애플리케이션에 적합하다고 볼 수 있겠습니다.