
LG AI 토크 콘서트 2025에서 이홍락 LG AI연구원 공동 연구원장이 발표하고 있는 모습
글로벌 AI 평가 기관에서 인정받은 성능
글로벌 AI 성능 분석 전문 기관인 '아티피셜 어낼리시스(Artificial Analysis)'가 발표한 인텔리전스 지수(Intelligence Index) 평가에서 엑사원 4.0은 종합 64점대를 기록하며 11위에 올랐다. 이는 미국 앤트로픽(Anthropic)의 최상위 모델인 클로드 4 오퍼스(Claude 4 Opus)와 동등한 수준이다.
아티피셜 어낼리시스는 AI 모델과 API 제공업체의 독립적인 성능 분석을 전문으로 하는 기관으로, 품질, 가격, 출력 속도, 지연 시간 등 핵심 성능 지표를 종합적으로 평가한다. 이번 평가에서는 추론과 지식 역량(MMLU-Pro, Humanity's Last Exam), 전문가 수준의 과학 문제 해결 능력(GPQA Diamond), 코딩 능력(LiveCodeBench, SciCode), 수학 문제 해결 능력(AIME 2024, MATH-500) 등 7개의 고난도 성능 평가 지표가 사용됐다.

글로벌 AI 기업
하이브리드 AI의 새로운 패러다임
엑사원 4.0의 가장 큰 특징은 국내 최초의 하이브리드 AI 모델이라는 점이다. 자연어 이해와 생성, 지식 기반의 빠른 답변에 강한 일반 언어모델(LLM)과 복잡한 추론 능력을 갖춘 추론 모델을 하나로 결합했다. 이를 통해 단순한 지시 이행부터 복잡한 사고가 필요한 문제 해결까지 모든 영역에서 균형 잡힌 성능을 발휘한다.
LG AI연구원이 지난 3월 공개한 '엑사원 딥(EXAONE Deep)'이 국내 첫 추론 AI 모델이었다면, 엑사원 4.0은 추론과 비추론 능력을 모두 갖춘 차세대 모델로 진화했다. 전 세계적으로 하이브리드 AI 모델을 공개한 기업은 미국의 앤트로픽, 중국의 알리바바에 이어 LG가 세 번째다.
실제 성능 비교에서도 이러한 효율성이 입증됐다. AI 지식 수준과 문제 해결 능력을 평가하는 MMLU-프로에서 81.8점을 기록해 딥시크-R1(85점), 큐원3-235B(83점)와 큰 차이가 나지 않았다. 코딩 능력 측정 테스트인 라이브코드벤치 V6에서는 75.4점으로 큐원-235B(71.1점)를 앞서기도 했다. 매개변수 규모를 고려하면 딥시크-R1(671B)의 4.8%, 큐원3-235B의 13.6%에 불과한 크기로 이런 성능을 낸 것이다.

아티피셜 어낼리시스의 인텔리전스 지수 순위(파란색이 오픈 웨이트 모델)
폭발적인 관심과 활용 확산
엑사원 4.0에 대한 글로벌 관심은 다운로드 수치로도 확인된다. LG AI연구원이 지난 7월 15일 글로벌 오픈소스 AI 플랫폼인 허깅 페이스(Hugging Face)에 오픈 웨이트 모델로 공개한 엑사원 4.0의 32B 모델은 공개 2주 만에 50만 다운로드를 돌파했다. 이는 국산 AI 모델 중 최단기간 기록으로, 현재는 55만을 넘어섰다.
오픈 웨이트 모델이란 AI 모델의 설계도나 학습 데이터는 공개하지 않지만, AI가 데이터를 처리하는 과정을 알 수 있는 가중치(Weight)를 공개해 연구자들이 자유롭게 수정이나 재배포할 수 있도록 한 형태다. 구글의 젬마(Gemma), 메타의 라마(Llama), 마이크로소프트의 파이(Phi) 등과 같은 방식이다.
엑사원 4.0은 연구 및 학술, 교육 목적으로 활용할 수 있도록 공개됐으며, 32B 전문가 모델과 1.2B 온디바이스 모델 두 종류로 제공된다. 전문가 모델은 의사, 치과의사, 한약사, 관세사, 감정평가사, 손해사정사 등 6가지 국가 공인 전문 자격증 필기시험을 통과할 정도의 전문성을 갖췄다.
온디바이스 모델은 지난해 12월 공개한 엑사원 3.5 2.4B 모델 대비 크기가 절반으로 줄어 가볍고 경제적이면서도, 수학, 코딩, 과학 분야에서 오픈AI의 GPT-4o mini보다 높은 성능을 보였다.

아티피셜 어낼리시스의 코딩 지수 순위
세계적 AI 연구 기관들의 연이은 인정
엑사원 시리즈의 성과는 이번이 처음이 아니다. LG AI연구원이 올해 공개한 '엑사원 딥'과 '엑사원 4.0'은 미국의 비영리 AI 연구 기관 에포크 AI(Epoch AI)의 '주목할 만한 AI 모델(Notable AI models)' 리스트에 연이어 등재됐다. 이 리스트는 매년 미국 스탠퍼드대에서 발간하는 AI 보고서에서 국가별 및 기업별 AI 경쟁력 비교 자료로 활용되는 권위 있는 평가다.
특히 지난해 12월 공개한 '엑사원 3.5'는 국내 AI 모델 중 유일하게 스탠퍼드대 AI 보고서에 포함되며 한국의 AI 역량을 세계에 알린 바 있다.
LG AI연구원의 기술 경쟁력은 단순히 모델 성능에만 국한되지 않는다. AI 모델 개발 과정에서 발생하는 데이터 저작권 문제를 자동으로 분석하고 판단하는 에이전트 서비스 '넥서스(Nexus)'를 개발해 법률적 리스크 관리까지 선도하고 있다. 또한 전문 분야 특화 AI 모델을 빠르게 만들 수 있는 '엑사원 데이터 파운드리' 기술로 데이터 생산성을 1000배 이상 향상시키는 성과를 거뒀다.
글로벌 AI 3대 강국을 향한 도전
이홍락 LG AI연구원 공동 연구원장은 "이번 결과는 LG의 엑사원이 세계 최고 수준의 프런티어 AI 모델들과 경쟁할 수 있는 역량과 잠재력을 갖추고 있다는 것을 증명한 것"이라며 "글로벌 AI 3대 강국 달성을 위해 세계 최고 수준의 AI 모델 개발을 위한 도전을 이어갈 것"이라고 강조했다.
LG AI연구원은 AI 기술 대중화를 위해 허깅 페이스의 공식 AI 모델 배포 파트너사인 프렌들리AI와 손잡고 엑사원 4.0 상용 API 서비스를 시작했다. 이를 통해 기업들이 별도의 GPU 인프라를 구축하지 않고도 API 형태로 엑사원 4.0을 서비스에 손쉽게 연동할 수 있게 됐다.
구광모 ㈜LG 대표는 올해 신년사에서 "AI와 같은 첨단 기술을 일상에서 편리하게 사용할 수 있게 해 소중한 시간을 보다 즐겁고 의미 있는 일에 쓰는 새로운 라이프 스타일을 만들어 갈 것"이라고 강조한 바 있다.
LG AI연구원의 엑사원 4.0 성과는 '파운데이션 모델 불모지'라고 불렸던 한국에서 글로벌 경쟁력을 갖춘 AI 모델을 개발할 수 있음을 보여준 상징적 사례다. 특히 매개변수 규모를 대폭 줄이면서도 성능을 유지하는 '효율성 중심' 접근법으로 AI 개발의 새로운 패러다임을 제시하고 있다는 평가를 받는다.
앞으로 LG AI연구원은 엑사원을 기반으로 한 다양한 산업 현장 적용을 통해 범용성과 전문성을 모두 갖춘 AI 생태계 구축에 나선다는 계획이다. 온디바이스 AI 시장에서의 주도권 확보와 함께, 한국이 글로벌 AI 강국으로 도약하는 데 핵심적인 역할을 할 것으로 기대된다.

아티피셜 어낼리시스의 인텔리전스 지수 순위
[글로벌에픽 안재후 CP / anjaehoo@naver.com]
<저작권자 ©GLOBALEPIC 무단 전재 및 재배포 금지>