알리바바, 중국의 최신 오픈소스 AI 혁신인 Qwen LLM 출시

[email protected]





알리바바(Alibaba)는 지난 화요일 차세대 오픈소스 대규모 언어 모델인 Qwen3를 출시하며 중국의 AI 시장에서 또 하나의 혁신을 이뤘다고 발표했다. Qwen3는 추론, 지시 수행, 도구 사용 및 다국어 작업에서 향상된 성능을 약속하며, 여러 산업 기준에서 DeepSeek의 R1과 같은 다른 최상위 모델들과 경쟁할 수 있는 능력을 갖춘 것으로 평가된다.

Qwen 시리즈는 8종의 다양한 아키텍처 및 크기로 구성되어 있어, 개발자들이 모바일과 같은 엣지 디바이스에 AI 애플리케이션을 구축할 때 유연성을 제공한다. 이번 모델은 알리바바의 첫 번째 ‘혼합 추론 모델(hybrid reasoning models)’로, 전통적인 대규모 언어 모델 기능과 ‘고급 동적 추론’ 기능이 결합되어 있다. 이 모델은 복잡한 작업을 위한 ‘사고 모드(thinking mode)’와 빠르고 일반적인 반응을 위한 ‘비사고 모드(non-thinking mode)’ 간의 원활한 전환을 가능하게 한다.

알리바바는 Qwen3-235B-A22B MoE 모델이 최신 모델들에 비해 배포 비용을 획기적으로 낮추었다고 주장하며, 이는 고성능 AI의 접근성을 높이기 위한 알리바바의 약속을 reaffirming하고 있다. 새로운 모델은 개인 사용자들이 Hugging Face와 GitHub 같은 플랫폼에서 자유롭게 사용할 수 있으며, 알리바바 클라우드 웹 인터페이스에서도 제공된다. 이 모델은 또한 알리바바의 AI 어시스턴트인 Quark를 구동하는 데 활용되고 있다.

AI 분석가들은 Qwen3가 중국 내 경쟁사들은 물론 미국 내 산업 리더들에게도 심각한 도전 과제가 될 것이라고 경고하고 있다. Counterpoint Research의 인공지능 선임 분석가인 Wei Sun은 Qwen3 시리즈가 “최고의 성능” 뿐만 아니라 “모델의 응용 가능성”을 지적할 수 있는 여러 가지 기능을 통해 중요한 혁신을 이루었다고 설명했다. 이 기능들에는 119개 언어와 방언을 다루는 다국어 지원과 오픈소스의 유용성 등이 포함된다.

오픈소스 소프트웨어는 보통 소스 코드가 웹에서 자유롭게 사용 가능하도록 공개되어 있어, 수정 및 재배포가 가능한 소프트웨어를 가리키며, 이번 해 초 DeepSeek의 오픈소스 R1 모델이 AI 분야에서 큰 반향을 일으키며 중국의 AI 모델 채택에 촉매 역할을 했다. 알리바바의 Qwen3 출시가 미국 수출 통제 강화 속에서도 중국의 실험실들이 경쟁력 있는 혁신적이고 오픈소스 모델을 개발할 수 있는 능력을 강조한다고 말한 Ray Wang은 미국과 중국 간의 경제 및 기술 경쟁에 초점을 맞추고 있다.

알리바바에 따르면 Qwen은 이미 전 세계에서 가장 널리 사용되는 오픈소스 AI 모델 시리즈로 자리 잡았다. 전 세계에서 3억 회 이상 다운로드되었고, Hugging Face에는 10만 개 이상의 파생 모델이 있다. Wang은 Qwen3의 성능 방식이 이것을 세계 최고의 오픈소스 모델로 만들 가능성을 제기하지만, 여전히 OpenAI의 o3 및 o4-mini 등의 최첨단 모델에는 미치지 못할 것이라고 덧붙였다.

중국의 경쟁사인 바이두(Baidu)도 DeepSeek의 출현 이후 신속하게 새로운 AI 모델을 출시하고 있으며, 보다 오픈소스의 비즈니스 모델로 전환할 계획을 세우고 있다. 한편, 로이터는 DeepSeek이 R1의 후속 모델을 가속화하고 있다고 보도했다.

미국과 중국 간의 AI 경쟁 맥락에서, Wang은 미국과 중국 간의 격차가 몇 달에서 몇 주 정도로 좁혀졌으며, 최신 Qwen3와 DeepSeek의 R2 출시로 이 격차는 더욱 줄어들 것으로 보인다며 전망을 제시했다.

Leave a Comment