알리바바, ‘비용 효율적인 AI 에이전트’ 위한 새로운 오픈 소스 AI 모델 출시

[email protected]





알리바바가 자사의 ‘Qwen 시리즈’ 최신 AI 모델인 ‘Qwen2.5-Omni-7B’를 출시했다. 이 새로운 멀티모달(Model)은 텍스트, 이미지, 오디오 및 비디오와 같은 다양한 입력을 처리할 수 있으며, 실시간 텍스트 생성 및 자연스러운 음성 응답을 생성할 수 있다. 이는 최근 ‘DeepSeek 순간’ 이후 중국 내 대형 언어 모델 경쟁이 치열해지는 가운데 이루어진 발표이다.

특히, 이 모델은 모바일 기기와 같은 엣지 장치에서도 배포될 수 있도록 설계되어 고효율과 성능 저하 없이 활용될 수 있다. 알리바바는 이 모델이 ‘민첩하고 비용 효과적인 AI 에이전트’ 개발의 완벽한 기반이 될 것이라고 강조하며, 특히 지능형 음성 애플리케이션에서의 응용 가능성을 언급했다. 예를 들어, 이 모델은 시각 장애인이 실시간 음성 설명을 통해 환경을 탐색하는 데 도움을 줄 수 있다.

이번 모델은 Hugging Face와 GitHub 플랫폼에서 오픈 소스로 공개되며, 이는 DeepSeek가 자사의 혁신적인 R1 모델을 오픈 소스로 공개한 이후 중국 내에서 증가하는 경향을 반영한다. 오픈 소스란 소스 코드가 웹에서 자유롭게 공개되어 수정 및 재배포가 가능한 소프트웨어를 의미하며, 알리바바 클라우드는 지난 수년간 200개 이상의 생성 AI 모델을 오픈 소스로 제공해왔다.

현재 중국 내 AI 열풍은 DeepSeek의 영향으로 가속화되고 있으며, 알리바바와 다른 생성 AI 경쟁자들은 비용 효율적인 모델과 제품을 전례 없는 속도로 출시하고 있다. 예를 들어, 최근 중국의 대형 기술 기업 바이두는 새로운 멀티모달 기초 모델과 최초의 추론 중심 모델을 발표했다. 알리바바는 올해 1월에 업데이트된 Qwen 2.5 AI 모델을 출시한 이후, 이달 초에는 AI 도우미 툴인 Quark의 새로운 버전을 선보였다.

알리바바는 AI 전략에 대한 확고한 의지를 표현하며, 지난달에는 향후 3년간 클라우드 컴퓨팅 및 AI 인프라에 530억 달러를 투자하겠다는 계획을 발표했다. 이는 지난 10년간 AI 분야에 지출한 금액을 초과하는 것으로, AI 요구를 충족시키기 위해 데이터 센터를 구축하는 동시에 자사의 대형 언어 모델(LLM)을 개발하고 있는 중국 대형 기술 기업들이 중국의 AI 혁명 속에서 많은 기회를 누릴 것이라고 전문가들이 전망하고 있다.

특히 알리바바는 최근 애플과 파트너십을 체결하여 중국에서 판매되는 아이폰에 AI 통합 기능을 도입하는 중요한 성과를 올렸다. 이러한 전략적 움직임을 통해 알리바바는 더 차별화된 AI 솔루션을 제공하고 글로벌 시장에서도 경쟁력을 강화할 계획이다.

Leave a Comment