DeepSeek의 하드웨어 지출, 최대 5억 달러에 달할 것으로 추정

[email protected]





중국의 AI 스타트업 DeepSeek가 이번 주 기술업계에서 가장 큰 화제가 되고 있다. 그 이유는 단 한 가지 숫자, 바로 600만 달러다. DeepSeek은 최근 발표한 인공지능 모델에 대한 논문에서 총 훈련 비용이 557만 6천 달러에 달한다고 명시했다. 이는 Nvidia 그래픽 처리 장치의 임대 가격을 기준으로 한 수치로, 회사는 이 숫자가 공식 훈련에만 해당하며, 이전 연구 및 아블레이션 실험에 소요된 비용은 포함되지 않았음을 분명히 했다.

올 주 초, DeepSeek의 AI 어시스턴트는 미국 애플 앱스토어의 무료 앱 다운로드 차트에서 OpenAI의 ChatGPT를 제치고 1위를 기록했다. 이에 따라 글로벌 기술주가 하락세를 보였으며, 반도체 제조업체인 Nvidia와 Broadcom은 월요일에만 총 8천억 달러의 시가총액을 잃었다.

SemiAnalysis라는 반도체 연구 및 컨설팅 회사는 DeepSeek의 하드웨어 지출이 회사 역사상 5억 달러를 훌쩍 넘는다고 추정했다. 이들은 R&D 비용과 총 소유 비용이 매우 크다는 점을 강조했다. 새 모델을 트레이닝하기 위한 “합성 데이터” 생성을 위해서는 상당한 컴퓨팅 비용이 필요하다고 설명했다.

보고서에 따르면, Anthropic의 Claude 3.5 Sonnet 모델의 훈련 비용은 수천만 달러에 달하는 것으로 나타났으며, 이는 Amazon과 Google로부터 수십억 달러의 자금을 조달한 사실과 연결된다. 이는 모델 운영 및 회사 운영에 필요한 자본이 얼마나 많은지를 반증한다. SemiAnalysis는 “이들은 실험을 통해 새로운 아키텍처를 연구하고, 데이터를 수집 및 정리하며, 직원들에게 보수를 지급하는 등 훨씬 더 많은 활동을 해야 한다”고 말했다.

DeepSeek의 논문에는 컴퓨팅 비용에 대한 추정이 포함되어 있지 않으며, 회사는 이에 대한 의견 요청에 즉각적인 답변을 하지 않았다. SemiAnalyst는 “DeepSeek는 이러한 비용과 능력을 최초로 달성한 회사라는 점에서 독특하다”며 “DeepSeek의 R1 모델은 매우 우수한 모델이며, reasoning edge를 이처럼 빨리 따라잡은 것은 객관적으로 인상적이다”라고 평가했다.

전문가들과 분석가들은 이번 주에 DeepSeek 모델의 품질을 높이 평가하며, 미국이 중국에 대한 반도체 수출을 세 번 축소한 것에도 불구하고 이토록 고속 성장한 것에 경외감을 표했다. 계속해서 인공지능 시장이 향후 10년 이내에 1조 달러를 넘을 것으로 예상됨에 따라, 미국이 중국과의 경쟁에서 뒤떨어질 우려가 커지고 있다.

Bernstein 애널리스트는 월요일에 발표한 메모에서 “우리가 지난 주말에 본 여러 (때때로 과장된) 의견들은 그 의미가 ‘정말 흥미롭다’에서 ‘AI 인프라 복합체의 죽음의 신호’에 이르기까지 다양하다”고 밝혔다.

DeepSeek은 2023년에 Liang Wenfeng, High-Flyer라는 AI 중심의 퀀트 헤지펀드의 공동 창립자에 의해 설립되었다. 이 AI 스타트업은 2023년 4월 헤지펀드의 AI 연구 단위에서 성장하여 대형 언어 모델 및 인공지능 일반 AGI(인간의 지능과 맞먹거나 이를 초월하는 AI)를 목표로 하고 있다.

주목할 만한 것은 DeepSeek가 자사 R1 모델을 공개하면서 이미 OpenAI의 o1 모델과 경쟁할 수 있는 능력을 보여주었다는 점이다. 또한 이 모델은 오픈 소스 형태로 제공되어, 누구나 활용할 수 있다. 그러나 다른 중국 챗봇과 마찬가지로, DeepSeek의 모델 역시 특정 주제에 대한 제한이 있다는 점에서 논란이 일고 있다.

OpenAI의 CEO 샘 올트먼은 DeepSeek 모델을 공개적으로 칭찬했으나, OpenAI 데이터가 불법으로 수집되었다고 주장하기도 했다. 올트먼은 워싱턴 D.C.에서 열린 OpenAI 주최 행사에서 DeepSeek를 “확실히 훌

Leave a Comment