중국의 인공지능(AI) 스타트업 DeepSeek가 이번 주 기술 분야에서 가장 주목받는 주제로 떠올랐다. 이 회사의 최신 인공지능 모델에 대한 논문에서 DeepSeek는 총 훈련 비용이 557만 6천 달러이라고 밝혔다. 이 비용은 Nvidia의 그래픽 처리 장치(GPU) 임대 가격을 기준으로 하며, 공식적인 훈련만 포함되어 있고, “이전 연구 및 실험에서의 비용은 제외된다”고 명확히 고지하고 있다.
DeepSeek의 AI 어시스턴트는 미국 애플 앱 스토어에서 가장 다운로드된 무료 앱 자리를 차지하면서 OpenAI의 ChatGPT를 제치며 주목을 끌었다. 이로 인해 글로벌 기술 주식들이 하락세를 보이며 Nvidia와 Broadcom의 시장 가치가 총 8000억 달러 감소했다.
세미분석(SemiAnalysis)이라는 반도체 연구 및 컨설팅 회사의 새로운 보고서는 DeepSeek의 지출에 대한 추가적인 맥락을 제공했다. 이 보고서에 따르면, DeepSeek의 하드웨어 지출은 “회사의 역사 전반에 걸쳐 5억 달러를 훨씬 초과할 것”으로 추정되며, 연구개발(R&D) 비용과 소유 비용이 상당하다고 보고했다. 모델 훈련을 위한 “합성 데이터” 생성에는 “상당한 컴퓨팅 자원”이 필요하다고 덧붙였다.
이 보고서는 Anthropic의 Claude 3.5 Sonnet 모델 훈련 비용이 “수천만 달러”라고 언급하면서도, Anthropic이 Amazon과 Google로부터 수십억 달러를 조달한 점을 지적하였다. 이는 모델을 운영하고 회사를 운영하는 데 얼마나 더 많은 자금이 필요한지를 나타낸다. 세미분석은 “실험을 하고, 새로운 아키텍처를 개발하고, 데이터를 수집하고 정리하며, 직원에게 급여를 지급하는 등 여러 작업이 필요하기 때문”이라고 설명했다.
DeepSeek의 논문에서는 자체적으로 컴퓨팅 비용 추정이 포함되어 있지 않으며, 회사는 즉각적으로 코멘트를 제공하지 않았다. “DeepSeek는 이 비용과 능력의 수준을 처음으로 달성한 독특한 회사임을 분명히 하고자 한다”는 세미분석의 발언은 DeepSeek의 R1 모델이 “아주 좋은 모델”이라는 사실을 전달하고 있다.
전문가들과 분석가들은 이번 주 DeepSeek의 모델 품질에 대해 긍정적인 평가를 내리고 있으며, 미국이 지난 3년 동안 중국에 대한 반도체 수출을 세 번 제한한 상황에서 이러한 성과는 더욱 인상적이라고 언급하고 있다. 이로 인해 미국이 이 시장에서 뒤처지고 있다는 우려도 제기되고 있으며, 향후 10년 내에 1조 달러 규모에 이를 것으로 예상되는 시장에서의 경쟁이 심화되고 있다.
이와 관련하여 버크셔 해서웨이(Bernstein)의 분석가는 “이번 주말에 본 다양한 의견들은 ‘정말 흥미롭다’에서 ‘이는 우리가 아는 AI 인프라 구조의 종말을 알리는 신호다’까지 다양한 시각을 내놓았다”고 적었다.
DeepSeek는 2023년에 설립된 회사로, AI에 집중한 정량적 헤지펀드 High-Flyer의 공동 창립자인 리앙 웬펑(Liang Wenfeng)이 설립하였다. 이 AI 스타트업은 2023년 4월 High-Flyer의 AI 연구 유닛에서 출발하여 대규모 언어 모델과 일반 인공지능(AGI)을 목표로 하고 있다. 현재 DeepSeek는 High-Flyer에 의해 전적으로 소유되고 있으며, 자금을 지원받고 있다.
DeepSeek에 대한 관심은 이 달 초 R1 모델을 출시하면서 급격히 증가하기 시작했다. R1은 OpenAI의 o1과 경쟁하는 추론 모델로서, 오픈 소스 형태로 제공되어 모든 AI 개발자가 사용할 수 있다.
하지만 DeepSeek의 chatbot 또한 특정 주제에 대한 제한이 있어, 예를 들어 중국의 시진핑 주석의 정책에 대한 질문에는 사용자에게 다른 방향으로 답변을 유도하는 것으로 알려져 있다. OpenAI의 CEO인 샘 알트먼(Sam Altman)은 DeepSeek의 모델에 대한 공개