본문 바로가기
산업분석

딥시크(DeepSeek) 탄생 및 성능 향후 AI, 반도체 시장에 미칠 영향

by 00년 새내기 2025. 2. 21.
728x90

 

딥시크(DeepSeek)

DeepSeek-V3는 AI 훈련비용이 미국기업의 훈련비용 대비 약 1/10 수준이지만 오픈AI의 GPT-4o 수준의 AI 성능을 구현해 세계의 주목을 받았다. 미국은 AI 패권 수성을 위해 대중국 반도체·AI모델 수출통제를 강화해 우리기업의 대중국 반도체, 반도체 장비 등의 수출이 영향을 받을 수 있기에 이에 대한 영향을 살펴보고자 한다.

 

딥시크(DeepSeek) 탄생

 

DeepSeek은 중국 퀀트 헤지펀드 운용사 High-Flyer의 자회사로 2023년 5월에 설립되었다. 중국 퀀트 헤지펀드 운용사 High-Flyer의 AI 연구소였던 DeepSeek은 2023년에 분사했으며 High-Flyer의 GPU 클러스터를 활용해 AI 모델을 개발했다.

 

High-Flyer는 2019년에 투자 기법 고도화를 위해 AI 전담 부서를 설립하고 2021년부터 엔비디아 GPU를 구매해왔다. DeepSeek은 2024년 12월에 거대언어모델(LLM) V3, 2025년 1월 20일에 V3 기반의 추론 모델 R1와 PC에서 로컬로 실행할 수 있는 R1의 경량화 버전 6개 모델을 출시했다.

 

 

DeepSeek의 AI모델 출시 현황

 

 

 

1. 딥시크(DeepSeek) 성능

DeepSeek-V3의 AI 훈련 비용은 약 560만 달러로 2,048개의 엔비디아 GPU H800을 2개월간 빌린 비용 기준이며 인건비, 연구개발비, 데이터수집 비용 등은 미포함되었다.

 

Meta의 Llama 3.1은 16,384개의 엔비디아 H100을 54일간 훈련에 사용했으나 DeepSeek은 미국의 대중국 반도체 수출 규제로 H100 대비 대역폭이 50% 작은 저사양 H800을 사용했다.

 

우리나라의 GPU 보유량(‘23)은 H100 기준으로 2,000장으로 DeepSeek의 GPU 보유량은 미국 빅테크기업보다는 적지만 단일 기업 기준으로 아주 적은 양은 아니다.

 

2023년 출시된 오픈AI의 GPT-4의 개발비용은 1억 달러, 훈련 비용은 78.4백만 달러로 추정된다. 2024년 12월에 출시된 DeepSeek-V3는 오픈AI의 GPT-4o(‘24.5 출시), Anthropic의 Claude 3.5 Sonnet(‘24.6 출시) 수준의 성능을 구현했다.

 

V3는 가장 최근에 출시된 AI 모델로 언어 능력과 소프트웨어 엔지니어링 문제 해결 능력은 GPT-4o보다 소폭 우수하나 수학은 매우 우수한 벤치마크를 기록하여 세상을 놀라게했다.

 

 

DeepSeek-V3의 성능 비교

 

2025년 1월에 출시된 DeepSeek-R1은 V3 기반의 추론 모델로 R1의 성능은 2024년 9월에 출시된 오픈AI의 o1 수준이다. 6개 평가 항목중 3개 항목(수학 등)에서 DeepSeek-R1이 오픈AI의 o1 대비 소폭 우수한 성능을 기록했다.

 

DeepSeek-R1과 오픈AI의 o1의 테스트별 정확도

 

 

반면, DeepSeek-R1의 사용료(API, Application Programming Interface)는 오픈AI의 o1 사용료 대비 1/20 수준으로 AI 대중화의 가능성을 보여주었다.

 

1백만 토큰기준으로 DeepSeek-R1의 Input Cost는 0.55달러, Ouput Cost는 2.19달러로 오픈AI의 Input Cost는 15.00달러, Output Cost 60.00달러보다 매우 낮은 수준을 제시했다.

 

DeepSeek-R1의 사용료

 

 

DeepSeek은 미국의 대중국 반도체 수출규제로 고성능 GPU 사용이 어려웠으나 기존에 알려진 AI 기술의 효율적 사용 등을 통해 AI의 성능을 제고한 것으로 보인다.

 

Mixture of Experts(MoE, 전문가 혼합)는 AI 모델을 다수의 전문가 서브 모델로 나누고 입력된 작업에 따라 적합한 전문가 모델만을 활성화시켜 연산을 최적화시켰으며, AI를 활용한 대규모 강화학습(Reinforcement Learning)으로 학습비용을 절감했다.

 

지식 증류(Knowledge Distillation)를 통해 소형 AI 모델의 정확도를 제고하고 Multi-head Latent Attention(MLA, 멀티헤드 잠재 어텐션)은 입력 문장 중 유의미한 내용만을 추출하여 연산하여 추론 속도를 향상시켰다.

 

Mixture of Experts(MoE)

 

 

마이크로소프트, 아마존 등은 오픈AI에 대한 의존도를 낮추고 사용자 저변 확대를 위해 자사 서비스에 DeepSeek을 도입했다. 주요국은 DeepSeek의 보안 이슈 등으로 공공부문의 사용을 금지했지만 주요 기업들은 DeepSeek에 대한 안정성 평가를 수행하고 서비스를 제공한다고 밝혔다.

 

 

2. AI 시장에 미칠 영향

DeepSeek은 AI 모델을 오픈소스로 공개하고 무료 상업적 사용을 허용해 AI 개발이 가속화될 전망이다. DeepSeek은 프로그램 소스를 MIT 라이선스로 공개하여 누구나 프로그램을 수정, 개선, 재배포할 수 있으며 수정된 버전을 상업적으로 사용할 수 있다.

 

오픈AI는 AI 모델을 공개하지 않는 폐쇄형 전략, Meta는 AI 모델을 오픈소스로 공개하나 상업적 사용 등에 제약이 있다. AI 모델 개발은 Big Tech의 전유물로 생각되었으나 DeepSeek이 저비용 AI 개발 가능성을 열어주어 다수 국가와 기업이 AI 개발을 추진할 전망이다.

 

더 나아가 DeepSeek의 경량화 AI 모델은 스마트폰, PC, 자동차, 로봇 등 엣지(Edge) 디바이스의 AI 탑재를 촉진할 전망이다. 중국에서는 DeepSeek 열풍으로 중국 자동차회사, 금융회사, 스마트폰 제조사 등에서 DeepSeek을 탑재하고 있다.

 

AI 추론 비용은 12개월마다 1/10 수준으로 낮아져왔으며 DeepSeek으로 인해 AI 모델 사용료 인하 등이 더욱 가속화될 가능성이 있다. 2025년 1월, 오픈AI는 경량 추론 모델 o3-미니를 출시했으며 성능은 R1보다 높지만 사용료를 낮추어 DeepSeek-R1과의 사용료 격차를 10배에서 2~4배 수준으로 좁혔다.

 

AI 추론 비용

 

 

3. 반도체 시장에 미칠 영향

AI의 확산은 기술발전으로 자원 사용 효율성이 제고되면 해당 자원의 사용이 증가해 시장이 확대된다는 ’제본스의 역설‘을 유발해 반도체 수요가 증가할 전망이다. 데이터센터 투자는 미국과 중국 중심이었으나 투자 지역이 다변화되고 생산성 향상 등을 위해 전산업에 AI가 도입될 전망이다.

 

AI는 텍스트 중심의 거대언어모델(LLM), 이미지·음성·영상을 생성하는 멀티모달(Multi Modal) 기반의 AI를 넘어 인간과 비슷하거나 똑똑한 범용AI(Artificial General Intelligence, AGI)로 진화·발전하면서 컴퓨팅 파워 고도화가 지속될 전망이다.

 

트럼프 대통령은 취임하자마자 미국에 AI 슈퍼컴퓨터 등 AI 인프라를 구축하는 사업인 Stargate Project를 발표했으며 투자비는 향후 4년간 5,000억 달러 규모에 달한다.

 

마이크로소프트, 오픈AI, 구글 등이 범용AI(AGI)를 지향하며 오픈AI의 CEO 샘 알트먼과 구글 딥마인드의 CEO 데미스 허사비스는 5년내에 범용AI의 등장 가능성을 전망했다.

 

반도체산업의 단기 영향은 제한적이나 중장기로는 AI 인프라 투자 속도 등이 조정받 을 가능성이 있겠다. AI 투자의 패러다임이 하드웨어에서 소프트웨어, 알고리즘으로 이동할 것이라는 우려에도 불구하고 미국 주요 기업은 2025년 AI 투자를 기존 계획보다 확대할 전망이다.

 

AI 모델 개발 방향은 대형·범용 모델에서 소형, task-specific, 오픈소스 모델로 전환 이 가속화될 전망이다.

 

주요 기업의 DeepSeek에 대한 의견

 

 

미국은 AI 패권 수성을 위해 대중국 반도체·AI모델 수출통제를 강화해 우리기업의 대중국 반도체, 반도체 장비 등의 수출이 영향을 받을 수 있다.

 

2025년 1월 13일, 바이든 행정부는 중국·러시아 등 ‘적성국’으로 분류한 22국에 대한 초고성능 AI 모델 수출 차단 조치를 발표했다. 동맹국이 아닌 ‘기타 국가’에 대한 반도체 수출 제한 조치를 신규 도입해 기타 국가에는 미국이 수출할 수 있는 반도체의 ‘총연산력’에 상한을 설정했다.

 

중국을 견제하기 위해 대중국 반도체 수출 규제가 저사양 AI 반도체, 레가시 반도체 (28나노 이상 공정 사용) 등으로 확대되고 장비 등의 수출 통제 강화 가능성이 있다.

 

 

728x90

댓글