발간자료
IP Focus, Global IP Trend 등 KIIP의
발간물을 제공합니다.
IP Focus
- HOME > 발간물 > 간행물 >
- IP Focus
| 딥시크의 출현과 지식증류 관련 지식재산 이슈 |
|---|
| 발행일 | 2025-04-16 (수시) | 조회수 | 1143 | |
|---|---|---|---|---|
|
||||
|
• 대다수 AI 개발사들은 약관상 경쟁 기술 개발에 자사 데이터의 사용(지식증류)을 금지하고 있으나, 정황상 후발주자들은 선두그룹의 AI 모델로부터 ‘지식증류’를 하고 있을 가능성 존재 • AI 모델 개발과 관련하여 데이터 무단 도용 문제가 논란이 되고 있어, 이에 대한 지식재산 쟁점 검토 작성자 문명섭 한국지식재산연구원 법제도연구실 AI혁신정책센터, 부연구위원/법학박사
고유흠 한국지식재산연구원 법제도연구실 AI혁신정책센터, 선임연구원/법학박사수료 ※ 본 보고서 내용은 필자의 개인적인 견해이며, 한국지식재산연구원의 공식적인 의견이 아님을 밝힙니다. Ⅰ배경 및 현황 □ 딥시크 충격과 성능 • 저비용・고효율 모델인 딥시크(DeepSeek)의 출현으로 전 세계 AI 산업계에 큰 파장을 미침 - 딥시크는 미국의 對중국 제재로 저사양 칩을 활용하여 최적화된 모델을 개발하는 방식으로 하드웨어 비용 절감* * 메타의 최신 AI 모델인 Llama 3 모델을 엔비디아의 고성능 칩인 H100으로 훈련한 비용 대비 10% 수준(OpenAI의 5% 수준). 단, 딥시크가 밝힌 금액은 H800(H100의 대중 규제 회피를 위한 수출용버전) 약 2,000개를 시간당 2달러에 2개월 동안 빌린 비용을 계산한 것에 불과. 또한, 연구인력은 150명(데이터 부분 31명)으로, OpenAI 약 1,200명 대비 13% 수준 - 이를 통해 오픈AI, 구글, 메타 등 선도적인 AI 기업에 대한 의존도를 낮출 수 있는 계기를 마련 • 개발 소요 비용・시간 측면에서 경쟁사 대비 월등히 우월한 경쟁력을 갖추면서도 동시에 유사한 성능을 시연하여 뛰어난 가성비를 보유 - (수리적 추론 능력) 미국 수학경시대회 AIME 2024 벤치마크 테스트에서 79.8% 달성(오픈AI ‘o1’의 경우 79.2%) - (챗봇 성능) 딥시크-V3과 딥시크-R1은 UC버클리 연구원들의 챗봇 성능 평가 플랫폼인 ‘챗봇 아레나’에서 상위 10위 안에 랭크(2025.1.25. 기준) • 한편, 기존 AI 기업들이 구축해 왔던 폐쇄적 운영 구조에 반해, 개방형 오픈소스 모델을 제시 - AI 모델을 MIT 라이선스1)로 공개하는 오픈소스* 전략을 채택하여, 상업적 활용을 자유롭게 허가 * AI모델의 코드와 가중치를 공개했으나, 학습 데이터와 훈련 과정은 비공개. 이에 일부 개발자들은 ‘오픈소스’라고 부르기에 부족하다고 비판 - 개방성은 세계 개발자들에게 더 많은 선택권을 제공하여 AI 혁신 속도 가속화 및 기술 경쟁 구도에 긍정적인 변화 예상* * (데미스 허사비스 구글 딥마인드 CEO) “딥시크는 ‘매우 뛰어난 엔지니어링 능력’을 보여 줬으며, 지정학적 차원에서 중요한 변화를 가져올 수 있다”고 언급 □ 딥시크의 출현과 AI 모델 개발 생태계의 변화 • 개방성을 가진 AI 모델을 전 세계 개발자들이 활용함으로써 모델의 성능이나 오류를 협력하여 지속적으로 개선할 수 있어 AI 기술의 발전 가속화 - 이러한 오픈소스 모델의 접근성과 활용성으로 인해, 기존의 폐쇄형 모델을 제공하는 AI 선도기업의 경쟁력이 약화될 가능성 존재 • 저비용의 AI 개발 가능성으로 스마트폰, 자동차, 로봇 등 엣지 디바이스2)의 AI 탑재를 촉진할 전망 - 중국에서는 딥시크 열풍으로 중국 자동차 제조기업, 금융기업, 스마트폰 제조기업 등에서 딥시크를 탑재*하는 추세이며, 엣지 디바이스용 AI 모델의 고도화는 새로운 시장을 창출 및 활용으로 인한 대중화 제고 * 중국 전기차인 BYD는 딥시크를 자사 차량에 적용하기로 했으며, 다른 자동차 제조사들도 AI 모델을 활용해 운전 중 음성명령 기능 등을 향상시킬 계획을 추진 • 저비용・고효율의 딥시크 출현으로 고성능 반도체에 대한 수요 감소 및 중저가 등 레거시 반도체에 대한 수요 증가 등 AI 반도체 생태계 변화 가능 - 딥시크의 경우 경쟁사 대비 GPU 사용량 약 9%만 필요하여, 고성능 GPU 수요 감소 및 연구개발 동력 상실 가능성 존재 - 저사양 GPU와 최적화된 알고리즘으로 고성능 반도체의 의존도가 경감될 수 있어, 연구개발 환경이 빅테크 중심에서 스타트업 중심으로 변화 전망 - 엔디비아의 고성능 칩 수요가 AMD, Intel, ASIC 등의 중저가 칩 수요로 대체될 가능성 및 중국산 제품 수요 증가 가능성 등에 따라 저사양 GPU 활용 추세에 맞춰 차별화된 메모리・패키징 솔루션 개발 기대 □ 경량화 AI 모델 개발을 위한 지식증류의 활용 • 딥시크는 AI 모델 경량화를 위해 전문가 혼합3) 방식과 FP84) 기술을 사용하여 강화학습을 수행하면서, AI 모델의 정확도를 높이기 위해 지식증류(Knowledge Distillation)5) 기술을 활용한 것으로 추정 - 지식증류는 대형 AI 모델(교사 모델)의 지식을 소형 모델(학생 모델)로 이전하여 AI 모델 훈련 비용을 낮추면서도 추론 속도를 향상시킬 수 있어, 효율적인 실시간 응답이 가능 - 또한 교사 모델과 유사한 성능을 유지하면서도 크기를 줄일 수 있어, 모바일 및 엣지 디바이스에서도 원활히 작동하기에 적합 • 경량화된 AI 모델 개발을 위해 저비용의 AI 학습 방법인 지식증류의 활용이 활성화될 것으로 전망 - 지식증류 방식을 통해 AI 모델 개발 비용이 감소하게 되어 더 많은 AI 서비스가 출현하고 스타트업이 AI 기술에 접근할 수 있는 환경을 조성할 것으로 기대 2 현황 □ AI 모델 개발 관련 지식재산 이슈의 변화: 저작권 침해 → 데이터 도용 • 그동안 AI 모델 개발과 관련된 지식재산 이슈는 AI 모델의 학습과정에서 발생하는 저작권 침해 이슈가 중심이었으나, 후발주자들의 선두그룹 AI 모델을 대상으로 학습하는 지식증류 기술로 인해 데이터 도용 이슈로 확대 - 기존에는 주로 방대한 뉴스 저작권을 보유한 언론사들이 AI 개발사들을 대상으로 저작권 침해 소송을 제기하였고, 이에 OpenAI 등은 학습데이터 확보를 위해 언론사들과 콘텐츠 사용 협약을 체결6) • 미국 정부 관계자 및 선두그룹 AI 모델 개발사들은 저비용으로 GPT 수준의 성능을 보이는 딥시크에 대해 데이터 도용 의혹을 주장7) - 도널드 트럼프 미국 대통령이 AI・암호화폐 정책을 총괄하는 차르로 임명한 데이비드 삭스(David Oliver Sacks)는 “딥시크가 미국의 지식재산을 도용했을 개연성이 있다”고 주장 - OpenAI는 “딥시크는 GPT 모델 군의 학습 내용을 R1에 넣은 정황을 포착했다”며 “이는 명백한 지식재산권 침해”라고 주장하고 있으며, MS는 2024년부터 딥시크와 연계된 것으로 추정되는 계정들이 오픈AI의 API를 사용한 정황을 발견했다고 하면서 서비스 이용 약관을 위반한 것으로 의심되는 해당 계정을 모두 차단했다고 밝힘 • 딥시크가 비용 효율적인 AI 모델로 전 세계적으로 큰 관심을 불러일으킨 후 보다 저렴한 AI 모델을 개발하려는 기업들의 행보가 가속화되고 있으며, 이 과정에서 지식증류에 대한 관심 증가 - MS는 소형언어모델인 파이(Phi) 시리즈 개발을 위해 OpenAI에 약 140억 달러를 투자하여 상업적 협력을 체결한 후 GPT-4를 이용한 지식증류 학습법으로, 적은 비용으로 특정 상황에 최적화된 소형 모델 개발에 활용8) - 또한, 지식증류는 AI 모델 개발을 위한 학습데이터의 고갈 문제를 해결하기 위한 합성데이터를 생성하는 방법으로도 주목받고 있음9) • 기업 간 또는 국가 간 글로벌 AI 기술 경쟁이 심화됨에 따라 후발주자(후발국)와의 초격차 유지를 위한 지식재산 분쟁으로 확대 가능성을 보이고 있음10) - AI 모델 개발 경쟁에서 지식증류는 중요한 수단 중 하나로 부각되면서 지식증류를 둘러싼 AI 개발사 간 갈등이 심화될 것으로 전망되고 있음 □ GPT 수준의 성능을 보이는 딥시크에 대해 데이터 무단 도용 가능성이 논란이 되고 있는 시점에서 지식증류 관련 지식재산(저작권, 부정경쟁행위) 쟁점에 대해 검토 1) MIT 라이선스는 오픈소스의 표준 사용 규칙 중 하나로 원작자 표시만 있으면 재사용 및 배포, 상업적 활용에 제약이 없는 자유로운 라이선스 방식임. 2) 엣지 디바이스는 데이터를 중앙화된 데이터 센터로 전송하지 않고, 네트워크의 하위 단계에서 실시간으로 처리, 분석 및 저장하여 처리하는 디바이스를 의미함. 3) 전문가 혼합(Mixture of Experts, MoE)은 AI 모델을 입력 데이터의 하위 집합을 전문으로 하는 별도의 하위 네트워크(또는 ‘전문가’)로 나누어 공동으로 작업을 수행하는 방식으로, 복잡한 작업을 처리할 때 모델의 용량과 효율성을 향상시키기 위해 고안된 고급 머신 러닝 기법임. 4) FP8은 8비트 연산기법으로(Floating Point 8-bit), 딥러닝 모델의 메모리 사용량을 줄이고 계산 효율성을 높이기 위해 설계된 데이터 형식임. 5) 지식증류에 대한 자세한 설명은 “Ⅱ. AI 모델의 학습과 지식증류” 참조. 6) 최영진, AI 학습 데이터의 저작권 소송 이어져…캐나다 언론사 오픈AI 상대로 소송, 이코노미스트, 2024.11.30.자. 7) 안경애, 미 AI차르 “딥시크, 오픈AI 지식재산 도용 증거 있어”, 디지털타임스, 2025.1.30.자. 8) 황치규, 모델 개발 비용 낮춰라...글로벌 AI판 ‘증류 기술’ 열기 고조, 디지털투데이(DigitalToday), 2025.3.5.자. 9) 박찬, 구글 “지식증류로 생성한 합성데이터가 LLM 추론 향상에 효과적”, AI타임스, 2025.1.6.자. 10) Brian E. Ferguson・Chaoxuan Charles Liu・Yuchen Han, “Is AI Distillation By DeepSeek IP Theft?”, Winston & Strawn LLP., MARCH 12, 2025. (이하생략) |
||||