제목:생성형 인공지능의 지식재산 이용:
TDM 면책과 공정 이용 논의
글:박소영(국회입법조사처 입법조사관)
생성형 인공지능의 지식재산 이용: TDM 면책과 공정 이용 논의
생성형 인공지능(Generative AI)이 몇 초 만에 글, 그림, 영상을 생성하면서 사회 전반을 변화시키고 있다. 생성형 인공지능은 방대한 데이터 학습의 결과로 글을 이해하고 콘텐츠를 만들어 내고 있다. 2020년 6월, 미국의 오픈에이아이(OpenAI)가 발표한 GPT-3는 45테라바이트(TB)에 달하는 텍스트 데이터를 학습했다. 그 이후 모델의 학습 데이터 규모를 밝히고 있지 않지만 그보다 더 많은 데이터를 학습하였을 것으로 보인다.
콘텐츠를 학습하여 콘텐츠를 만드는 생성형 인공지능이 빠르게 성장하면서, 여러 지식재산권 이슈가 발생하고 있다. 학습 과정에서 허락 없이 저작권이 있는 콘텐츠를 이용하거나 데이터베이스 정보를 가져오는 문제, 생성한 콘텐츠가 저작권·상표권 등을 침해하는 문제, 생성한 콘텐츠에 대해 저작권·특허권을 인정할 것인지에 대한 문제가 대표적이다.
특히 학습 과정에서 발생하는 지식재산권 이용 문제에 대해 법적 분쟁이 상당수 발생하고 있다. 최근 여러 소송이 진행되고 있는데, 미국의 뉴욕타임스(NYT)가 OpenAI와 마이크로소프트를 상대로 제기한 소송이 대표적이다. NYT는 OpenAI가 자신들의 수백만 건 기사를 허락 없이 인공지능 학습에 사용하여 저작권을 침해하고, 이러한 학습을 통해서 NYT 콘텐츠를 대체하는 경쟁 상품을 만듦으로써 부당한 경쟁 우위를 확보하며, 잘못된 정보를 NYT 출처로 제공하면서 NYT의 명예를 훼손하였음을 주장하고 있다. 이에 대해 OpenAI는 방대한 데이터를 학습하였기 때문에 특정 출처의 데이터가 차지하는 비중은 매우 작고, 인터넷에 공개된 자료를 사용하여 학습하는 것은 공정 이용에 해당한다고 주장하고 있다.
NYT 소송은 국내에도 영향을 주었다. 올해 1월 지상파 방송 3사(KBS, MBC, SBS)는 자사 뉴스를 네이버가 무단으로 생성형 인공지능에 활용하였음을 이유로 하여, 네이버를 상대로 저작권 침해·부정경쟁방지법 위반으로 인한 손해배상 청구, 학습금지 등을 청구하는 소송을 제기했다. 다른 언론단체도 뉴스 데이터의 인공지능 학습 대가 관련 소송을 진행하거나 소송 여부를 검토하고 있는 것으로 파악되고 있다.
인공지능 발전과 지식재산권 보호 사이의 이해관계 조정은 앞으로 중요한 문제이다. 인공지능 기술 발전과 혁신을 촉진하기 위해서는 기존 지식재산권에 대한 접근 허용이 어느 정도 필요한 반면 지식재산권자의 권리 보호도 함께 고려되어야 한다.
2010년대부터 이러한 조정 방안으로 TDM(Text-Data Mining) 면책 규정이 논의되었다. TDM 면책 규정은 인공지능 모델의 학습 과정에서 문서와 데이터를 수집하고 분석하는 행위(TDM)는 콘텐츠의 표현 자체를 이용하는 것이 아니라 콘텐츠 속의 정보를 추출하고 분석하기 위한 것이라 보고 일정한 조건 하에서 저작권 이용을 허락하는 내용을 담고 있다.
EU는 2019년 「디지털 단일시장 저작권에 관한 유럽의회 및 위원회 지침」에 TDM 면책 규정을 도입하였다. 연구기관과 문화유산기관이 학술연구 목적으로 이용하는 경우에 대해서는 TDM 면책을 강제하고, 그 외의 경우에는 적법하게 접근할 수 있는 저작물에 대해서 권리자가 이를 명시적으로 배제하지 않는 한 TDM을 위한 복제, 추출을 허용하고 있다. 일본은 2018년 「저작권법」을 개정하여 TDM 면책 규정을 도입하였다. 저작물에 표현된 사상이나 감정을 자신 또는 타인이 향수하는 목적이 아닌 경우와 컴퓨터를 이용한 정보처리를 통해 새로운 지식·정보를 창출함으로써 부수적으로 경미하게 이용하는 경우에 대해서 면책하고 있다. 영국은 2014년 「저작권법」을 개정하여 비상업 목적에 한하여 TDM 면책을 도입하였다.
일부 국가에서 TDM 면책 규정을 도입한 당시에는 분류 및 예측 모형의 인공지능이 대부분이었다. 2022년 ChatGPT 등장 이후 생성형 인공지능이 폭발적으로 증가하고 학습 데이터 활용과 관련된 분쟁이 본격화되면서 생성형 인공지능의 지식재산권 이용 논의는 새로운 국면을 맞이하였다.
미국은 TDM에 대한 명확한 면책 규정 없이 판례를 통해 인공지능 학습 데이터의 저작권 침해 여부를 판단하고 있는데, 최근 공정 이용을 엄격하게 인정하는 방향을 보이고 있다. 특히 미국 연방대법원은 2023년 앤디 워홀 재단(Andy Warhol Foundation) vs. 골드스미스(Goldsmith) 사건에서 공정 이용에 대한 기준을 엄격하게 제시하면서, 원작자의 허락 없이 무단으로 저작물을 활용한 경우 이를 쉽게 공정 이용으로 판단하지 않을 것임을 시사하였다. 이러한 기준이 생성형 인공지능의 지식재산권 이용 문제에도 적용될 가능성이 높아, 향후 미국 내 관련 논의에 중요한 영향을 미칠 것으로 보인다.
앞으로 다양한 소송 사례와 입법적 논의를 통해 TDM 면책 규정의 필요성과 적용 범위뿐 아니라 공정 이용 법리의 구체적인 허용 기준 등이 보다 명확히 정립되어 나갈 것으로 보인다. 인공지능이 지식재산권 체계에 미치는 영향이 점점 확대되는 상황에서 인공지능 발전과 지식재산권 보호라는 두 가치를 균형있게 충족시킬 수 있는 접근방법을 모색해 나가야 할 필요성이 있다.