KIIP웹진

웹진 발간일 2023년 7월

지난호 보기 넘어가기
세미나On

AI 산업 활성화와 저작권 제도의 조화
-TDM 면책과 생성형 AI-

현재 서비스 페이지를 안내합니다

AI 산업 활성화와 저작권 제도의 조화

2023년 6월 30일, 한국저작권법학회의 주관으로 'AI산업 활성화와 저작권 제도의 조화'라는 주제로 2023년 상반기 저작권 학술대회가 국회 의원회관 제8간담회실에서 개최되었다. 이번 학술대회에서는 인공지능 산업의 발전으로 인한 데이터 이용의 확대와 저작권법상의 권리 행사 사이에 법제도적 균형을 이루고, 이를 통한 산업적 발전을 도모할 수 있는 방안 모색을 위해 이루어졌다.

학술대회는 한국저작권법학회 안효질 회장의 개회사와 정갑윤 지식재산단체총연합회 회장, 장동혁 국회의원의 축사로 시작되었다.

이어 전남대학교 법학전문대학원의 류시원 교수가 '주요국 텍스트·데이터 마이닝 면책규정의 현황 및 시사점'을 주제로 발표하였고, 두 번째로 충남대학교 법학전문대학원의 이철남 교수가 '생성 AI의 데이터 학습에 관한 쟁점과 TDM 관련 저작권법 개정 방향'에 대해 발표하였다. 지정토론으로는 김병일 교수(한양대학교 법학전문대학원), 차상육 교수(경북대학교 법학전문대학원), 박수호 국장(한국음악저작권협회), 이문배 이사(한국문학예술저작권협회), 장경근 과장(문화체육관광부 저작권정책과), 최동원 과장(과학기술정보통신부 인공지능정책과)이 저작권법상 TDM 면책에 관한 다양한 논의를 제시하였다.

안효질 한국저작권법학회장은 개회사를 통하여 AI(인공지능) 산업의 발전을 위해서는 기존의 저작물이나 각종 데이터에 용이하게 접근하고 이를 이용할 수 있는 법제도적 환경이 마련되어야 한다고 강조하였다. 특히 일본, 유럽 등에서는 관련된 제한규정을 두고 있다는 점과 달리 아직 우리나라는 이와 같은 입법이 이루어지지 않고 있음을 지적하였다. 따라서 AI 산업계에 예측가능성을 부여하고 법적 불확실성을 제거하기 위해서는 저작권법의 개정 또는 현행 저작권법의 해석 기준 등을 명확히 할 필요가 있다고 하였다.

정갑윤 지식재산단체총연합회장은 축사를 통하여 텍스트·데이터 마이닝(TDM) 기법이 통신, 미디어 및 기술, 뱅킹 및 보험, 교육, 제조 등 다양한 영역에서 활용되고 있는 상황에서, TDM 기술의 활용이 기존의 개인정보보호법이나 저작권법 등이 보호하고자 하는 재산적 이익과 충돌하는 문제가 등장하고 있음을 지적하였다. 이러한 문제 해결을 위해 새로운 법적 해석의 필요성이 발생하고 나아가 면책규정이나 입법의 개정 등이 필요하게 된 것이라며 이번 논의의 의의를 제시하였다.

장동혁 국회의원은 축사를 통하여 TDM 기술의 활용 시 저작권법의 보호법익과 충돌가능성이 있음을 지적하고, 이를 해결하기 위해 저작권법상 면책규정 등의 개정을 논의하고 있다고 하였다. 이러한 흐름에서 이번 학술대회는 유의미한 정책 또는 입법으로 이어질 수 있도록 하기 위한 특히 중요한 이정표가 될 수 있을 것으로 기대한다고 하였다.

발표자료 요약

발제1 주요국 텍스트·데이터 마이닝 면책규정의 현황 및 시사점

전남대학교 법학전문대학원 류시원 교수

정보화사회로의 진전은 학술적·산업적 의미를 갖는 데이터의 양적·질적 증대를 가져왔고, 대량의 데이터를 분석하여 가치 있는 정보를 발견하는 정보처리기술인 텍스트·데이터 마이닝(Text and Data Mining, 이하 "TDM") 기법의 활용범위가 확장되었다. 빠르게 확산되고 있는 TDM 기술은 기존 법제와 일부 마찰을 빚고 있다. 예를 들어, 저작권법에서 저작물 혹은 데이터베이스의 상당한 부분을 구성하는 소재가 TDM 분석을 위해 대량으로 수집 및 처리되는 과정에서 저작권법이 보호하는 재산적 이익과 충돌하는 양상으로 나타난다. 그런데 TDM 과정에서의 저작물 등의 이용은 저작권으로 보호되는 창작적 표현형식을 표현으로 재현하거나 소비하는 것이 아닌, 표현으로부터 일정한 패턴이나 정보를 추출하기 위한 메타-표현적 이용에 가까워 저작권법이 예정하고 있는 전형적인 침해적 이용방식과는 차이가 있고, 일정한 학술적·산업적 가치를 가진다는 점에서 정책적으로 장려되어야 할 측면도 있다.

이러한 흐름에 맞춰 주요국에서는 TDM 면책 입법을 활발하게 논의, 실행하고 있다. 일본은 2009년과 2018년 두 차례에 걸친 저작권법 개정을 통해 AI 개발을 위한 데이터의 수집, 처리 등에 관한 규정을 정비하였고, 유럽의 경우 2014년 영국을 필두로 하여 2016년 프랑스, 2017년 독일이 각각 제한된 범위의 TDM 면책규정을 자국 저작권법제에 도입했다. 2019년에는 유럽연합이 역내 TDM 관련 규율체계의 통일화에 관한 내용을 포함하는 디지털 단일시장 저작권 지침(이하 'DSM 지침')을 제정하였다. 이러한 흐름의 근저에는 TDM의 활용이 경제와 사회 전체의 발전에 기여하고 인간에게 유용한 결과를 가져온다는 인식이 깔려 있다. 따라서 TDM의 순기능을 긍정하는 전제에서, 우리나라의 현행 저작권법이 TDM에 적합한 환경을 제공해 주는지, 개선할 지점은 없는지를 검토하는 것은 자연스러운 수순이다.

따라서 국내에서도 도종환 의원 등이 유럽연합의 DSM지침과 일본의 개정저작권법의 각 규정을 참조하여 2021년 초 저작권법 전부개정안을 발의한 뒤로 몇 건의 개정안이 발의되었고 발의된 입법안은 다음과 같은 공통점이 있다. i) 면책 대상의 측면에서는 정보분석 목적의 복제·전송 및 필요한 한도 안에서의 복제물 보관이 공통적으로 포함되고(황보승희 의원안은 2차적저작물 작성도 포함함), ii) 중심 면책 요건으로 적법한 접근과 비향유적 이용일 것을 요구하며, iii) 상업적 목적과 비상업적 목적을 구분하지 않는다는 것이다.

개정안에 관해 '사상 또는 감정의 비향유적 이용'의 의미가 불명확하고 그 해당 여부가 저작물의 표현형식에 따라 달라질 수 있다는 비판이 있고, 상업적 이용까지 면책하는 점에 관해서는 저작권자와 이용자 간의 법익균형 및 국제적 조화 면에서 바람직하지 않다는 비판도 있다. 적법한 접근권한을 요구하는 점에 관해서는, TDM 개별 면책규정 도입의 실익을 해한다거나 접근통제 문제로 이어질 우려 내지 사물인터넷 등을 통한 대량 데이터 수집의 경우에는 그 데이터가 적법한 권한 있는 자에 의해 업로드된 것인지 확인하는 데에 현실적인 한계가 있다는 등의 비판이 제기된다. 근본적인 차원에서 저작권법 전부개정안이 품고 있는 문제를 지적하면 다음과 같다. 첫째로, TDM 면책 입법의 논의 과정에서 우리나라의 고유한 법제 및 현실에 대한 면밀한 고려에 바탕한 정책 형성 과정이 생략되었다. 둘째로, 해외의 유사 입법의 내용만을 단순히 참고하여 차용하는 데 그쳤고, 해당 국가 또는 권역의 입법 형성의 배경에 관한 검토는 거의 이루어지지 않았다.

TDM 면책규정의 도입을 현대적 저작물 이용환경에서 다양한 이해관계의 균형점을 탐색한다는 관점에서 바라본다면, 타국 법제의 요소들을 차용하기에 앞서 우리나라의 연구계와 산업계에서의 각각의 TDM 기술의 발전상황과 수요, 면책의 범위나 수준이 국가경쟁력과 시장 경쟁에 미칠 영향 등에 관한 조사·분석이 선행되고, 이를 바탕으로 우리나라의 산업적·정책적 상황에 가장 적합한 균형점이 탐색되고 설정되어야 한다. 나아가 우리 저작권법 전부개정안에서 취한 것과 같이 서로 다른 입법례의 일부 요소를 각각 차용하는 경우에는 상이한 성격의 입법 요소들을 혼합할 때 나타날 부작용 혹은 시너지에 대한 결과 예측을 바탕으로 세밀한 입법적 검토가 요구된다. 저작권법 전부개정안이 표류 상태에 있는 현 상황에서, 차제에 실증적 조사와 정책 수요에 관한 의견수렴, 정책 목표의 명확한 설정 등의 단계를 차근차근 밟아가며 입법 논의가 재개될 수 있기를 기대한다.

발제2 생성 AI의 데이터 학습에 관한 쟁점과 TDM 관련 저작권법 개정 방향

충남대학교 법학전문대학원 이철남 교수

지난 10여년 동안 기계학습과 심층학습, 인공신경망을 기반으로 한 AI 기술이 우리 사회 각 분야를 크게 변화시키고 있으며, 최근에는 생성 AI가 텍스트, 이미지, 음악 등의 창작 환경에 큰 영향을 미치고 있다. 그런데 특히 대규모 생성 AI 모델은 텍스트 등 대용량의 학습데이터를 필요로 하지만, 현실적으로 저작자 등의 허락을 얻는 것이 쉽지 않다. 이러한 가운데 유럽은 텍스트·데이터 마이닝(Text and Data Mining, 이하 'TDM')을 위한 저작권 면책 규정을 도입했으며, 미국에서는 생성 AI를 위한 데이터 학습의 공정이용 여부에 관한 소송들이 진행되고 있다.

우리 저작권법은 미국의 경우처럼 공정이용에 관한 규정을 두고 있음에도 AI 산업계에서는 예측가능성 등의 관점에서 TDM에 관한 면책규정의 도입을 원하고 있는 것으로 보인다. 저작권 학계, 정부 및 국회 차원에서도 지난 수년간 TDM 관련 저작권법 개정에 관한 논의를 이어오고 있고, 그 과정에서 해외 입법례의 비교·분석을 바탕으로 한 입법론적 논의는 상당히 이루어져왔다.

학습데이터 관련 권리와 이해관계에 관한 주요 쟁점은 저작자의 이용허락에 관한 쟁점과 데이터베이스제작자(플랫폼)의 이용허락에 관한 것으로 나뉜다. 생성 AI의 학습데이터에는 다양한 형태의 데이터가 포함되어 있고, 개별적인 데이터들 중 저작물성 요건을 충족하는 경우에는 저작권에 의한 보호를 받게 된다. 따라서 공정이용 등 저작권법이 허용하고 있는 경우가 아니라면 개별적으로 저작권자의 허락을 받아야만 이용할 수 있다. 하지만 인터넷에 공개된 웹페이지에는 개별 저작물의 이용허락에 관한 내용이 포함되지 않은 경우가 많다. 이와 같은 경우 인터넷에 공개했다는 사정만으로 이용허락을 했다고는 볼 수 없으며, 이를 AI 학습에 이용했다면 공정이용 여부가 중요한 쟁점이 된다.

또한 학습데이터셋은 대부분 데이터베이스의 형태로 존재하므로, 데이터셋을 제작한 기업등은 저작권법상 데이터베이스제작자의 권리를 갖게 된다. 저작권법상 데이터베이스제작자는 그의 데이터베이스의 전부 또는 상당한 부분을 복제·배포·방송 또는 전송할 권리를 가진다. 따라서 누구든지 데이터베이스의 전부 또는 상당한 부분을 이용하고자 할 경우 데이터베이스제작자의 허락을 얻어야만 이용할 수 있다. 하지만 사이트 이용조건을 무시하고 크롤링을 통해 데이터를 수집하여 생성 AI의 학습데이터로 사용했을 경우의 어떻게 취급할 것인지에 관한 쟁점이 있을 수 있다.

현재 이와 관련하여 국회에 계류되어 있는 3개의 TDM 관련 개정안을 검토하면, 공통적으로 i) 인공지능·빅데이터 기술 등의 발전으로 저작물등이 포함된 대량의 정보를 활용할 필요성과 그 분석과정에서 저작물등을 허락 없이 이용하는 경우도 늘어나고 있는데, '공정이용' 조항만으로는 불분명하다는 점, ii) 컴퓨터를 이용한 자동화된 정보분석 과정을 위한 저작물 이용에 대해서는 저작재산권이 제한되는 규정을 명시화하여 경계선을 명확히 함으로써 관련 산업계의 예측가능성을 높인다는 점, iii) 일정한 목적에 필요한 범위에서 적법하게 접근한 저작물에 대해서만 적용되도록 함으로써 저작권자의 권익과 균형을 꾀하고자 했다는 점이 나타난다.

개정안의 주요 쟁점에 대해 검토해보면, EU 지침, 독일 등의 경우 TDM의 행위 주체를 구분하여 적용범위를 달리하고 있는 것과 달리, 개정안은 공통적으로 행위 주체를 구분하지 않고 있다. 또한 비상업적 연구 목적으로 한정하고 있는 영국 등과 달리, 영리를 목적으로 하는 경우에도 정보분석을 허용하는 것으로 규정하고 있다. 영리적인 목적이더라도 기존의 TDM과 같이 원저작물 시장이나 데이터 시장에 큰 영향을 미치지 않는다면 문제가 되지 않으나 생성 AI의 경우 원저작물이나 데이터를 대체하는 효과를 가져올 수 있다는 점에서 시장에 큰 영향을 미칠 위험이 있다. 따라서 기타 기계학습의 경우에도 데이터 시장에 영향을 미칠 가능성을 개별적으로 검토할 필요가 있다.

다음으로, 개정안은 "저작물에 표현된 사상이나 감정을 향유"하는 경우에는 적용대상에서 제외하고 있다. 일본 저작권법에서 차용한 표현으로 보이는데, 그 구체적인 의미가 무엇인지는 명확하지 않다. 특히 생성 AI의 경우 원저작물의 특징을 추출하고 이와 유사한 저작물을 생성할 수 있다는 점에서 구체적인 모델에 따라서는 개정안이 예상한 TDM의 범위에서 제외될 가능성도 있다. 향후 다양한 AI 모델이 나올 것으로 예상되고, 생성 AI와 기타 AI의 경계가 모호해진 경우에는 그 해석과 적용이 쉽지 않을 것으로 보인다.

또한, TDM 개정(안)은 데이터베이스제작자의 권리에 대해서도 준용되는데, 이 경우 특히 개별 저작물과는 별도로 전체 데이터베이스의 시장 가치 측면을 고려할 필요가 있다. 특히 생성 AI 등이 원저작물이나 데이터베이스의 시장 및 가치에 큰 영향을 미칠 수 있다는 점을 고려하면, EU 지침이나 독일 저작권법의 경우처럼 (생성 AI의) 상업적 이용의 경우 권리자들이 TDM 제한 조항의 적용을 배제할 수 있는 옵션을 부여하는 것이 바람직하다고 본다. 대량의 정보를 분석하는 과정에서 개별 권리자들의 의사를 파악하는 것이 쉽지 않으므로, 온라인으로 접근 가능한 저작물의 경우 기계가 읽을 수 있는 형식으로 유보 의사를 표시하도록 할 필요가 있다.

마지막으로, 개정안은 정보분석을 위한 복제·전송에 대해 출처 명시 의무를 면제하고 있다. 하지만 AI의 투명성 관점이나 저작권 보호의 관점에서 개별적인 저작물에 대한 출처 표시는 어렵더라도 학습데이터에 대한 기본적인 내용을 공개하도록 하는 것이 바람직하다고 본다.

주요 쟁점별 분석 내용을 토대로 TDM 관련 저작권법 개정 방향에 대해 3개의 옵션을 제시한다. 옵션 1은 기본적으로 현행 공정이용 규정을 적용하되 AI 연구 및 산업계를 위한 가이드를 제시하는 것이 핵심이다. 시장에서 미치는 영향 등을 고려해 공정이용 여부에 대해 사법부의 개별적인 판단을 하고, 이를 통해 시장에서 자율적인 이해관계 조정을 기대한다. 옵션 2는 연구기관 등의 비영리적 이용에 대해서는 TDM 면책 규정을 도입하고, 영리적 이용에 대해서는 공정이용 조항을 적용하도록 하는 것이다. 옵션 3은 영리적 이용의 범위까지 적용되는 TDM 면책 조항을 도입하는 방향이다. 영리적 이용의 범위는 변형적 이용 범위에 해당하고 시장에 큰 영향을 미치지 않는 범위로 영리 목적 TDM에 대한 면책을 명시적으로 규정하는 방안이다.