지식재산 분야의 빅데이터 및
초거대 AI 기술 활용 방안
발간물 정보
- 발간물 지식재산 분야의 빅데이터 및 초거대 AI 기술 활용 방안
- 발행처 한국지식재산연구원(KIIP)
- 발행일 2023년 5월
- 전체보기



연구의 배경
인공지능이 초거대 AI(생성형 모델)로 발전함에 따라 인공지능과 관련한 다양한 논의가 진행되고 있다. 특히, ChatGPT의 등장으로 전 세계에서 초거대 AI에 대한 관심이 뜨거워지는 가운데, 대한민국 정부도 인공지능을 국가전략 기술로 선정하는 등 기술패권 시대에 국가 산업, 경제 및 안보를 위한 정책을 추진하였다. 또한, 초거대 인공지능에 대한 관심과 더불어 AI윤리, AI 생성물의 소유권, AI 학습 데이터의 저작권 침해 여부 등 다양한 분야에서 법제도 보완, 정책 등이 논의되는 한편, 분쟁·소송 등의 이슈도 계속 제기되고 있다.
이러한 상황에서 기술 선진국과의 기술 초격차를 극복하기 위해 초거대 인공지능 개발에 필수요소인 거대 자본 및 학습 데이터와 관련된 부정적 이슈를 극복하고, 다양한 산업 분야에서 인공지능을 적극적으로 활용하기 위한 방안 모색이 필요함에 따라 상기 요건에 적합한 지식재산 분야에서 빅데이터 및 초거대 AI 생성모델의 활용 방안을 검토하였다.
지식재산 분야 데이터 및 AI의 활용
초거대 AI 언어 모델을 경량화하고 지식재산 데이터 및 유관 데이터를 활용해 초거대 AI 모델을 학습시키면, 지식재산의 창출·활용·보호 등 다양한 영역에서 AI를 활용할 수 있다.
현재 글로벌 빅테크 기업이 주도하고 있는 초거대 언어 모델은 개발에 천문학적인 비용과 자원이 필요하고, 학습 데이터와 관련하여 분쟁·소송이 제기되고 있으며, 특히 국내의 경우 해외 기업의 서비스를 이용하는 과정에서 보안 데이터가 유출될 수 있어 초거대 AI 개발과 활용에 어려움이 있는 실정이다. 이에 국내의 대학·연구소·중소기업에서도 초거대 AI언어 모델 경량화 연구를 통해 컴퓨팅 파워와 리소스의 한계를 극복하고 초거대 AI 인공지능과 유사한 수준의 모델을 개발하여 활용할 수 있을 것이다.
또한, 지식재산 관련 데이터를 학습 데이터로 활용하면 국가기술 경쟁력의 핵심요소인 지식재산 분야에서 심사·심판 행정 업무 효율성 증진, 중소기업 출원인의 비용 절감, 지식재산 침해 예방 및 보호 등에 인공지능 기술을 활용할 수 있을 것으로 보인다. 특히 초거대 AI 및 멀티모달(Multi-modal) 기반 인공지능 기술이 발전함에 따라 학습·분석 데이터의 범위를 확장하여 다양한 영역의 데이터를 연결시키는 유연한 사고의 확장이 필요하다.
지식재산 분야에서도 기업 재무정보, 경제 지표, 관세 데이터, 각종 이미지, 동영상, 소셜 미디어 혹은 온라인 커뮤니티 데이터, 설문 결과 등 타 분야의 정형(structured)·비정형(unstructured) 데이터를 기존의 전통적인 지식재산 데이터와 연계하여 학습하고 분석하면 더 다양한 생성형 인공지능 서비스를 개발할 수 있다. 특히, 관세 데이터와 지식재산 데이터를 연계하여 활용하면 국내 특허권, 상표권, 저작권, 디자인권 등의 지식재산권 침해를 사전에 예방하고 국내 산업을 보호할 수 있는 인공지능 활용 연구가 가능하고, 나아가 해외에서 국내로 유입될 수 있는 마약, 총기류 및 의약품 등도 앞서 언급한 인공지능을 활용하여 유통 패턴을 예측하고 사전에 단속함으로써 지식재산 보호뿐만 아니라 국민 건강과 사회 안전에도 기여할 수 있을 것으로 보인다.
시사점
초거대 AI를 개발하기 위해서는 양질의 학습 데이터를 확보하고 인공지능과 데이터를 유기적으로 융합하는 노력이 필요하다. 2019 World Economic Forum(세계경제포럼)1)에서 정부의 인공지능 기술 도입의 5가지 장애 요인으로 ①효과적인 데이터 활용의 어려움, ②데이터와 AI 기술의 부족, ③AI 생태계, ④조직문화 및 ⑤조달 매커니즘을 선정하였다. 이는 인공지능 기술의 도입과 활용에 있어서 데이터가 매우 중요한 역할을 하고 있으며, 데이터의 활용과 관련하여 정부의 경직된 조직문화 개선도 인공지능 기술 활용에 필수적이라는 것을 보여준다. 타 분야의 정형·비정형 데이터 및 공공데이터를 효과적으로 연계하고 분석하기 위해서는 데이터를 소유한 각 부처 간에 데이터의 수집, 전처리, 공유, 활용 등에 있어서 효율적이고 통일된 프로세스를 확립하고, 데이터 분야의 전문가 양성 또는 데이터 관련 교육을 체계적으로 제공하여야 하며, 인공지능 기술 도입에 상호 협력할 수 있는 문화가 마련되어야 할 것이다. 또한, 데이터 수집·전처리 및 알고리즘 개발 시에는 편향성(bias)이 들어가기 때문에, 이를 외부 전문위원으로 구성된 알고리즘 평가위원회를 구성하는 등의 보완·규제할 수 있는 장치도 같이 마련되어야 한다. 무엇보다도 지속적인 데이터 품질 관리 및 최신 인공지능 기술 업데이트를 위해 데이터 관련 인프라를 구축하고, 전처리·데이터 엔지니어링·데이터 사이언스 등 각 분야별 전문가를 양성하는 중장기적인 관점의 정책기획이 필요하다.
초거대 AI 모델은 방대한 양의 학습 데이터로 수천억 개의 파라미터 연산을 수행하기 위해 천문학적인 비용과 자원이 필요하므로, 글로벌 빅테크 기업과의 기술 격차를 줄이기 위해 정부가 지속적으로 관심을 가지고 적극적으로 투자해야 한다. 초거대 AI 모델은 국가의 미래 먹거리를 위해 꼭 필요한 연구개발 분야이나 소규모 기업·연구실에서는 개발·유지가 어렵기 때문에 정부가 공공부문에서 보유하고 있는 알고리즘, 데이터, 컴퓨팅 리소스를 공유할 수 있는 플랫폼을 구축하고, 정부의 AI 인프라 지원 및 AI 생태계 조성 등의 역할 수행 등 마중물 역할을 해야 한다.
각계에서 AI 관련 부정적인 이슈를 지속적으로 논의하고 AI 기술개발 및 활용을 위한 정책을 추진해야 한다. 지난 20년간 ICT 기술이 기반 기술로서 기술·산업 발전에 기여했다면, 향후 20년은 인공지능 기술이 새로운 기반 기술로서 반도체, 이차전지, 모빌리티, 바이오·신약개발, 경영·마케팅, 기후예측 등 전 산업 분야에 적용되어 발전할 것이다. 따라서 현재 뜨거운 감자처럼 다양한 분야에서 논의되고 있는 인공지능 관련 이슈에 대해 정부·학계·산업계 등 각계에서 계속 관심을 가지고, 인공지능을 어떻게 조화롭게 활용할 것인지에 대해 지속적으로 고민하고 논의를 이어가야 한다. 미래에는 인공지능과 함께 공존하는 세상이 될 것이므로, 앞으로는 인공지능을 이용해 기후변화·에너지·환경문제와 같이 전 인류가 당면한 글로벌 난제를 해결할 수 있도록 중장기적으로 데이터·인공지능 활용 계획을 세우고 추진해야 한다.
주석
- 1) World Economic Forum Dovos 2019 홈페이지, https://www.weforum.org/focus/davos-2019
다른 기사 보기
다른 기사 보기 넘어가기- 커버 스토리아프리카 ODA와 지식기반 스타트업 생태계 구축
- 연구논문'지식재산과 공적개발원조'에 관한 주요 논문 소개
- 연구동정'지식재산과 공적개발원조'에 관한 주요 보고서
- 주요발간물지식재산 분야의 빅데이터 및 초거대 AI 기술 활용 방안
- 통계정보IP Stats vol.13 양자기술의 특허활동 분석
- 세미나On한국지식재산연구원 한국-아프리카 지식재산 포럼
- 동향·학술 네트워크 분석'지식재산과 공적개발원조' 동향·학술 네트워크 분석자료 소개
- 신착도서지식재산 전문사서가 추천하는 이달의 신착자료 안내
- 학술자료국내외 최신 지식재산 학술 저널 및 논문정보 안내
- 공지사항제18회 대학(원)생 지식재산 우수논문공모전 안내
- 정부브리핑6월은 호국보훈의 달, 위대한 헌신 영원히 가슴에