KIIP웹진(2023년3월) 딥러닝과 학습데이터 보호

커버 스토리

ChatGPT의 등장과 우리사회의 변화

기고자. 김진홍 교수(배재대학교 소프트웨어학과)

빠른 전체 메뉴

현재 서비스 페이지를 안내합니다

본문

우리의 삶은 인공지능과 함께 현 시대를 살아가고 있다. 인공지능 기술이 마치 우리의 일상과 함께 움직이듯이 인공지능은 학습, 문제 해결, 패턴 인식 등과 같은 인간 지능과 연결된 인지 문제를 해결해 줄 뿐만 아니라, 로봇 공학이나 미래의 모습을 내포하고 있다. 인공지능은 공상 과학 소설 혹은 영화에 나오는 작은 로봇을 넘어 첨단 융합 공학의 현실로 자리를 잡고 있으며, 논리와 철학에 기원을 둔 상징주의자, 신경 과학에서 유래한 연결주의자, 진화 생물학과 관련된 진화론자, 통계와 개연성을 다루는 베이지안, 그리고 심리학에 기반을 둔 유추론자로 구성된 기계 학습의 "5가지 집단"(Pedro Domingos 교수)의 이론을 뒷받침하고 있다.

그 가운데 인공지능의 언어 모델은 전 세계적으로 AI 커뮤니티를 넘어 최고의 이슈로 자리 잡고 있으며, OpenAI는 인공지능의 기술을 적용하여 복잡한 질문에 대화식으로 답할 수 있는 ChatGPT를 선보였다. 인간 수준의 응답을 제공하는 뛰어난 능력을 가진 ChatGPT가 인간이 컴퓨터와 상호 작용하는 방법을 변형하면서 정보 검색 방법의 패러다임을 변화시켰다.

OpenAI가 개발한 ChatGPT(현재 GPT-4 버전)는 대형 언어 모델(Large Language Model, LLM) 챗봇을 뜻한다. ChatGPT는 대화 형태로 상호작용을 하며 일련의 단어에서 다음 단어를 예측하는 작업을 수행하고, 인간 피드백형 강화학습 (Reinforcement Learning Human Feedback)을 통해 사용자의 지시에 맞는 만족스러운 반응을 생성하는 능력을 만들기 위하여 인간 피드백에 기반한 추가 훈련 계층을 사용한다.

그러면 ChatGPT는 어떻게 훈련이 되었는가? GPT는 ChatGPT가 대화를 학습하고 인간과 같은 대응 방식을 달성할 수 있도록 온라인 커뮤니티 내 토론과 같은 소스를 포함하여 인터넷의 코드 및 정보에 대한 방대한 양의 데이터를 통해 훈련되었다. 또한, 대형 언어 모델 (LLM) 훈련을 통해 인간이 질문에 대해 기대하는 답변을 생성할 수 있도록 학습한다.

그렇다면 ChatGPT는 우리가 흔히 이야기 하고 있는 인공지능과 어떤 차이점이 있는 것일까? 인공지능은 동적 컴퓨팅 환경에 내장된 알고리즘을 생성하고 적용하여 인간의 지능을 모방하는 것으로 '계산 시스템', '빅데이터', '고급AI 알고리즘' 데이터와 처리 성능을 요구하는 소프트웨어와 하드웨어로서, 의사 결정을 지향하는 미래 기술이라 할 수 있다. 반면 ChatGPT는 OpenAI가 개발한 인공지능 기술로서, HCI(Human Computer Interaction)에 의한 정보 검색을 지향하는 대형 언어 모델이라는 점에서 차이를 갖는다. 이 차이점은 개념적 정의에 의한 차이일 뿐, ChatGPT는 인공지능의 다양한 기술을 응용한 것이라 볼 수 있다.

NLP과 GPT-4 비교
언어모델	NLP	GPT-4
언어모델 대화기반	NLP 명령기반	GPT-4 지속적인 대화 기반
언어모델 기능	NLP 텍스트 분류 및 추출	GPT-4 자연어 이해 및 생성
언어모델 사용자 인터페이스(UI)	NLP 웹 브라우저 인터페이스	GPT-4 채팅 인터페이스
언어모델 학습데이터	NLP 사용자가 제공한 데이터	GPT-4 대규모 인터넷 코퍼스

AI 언어 모델은 우리의 일상생활 및 산업 분야에 활용되어 혁신을 일궈내고 있다. 특히 ChatGPT라는 언어AI가 탄생함에 따라 역사상 가장 뛰어난 인공지능 언어에 초점을 맞춰 세계 각국의 다양한 기업들은 이 흐름에 따를 고도화된 서비스를 개발하고 있다. 중국 화웨이는 최대 2,000억개의 매개변수를 포함하는 대규모 자연어처리 모델(750GB)인 '판구 알파'를 개발하고 아카이브를 공개하였다. 트랜스포머 기반 자기회귀언어 모델을 기본 아키텍처로 선택함으로서 다른 쿼리 레이어가 트랜스포머 레이어 위에 추가되는 모델을 선보인 것이다. 구글의 람다(LaMDA)는 오픈소싱기반 신경망 아키텍처인 트랜스포머를 기반으로 구축한 것으로, 새로운 구글 언어AI를 연구 개발 중에 있다. 국내에서는 SK텔레콤이 아마존웹서비스와 협력해 오픈 AI의 GPT-3 이전 모델인 'GPT-2'에 상응하는 최초의 한국어로 학습된 오픈소스 기반 모델인 'KoGPT-2(Generative Pretrained Transformer)'를 공개하기도 하였다.

이처럼 초거대 AI 언어 모델은 현재 많은 대학, 연구소 및 기업을 중심으로 매우 활발하게 연구·개발되고 있다. 앞으로 기업 뿐만 아니라 이를 사용할 수요자들 모두에게 중요한 영향을 미칠 것으로 예상된다. 또한, 인간 언어의 의미망을 확대한 AI 알고리즘의 발전이 의료산업, 법, 교육, 예술 등 다양한 분야에서 어떤 파급 효과를 가져올 것인지 많은 상상이 진행되고 있다. 아직 ChatGPT와 같은 초거대 AI 언어 모델로 인하여 어떠한 효과가 우리 사회에 미칠 것인지 확신할 수는 없지만, 대량의 비정형화된 빅데이터 언어로부터 세상의 'Valuable Knowledge'를 추출하고 가공할 수 있는 AI 언어처리 기술이 차세대 초지능, 초연결 사회 구현에 기반이 되는 중요한 기술이자 인공지능 구현을 위한 핵심 기술로 작용될 것으로 전망한다.

다른 기사 보기

다른 기사 보기 넘어가기