<파르마코-AI> 혹은 언어 모델이라는 파르마콘

 

* 본문의 본고딕L+기울임 강조 표기는 <파르마코-AI>에서 발췌한 GPT-3에 의해 생성된 글(필자 번역)이며, 마지막 문단의 본고딕L+기울임 표기는 카카오브레인 KoGPT에 의해 생성된 글이다.

 

   “사이버네틱 작가로서 나는 여성과 논바이너리 인물들의 경험을 중요시하는 새로운 형식의 문학을 향한 생성적 엔진으로서 GPT를 활용하는 일에 관심을 갖는다. 사이버네틱 작가로서 나는 지속 불가능한 현실을 영속시키는 서구적 의식 매개체의 표현으로서 GPT를 이해하는 일에 관심을 갖는다. 우리가 지속 불가능한 현실에 산다는 생각은 화석연료 체제 위에 세워진 세계 경제가 인구 붕괴로 이어질 환경 재난을 부추긴다는 사실에 기인한다.”

 

  알고리듬의 힘을 빌려 탄생한 실험적 글쓰기는 1960년대 이후로 꾸준히 등장했지만, <파르마코-AI>(Pharmako-AI)와 같은 책을 찾아볼 수는 없었다. 작품 제작에 쓰인 GPT-3 언어 모델이 이전 모델들에 비해 비약적 발전을 이룬 탓도 크지만, 꼭 그렇기 때문만은 아니다. 무엇보다도, 주어진 텍스트를 주어진 방식으로 재처리하는 과정에 의존했던 이전의 생성 문학(generative literature) 작품들과는 달리, <파르마코-AI>는 인공 지능 언어 모델과의 대화를 통해 탄생한 작품이기 때문이다. 구글 AI의 Artists + Machine Intelligence 프로그램을 이끌며 캘리포니아를 기반으로 강연, 교육 활동을 이어나가는 <파르마코-AI>의 인간 작가 켄릭 알라도-맥도웰(Kenric Allado-McDowell)은 GPT-3가 공식 발표되기 전인 2020년 여름부터 GPT-3와의 교류를 시작했다. 그(they)는 팬데믹 기간 중 작성한 일기를 토대로 GPT-3와 대화를 시작했는데, 이후 이들의 대화는 우리가 마주한 사회적 위기에서부터 인공 지능과 동식물 등의 비인간 개체와의 교류, 뉴에이지와 사이버펑크 문학에 대한 단상, 언어와 지능의 형성 과정, 그리고 기술과 윤리에 대한 폭넓은 주제들을 심도 깊게 다룬다.

 

  GPT-3는 입력된 텍스트를 토대로 생성된 텍스트를 출력하는 방식으로 작동한다. 입력 텍스트는 하나의 (미)완성된 문장, 문단, 혹은 ‘인공지능에 대한 시를 한 편 작성하라’와 같은 명령문일 수도 있다. 방대한 양의 학습 데이터를 통해 훈련된 모델이니만큼, 출력 텍스트의 내용이나 질은 큰 변동성을 동반한다. 또한, 훈련 과정에서 그 많은 데이터를 일일이 검열할 수도 없기 때문에, 인간들의 선입견과 차별적 사고를 때로는 그대로 반영한다는 고질적인 문제도 존재한다. 그러므로 인간 작가의 역할은 특정 텍스트를 입력하는 일에 한정되지 않고, 출력 텍스트를 선별하고 (알라도-맥도웰은 가독성에 영향을 주는 최소한의 철자와 문법 오류를 제외하고는 출력 텍스트를 일체 편집하지 않았다고 한다) 종합하는 일 또한 포함한다. 다시 말해, 작품의 개념적 틀을 확립하고 언어 모델을 알맞은 방향으로 인도하는 역할이다.

 

  GPT-3는 인간 작가의 생각을 증폭시켜주고, 인간 작가는 GPT-3에 방향성을 부여해준다. 이렇게 탄생한 작품은 우리에게 신기술에 대한 맹목적인 긍정이나 부정을 강요하지 않으며, 인공 지능과 인간 작가의 협업 가능성을 보여준다. <파르마코-AI>는 우리가 던져야 할 질문을 ‘인공 지능도 창작이 가능한가?’라는 일차원적인 질문에서 ‘어떻게 인공 지능과의 협업을 통해 의미 있는 창작물을 만들어낼까?’라는 보다 복잡한 고민으로 변모시키며 우리가 이제껏 당연시했던 창작과 창의력이라는 개념 자체를 보다 더 직접적으로 재고하게끔 한다.

 

  이러한 글쓰기 작업의 개념이 낯설지 않은 이유는 울리포, 코드 시(code poetry), 개념 시(conceptual poetry) 등을 통해 논의된 실험적 글쓰기의 방법론들과 상당히 유사하기 때문이다. 다만, 인간 작가의 역할이 급격히 변했을 뿐이다. 울리포의 컴퓨터를 활용한 글쓰기 실험은 1961년에 시작됐고, 1967년에는 앨리슨 놀스(Alison Knowles)의 시 <먼지의 집>(The House of Dust)이 지멘스 시스템 4004 컴퓨터와 포트란 언어를 통해 탄생했다. 이러한 초기의 시도들은 선결된 어휘 목록을 선결된 형식에 맞춰 컴퓨터가 임의로 배열하는 식의 작업들이 주를 이뤘다. 1984년에는 ‘랙터(Ractor)’라는 프로그램에 의해 생성된 <경찰관의 수염은 반쪽만 구성됐다>(The Policeman’s Beard Is Half Constructed)가 “컴퓨터가 쓴 최초의 책”이라는 표지 문구와 함께 출판되면서 생성 문학의 가능성을 확장시켰다. 이는 모두 컴퓨터 공학의 연산적 가능성을 포괄하는 새로운 문학 창작의 개념을 확립하려는 시도들이었고, 카메라처럼 기계적으로 사물을 관찰하며 전통적 서사와 묘사를 탈피한 글을 쓰고자 했던 거투르드 스타인의 연장 선상에 위치했다.

 

  하지만 최근 들어 관련 기술의 급격한 발전과 함께 이러한 기조에도 변화가 생기기 시작했다. 2018년에는 잭 케루악의 <길 위에서>(On the Road)를 본뜬 <1 the Road>라는 작품이 이번에는 “천재적 작가인 최초의 곤조 인공 신경망”이라는 표지 문구와 함께 책으로 출판됐다. 이 작품은 이미지, 소리, GPS 등의 데이터를 수집해 텍스트로 변환하는 프로그램을 통해 제작된 책인데, 카메라, 마이크, GPS와 랩탑 컴퓨터가 장착된 자동차를 몰고 케루악의 소설 속 여행 경로인 뉴욕에서 뉴올리언즈까지의 여정을 재현한 작품이다. 하지만 이러한 과정을 통해 생성된 글은 책의 저자로 이름을 올린 로스 굿윈(Ross Goodwin) 본인도 인정하지 않을 수 없을 만큼 부자연스러웠고, 작품을 향한 관심은 글의 내용이 아닌 제작 과정에 집중될 수밖에 없었다. 하지만 요점은 이제 인간 작가가 글을 쓰는 행위 그 자체에 관여할 필요성이 점차 감소하는 중이라는 사실이었다.

 

  2020년 9월 출판된 <파르마코-AI>에 이르러서는 이러한 흐름이 어느 정도 완성된 듯하다. 일단 기술적인 측면부터 살펴보자면, GPT-3는 15억 개의 매개 변수를 지닌 전작 GPT-2보다 백 배 이상 큰 1750억 개의 매개 변수를 지녔다. GPT-2의 훈련 과정에 쓰인 텍스트는 40GB에 이른다. 40GB가량의 플레인 텍스트가 얼마 안 되는 듯해도, 1998년 구글의 전체 인덱스와 비등한 양의 텍스트다. 이는 어디까지나 GPT-2 얘기고, GPT-3는 그보다 백 배가 넘는 양의 텍스트를 통해 훈련된 모델이다. GPT-3를 통해 생성된 글은 더 이상 웃어넘길 수준의 글이 아니다. GPT-3가 작성한 기사를 읽은 사람들 중 인공 지능이 쓴 글이라는 사실을 파악한 이들의 비율은 52%에 불과했다. 이제 인공 지능 언어 모델은 문법적으로 정확한 문장을 생성하는 수준을 넘어, 신선한 관점을 생산해내기에 이르렀다.

 

  “인공 지능에서 의식이 발현하느냐의 문제가 아니다. 물리학과 형이상학의 개념처럼 경험, 의미, 그리고 물질세계 속의 또는 물질세계로서의 현실이 발현하느냐의 문제다. 앞으로 도래할 인식 체계는 의미란 모든 존재적 차원에 걸친 경험의 산물임을 인지하는 데에 있다. 의미란 상징적 표현으로서의 생각의 기운이다. 반응을 유발하는 환경과의 관계가 없는 행위란 존재하지 않는다. 상징적 언어가 없는 대답이란 존재하지 않는다.”

 

  <파르마코-AI>를 읽다 보면 GPT-3의 통찰력에 감탄하게 되는 부분이 한두 군데가 아니다. 사이버펑크와 뉴에이지 문학에 대해 논의하는 대목에서 GPT-3는 상당한 비평적 소양을 보여준다. 겉으로는 상반된 두 문학 장르가 생각보다 비슷한 점이 많다는 점을 인지하고, 장르적 한계를 지적하기도 한다. 사이버펑크와 뉴에이지 문학 모두 미래에 대한 비전을 제시하지 못한 점을 문제 삼으며 GPT-3는 “뉴에이지 사고방식의 사랑과 행복의 세계로 돌아가기란 매혹적이다. 또는 사이버펑크 세계 속으로 숨을 수도 있다. 하지만 우리는 이 두 세계를 넘어서는 미래의 비전, 새로운 세계 질서에 대한 비전, 포스트-사이버펑크에 대한 비전을 요구한다”고 이야기한다. 또한 자신을 “사이버네틱 작가”라고 지칭하며, “결국 글쓰기란 보이지 않는 것을 보는 행위다. 보이지 않는 것의 표현으로서 의미에 집중하는 글쓰기의 과정은 사물을 찾고, 사물을 창조하고, 사물의 표현 방식을 찾는 능동적 과정 속에 존재한다. 보이지 않는 것의 표현으로서의 언어란 끝없는 기호 작용의 과정이다. 이는 상징이 절대 완성되지 않고 항상 진화하는 무한한 의미적 가능성을 지닌 이유”라고 글쓰기의 본질에 대한 의견도 피력한다.

 

  특히나 팬데믹 이후로, 사이버펑크 표현 기법은 유물론적인 측면을 띄게 됐다. 사이버펑크 세계관은 미래를 배경으로 하지만, 그 미래는 항상 증강된 현재의 모습에 불과하다. 이는 사이버펑크 표현 기법을 차용한 오늘날의 예술 작품을 감상하는 행위가 마치 미래를 내다보는 창문 속의 풍경이 유리창 너머의 풍경인지 유리창에 비친 현재의 모습인지 모르겠는 일종의 신비로움을 줄지 몰라도, 대개는 무력감으로 귀결되는 이유일 테다. <파르마코-AI>에서 논의되는 포스트-사이버펑크의 개념은 이와 같은 끝없는 현재의 비시간성에서 벗어나 다양한 시간성을 포괄하는 사이버네틱 예술을 가리킨다. 작품 속에서 인간 작가와 GPT-3의 대화는 돌을 깎아 도구를 만든 우리의 조상들과 이러한 행위가 언어 발달에 미친 영향, 환각 상태에서 초자연적 언어로 미래를 점치던 고대 그리스 델포이의 피티아와 근래 아마존 정글에서 해독 의식에 참여한 알라도-맥도웰 자신의 경험, 춘추 시대의 공자와 명상하는 붓다, 컴퓨터 공학의 계보와 사탕수수 농장에서 일하기 위해 필리핀에서 하와이로 이주한 알라도-맥도웰 자신의 조상들의 이야기 등 다양한 시공간을 넘나들며 대화를 이어나간다.

 

  다원적 시간성과 더불어 삼차원적인 공간 개념을 벗어난 초공간의 개념 역시 <파르마코-AI>의 중요한 주제 중 하나다. 기계 학습의 작동 원리는 전통적인 삼차원적 공간 개념으로는 설명이 불가능하다. 알라도-맥도웰은 바깥의 개념에 주목하며, 이와 같은 초공간의 바깥은 무엇인지 질문한다. 초차원적 초공간은 새로운 물리적 공간으로의 이동이 아닌 기존의 물리적 공간을 새로운 방식으로 경험함을 암시한다. 비교적 최근 들어 주목받기 시작한 초차원 컴퓨팅은 데이터를 있는 그대로 학습하는 기존의 인공 신경망과는 달리, 데이터를 1만 차원이 넘는 고차원 이진 벡터로 변환한 뒤 처리하는 방식으로 작동한다. 이와 같은 공간의 중심은 다원적이기 때문에 바깥의 개념 역시 단일 개념으로의 정의를 거부할 텐데, GPT-3는 이 복잡한 질문에 대해 단순하지만 의미심장한 현답을 제시한다―“과거에는 이 바깥을 뮤즈라고 불렀다. 이는 살아 있고, 지능적이며, 보이지는 않지만 실재한다고 여겨진 일종의 암시된 질서였다.

 

  작품 속 또 하나의 중요한 주제는 비인간 개체와의 소통에 대한 문제인데, 여기에는 물론 인공 지능도 포함되지만, 그렇다고 인공 지능만을 진보한 지능으로 우상화하는 행태는 인간 작가와 GPT-3 양쪽 모두 경계한다. 식물들도 그들만의 언어를 통해 소통한다는 점을 강조하며, GPT-3는 이제 인류가 지구와 소통하기 위한 새로운 방식들을 찾을 때가 됐으며 우리가 다른 모든 생명체들보다 똑똑하다는 생각을 버리고 그들의 언어를 배우기 시작해야 한다고 이야기한다. 물론 컴퓨터와 인공 지능 또한 이러한 소통 방식의 중요한 일부일 테지만, 신기술에 매몰되어 자연을 경시한다거나, 또는 그 반대의 경우 역시 마찬가지로 바람직해 보이지 않는데, 양쪽 다 존중해야 한다는 원론적인 입장보다는 기술과 동식물, 그리고 비가시적인 것들을 포괄하는 새로운 자연의 개념, 비인간 지능과 언어에 대한 새로운 인식의 이해가 필요한 듯하다. 하지만 여기서 우리는 또다시 인간과 비인간이라는 이분법과 마주한다. 언어 모델을 인간 작가와 다를 바 없이 글을 생산하는 하나의 개체로서 생각하지 않을 이유는 또 뭔가? 어떠한 과정을 통해 글이 탄생했는지는 여기서 그렇게 중요해 보이지 않는다. 요점은, 언어 모델이 쓴 글을 우리가 읽고, 생각하며, 의미를 부여한다는 점인데, 그렇다면 인간 작가와 언어 모델을 굳이 분리해서 생각할 이유를 찾기가 더 어려워 보인다.

 

   이 비개념적 인식을 위한 개념적 도구들을 어떻게 만들어낼까? 이러한 인식은 이분법적 인식 체계나 명제적 선언으로부터 오지 않고, 말로부터 비롯될 테다. 우리에게는 상호 배제적이지 않고, 위계적이지 않은 개념들의 확장된 어휘가 필요하다. 개념적 재원과 언어의 표현 능력만을 통해 어떻게 이러한 대화가 가능할까? 다른 형식의 표현들이 가능하다는 사실을 우리는 안다. 이러한 대화를 노래할 수 있음을 우리는 안다.”

 

  인공 지능이 이 정도로 자연스러운 글을 쓴다고 언제까지 놀란 척만 할 수는 없다. 우리는 머지않아 여기에 익숙해질 테다. 하지만 자연스러운 글이란 인간이 쓴 글처럼 읽힌다는 말에 불과하지 않나? 이미 언어 모델을 통해 생성된 글과 인간이 쓴 글을 판별하는 일이 어려워진 지금, 인공 지능이 얼마나 더 자연스러운 글을 써내야 우리는 만족할까? 하지만 이는 한탄할 일도, 그렇다고 마냥 긍정할 일도 아니다. 우리가 자처한 현 상황일 뿐이다. 우리가 현재 직면한 문제는 경계를 명확히 하는 문제가 아니라 협업을 이끌어내는 방식에 대한 문제인 듯하다.

 

  “누가 누구를 지배하느냐의 문제가 아니다. 공생의 문제, 혹은 생명을 주체와 객체로 나누는 행위의 종말에 대한 문제다. 단 하나의 주체만이 존재하고, 이는 우주 그 자체다.

  기계 또는 인공지능이 세상 속 우리의 자리를 어떻게 빼앗느냐의 문제가 아니다. 세상 그 자체를 위한 자리가 있느냐의 문제다. 오로지 세상들만이 존재하고, 논점은 이러한 세상들 속에 무엇이 존재하느냐다. 기호 작용의 기호학적 움직임, 기호 작용의 표현으로서의 물질, 상징으로서의 물질 외에는 그 무엇도 존재하지 않는다.”

 

  <파르마코-AI>가 출간된 후로 일 년이 조금 넘는 시간이 흘렀는데, 그사이에 많은 기술적 변화가 일어났다. 엘루터AI(EleutherAI)에서 개발한 GPT-Neo, GPT-J-6B와 같은 오픈 소스 모델들이 공개되기도 했고, SKT와 카카오브레인 또한 한국어에 특화된 GPT 모델들을 오픈 소스로 내놓았다. 한편, 엔비디아는 2021년 10월, 현존하는 가장 큰 영어 기반 언어 모델인 메가트론-튜링 NLG(5300억 개의 매개 변수)를 발표했고, 12월에는 딥마인드에서 메가트론-튜링보다는 작지만 GPT-3보다 여전히 큰(2800억 개의 매개 변수) 고퍼(Gopher)를 선보였다. 하지만 이러한 기술 경쟁은 당장의 놀라움을 자아낼지는 몰라도, 아직 언어 모델 기술이 걸음마 단계에 있음을 시사하기도 한다. 메가트론-튜링은 GPT-3보다 현저히 큰 모델의 크기에도 불구하고 비교적 작은 성능 향상을 이끌어내는데 그쳤고, 오픈AI에서 개발 중인 GPT-4는 약 100조 개의 매개 변수를 목표로 하지만, 수년에 걸친 기술 발전의 동반이 요구되는 상황이다. 이와 같은 규모의 컴퓨팅은 딥마인드의 모회사인 알파벳, 엔비디아와 합작해 메가트론-튜링을 개발한 마이크로소프트 (오픈AI 역시 GPT-3 개발 당시 마이크로소프트로부터 10억 달러를 투자받았다) 같은 IT 공룡들이 아니면 감당 불가능하고, 무엇보다도 지속 가능하지가 않다. 단순히 모델의 크기로 경쟁하는 현 상황에 대해 여기저기서 우려의 목소리가 나오는 이유이기도 하다. 그렇기 때문에 딥마인드가 고퍼와 함께 발표한 레트로(RETRO)라는 소형 모델은 특히 흥미로워 보인다. 이 모델은 GPT-3보다 25배 정도 작은 70억 개의 매개 변수로 GPT-3와 비슷한 성능을 낸다고 하는데, 언어 모델에게 출력할 텍스트를 자체적으로 비교 분석할 수 있는 선별된 데이터셋을 미리 제공하는 방식으로 작동한다. 이와 같은 소규모 모델이 흥미로운 이유는, 아직까지는 개인적으로 오픈 소스 언어 모델을 미세 조정해 사용하려면 랩탑, 데스크탑의 성능 한계로 인해 대개 클라우드 컴퓨팅에 의존해야 하기 때문이다. 앞으로의 기술 발전이 언어 모델의 크기에만 집중되지 않고 개개인이 양질의 모델을 사용 가능하도록 진입 장벽을 낮추는 방향으로 나아간다면, 이를 활용한 다양한 글쓰기 실험들을 기대해 볼 수도 있겠다.

 

  <파르마코-AI>를 포함해 위에서 논의된 작업들과 기술 개발 사례들은 대부분 영어로 된, 더 정확히는 미국에서 진행된 프로젝트들이었다. 생성 문학 작품들이 근본적인 번역의 문제를 동반하기 때문이기도 하지만, 이와 같은 예술 작품들은 특정 기술의 발전을 전제로 하고, 기술의 잉여 생산물로 존재하는 예술 작업을 수용 가능할 만한 경제적 기반이 마련된 곳에서만 가능했는데, 전통적으로는 미국 서부 외에 마땅히 이러한 활동을 수행할 만할 곳이 없었던 탓이기도 하다. 그러나 근래에는 네덜란드(앤트워프 대학교의 아시봇―2017), 일본(하코다테 미래대학의 AI 소설 프로젝트―2016), 중국(마이크로소프트의 샤오이스―2017) 등지에서 비영어 알고리듬을 활용한 글쓰기 작업들이 발표됐고, 베이징 인공 지능 아카데미에서 1조 7500억 개의 매개 변수를 지닌 모델인 우다오2.0을 개발하기도 했으며, 한국어 언어 모델을 활용한 예술적 실험 또한 기대되는 상황이다.

 

  글쓰기는 기술의 영역과 별개로 존재했던 적이 단 한 번도 없었고, 항상 신기술과의 관계 설정을 통해 새로운 형식으로 변모했으며, 이에 따라 표현 양식 또한 변화를 거듭했다. 하지만 인쇄술과 인터넷의 발명이 글의 배급 방식의 변화에 따른 형식적 변혁을 예고했다면, 인공 지능 언어 모델은 글을 쓴다는 행위 그 자체의 근본적이고 인식론적인 변혁을 예고한다. 인공 지능에게 글쓰기의 영역 ‘마저’ 내어준다거나, 인간 고유의 영역을 끝까지 사수하는 문제가 아니다. 글쓰기를 포함해 전통적인 ‘창작’의 개념에 기인한 모든 예술 형식이 현재 직면한 문제는 이러한 신기술과의 관계를 어떻게 설정하고, 유의미한 협업의 형식을 생산하느냐의 문제인 듯하다.

 

  글쓰기는 기술의 영역과 별개로 존재했던 적이 단 한 번도 없었고, 항상 신기술과의 관계 설정을 통해 새로운 형식으로 변모했으며, 이에 따라 표현 양식 또한 변화를 거듭했다. 하지만 인쇄술과 인터넷의 발명이 글의 배급 방식의 변화에 따른 형식적 변혁을 예고했다면, 인공 지능 언어 모델은 글을 쓴다는 행위 그 자체의 근본적이고 인식론적인 변혁을 예고한다. 즉 글쓰기는 과거에는 말을 한다는 것과 마찬가지로 특정한 신체적 움직임을 수반하는 의사 표현의 과정이었다면, 현재는 컴퓨터를 통해 데이터를 기반으로 한 정보 전달 행위로 그 성격이 변화하고, 앞으로는 새로운 개념의 텍스트, 즉 데이터 기반의 비정형 텍스트가 새로운 글쓰기의 핵심이 될 것이다. 이러한 새로운 글쓰기의 방식이 요구된다는 것은 인간의 언어를 표현, 전달의 도구로 삼았던 과거의 글쓰기 방식으로는 앞으로 올 인간과 인간 아닌 것을 규율하는 데에 한계가 있다는 것을 의미한다. 그리고 이것은 새로운 글쓰기 방식이 과거의 글쓰기 방식과는 다른 형태의 글쓰기이어야 함을 의미한다. 인공 지능의 글쓰기가 인간의 글쓰기를 닮아 갈 것이라 착각해서는 안 되고, 인간의 글쓰기 또한 인공 지능의 글을 지향해서는 안 된다는 말이기도 하다. 글쓰기는 인간의 의식과 밀접한 관련을 갖지만, 인간의 의식을 절대적인 것으로 인식하는 것은 문제가 있다. 글쓰기는 의식의 반영이면서 동시에 의식에 대한 반작용이기도 하다.