AI 빅뱅
김재인 지음 | 동아시아
AI 빅뱅
김재인 지음
동아시아 / 2023년 5월 / 388쪽 / 20,000원
생성 인공지능의 빛과 그림자 - 인공지능의 발전 현황과 한계
인공지능은 왜 눈치가 없을까? - 인공지능의 원리와 한계
의미 이해와 요약: 챗GPT는 답변은 물론 요약도 잘해준다. 5,000단어 정도의 신문 기사를 넣으면 10줄 정도로 요약해 주기도 한다. 근데 도대체 요약한다는 게 무슨 뜻일까? 챗GPT는 문서에서 키워드를 추리고 얼버무려서 출력해 준다. 그런데 결과물에 대한 평가는 극과 극이다. 인문학 관련 요약은 별 도움이 되지 않는다. 오히려 원문의 초록, 서론, 결론을 훑어보는 편이 낫다. 반면 과학기술 관련 요약은 꽤 유용하다. 증명 과정보다 도출된 결과가 중요한 분야이기 때문이다. 따라서 어떤 용도로 인공지능 요약을 원하는지 분명하게 자각하는 게 무엇보다 중요하다.
더욱이 원문은 다양한 수준에서 해석되며, 전달받는 쪽에서 바라는 눈높이가 있다. 요약 행위는 그 수준을 잘 조율하는 작업이다. 때로는 분량이 길어지거나 짧아지기도 하고 강조점이 바뀌기도 한다. 이 모든 과정에서 중요한 건 중간에 있는 매개자다. 배우나 더빙하는 성우도 이 위치에 있다(라틴어로 medium이라고 하며, 영어로는 medium, media가 됐다). 번역가는 배우 혹은 성우다.
인문학 분야를 조금 더 살펴보자. 이 경우에 요약문은 원문 ‘내용’에 대해서는 알려주는 바가 별로 없다. 가령 1시간 분량의 강의 내용을 텍스트로 넣어주고 요약을 요청하면, ‘연사(speaker)는 챗GPT 같은 언어 생성 인공지능과 딥엘 같은 언어 번역 인공지능에 대해 흥미롭게 이야기했다’는 정도로만 요약한다. 이 요약에서 얻을 수 있는 정보는 별로 없다. 구체적으로 어떤 이야기를 했고 어떤 점이 흥미로웠는지가 더 중요하기 때문이다. 따라서 인공지능 요약은 글 전체를 읽어야 할지 말지를 걸러 주는 역할, 즉 문서나 글에서 얻어 갈 게 있는지 없는지를 알려주는 수준에 그친다고 보면 적절하다.
그러면 인간의 이해와 인공지능의 이해는 어떻게 같고 어떻게 다른 걸까? 인간이 어떤 언어적인 내용을 이해한다는 게 무슨 뜻일까? 인공지능은 이해했을까? 챗GPT 같은 챗봇이나 딥엘 같은 번역 인공지능은 내용을 이해한 걸까? 과연 이해하고 작업한 걸까? 언어 생성 인공지능 앞에서 이런 질문이 제기될 수밖에 없다. 국어사전에서는 ‘이해’를 이렇게 설명한다. “① 사리를 분별하여 해석함. ② 깨달아 앎. 또는 잘 알아서 받아들임. ③ 남의 사정을 잘 헤아려 너그러이 받아들임. ④ [철학] 문화를 마음의 표현이라는 각도에서 그 뜻을 파악함.” 이걸 보고 ‘이해’의 의미가 이해될까? 그렇지 않다.
그렇다면 하나하나 살펴보도록 하자. 먼저 요약을 생각해 보자. 요약이라는 게 뭘까? 요약은 이해 과정 없이는 할 수 없는 대표적 작업이다. 요약에 비하면 번역은 오히려 쉬운 작업일 수 있다. 다차원 공간에 보편적인 인간 언어의 좌표를 설정하고, 거기에 함수와 텐서 같은 수학적인 방식으로 언어 세계를 구축한 다음 구체적인 특정 언어, 가령 한국어, 영어, 일본어, 중국어로 출력하는 과정이라고 보면 번역은 쉬울 수 있다. 왜냐하면 입력 언어가 어떤 보편적 좌표에 도달한 다음 그걸 다시 출력 언어로 뽑아내면 되니까. 이 점에서 번역은 기계가 처리하기 쉬운 일일 수도 있다.
한편 요약은 언어 안에 있는 핵심을 추려내는 것이다. 이건 번역과 같은 방식으로는 작업하기 어렵다. 그래서 ‘요약한다면 이해한 것’이라고 말할 수 있다. 실제로 기계 요약은 어떤 경우에는 그럴듯하고 어떤 경우에는 피상적이다. 수치나 데이터 같은 게 중심이 되는 내용, 가령 경제나 스포츠는 사용되는 패턴이 분명하고 사람들이 알고 싶은 내용도 명확하니 그것들을 잘 찾아내서 재구성하면 어느 정도 요약이 가능하다. 하지만 내용을 이해해야만 요약할 수 있는 대목은 구체적 핵심을 건너뛰거나 뭉뚱그려 아우르는 단어만 남는다. 가령 구체적인 여러 철학자나 철학책을 길게 이야기했다면 ‘철학자에 대해 이야기했다’거나 ‘철학책이 중요하다고 이야기했다’는 정도로 그친다. 이것은 요약이라고 보기 어렵다. 상황을 종합해 보면, 요약과 관련해서는 기계가 이해했다고 보기 어렵다. 수학적으로 처리할 수 있는 영역에서는 잘해내는데, 그건 이해했다기보다는 패턴을 잘 찾아 인식한 것이지 않을까 싶다.
눈치와 맥락 그리고 전문성: ‘문해력’은 보통은 문자 언어를 얼마나 이해하느냐를 가리키지만 요즘은 더 넓은 뜻으로 쓰인다. ‘디지털 문해력’ 같은 표현이 확장된 의미를 반영한다. 왜 문해력이 문제가 될까? ‘의미 이해’와 ‘문해력’은 어떤 점에서 차이가 날까? 의미 이해라는 것은 추상적이고 모호하지만, 문해력, 즉 의미 해독 능력은 구체적이고 확인할 수 있다. 또 의미 이해는 문해력을 통해 표현되는 한에서만 의미가 있다. 달리 말하면, 문해력을 구사할 수 있어야 ‘의미를 이해’한다고 볼 수 있다. 이해란 결국 ‘눈치’인 것 같다. 눈치껏 알아채는 것이 이해다. 의미의 층이 사실은 두 개다. 우선, 우리가 의미론에서 다루는, 한마디로 직역 수준의 언어 구사가 있다. 한국어 문장을 영어 문장으로 번역하는 작업에서 옮겨지는 일차적 의미가 그것이다. 이런 일차적 의미도 물론 중요하다. 그런데 사용되는 맥락을 이해해서 그에 맞게 그 말의 인간적, 사회적 의미까지 도달하는 건 눈치가 있어야 할 수 있는 일이다. 가령 폭력배 채권자와 채무자 사이의 대화와, 친구 사이의 대화를 비교해 보자.
대화에서 오가는 “언제 갚을래”라든지 “네가 오늘 계산해”와 같은 말은 분명히 의미론적으로는 같은 내용이다. 하지만 실제로 언어가 발화돼서 상대방에게 전달되는 힘은 천차만별이다. 그래서 이제 진짜 의미는 언어 수준에서만 머무는 의미론적인 차원에 그치지 않고, 그것도 분명히 필요하지만, 언어를 통해서 ‘행사’되는 의미일 것이다. 그걸 ‘눈치’라는 말로 표현하면 적절할 것이다. 결국 인간 사이에서 이루어지는 행동의 측면이 언어에 더 중요하지 않을까 생각한다. 그렇다면 인공지능은 과연 그런 맥락을 파악하는가? ‘파악한다’고 할 수 없을 것 같다. 다음과 같은 연구 결과도 참고할 수 있다.
어떤 문장에서 영국인과 네덜란드인이 생각하는 속내가 무엇인지 비교한 논문에 따르면, 일상생활에서 영국인이 “당신 말 들었어(I hear what you say)”라고 말하는 속내는 “내 의견은 완전히 달라”이지만, 네덜란드인은 그 말을 “그가 내 관점을 인정했어”라고 알아듣는다. 논문을 심사할 때 영국인이 “기술된 방법은 다소 독창적이다(The method described is rather original)”라고 쓴다면 이는 “헛소리”라는 뜻이지만, 네덜란드인은 “훌륭한 방법”이라고 알아들으며, 영국인이 “이번에 당신을 실망시켜 미안하다(I am sorry to disappoint you on this occasion)”라고 쓰면 “더는 신경 쓰지 않겠다”라는 뜻이지만, 네덜란드인은 “그 사람이 미안해하는군”으로 알아듣는다.
우리나라도 마찬가지다. 수도권과 남부 지역의 언어 표현이 다르다. 수도권에서는 굉장히 직설적인 반면 남부 지역에서는 대단히 함축적이다. 이런 식으로 사회마다 실제 전해지는 의미가 조금씩 다르기 때문에 사회 맥락, 즉 발화가 진행되는 맥락을 알아야 의미가 실질적으로 전달될 수 있다. 따라서 인공지능이 표면적인 의미가 아닌 맥락 안에 있는 의미를 번역할 수 있느냐 하는 문제가 발생한다. 한편 맥락을 이해한다는 것이 갖는 다른 함의도 있다. 막연하게 ‘맥락’이라고 표현했지만, 거기에는 ‘뉘앙스’나 ‘전문적 식견’ 같은 것이 녹아 있는 것 같다. 그래서 자기 전문 분야의 내용을 남이 말하는 걸 들을 때 오류도 잘 찾아내고 핵심도 잘 찾아낸다. ‘질문을 잘하는 능력’이 필요하다고 하지만, 결국 ‘자기 전문 분야의 지식을 깊게 쌓는 것’에서 질문을 잘하고 문맥을 잘 조율하는 능력이 나온다. 인공지능이 전문 영역을 약화한다는 주장도 있지만, 믿지 않는다. 인공지능이 해내는 것보다 더 잘해낼 수 있는 능력을 갖추는 게 진짜 중요하다. 인공지능이 더 잘하면 그 수준을 처리하는 인간은 경쟁력이 없다. 반대로 사람이 더 잘하면 이 사람은 함께할 수 있는 동료나 팀이 될 수 있다.
맥락을 파악하는 능력이 인간 말고 몇몇 동물에게서 관찰된다. 고양이나 개 같은 반려동물도 그렇다. 주변 환경과 자기 행동의 관계와 맥락을 파악하는 것이다. 그런 동물들은 인간 수준은 아니지만 특정 의미를 이해하고 있다고 말해도 좋을 것이다. 그러니까 눈치라는 건 결국 어떤 개체가 환경과 어우러지면서 서로 주고받는 관계를 형성한다는 뜻이다. 환경 또는 개체가 처한 조건이 달라지면 같은 게 같은 게 아니라는 걸 깨닫는 것이다. 사실 ‘의미 이해’가 중요한 건 언어 자료를 충분히 해독하고 종합하고 가공해서 새로운 언어로 표현하는 과정을 가리키기 때문이다. 문해력이 독서를 통해 길러진다는 점은 잘 알려져 있다. 독서가 단지 정보를 받아들이는 수동적 과정일 뿐만 아니라(물론 정보를 정확히 읽어내는 것도 굉장한 훈련이 필요하지만) 정보를 선별적으로 수용하고 가공하고 응용해서 종합하는 능동적, 창조적 과정이기 때문이다. 우리는 이런 과정을 ‘생각’이라고 부르길 주저하지 않는다.
거짓말과 의식: 인공지능은 학습 자료를 통해서 어떤 것을 습득한다. 그런데 결국 인간도 그 자료를 통해서 뭔가를 이해한다. 기계학습 과정도 실천해 보고 안 되면 다시 수정하는 일이다. 일종의 시행착오인데, 이런 면도 인간과 비슷해 보인다. 하지만 이 과정에서 일어나는 일의 키워드를 ‘이해’로 잡아서는 안 될 것 같다. 인간의 이해도 인공지능보다 못한 수준이 태반이다. 인간의 이해는 무엇일까? 인간에게는 두 개의 층(layer) 아니면 층위(level)가 같이 작동한다는 점에서 출발해 보자. 한편에 바라보는 관찰자적인 ‘나’가 있고 다른 한편에는 관찰되는 다양하고 잡다한, 때로는 또렷하고 때로는 흐리멍덩한 어떤 ‘작용’이 있다. 이 두 층을 언어활동에 적용해 보면, 의미론적인 수준이 하나 있고(‘작용’의 층), 의미가 오가는 배경이나 환경 또는 맥락에 해당하는 층(관찰하는 ‘나’의 층)이 있다. 인간에게는 그 두 층을 동시에 포착하는 능력이 있다. 하지만 인공지능은 작동이 일어나는 한 층밖에 없다.
챗GPT의 문제는 같은 걸 물어봐도 다른 답을 계속 내놓고 다른 답을 한다는 걸 알아채지도 못한다는 점이다. 알아채는 주체에 해당하는 뭔가가 없다. 순전히 무작위다. 챗GPT는 너무 쉽게 고친다. 고정된 몸이 없다. 생성 인공지능에서 생성물의 ‘변덕성’에 주목해야 한다. 미드저니, 달리, 스테이블디퓨전 같은 이미지 생성 인공지능도 그렇고, 챗GPT 같은 언어 생성 인공지능도 그렇고, 가끔은 번역 인공지능도 그러한데, 조금만 다른 프롬프트를 주면, 아니 심지어 같은 프롬프트를 주더라도 생성물이 크게 바뀐다. 인간으로 치면 매번 생각이 바뀐다고 해야 할 것이다. 인공지능은 휘발성이 강해 매번 새롭다. 학습된 모델 자체는 엄청난 잠재 기억 덩어리지만, 생성물이 변덕스럽게 달라지는 인공지능.
그런데 인간의 생각은 쉽게 바뀌지 않는다. 인간은 습관을 가지고 있어서 계속 고집을 피운다. 반복하면 굳어지고, 그게 습관이라고 많은 철학자가 말한다. 인간은 잘 안 고친다. 외부에서 주어진 정보가 달라져도, 가령 위조 뉴스가 위조된 것임을 확실히 알려주는 증거를 접하더라도 인간은 좀처럼 생각을 바꾸지 않는다. 고집은 인간의 중요한 ‘특징’이다. 언제 증발하고 바뀔지 모르는 불확실한 기억의 소유자지만, 고집스럽게 자기 생각을 고수하는 인간. 그런데 그건 몸의 문제이기도 한 것 같다. 몸은 생각에 비해 더 안 바뀐다. 인간은 몸의 고집스러움과 생각의 고집스러움이 함께 가는 반면에 인공지능은 프로그램이니까, 몸이 없으니까, 자유로움과 휘발성이 있다. 자유가 꼭 좋은 것만은 아니다. 극단적인 자유로움은 자기가 능동적으로 할 수 있는 게 아무것도 없다는 뜻이니까.
챗GPT가 헛소리를 계속 내뱉는다는 건 잘 알려져 있다. 없는 정보를 생성한다고 해서 ‘환각’이라고 놀림을 받기도 한다. 세종대왕이 맥북을 던졌다고도 이야기했다. 그럼 인공지능이 거짓말을 한 걸까? 단언컨대 거짓말을 한 게 아니다. 틀린 이야기를 지어냈을 뿐이다. 거짓말을 하는 것과 틀린 소리를 하는 것은 어떤 차이가 있을까? 나의 의도와 발화 사이에서 괴리를 느낄 수 있어야 거짓말이 성립한다. ‘나는 돈을 갚을 생각이 없다’라는 생각(속내)과 “내일 돈을 갚을게”라는 말(발화) 사이에 괴리가 반드시 있어야 한다. 그러니까, 두 개의 층이 같이 작동해야 한다. 그런데 챗GPT가 내뱉는 말은 사실관계도 틀렸지만, 의도(그런 게 있다면)와 표현 사이에 어떤 간격도 없다. 그런 경우라면 거짓말이 아니다. 인간은 거짓말을 할 수 있고(능력이 있고) 또 굉장히 잘한다. 거짓말은 능력의 발현으로 봐야 한다. 거짓말은 인간의 더 포괄적인 능력을 발현하는 한 가지 형태다. 그 능력은 의식과 관련 있다. 거짓말은 결국 의식 활동의 한 표현 형태다.
‘의식’이 어려운 말이긴 한데, 가장 쉽게 설명하면 내가 어떤지를 스스로 돌아보고 알아채는 것, 자신을 자각하는 것, 그러니까 두 층이 함께 작동하는 활동이 의식이다. 이런 의미에서 의식(consciousness)은 항상 자의식(self-consciousness)일 수밖에 없다. 자기가 하는 일을 자기가 알고 있다는 것이다. 그런 점에서 인공지능은 의식이 없다. 거짓말을 하지 못하는 건 결국 의식이 없기 때문이다. 거짓말 말고도 의식으로 인한 다른 귀결이 있을 것이다. 자기를 돌아볼 수 있다고 해서, 즉 의식이 있다고 해서 꼭 좋은 건 아니다. 우리에게 일어나는 대다수 현상은 무의식적으로 이미 결정된다. 다만 의식은 내가 어떠한지를 확인해서 거기에 개입할 틈을 만들어 준다는 점에서 도움이 된다. 의식하면 고집할 수 있지만 달라질 수도 있다. 의식 작용의 의미는 거기에 있다. 아무튼 인공지능의 이해는 인간의 이해와 다르다. 하지만 이해라는 말을 인간의 이해에 국한할 필요는 없다. 인간도 많은 경우 인공지능 수준의 이해 능력을 갖고 살아간다. 인간의 이해 능력을 어떻게 더 키워나갈지가 오늘날 교육과 학습의 핵심 과제로 부각되고 있음은 분명하다.
창조성의 진화 - 새로운 인문학과 융합 교육
창조성과 창의적 협력
인공지능의 발달에 따른 예술 창작 주체의 문제: 인공지능 기술이 빠른 속도로 발전하면서 인공지능이 인간만의 특권적 활동인 예술 창작 영역까지 넘보는 것 아니냐는 우려와 기대가 교차하고 있다. 이 문제를 살피는 데 있어 검토해야 할 세부 사항은 3가지다. 첫째, 현대인은 예술을 무엇이라고 생각할까? 둘째, 인공지능은 예술작품 창작의 주체일까, 도구일까? 셋째, 오늘날 창작과 창의성의 의미는 무엇일까? 결론부터 말하면, 인공지능은 다른 분야에서 응용될 때와 마찬가지로 예술 창작에서도 유용한 ‘미디어’이자 ‘도구’일 수 있다. 하지만 현재의 인공지능 수준과 가까운 미래에 개발될 인공지능 수준을 보면, 인공지능은 어디까지나 미디어일 뿐 창작 주체가 될 수는 없다. 여기서 ‘창작 주체’라는 말은 ‘인간 예술가’가 수행하는 작업의 특성을 기준으로 삼았을 때 인간과 유사한 작업을 수행하느냐와 관련된다. 비교할 준거가 없으면 어떤 진술의 의미도 확정될 수 없으므로, 우리가 통상 염두에 두는 ‘창작 주체’인 인간 예술가를 기준으로 놓는 것이 좋겠다는 말이다. 이는 모든 예술가가 신과 같은 작업을 하는 ‘절대적 주체’라는 뜻도, 전통적 의미의 ‘천재’라는 뜻도 함축하지 않는다. 또한 사람마다 편차가 크기 때문에, 모든 인간이 ‘창작에 능하다’는 뜻을 함축하지도 않는다. 이런 점을 고려하면서, 인공지능은 ‘주체’가 아니라 ‘미디어’일 따름이라는 것이 나의 잠정적 결론이다.