AI는 인간을 먹고 자란다
마크 그레이엄, 제임스 멀둔, 캘럼 캔트 지음 | 흐름출판
AI는 인간을 먹고 자란다
마크 그레이엄 외 지음
흐름출판 / 2025년 5월 / 348쪽 / 24,000원
머리말 - 추출 기계의 시대, 보이지 않는 노동자들머시는 깊이 숨을 들이마신 뒤 화면을 들여다본다. 새로 연 작업창엔 충격적인 이미지와 영상이 줄지어 나타난다. 케냐 수도 나이로비의 외주 업체에서 메타의 콘텐츠 검수자(content moderator)로 일하는 머시는 하루에 10시간씩, 55초마다 하나의 티켓을 확인해야 한다. 이번 영상은 심각한 자동차 사고 장면이다. 누군가가 현장을 촬영해 페이스북에 올렸고, 다른 사용자가 거기에 플래그(flag)를 달았다. 플래그가 달린 게시물이 폭력적이거나 자극적인 콘텐츠를 금지하는 메타의 정책을 어겼는지를 판단하는 일이 그녀의 업무다.
촬영자가 화면을 확대하자 사고 현장의 참상이 더 자세히 보인다. 그러다 어느 순간, 머시는 화면 속 인물이 어딘지 낯익다는 느낌을 받는다. 영상의 초점이 채 제대로 맞춰지기도 전에 그녀는 그 사람이 누구인지 알아본다. 바로 자신의 할아버지였다.
머시는 의자를 밀치고 일어나 출구 쪽으로 뛰어간다. 주변의 동료들이 걱정스러운 눈빛으로 그녀의 뒷모습을 바라본다. 밖으로 나가자마자 가족들에게 연락을 돌린다. 그러나 아직 아무도 사고 소식을 듣지 못했고, 그녀의 이야기를 믿으려 하지 않았다. 머시를 따라 나온 감독관이 위로의 말을 건네지만, 당일 목표를 채우려면 자리로 돌아가야 한다는 말도 덧붙인다. 내일 휴가를 낼 수 있다. 하지만 지금은 이미 출근한 만큼 일을 마저 끝내는 편이 낫다는 게 감독관의 말이다.
자리에 돌아온 머시의 컴퓨터 화면에 또 다른 티켓이 뜬다. 다시 할아버지의 사고 영상이다. 같은 영상이 연달아 페이스북에 올라왔고, 신고가 반복됐다. 사고 차량, 피해자들의 모습, 현장에 대한 상세한 묘사까지, 머시는 이제 모든 세부 사항을 알게 됐다. 고작 몇 시간 전 자신이 사는 곳 근처에서 벌어진 사고였다. 수도 없이 오갔던 익숙한 길이었다. 사망자는 네 명. 그중 한 명이 머시의 할아버지였다. 근무 시간은 영원히 끝나지 않을 것처럼 길게만 느껴진다.
추출 기계를 숨 쉬게 하는 일곱 사람의 이야기이 책은 AI의 발전에 기여하는 ‘보이지 않는 노동자’의 이야기를 중심으로 쓰였다. 앞으로 이들의 노동이 왜 중요하며, 어떻게 감춰지고 있는지 살펴볼 것이다. 또한 AI의 기본 개념과 속성을 공부하고 AI를 중심으로 형성되는 자본, 네트워크, 일자리 기회 등이 어떻게 세계적인 불평등과 권력 불균형을 초래하는지를 분석한다. 집필을 위해 우리 저자들은 데이터 주석 작업자, 콘텐츠 검수자, 머신러닝 엔지니어, AI 윤리학자, 물류 노동자, 노동 조직가, 투자자 등 200명 이상의 사람들과 인터뷰를 했다.
이 책에 등장하는 노동자들은 다양한 위치에 놓여 있다. 최소한의 고용 보호 장치도 없는 악조건 속에서 일하는 저임금의 데이터 주석 작업자부터 글로벌 기업에서 높은 급여를 받는 머신러닝 엔지니어에 이르기까지 다양하다. 이들이 포함된 AI 생산 네트워크를 연결하는 돈의 흐름을 쫓다 보면, AI를 둘러싼 깊은 역사를 이해할 수 있다. 또한 AI 생산 네트워크에 드리워진 제국주의적 유산을 만날 수 있다.
인공지능은 흔히 인간지능을 비추는 거울이라고 불린다. 이는 인간의 사고 과정을 재현함으로써 지능을 해결하려는 시도라고 할 수 있다. 그러나 우리가 이 책에서 발전시킨 관점에서 보자면, AI는 추출 기계(extraction machine)에 가깝다. 우리가 소비자로서 AI 제품을 사용할 때, 우리 눈에 보이는 것은 표면적인 결과물일 뿐이다. 그러나 그 세련된 외관 아래에는 AI를 작동하기 위해 필요한 복잡한 추출 기계 네트워크가 존재한다. 추출 기계는 자본, 권력, 천연자원, 인간 노동, 데이터, 집단 지성이라는 핵심 요소를 빨아들여 통계적 예측치로 변환한다. 그리고 AI 기업들은 이를 이윤으로 전환한다.
AI를 추출 기계로 이해하는 것은, AI가 내세우는 객관성과 중립성의 허울을 벗겨내는 시도이다. AI는 기존의 정치경제 시스템에 뿌리내려 있어, 데이터를 분류하고, 차별하며, 예측하는 모든 과정은 이를 만든 사람들의 이해관계와 권력 구조를 반영한다. 이런 관점에서, AI는 부유하고 권력을 가진 소수의 이익을 대변하는 도구이며, 그들의 지배력을 공고히 하는 수단이다. 또한 기존 사회의 편견과 차별을 디지털 환경에서 더욱 정교하게 재생산하는 역할을 한다. 한편 테크 기업들은 AI가 작동하는 데 필요한 물리적 기반과 인간 노동의 현실을 감추면서, AI의 가능성과 편의성을 강조하는 서사에 집중한다.
훈련된 AI 시스템은 종종 초인적인 수준의 성능을 보이는데 그 기반이 되는 데이터는 공공 영역에 있는 자료뿐만 아니라, 무단으로 수집된 저작물을 포함하고 있다. AI 기업들은 이러한 데이터세트를 독점적으로 통제하고, 집단 지성을 사유화하여 자신들의 이익을 창출한다. 즉, 공동의 지식이 담긴 데이터를 특정 기업의 자산으로 전환하고, 이를 독점적 소프트웨어로 가공하여 새로운 결과물을 만들어낸다. 다시 말해 추출 기계는 물질적 자원만큼이나 인간의 지적 자원을 갈취해야 유지되는 시스템이다.
우리가 이 시스템을 추출 기계라고 부르는 이유는 단순히 자원, 인간 노동, 집단 지성을 약탈하여 만들어져서가 아니다. AI가 실제 업무 환경에서 운영될 때, 또 다른 형태의 착취가 이뤄진다. 가장 대표적인 예가 노동력 추출이다. AI 기반 관리 시스템은 노동 과정에 대한 지식을 한곳에 모으고, 업무를 표준화하고 단순화해서 노동자의 기술적 숙련도를 떨어뜨린다.
이렇게 되면 노동자들은 더 많은 일을 더 빠르게 처리해야 하는 상황으로 내몰린다. 이를 통해 기업은 노동자의 생산성을 극대화하여 더 많은 이윤을 챙길 수 있게 된다. 이러한 추출 과정의 고도화는 결국 노동자로부터 더 많은 가치를 쥐어짜는 구조로 이어진다. 서론이 길었다. 이제 우리는 독자들과 함께 AI가 어떻게 만들어지는지, 그 과정에서 노동자들이 어떤 역할을 하는지를 밝히기 위해 세계 각지의 현장을 방문할 것이다.
기계가 우리를 닮아갈수록, 우리는 기계가 되어 간다 - 우간다 굴루, 데이터 주석 작업자
기계적이고 단순하며 예측 가능한 노동이른 새벽, 애니타가 도시를 향해 걷기 시작했을 때 바깥은 여전히 어둡다. 차와 죽으로 간단하게 아침 식사를 하고 가족이 잠들어 있는 집을 나선 시각은 오전 5시경. 앞으로 두 시간은 걸어야 한다. 애니타는 우간다 남부에서 가장 큰 도시인 굴루의 변두리에 위치한 작은 마을에서 어머니, 자매, 세 명의 자녀와 함께 살고 있다. 바퀴자국이 울퉁불퉁 난 흙길에는 버스가 다니지 않는다. 그래서 걷기 싫은 통근자들은 보다보다(오토바이 택시)를 부른다. 한 번 타고 회사까지 가는 데 대략 2달러 정도가 든다. 왕복으로 치면 애니타가 매일 감당하기에는 부담스러운 금액이다. 그래서 그녀는 하루 종일 데이터 주석 작업을 마친 뒤 녹초가 된 몸을 위해, 돌아올 때만 보다보다를 이용한다.
애니타는 자율주행차량 회사의 프로젝트에 참여하고 있다. 그녀의 업무는 운전자의 영상을 시간 단위로 검토하는 것이다. 운전자가 집중력을 잃는 순간이나 졸음 상태로 보이는 장면이 있는지를 확인한다. 그녀가 검수한 데이터는 운전자의 얼굴 표정과 눈 움직임을 기반으로 한 ‘실내 행동 모니터링 시스템’을 구축하는 데 활용된다. 한 번에 몇 시간 동안 컴퓨터 앞에 앉아 비슷한 영상에 집중하다 보면 진이 빠진다. 데이터 주석 작업을 하기 전, 애니타는 길거리에서 주스와 채소를 팔아 생계를 유지했다. 하지만 이런 일은 계절에 따라 수입이 들쭉날쭉했고, 지금의 일보다 훨씬 벌이가 적었다. 운 좋게도 그녀는 이 회사에서 5년 넘게 일할 수 있었고, 그동안의 수입으로 가족을 부양할 수 있었다.
애니타의 하루는 끊임없는 클릭과 드래그 속에서 정신없이 흘러간다. 매일 정해진 목표를 맞추기 위해 일정한 속도를 유지해야 한다. 그래야만 감독관의 화면에서 자신의 이름이 초록색으로 유지될 터이다. 만약 실적이 떨어져 이름이 빨간색으로 바뀌면, 목표를 채울 때까지 무급으로 초과 근무를 해야 한다. 시간은 더디게 흐르고, 허리는 점점 쑤셔온다. 의자에 앉은 채 몸을 쭉 펴보지만, 이내 손과 손목에도 경련이 오기 시작한다. 화면이 흐릿해지고, 눈의 초점이 점점 흐려진다. 잠시 졸음에 빠져들지만, 곧 화들짝 정신을 차린다. 그렇게 하루가 끝날 무렵이면 완전히 녹초가 된다.
애니타는 지금 위기에 처해 있다. 일은 단조롭고 스트레스가 심하다. 하지만 회사를 관둔다고 해서 더 나은 기회가 있는 것도 아니다. 은행, 정부 기관, NGO 같은 안정적인 직장의 취업은 경쟁이 치열하다. 그녀는 회사에 업무 환경을 개선할 방법을 제안해 보고, 장시간의 근무와 낮은 임금, 일부 관리자의 괴롭힘에 대해 불만을 제기해봤지만, 돌아오는 건 언제나 침묵뿐이었다. 외면당하는 기분이다. 어떻게 해야 할지 모르겠다. 뭔가 더 나은 기회가 오면 미련 없이 떠날 텐데.
기계적이고 단순하며 예측 가능한 노동디지털 노동 플랫폼을 통해 전 세계 개별 작업자들에게 일이 분배되는 데이터 주석 작업(흔히 Gig Work라고 알려진 노동)과 달리, 애니타가 속한 BPO(Business Process Outsourcing)들은 수천 명의 노동자를 한곳에 모아놓고 철저한 노동 규율을 적용함으로써 생산성과 효율을 극대화한다.
이러한 통제 기술은 오랜 역사를 가지고 있는데, 과거의 플랜테이션 농장, 방적 공장, 제조업 현장에서 시행착오를 거치며 점진적으로 발전해 왔다. 실제로 오늘날 데이터 주석 센터에서 사용되는 노동 관리 방식은 과거 식민지 시대에 확립된 후, 유럽과 미국으로 확산된 경영 기법을 그대로 이어받았다. 이런 관리 시스템이 필요한 이유는 인프라와 달리 노동은 예측하거나 통제하기 어렵기 때문이다.
애니타가 일하는 사무실의 풍경을 보자. 수백 명의 데이터 주석 작업자들이 줄을 맞춰 앉아 있다. 이 광경은 콜센터에서 일해 본 사람이라면 익숙한 풍경일 것이다. 관리 방식도 다르지 않다. 조명은 어둡게 조정되어 있는데, 이는 하루 9시간 동안 화면을 응시해야 하는 작업자들의 눈 피로를 줄이려는 조치다. 노동자들의 화면에는 끊임없이 주석을 달아야 할 이미지와 영상이 깜빡이며 흘러간다. 애니타를 비롯한 작업자들은 고객의 요구사항에 맞춰 이미지 내 특정 요소를 식별하는 데 집중한다. 예를 들면, 신호등, 정지 표지판, 사람의 얼굴 같은 다양한 객체 주위에 다각형을 그리는 작업을 한다.
하나의 프로젝트에 보통 수백 명의 주석 작업자가 투입되는데, 이들은 다시 20명 정도의 소규모 팀으로 나뉜다. 각 팀에는 팀 리더가 배정되며 리더는 팀원들 사이를 오가며 작업 속도를 점검하고 시간 낭비가 없는지 감시한다. 리더의 주요 임무는 목표 생산성을 유지하는 데 있다. 성과가 낮은 작업자에게는 압박이 가해진다. 때로는 소리를 지르고, 때로는 부드럽게 타이른다. 의뢰 업체가 결과물을 빨리 달라고 독촉하면 BPO는 8시부터 18시까지의 주간 근무조와 20시부터 6시까지의 야간 근무조를 운영하기도 한다. 팀 리더는 작업 난이도를 고려해 팀별 성과 목표를 설정하나 목표 설정은 그리 인간적이지 않다. 프로젝트를 처음 시작할 때는 작업 속도를 평가하기 위해 테스트를 하는데 이를 바탕으로 일정 수준 이하의 속도로는 목표를 달성할 수 없도록 기준을 설정한다.
그런데 이 기준은 프로젝트가 진행될수록 점점 높아진다. 만약 하루치 목표를 달성하지 못하면, 무급 야근을 해야 할 수도 있다. 이러한 혹독한 근무 조건 아래에서 애니타와 동료들은 주당 최소 45시간 이상을 극도로 집중하며 일한다. 그들이 받는 임금은 월 80만 우간다 실링(미화 200달러), 시간당 약 1.16달러에 불과하다. 노동자들은 속도와 정확성뿐만 아니라 효율 점수도 신경 써야 한다. 주석 작업을 잠시라도 멈추면 효율 점수가 즉시 하락하는데, 효율 점수가 일정 수준 이하로 떨어지면 일자리가 위태로워질 수 있다.
이런 노동 환경 속에서도 이들 중 누구도 안정적인 고용 계약을 보장받지 못한다. 대부분의 노동자는 한두 달의 단기 계약을 맺는다. 그래서 늘 해고될 수 있다는 불안 속에서 일한다. 주석 작업의 특성상, 고객사의 프로젝트가 일정하지 않아 필요한 일자리가 갑자기 늘어나거나 줄어들기도 한다. 대형 고객사의 프로젝트가 끝나면, BPO는 노동자들을 해고한 후 소위 벤치에 두는데, 이는 대기 명단에 이름을 올리는 것에 불과하다.
굴루의 노동 시장은 극도로 열악하기 때문에, 벤치에 오른 사람들은 비공식 경제에서 생계를 이어갈 수밖에 없고, 다시 BPO에서 일할 기회가 주어지면 돌아가려 한다. 이런 환경에서는 권력 남용의 가능성이 크다. 여성 노동자들은 상대적으로 더 큰 위험에 노출되어 있다. 일부 노동자들은 출산에 따른 차별을 당하거나 이른바 기업 내 성적 대가 시스템에 시달린다.
기계는 어떻게 학습하는가전 세계 수많은 사람들이 데이터 주석 작업자로 일하면서, 엄청난 양의 데이터를 정제된 학습 데이터세트로 바꾸는 지루하고 반복적인 일을 하고 있다. 왜 이런 방식의 노동이 필요할까? AI 모델을 훈련하려면 엄청난 양의 데이터가 필요한데, 이 데이터를 AI 시스템에 곧바로 입력할 방법은 없다. 애니타 같은 노동자들이 데이터를 정리하고 꼬리표를 붙여야만 AI가 이를 이해할 수 있다.
AI의 대표적인 응용 분야 중 하나가 컴퓨터 비전이다. 이 기술을 통해 AI는 이미지와 영상을 분석하고, 적절한 행동을 결정한다. 예로 자율주행자동차가 도로에서 자동차, 신호등, 보행자를 구분하려면, 다양한 환경에서 객체를 정확하게 분류한 수백만 개의 이미지가 필요하다. 2018년, 미국 애리조나에서 보행자가 자율주행 자동차에 치여 사망하는 사건이 발생했다. 피해자는 자전거를 끌고 도로를 건너고 있었는데, 차량의 AI가 이를 보행자로 인식하지 못하면서 사고가 일어난 것이다. 이런 사고를 방지하려면 AI 학습 데이터세트에 포함된 모든 프레임에서 사람, 자전거, 표지판, 고양이, 나무, 다른 차량 등 다양한 객체들이 완벽한 정확도로 식별되어야 한다. 이를 구분하는 것이 애니타가 하는 일이다.
기계는 인간을 먹고 자란다한편, AI 산업을 떠받치는 데이터 주석 노동을 근본적으로 바꿀 수 있는 새로운 기술이 등장하고 있다. 바로 합성 데이터(synthetic data)다. 이는 AI 모델이 인간이 생산한 데이터세트를 분석해 통계적 패턴을 학습한 뒤, 이를 바탕으로 인공 데이터를 생성하는 방식이다. 오픈AI 창업자인 샘 알트먼은 사람이 직접 데이터 주석을 다는 방식이 가진 한계에 대해 “인공지능이 스스로 학습에 필요한 데이터를 만들어낼 수 있게 되면 모든 문제가 해결될 것”이라며 자신감을 보이기도 했다.
AI 알고리즘이 실제 데이터를 기반으로 스스로 가상의 새로운 데이터를 생성할 수 있다면, 노동자들이 데이터 주석 작업을 수행하지 않아도 되는 미래가 올지도 모른다. 미국과학재단의 최근 보고에 따르면, 알고리즘은 기존 데이터의 통계적 특성을 분석한 뒤, 완전히 새로운 데이터를 만들어낼 수 있는 수준까지 발전했다. 이론적으로 합성 데이터가 광범위하게 사용된다면 인간이 수행하는 데이터 주석 작업과 그에 따른 윤리적 문제들이 사라질 수도 있다. 하지만 그런 변화가 얼마나 빠르게 일어날지는 미지수다. 앞으로 합성 데이터의 사용은 늘어나겠지만, 인간 노동의 필요성을 완전히 없애지는 못할 것이다. 합성 데이터의 사용은 AI 모델이 어떤 목적으로 훈련되는지에 따라 달라지기 때문이다.
세계는 평평하지 않다디지털 산업의 열악한 노동 환경은 단지 일부 악덕 관리자들이 벌이는 일탈 행위의 결과라고 볼 수는 없다. 참고로 우리가 인터뷰한 다수의 경영자들은 조직의 장기적인 수익성을 확보하고, 노동자들의 일자리와 생계를 보장하기 위해 불가피한 결정을 내릴 수밖에 없다고 강변한다. 그들은 자신들이 노동자를 착취하는 것이 아니라, 기업의 지속가능성을 위해 최선을 다하고 있다고 말한다.