엔비디아, 세계 최강 반도체 기업이 만드는 2040 AI 세계
츠다 켄지 지음 | 시그마북스
엔비디아, 세계 최강 반도체 기업이 만드는 2040 AI 세계
츠다 켄지 지음
시그마북스 / 2025년 4월 / 220쪽 / 18,000원
엔비디아는 어떤 회사인가
반도체 기업 최초 1조 달러 클럽 가입: 2023년 5월, 엔비디아는 시가총액 1조 달러를 돌파한 기업이 되었다. 그로부터 약 1년 후 엔비디아의 시총은 3조 달러를 넘어섰으며 한때 전 세계의 모든 기업을 제치고 정상에 등극하기도 했다. 그동안 시총 1위 자리를 지키던 기업은 마이크로소프트였다. 마이크로소프트는 최근 들어 클라우드 서비스에 주력하며 높은 시가총액을 유지하고 있었다. 그런데 이런 마이크로소프트를 누르고 세계 정상에 올라선 엔비디아는 도대체 어떤 기업일까?
2007년경 필자는 도쿄 아카사카의 엔비디아 일본 법인에서 열린 게임기용 GPU 신제품 발표회에 처음 참석했다. 이것이 엔비디아와의 첫 대면인데, 당시 엔비디아는 게임기 영상용 그래픽 반도체 칩을 만드는 회사였다. 그랬던 엔비디아가 2016년에 들어서자 인공지능(AI)으로 방향을 전환했다.
AI에 필요한 알고리즘을 실행하려면 클라우드 컴퓨터나 슈퍼컴퓨터 같은 고성능 컴퓨터가 꼭 필요하다. 이런 고성능 컴퓨터를 움직이게 하는 기술을 따라가다 보면 반도체라는 결론에 도달하는데, 거기에 있는 기업이 바로 엔비디아다.
TSMC가 보는, 일하지 않는 일본인: 2016년 AI로의 전략 전환은 엔비디아의 기업 문화에 커다란 영향을 끼쳤다. 이를 계기로 경영진과 직원들 간의 관계가 대등해졌다. 젠슨 황은 말한다. “우리 회사에는 보스가 없다. 프로젝트가 우리의 보스다.” 이 말은 수평적이고 대등한 관계를 의미한다. 엔비디아는 이렇듯 수평적 조직 문화를 중요하게 여겼고, 약 3만 명의 직원이 일하는 기업으로 성장한 지금도 변함없이 이어지고 있다.
“프로젝트가 우리의 보스”라는 말은, 직원 한 사람 한 사람이 책임을 갖고 업무에 임하며 꽤 많은 재량권도 부여받는다는 사실을 잘 보여준다. 직원 개개인을 믿어주니 일하는 사람의 의욕이 달라지고, 근무시간에 얽매이지 않고 집중해서 원하는 만큼 일할 수 있다는 뜻이기도 하다. 이 같은 엔비디아의 기업 문화는 일본의 기업 문화와 전혀 다르다는 점에서도 꽤 흥미롭다. 엔비디아에는 장시간 근무를 하는 사람도 많은데, 누가 시켜서 하는 게 아니라 모두가 스스로 업무를 할당하고 재량권을 가지기 때문에 설령 일이 힘들다 하더라도 악덕 기업과는 큰 차이가 있다.
야근과 밤샘 근무도 마다하지 않는다는 대만의 반도체 기업 TSMC가 최근 일본에 현지법인을 만들면서 일본인과 함께 일하게 되었는데, TSMC 관계자에게서 “일본 사람들은 일하지 않는다”라는 푸념이 나온다고 한다. 그렇다고 TSMC가 악덕 기업인가 하면 그렇진 않을 것이다. 직원들을 일하게 만들고 싶다면 야근 여부도 포함해 스스로 결정하게 하는 것이 중요하다. 재량권을 주는 것과 책임을 지우는 것은 엄연히 다르다. 엔비디아에서는 책임은 어떻게 지게 할까?
벌거벗은 임금님이 되지 않도록: 엔비디아에는 프로젝트가 보스이고 책임은 팀 전체가 함께 진다는 수평적인 문화가 존재한다. 몇 개월 전 순수 일본 기업에서 엔비디아에 입사한 어느 직원은 엔비디아의 조직 문화에 놀라움을 금치 못했다고 했다. 우선 황 CEO에게는 사장실이 없다. 디지털 시대의 유목민처럼 건물 안에서 돌아다니기를 좋아하기 때문이란다. 미국 다국적 기업 내쇼날인스트루먼트(NI)의 공동 창업자 제임스 트루차드 역시 사장실을 따로 만들지 않는다고 했다. 그는 NI는 항상 미래 기술이 향하는 쪽으로 방향을 정해야 하기 때문에 사장실에 틀어박혀 있으면 ‘벌거벗은 임금님’이 되기 쉬워 방향을 놓치고 만다고 했다. 엔비디아의 젠슨 황도 이와 같은 생각으로 직원들과 같은 층에서 일하며 끈끈한 관계를 이어가고 있는 게 아닐까?
수많은 제휴와 협업으로 완성되는 엔비디아의 세계: 엔비디아 사내에서의 대등한 관계는 회사 밖에서도 마찬가지인 듯하다. 엔비디아에 자재와 기술을 제공하는 공급사와 고객사도 모두 대등한 파트너 관계다. ‘손님은 왕’이라는 인식이 없어 사회 문제가 되는 고객 갑질과는 무관한 세계다. 엔비디아에 제품이나 기술을 제공하는 공급사가 있는가 하면 엔비디아가 제품을 납품하는 고객사도 있다. 그렇기에 분야에서의 관계 구축, 다시 말해 파트너십이 꼭 필요하다. 대등한 관계의 파트너십을 맺는 협업 체계에서는 수평 분업 체제가 원활하게 이루어지기 쉽다. 엔비디아의 본업인 팹리스 반도체 설계 회사는 수평 분업 시스템 속에서 일해왔다.
AI 기술 개발과 각국 기업
2016년, AI 기업으로의 방향 전환: 2016년 4월 미국 산호세에서 열린 엔비디아 주최 개발자 콘퍼런스 ‘GTC 2016’에서 젠슨 황은 엔비디아가 AI 기업으로 크게 방향을 전환할 것이라고 발표했다. 발표 이후 엔비디아는 AI의 계산에 필요한 반도체 GPU의 개발뿐만 아니라 AI 활용에 빼놓을 수 없는 학습 기능을 강화하기 위한 소프트웨어 라이브러리를 보강하거나 병렬처리 연산을 실행하기 쉽게 해주는 소프트웨어 ‘쿠다(CUDA)’를 정비하는 등, 소프트웨어 측면도 꾸준히 강화해나갔다. 그리고 IT 기업이나 인터넷 서비스 사업자 이외의 업종에 속한 기업과도 적극적으로 제휴를 추진했다. 예컨대 제조 관련 소프트웨어를 개발하는 기업 지멘스, 그리고 영국 원자력청(UKAEA)과도 제휴했다. 이렇게 다양한 업종과 연결고리를 만듦으로써 꾸준히 고객을 늘릴 수 있었다.
독일 지멘스와 만드는 디지털 트윈 공장: 제조 관련 소프트웨어를 개발하는 독일의 글로벌 그룹 지멘스는 엔비디아의 GPU에 주목했다. 지멘스의 소프트웨어는 CAD(컴퓨터 지원 설계)로 영상을 만들어 낼 수는 있었으나, 컴퓨터 그래픽 영상이라는 티가 너무 많이 나서 사실적이지 않았다. 소프트웨어를 아무리 파고들어도 시뮬레이션 속도에 한계가 있기 때문이었다. 그러자 지멘스는 계산 속도가 빠른 하드웨어, 즉 GPU를 컴퓨팅 리소스로 만드는 편이 더 빠르겠다고 판단했다.
마침 그즈음 지멘스는 엔비디아와 제휴를 맺고 협업하면서 엔비디아가 단순히 GPU라는 하드웨어만 설계하는 것이 아니라 사실적인 그림을 그리는 옴니버스라는 소프트웨어도 제공한다는 사실을 알게 되고 이걸 사용하면 산업용 메타버스라 할 만한 디지털 트윈을 만들어 낼 수 있을 거라고 본 것이다.
디지털 트윈이란, 실제 제품이나 서비스 혹은 공장을 시뮬레이션으로 완전히 똑같이 재현하는 기술을 말한다. 이를테면 제품을 생산하기 전에 컴퓨터로 가상의 제품을 만들고 실제 환경과 같은 상태를 구현해 시뮬레이션하면 시제품 제작부터 대량생산까지 이르는 개발 기간을 단축할 수 있다. 지멘스는 3차원 CAD와 시뮬레이터 등의 종합 디지털 플랫폼 ‘액셀러레이터’에 엔비디아의 옴니버스를 집어넣었다. 이를 통해 더욱 현실적인 제품 정보를 고객 및 잠재 고객과 공유할 수 있게 되었다.
세계 반도체 업계의 왕좌에 오르다
뱅크 오브 아메리카의 매그니피센트 7: ‘매그니피센트 7(The Magnificent Seven)’은 1960년대에 공개된 미국 영화 <황야의 7인>의 원제다. ‘매그니피센트 7’은 뱅크 오브 아메리카의 애널리스트가 처음 사용한 표현으로, 시장 지배력과 기술적 영향력 등을 고려해 선정한 7대 기업을 가리킨다. 구글과 아마존, 페이스북(현재는 Meta), 애플, 마이크로소프트 모두 시가총액 1조 달러를 넘는 빅테크 기업이다. 여기에 테슬라와 엔비디아를 더해서 총 7개 기업이 되었다. 테슬라는 최고점일 때 시총 1조 달러를 넘었고, 엔비디아도 시총 1조 달러를 훌쩍 뛰어넘었다.
126%라는 파괴적인 급성장: 엔비디아의 가파른 성장세는 전 세계 반도체 기업 가운데서도 단연코 돋보인다고 할 수 있다. 특히 2023년부터 2024년에 걸쳐 그 성장이 두드러진다. 2023 회계연도의 매출액은 269.7억 달러였는데 2024 회계연도에는 609.2억 달러의 매출을 기록했다. 무려 2.26배, 126%나 증가했다. 이것은 비정상적일 정도의 수치다. 스타트업처럼 규모가 작은 기업이 아니라 270억 달러나 되는 매출을 올리는 대기업이, 대규모 인수합병도 없이 1년 만에 매출이 126%나 급증했다는 이야기는 일찍이 들어본 적이 없다.
반도체와 AI, 양쪽을 다 갖춘 것이 성장 요인: 엔비디아의 성장 요인은 뭐니 뭐니 해도 AI다. 2012년, 캐나다 토론토대학의 신경망 연구자 제프리 힌턴 교수팀이 합성곱 신경망(CNN) 방식을 사용한 고도의 이미지 인식 기술 알렉스넷(AlexNet)을 개발했다. 젠슨 황은 알렉스넷을 ‘오늘날의 AI 빅뱅’이라 표현했다. 그만큼 획기적인 기술이었다.
알렉스넷은 2012년에 개최된 이미지 인식 국제대회에서 압도적인 차이로 우승했다. 그 전까지는 이미지 인식 기술에서 인식 오류율은 가장 낮은 기술조차 25~30%를 넘었다. 이에 비해 알렉스넷은 인식 오류율이 16%로, 이는 기존보다 10%나 낮은 수치였다. 그러자 알렉스넷이 사용한 딥러닝 기술에 이목이 쏠렸고, 이후 딥러닝, 기계학습 관련 논문이 봇물 터지듯이 쏟아져나왔다. 알렉스넷이 우승한 뒤 2015년에는 중국의 바이두가 인식 오류율 5.98%라는 결과를 내놓았고, 한 달 뒤에는 마이크로소프트가 4.94%, 그 5일 후에는 구글이 4.82%를 기록하며 계속해서 기록을 갈아치웠다.
사실 알렉스넷의 딥러닝에는 엔비디아의 GPU와 소프트웨어 쿠다가 쓰였다. 대학과 기업의 연구원들이 딥러닝을 연구하는 과정에서 CPU로 계산하는 것보다 GPU로 계산하면 학습이 더 빨리 진행된다는 사실을 알게 된 힌턴 교수팀이 이 내용을 논문으로 발표했다. 논문을 읽은 엔비디아의 엔지니어가 신경망을 사용해 GPU를 동작시켰더니 이미지 인식 정밀도가 높아진다는 점을 확인했다.
엔비디아는 그동안 게임기용 이미지 처리 GPU를 중심으로 개발해왔는데, 알렉스넷의 등장 이후 AI 관련 연구도 시작했다. 그 결과 게임기에 사용하던 GPU를 AI의 기본 모델인 신경망 연산에 사용할 수 있다는 사실을 알아냈고, GPU로 AI의 학습과 추론 성능을 향상시키기 위한 기술 개발에 나섰다.
AI 기술 개발의 결실: 그리고 마침내 엔비디아의 AI 기술 개발이 마침내 성과를 거두게 된다. 2018년 AI 슈퍼컴퓨터용 GPU인 볼타(Volta)로 기존에는 며칠이 걸리던 학습 시간을 크게 단축하는 데 성공하면서, 새로운 텐서 코어 아키텍처를 채택하여 본격적으로 AI 사업에 뛰어들었다. AI용 GPU인 볼타 기반의 테슬라 V100 액셀러레이터(전용 프로세서)는 여러 데이터센터에 배치되기 시작했다.
다만 엔비디아의 전체 매출액에서 보면 AI 매출액은 게임기용 매출액보다 아직 많지 않았다. 2022년 엔비디아의 전체 매출액은 전년도 대비 61% 증가한 269.14억 달러를 기록했다. 이 시점에서도 아직 게임기용의 매출액이 더 높았다. 2023년 매출액은 전년도에 비해서 거의 차이가 없는 269.74억 달러였다. 그런데 AI 학습 칩을 사용하는 데이터센터용 매출액은 전년도 대비 41% 늘어난 150.1억 달러를 기록했고, 게임기용 매출이 27% 감소한 90.7억 달러로, 이때 처음으로 AI 매출액이 게임기용 매출액을 앞질렀다.
2023년 반도체 업계 전체 매출액은 전년 대비 8.2% 줄어든 5,269억 달러로 하향 추세였다. 그런데 엔비디아만 전년도 대비 2.26배라는 큰 폭의 수익 증가를 이뤄냈다.
엔비디아가 주력해온 GPU란 무엇인가
다각형 조합으로 곡선도 자연스럽게: 엔비디아는 창업 이래 게임기용 그래픽을 자연스럽게 그리기 위한 프로세서 GPU를 개발해왔다. 오로지 GPU에 주력해왔다고 해도 과언이 아닐 정도다. GPU를 통해 만들어진 선명하고 사실적인 영상을 사용하면 게임에 몰입감이 한층 더해진다.
GPU를 사용해 컴퓨터의 고속화가 가능하다는 사실을 알게 된 엔비디아는 이후 신경망 모델을 바탕으로 한 AI 분야에도 진출했다. GPU 1대로 게임기부터 고속 컴퓨터 그리고 AI까지 구현한 것이다. 그렇다면 이 GPU란 무엇일까? 영상을 그리는 프로세서가 어떻게 AI 프로세서로 변신할 수 있을까? 이것은 GPU의 구조를 알면 이해가 가능하다.
GPU(Graphics Processing Unit)란 컴퓨터상에서 그림을 그리기 위한 전용 프로세서를 말한다. 컴퓨터상에 그림을 그리려면 직선은 물론 곡선도 정확하게 그려야 한다. 이를 위해 펜 대신 폴리곤(다각형)이라는 작은 요소를 사용해서 곡선을 표현했다. 보통은 삼각형을 기본 단위로 해서 그리는데, 삼각형 변의 길이를 여러 종류로 바꿔가면서 곡선을 그려낸다. 2차원뿐만 아니라 입체감 있는 3차원 물체도 폴리곤 구조로 표현이 가능하다. 3차원 화면에서는 물체의 뒤쪽을 보여주는 경우가 많은데 뒷면은 물체를 회전시켜서 표현한다.
이때 좌표축이나 점을 중심으로 회전시키기 때문에 좌표 변환 작업을 하기 위한 계산이 필요하다. 게임 등에서는 다양한 장면을 각각 다른 각도에서 보여줄 때가 있는데, 이것 역시 좌표 변환 처리로 해결한다. 우리가 보는 게임 영상 이면에서는 좌표 변환과 같은 아주 복잡한 계산이 이루어지고 있다.
좌표는 (x, y) 또는 (x, y, z)라는 점으로 표현하는데, 이 좌표가 어느 정도 움직이는지에 따라서 물체(이를테면 돌고래의 머리나 꼬리)가 얼마나 회전 이동하는지를 계산한다. 이런 계산은 행렬 연산식으로 나타낸다. 다시 말해 곱셈 누적(MAC; Multiply-Accumulate) 연산으로 표현할 수 있다. 곱셈 누적이란 곱셈한 후에 그걸 계속 덧셈해나가는 계산법이다.
색깔 섞기도 결국 곱셈 누적 연산: 우리는 그림을 그릴 때 먼저 스케치를 한 다음 색칠을 한다. 이와 마찬가지로 그래픽에서도 삼각형의 폴리곤을 사용해 대충 밑그림을 그리고 나서, 이것을 정밀하게 완성해나간다. 즉 커다란 삼각형을 잘게 쪼개면 미세한 부분을 표현할 수 있다. 형태를 그렸다면 다음은 색칠하기다. 이때 색깔을 섞는 작업이 필요한데, 이 작업 역시 색의 각 요소를 곱셈 누적 연산하는 것과 같다.
컴퓨터로 그림을 그리는 경우, 인간이 그릴 때와 달리 큰 장점이 있다. 바로 화면을 수십 개, 수백 개로 쪼개어 각각의 부분을 동시에 그릴 수 있다는 점이다. 인간은 한 장의 그림을 한쪽 구석 혹은 가운데에서부터 차례로 완성해나가지만, 컴퓨터는 전체를 잘게 나누고 그것을 동시에 병렬로 그리는 일이 가능하다. 어떻게 보면 캔버스 위에 수많은 인간이 자신이 담당한 부분을 함께 동시에 그리는 느낌이다. 그래서 고속으로 그림을 그릴 수 있는 것이다. GPU에는 MAC 연산기가 대량으로 집적되어 있는데, 이것을 동시에 계산하게 작동시켜 한 장의 그림을 단시간에 완성해낼 수 있다.
게임에서는 영화처럼 사실적인 영상이 필요하다. 영상을 만들려면 30fps(1초당 30장의 프레임)가 필요하다고 한다. 30장의 사실적인 그림을 1초 만에 움직이게 하면 사실적인 영상이 된다. 여기에는 대량의 사실적인 그림을 그려낼 초고속 칩 성능이 요구된다.
미분 방정식과 복잡한 수치 계산에 강점: 게임뿐만이 아니다. 슈퍼컴퓨터나 고성능 컴퓨팅(HPC) 분야에서도 고속 계산이 필요하다. 엔비디아는 슈퍼컴퓨터나 HPC에서 다양한 미분 방정식과 복잡한 계산식을 풀기 위해 곱셈 누적 연산을 이용한 수치 계산이 쓰이고 있으며 GPU가 컴퓨터를 고속화하는 데에도 쓰일 수 있다는 점을 알게 된 것이다.