xAI: 혁신적인 엔지니어링 접근 방식
xAI 직원 인터뷰 유출 사건이 흥미롭다. Sulaiman Khan Ghori라는 엔지니어가 팟캐스트에 나가서 회사 내부를 적나라하게 공개했다가 3일 만에 회사를 떠났다. 그가 밝힌 내용들을 보면 왜 xAI가 다른 방식으로 작동하는지, 그리고 왜 AI에 대한 비관적 예측들이 빗나가고 있는지 이해할 수 있다.

Ghori가 묘사한 xAI의 작업 방식은 기존 테크 기업과 완전히 다르다. 관리 계층이 딱 세 개다. 개인 기여자, 공동 창업자급 매니저, 그리고 일론 머스크. 끝이다. HR 업데이트 없이 프로젝트를 자유롭게 옮겨 다니고, 모든 직원이 엔지니어로 분류된다. 영업팀조차 엔지니어링을 한다. 좋은 아이디어가 나오면 그날 바로 구현해서 머스크에게 보여주고 피드백을 받는다. 인프라 문제가 생기면 담당자가 아니어도 누구나 고쳐서 소유자에게 보여주고 배포한다.
이 시스템이 만들어내는 속도는 놀랍다. Colossus GPU 클러스터를 122일 만에 구축했다. 엔비디아 CEO 젠슨 황이 직접 칭찬할 정도였다. 일반적인 기업에서 수주에서 수개월 걸리는 훈련 런 준비를 랙 설치 후 몇 시간에서 하루 안에 시작한다. Ghori 본인은 메인 레포지토리에 하루 5개 커밋을 하면서 1250만 달러 가치를 더했다고 말했다. 한 명의 엔지니어가 20개 AI 에이전트를 활용해서 코어 API 전체를 재구축했다.
인센티브 시스템도 독특하다. 머스크가 엔지니어 Tyler에게 24시간 내 GPU 훈련 런을 완료하면 사이버트럭을 주겠다고 제안했고, Tyler는 성공해서 트럭을 받았다. 그 트럭이 지금도 xAI 사무실 밖에 주차되어 있다고 한다. 즉각적이고 과감한 보상이 속도를 유지하는 핵심이다. 커밋 하나당 250만 달러 가치로 계산하고, 프로젝트 지연이나 가속이 즉각 수익 변동으로 환산된다. 모든 것이 경제적 레버리지에 연결되어 있다.
Ghori가 밝힌 인간 에뮬레이터 프로젝트는 특히 주목할 만하다. 키보드와 마우스 입력, 화면 결정 등을 에뮬레이션해서 소프트웨어 변경 없이 인간이 하던 일에 그대로 배포할 수 있는 AI다. 비용은 인간의 20분의 1이고 24시간 7일 가동된다. 북미에만 400만 대가 있는 테슬라 차량의 유휴 컴퓨팅 파워를 활용해서 수백만 개를 스케일링할 계획이다. 70에서 80퍼센트가 유휴 시간이라는 점을 감안하면 엄청난 분산 컴퓨팅 자원이다. 내부 테스트에서 이미 가상 직원을 조직도에 추가하고 슬랙과 이메일로 상호작용하는 실험을 진행했다. 물론 환각 문제로 AI가 동료에게 직접 만나자고 해서 사람이 빈 책상으로 가는 웃긴 에피소드가 발생하기도 했다.
AI에 대한 비관적 예측을 하는 사람들이 자주 지적하는 문제들이 있다. 환각, 신뢰성, 일반화 능력, 비용, 확장성. 그런데 이런 예측들이 과거의 지식에 기반해서 미래를 재단하고 있다는 점이 핵심이다.
환각 문제를 예로 들어보자. 학계와 많은 전문가들은 대형 언어 모델의 환각이 구조적 한계라고 주장해왔다. 확률적 토큰 생성 방식의 본질적 문제라는 것이다. 그런데 xAI는 이 문제를 어떻게 접근하나. 빈 책상 에피소드가 발생하면 그걸 인간 관찰로 고치고 포스트모템을 진행한다. 실험 실패가 잦지만 자유롭게 시도하고 빠르게 반복한다. 문제가 발생하면 그날 밤 워 룸에서 고친다. 머스크가 X에 잘못된 Grok 출력을 올리면 바로 수정이 시작된다. 환각이 구조적 한계라서 해결 불가능한 게 아니라, 빠른 반복과 피드백으로 지속적으로 줄여나가는 엔지니어링 문제로 취급하는 것이다.
비용 문제도 마찬가지다. AI 컴퓨팅 비용이 너무 비싸서 범용 적용이 어렵다는 예측이 많았다. 그런데 xAI는 테슬라 차량의 유휴 컴퓨팅 파워를 활용하는 방식으로 접근한다. VM이나 엔비디아 클라우드보다 저렴하다. 이미 존재하는 자원을 다르게 활용하는 것이다. 사우디아라비아와 협력한 500MW AI 컴퓨트 프로젝트도 진행 중이다. 문제를 정면으로 해결하기보다 우회로를 찾는다.
속도에 대한 비관적 예측도 있었다. AI 발전이 점점 느려질 것이고, 로우 헹잉 프루트가 소진되면서 돌파가 어려워질 것이라는 주장이다. 그런데 xAI의 방식은 다르다. 머스크가 병목을 수년 앞서 예측하고 역산 작업을 한다. 하드웨어로 타임라인을 보정하고 일일 업데이트를 한다. 모델이 인간 속도의 1.5배 이상이면 된다는 대담한 베팅을 한다. 다른 회사들이 반대한 결정이었지만, 빠른 반복이 가능해진다는 논리였다. 문제가 생기면 자정에 이메일로 올핸즈를 소집하고 슬리핑 포드와 텐트에서 야근하면서 하룻밤에 수개월 진척을 만들어낸다.
비관적 예측이 빗나가는 이유는 예측의 근거가 되는 모델 자체가 과거 데이터에 기반하기 때문이다. 기존 테크 기업의 속도, 기존 조직 구조의 효율성, 기존 인센티브 시스템의 효과를 전제로 미래를 예측한다. 그런데 xAI는 그 전제 자체를 바꿔버렸다. 관리 계층을 세 개로 줄이고, 모든 직원을 엔지니어로 만들고, 즉각적인 보상 시스템을 도입하고, 테슬라의 유휴 자원을 활용하고, 사이버트럭을 베팅 상품으로 쓴다. 과거의 패턴으로 예측할 수 없는 시스템이다.
물론 xAI의 방식에도 문제가 있다. 고강도 노동으로 인한 번아웃, 빠른 의사결정으로 인한 실수, 보안 유출 사건처럼 신뢰 문제가 발생한다. 가드레일에 대한 머스크의 불만으로 안전 팀 일부가 퇴사했다는 이야기도 있다. 500명 대량 해고처럼 피벗이 가혹할 수도 있다.
그러나 핵심은 문제가 해결 가능한가 불가능한가의 차이다. 비관적 예측은 문제를 구조적 한계로 본다. xAI의 접근은 문제를 엔지니어링 과제로 본다. 환각이 있으면 고치고, 비용이 높으면 다른 자원을 찾고, 속도가 느리면 조직을 바꾼다. 불가능해 보이는 목표에 사이버트럭을 걸고 24시간 안에 해결한다.
Ghori가 인터뷰에서 한 말이 있다. xAI에서는 문서가 없어서 코드를 반복해서 읽어야 한다고. 속도 때문에 문서화할 시간이 없다는 것이다. 비효율적으로 보일 수 있지만, 문서를 만드는 시간에 제품을 배포하는 시스템이다. 기존 상식으로는 이해하기 어려운 방식이지만, 결과물은 나오고 있다.
비관적 예측을 하는 전문가들의 지식이 틀린 게 아니다. 그들이 아는 세계에서는 맞는 예측이다. 다만 그 세계가 더 이상 유일한 세계가 아니라는 점을 놓치고 있을 뿐이다.
