AI가 대신 알아주지 않는다 – 인지적 하청과 진짜 앎의 조건
AI를 학습 도구로 쓰면 오히려 기억력이 떨어질 수 있다. 2025년 리우데자네이루 연방대학교(UFRJ) 앙드레 바르카우이(André Barcaui) 교수팀의 무작위 대조 시험에서, ChatGPT를 자유롭게 쓴 학생의 45일 뒤 정답률은 57.5%에 그쳤고, 전통적 학습법을 쓴 학생은 68.5%를 기록했다. 도구가 똑똑해진다고 사용자도 똑똑해지는 것은 아니다.

AI 시대에 가장 빠르게 퍼지는 착각이 있다. 도구의 지능이 곧 나의 지능이라는 믿음이다. 계산기를 쓴다고 수학을 아는 것이 아니듯, AI를 쓴다고 지식이 내 것이 되지는 않는다. 알고 있다는 느낌과 실제로 아는 것 사이에는 생각보다 넓은 간극이 있다.
2025년 X(구 트위터)에서 크게 화제가 된 사례가 있다. 한 MIT 대학원생이 구글의 AI 노트 도구인 NotebookLM을 활용해 48시간 만에 한 번도 공부한 적 없는 분야의 자격시험(Qualifying Exam)을 통과했다는 이야기다. 이 이야기의 진위 여부를 독립적으로 검증할 방법은 없다. 바이럴 콘텐츠가 으레 그렇듯, 과장이 섞여 있을 수도 있다. 그런데 진위와 별개로 흥미로운 것은 그 방법론이다. 이 학생은 단순히 AI에게 요약해달라고 하지 않았다. 교과서 6권, 연구 논문 15편, 전체 강의 녹취록을 NotebookLM에 넣고, 세 가지 질문을 던졌다. 이 분야 전문가들이 공유하는 핵심 사고 모델은 무엇인가. 전문가들이 근본적으로 의견이 갈리는 지점은 어디인가. 이 주제를 진짜 이해한 사람과 단순히 암기한 사람을 구분하는 질문은 무엇인가. 그리고 마지막 질문에서 나온 테스트 문항에 스스로 답을 적고, 틀린 부분을 AI에게 검증받는 과정을 48시간 동안 반복했다. AI를 답을 주는 기계가 아니라, 자기 생각의 빈틈을 드러내는 거울로 쓴 것이다.
이 방식이 효과적이었다고 알려진 이유는 하나다. 인지적 노력(Cognitive Effort)의 방향이 달랐다. 대부분의 사람은 AI를 쓸 때 노력을 줄이려 한다. 이 학생은 반대로 했다. AI를 통해 자기 생각을 더 많이 꺼내고, 더 자주 부딪히고, 더 깊이 파고들었다. 도구를 편하게 쓴 것이 아니라, 도구를 불편하게 쓴 것이다.
문제는 대부분의 사람이 이렇게 쓰지 않는다는 것이다. 바르카우이 교수팀이 Social Sciences & Humanities Open에 발표한 무작위 대조 시험(Randomized Controlled Trial)이 이를 보여준다. 120명의 대학생을 모집해 두 그룹으로 나눴다. 한쪽은 ChatGPT를 자유롭게 학습 보조 도구로 사용하게 했고, 다른 쪽은 교과서와 필기 같은 전통적인 방법만 쓰게 했다. 45일 뒤 예고 없이 같은 시험을 치르게 했고, 최종적으로 85명이 테스트를 완료했다. 결과가 분명했다. AI를 쓴 그룹의 정답률은 57.5%, 전통적 방법을 쓴 그룹은 68.5%였다. 효과 크기(Cohen’s d)는 0.68로, 통계적으로도 실질적으로도 유의미한 차이였다.
AI를 쓰면 왜 기억에 덜 남는가. 연구팀은 이 현상을 인지적 하청(Cognitive Offloading)이라는 개념으로 설명했다. 기억하고, 정리하고, 연결하는 작업을 기계에 넘기면 뇌는 그 작업을 건너뛴다. 건너뛴 작업은 기억에 남지 않는다. 편하게 배운 것은 빨리 잊힌다. 인지심리학에서 말하는 바람직한 어려움(Desirable Difficulties)의 원리와 정확히 반대 방향이다. 학습에 적절한 저항이 있어야 기억이 단단해지는데, AI가 그 저항을 제거해버린 것이다.
도덕경(道德經) 71장에 이런 구절이 있다. 知不知上 不知知病. 알면서도 모른다고 여기는 것이 최상이고, 모르면서 안다고 여기는 것이 병이다. 노자가 2,500년 전에 짚은 것이 정확히 이 지점이다. 앎의 가장 위험한 형태는 무지가 아니다. 안다는 착각이다. AI가 정리해준 내용을 읽고 나면 사람은 그것을 안다고 느낀다. 화면에 깔끔하게 정돈된 요약을 보면, 그 내용이 내 머리 안에도 같은 형태로 들어 있다고 착각한다. 그런데 45일 뒤 시험지 앞에 앉으면 아무것도 떠오르지 않는다.
AI에게 올바르게 질문하는 법이 학습의 관건이 된다. 바이럴 사례의 학생이 한 것과 바르카우이 실험의 학생들이 한 것의 차이는 결국 질문의 방향이다. 대부분은 AI에게 물었다. 이것을 설명해줘. 그 학생은 AI에게 물었다. 내가 이해한 것이 맞는지 확인해줘. 전자는 받는 행위이고, 후자는 꺼내는 행위다. 인지심리학에서 이 차이를 능동적 회상(Active Recall)이라 부른다. 기억 속에서 정보를 직접 끌어내는 행위 자체가 기억을 강화한다. 시험이 학습 도구가 되는 이유도 이것이다. 시험은 평가가 아니라 인출 연습(Retrieval Practice)이다.
특히 흥미로운 것은 세 번째 질문이다. 전문가들이 근본적으로 의견이 갈리는 지점은 어디인가. 이것은 단순한 이해를 넘어선 질문이다. 두 개의 서로 다른 체계를 머릿속에 올려놓고, 그 사이의 긴장을 읽어내는 작업이다. 이런 질문을 던질 수 있으려면 이미 두 체계를 어느 정도 소화하고 있어야 한다. AI는 그 충돌 지점을 찾아줄 수 있다. 그런데 그것을 이해하는 것은 사람의 몫이다.
여기서 한 가지 구분이 필요하다. 정보와 지식은 다르다. 정보(Information)는 바깥에 있다. 검색하면 나온다. AI에게 물으면 정리해서 보여준다. 그런데 지식(Knowledge)은 안에 있다. 정보가 내 경험과 만나고, 기존에 알고 있던 것과 부딪히고, 시행착오를 거쳐 체화된 것이 지식이다. 정보는 전달할 수 있지만 지식은 전달할 수 없다. 각자 자기 안에서 만들어야 한다.
도덕경 71장의 뒤를 이어 노자는 이렇게 말한다. 夫唯病病 是以不病. 병을 병으로 알아야 비로소 병이 아니다. 자기가 모른다는 것을 아는 사람은 배울 수 있다. 자기가 안다고 믿는 사람은 배울 이유가 없다. AI 시대의 역설이 여기에 있다. 도구가 너무 잘 정리해주니까, 사람은 자기가 이미 안다고 느낀다. 그 느낌이 배움의 문을 닫는다.
바이럴 사례가 보여주는 것은 AI의 가능성이 아니라 사용자의 태도다. 같은 도구를 쥐어줘도 어떤 사람은 편해지고, 어떤 사람은 날카로워진다. 편해진 사람은 잊고, 날카로워진 사람은 남긴다. 바르카우이의 실험에서 AI를 자유롭게 쓴 학생들은 학습 과정에서 분명 더 편했을 것이다. 빠르게 답을 얻었고, 깔끔한 요약을 받았고, 공부한다는 느낌을 충분히 받았을 것이다. 그런데 45일 뒤 남은 것은 그 느낌뿐이었다.
칼을 차고 다닌다고 검객이 되는 것은 아니다. 칼로 수천 번 베어본 사람만이 검객이다. AI는 지금까지 인류가 만든 것 중 가장 날카로운 칼이다. 문제는 그 칼을 누가 쥐고 있느냐가 아니라, 칼을 쥔 사람이 자기 손으로 벤 적이 있느냐다.
아는데 실천이 어렵다고 하는 사람들은 알아야 한다. 당신은 아는게 아니다. 안다고 착각하고 있는거지.
