2026년 5월, 프린스턴대학이 133년간 지켜온 무감독 시험 전통을 폐기했다. AI 사용이 익숙해지면서 부정행위 문제가 심각해졌기 때문이다. 이는 프린스턴 뿐만 아니다. AI가 교육의 근본 전제를 하나씩 바꾸고 있다.
한 표 차이로 끝난 133년
1893년, 프린스턴 학생들은 스스로 청원해 시험장에서 감독관을 없앴다. “우리는 정직할 수 있다”는 선언이었다. 프린스턴은 그 약속을 바탕으로 이후 133년을 쌓아왔다. 학생들은 시험지 위에 서명했다.
나는 부정행위를 하지 않았으며, 다른 학생의 부정행위도 목격하지 못했다.
2026년 5월 11일, 프린스턴 교수회가 반대 1표로 이 전통을 끝냈다. 7월 1일부터 모든 대면 시험에 감독관이 배치된다. 계기는 AI였다.
전 세계 교육 현장에서 벌어지고 있는 일
영국 더 가디언이 131개 대학을 대상으로 정보공개 청구(FOI)를 통해 조사한 결과, 2023~2024년 학사연도에 AI 관련 부정행위가 거의 7,000건 확인됐다. 학생 1,000명당 5.1건으로, 전년도 1.6건에서 3배 이상 뛰었다.
2024년 3월 와일리(Wiley)가 미국·캐나다 교수 850명을 대상으로 조사한 결과, 96%가 “지난 한 해 학생 중 일부는 부정행위를 했을 것”이라고 응답했다. 2021년 같은 조사에서 72%였던 수치가 3년 만에 24%포인트 올랐다.
가장 충격적인 수치는 따로 있다. 리딩대학교(University of Reading) 연구팀이 PLOS ONE에 발표한 논문에 따르면, AI가 작성한 답안 100개를 채점자 몰래 실제 시험에 섞었을 때 94%가 탐지되지 않았다. 게다가 AI 작성 답안의 평균 점수가 실제 학생 답안보다 높았다.
프린스턴 명예제도가 흔들린 구조와 같다. 이 제도는 두 가지 전제 위에 서 있었다.
- 부정행위는 눈에 보인다.
- 목격한 학생은 신고한다.
AI가 이 두 전제를 동시에 무너뜨렸다.
프린스턴 2025년 졸업생 설문(500명 이상 응답)에서 29.9%가 재학 중 부정행위를 인정했고, 44.6%는 목격하고도 신고하지 않았다. 실제 신고율은 0.4%였다.
세 가지 대응, 그리고 각각의 한계
교육 현장은 세 방향으로 반응하고 있다.
① 탐지 도구
턴인잇(Turnitin) 같은 AI 감지 소프트웨어 도입이 확산되고 있다. 하지만 리딩대학 연구가 보여주듯, AI 작성 답안의 94%가 탐지를 통과한다. 오탐(false positive)으로 억울하게 징계를 받은 학생 사례도 속출하고 있다.
② 과제 재설계
결과물이 아닌 과정을 보는 평가로 전환하는 흐름이 있다. 초안, 단계별 체크포인트, 성찰 일지 등이다. 방향은 맞지만, 설계하는 데 드는 교수 자원이 막대하고 전면 도입은 더디다.
③구술시험 부활
필라델피아 인콰이어러, 워싱턴 포스트 등의 보도에 따르면, 미국 대학들 사이에서 구술시험이 빠르게 확산되고 있다. 코넬대 바이오메디컬 엔지니어링 교수 크리스 샤퍼(Chris Schaffer)는 “AI로는 구술시험을 통과할 수 없다”며 ‘구술 방어(oral defense)’ 방식을 도입했다. 펜실베이니아대에서는 에밀리 해머(Emily Hammer) 교수가 서면 과제에 구술시험을 병행하기 시작했다.
그 배경에는 교수들이 직접 목격한 현상이 있다. 완벽한 과제를 냈는데 직접 설명하지 못하는 학생들. 해당 보도의 제목이 이를 묘사하고 있다.
Perfect homework, blank stares
완벽한 과제, 텅 빈 눈빛
사실 구술시험도 한계가 있다. 100명짜리 강의를 구술로 평가하는 건 현실적이지 않기 때문이다.
시험장 밖의 문제
이 모든 대응이 겨냥하는 곳은 시험장이다. 하지만 더 큰 문제는 시험장 밖에서 진행되고 있다.
프린스턴 기사에 달린 해커뉴스 댓글 하나가 핵심을 찌른다. 8년차 수학 교수라고 밝힌 이용자가 쓴 내용이다.
LLM이 학부 수학 문제 대부분을 이미 안정적으로 풀 수 있다. 나는 이제 ‘학생이 수업 밖에서는 스스로 공부하지 않을 것’을 전제로 수업을 설계해야 한다. 커리큘럼을 대폭 줄여야 했다.
즉, 교육 시스템이 당연하게 여겨온 세 가지 전제가 동시에 흔들리고 있다.
- 학생은 스스로 공부한다 ▶️ AI가 숙제를 대신할 수 있다면?
- 결과물은 본인의 것이다 ▶️ AI가 쓴 보고서를 제출해도 탐지가 안 된다면?
- 지식을 찾고 정리하는 데는 노력이 든다 ▶️ 검색과 요약이 공짜에 가까워진다면?
AI는 이 세 가지를 동시에 제거하고 있는 것이다.
프린스턴의 선택이 던지는 질문
프린스턴이 감독관을 도입하면서도 학생 자치 심의 기구(명예위원회)는 유지한 것은 의미심장하다. 명예위원회 전 위원장 나디아 마쿠크(Nadia Makuc)는 “신뢰를 폐기한 것이 아니라, 신뢰가 작동할 수 있는 조건을 다시 만들려는 것”이라고 썼다.
OECD 2026 디지털 교육 전망 보고서는 범용 AI 도구가 아닌, 학습 자체를 위해 설계된 AI로의 전환을 권고하고 있다. 평가의 방향도 “무엇을 만들었나”에서 “어떻게 생각하는가”로 이동하고 있다.
감독관은 시험장 문제를 해결한다. 구술시험은 과제 문제를 일부 해결한다. 그런데 정작 아직 해결되지 못한, 핵심적인 질문은 이것이다.
지금 시험을 보는 것들이
AI가 더 잘하고, 대신 할 수 있는 것이라면
이제 앞으로는 무엇에 대해 교육해야 할까?
프린스턴의 한 표는 그 질문의 시작점이었다.
FAQ
AI 도구를 사용하는 부정행위가 눈에 보이지 않게 됐기 때문이다. 스마트폰으로 AI 앱에 접근하는 것은 교과서를 꺼내는 것과 달리 옆 사람이 알아차리기 어렵고, 2025년 졸업생 설문에서 실제 신고율이 0.4%에 그쳤다.
현재로선 제한적이다. 리딩대학교 PLOS ONE 연구에서 AI 작성 답안의 94%가 실제 시험에서 탐지되지 않았고, 오탐으로 억울하게 징계받은 학생 사례도 보고되고 있다.
부정행위 방지 측면에서는 효과적이다. 다만 대규모 강의에 적용하기 어렵고 교수 부담이 크다는 한계가 있다.
OECD 2026 보고서는 학습 자체를 위해 설계된 AI로의 전환과 결과물 중심에서 과정·사고력 중심으로의 평가 재설계를 권고한다. 하지만 실제 전환은 교육 시스템 전반의 재설계가 필요해 더디다.
아니다. AI가 숙제와 과제를 대신하는 상황은 교육 단계와 관계없이 공통적으로 발생하고 있다. 다만 고등교육에서 논의가 가장 가시적으로 이루어지고 있다.
AiLit에서 더 알아보기
구독을 신청하면 최신 게시물을 이메일로 받아볼 수 있습니다.

