“The tree knew before she did — and it waited.”
이 문장으로 2026년 하퍼스 바자 UK(Harper’s Bazaar UK) 단편소설 공모전 우승작이 시작된다. 소설 제목은 “Back and Forth”, 저자명은 카비아타 카이(Kavyata Kay). 발행된 지 며칠 만에 이 글은 문학계에서 가장 불편한 질문의 중심에 섰다. AI가 쓴 것 아니냐는 의혹 때문이었다.
두 개의 문학 수상, 같은 AI 의혹
하퍼스 바자 UK 단편소설 공모전 우승작 「Back and Forth」를 둘러싼 AI 의혹은 빠르게 확산됐다.
논란의 시작은 AI 탐지 도구 팽그램(Pangram)이었다. 나빌 S. 쿠레시(Nabeel S. Qureshi)는 작품을 분석한 결과를 공개하며 AI가 작성했을 가능성을 제기했다. 온라인에서는 문체와 표현 방식까지 분석하는 글들이 쏟아졌고, 작품은 순식간에 AI 논란의 중심에 섰다. 그런데 비슷한 일은 이미 한 달 전에 벌어진 적이 있었다.
2026년 5월, 영연방 작가들을 대상으로 하는 권위 있는 문학상인 커먼웰스 단편소설상(Commonwealth Short Story Prize)의 카리브해 지역 우승작 「The Serpent in the Grove」 역시 AI 사용 의혹에 휩싸였다.
해당 작품은 총 7,806편의 응모작 가운데 선정된 수상작이었다. 심사위원단은 작품의 “정밀하면서도 풍부한 환기적인 언어(precise yet richly evocative language)”를 높이 평가했다. 하지만 수상 직후 와튼스쿨 교수이자 AI 연구자인 에단 몰릭(Ethan Mollick)이 AI 탐지 도구 분석 결과를 공유하면서 상황이 달라졌다.
그는 탐지 결과뿐 아니라 반복적인 문장 구조, 정교한 은유 표현, 세 가지 요소를 나열하는 문체 등 AI 글쓰기에서 자주 발견되는 특징이 작품에 나타난다고 지적했다.
흥미로운 점은 두 작품 모두 일반적인 인터넷 게시물이 아니라 전문 심사위원단이 직접 선정한 수상작이었다는 사실이다. 한 번도 아니고 두 번 연속 비슷한 의혹이 제기되면서 문학계는 새로운 질문과 마주하게 됐다.
AI가 정말 문학상을 받을 만큼 글을 잘 쓰게 된 것일까. 아니면 인간이 쓴 글조차 AI로 의심받는 시대가 시작된 것일까.
작가는 “내가 썼다”고 했다
먼저 커먼웰스 단편소설상 수상자인 자미르 나지르(Jamir Nazir)는 AI 사용을 즉각 부인했다. 그는 자신의 작품이 전적으로 본인의 창작물이며, 트리니다드에서 보낸 어린 시절의 경험을 바탕으로 썼다고 설명했다.
특히 그는 자신의 글쓰기 방식도 공개했다. 만성 건강 문제로 오랜 시간 키보드를 사용하기 어려워 음성 입력을 활용해 초고를 작성하고, 이후 직접 수정과 퇴고를 거친다는 것이다.
나지르는 AI 탐지 결과에 대해서도 반박했다. 완성도 높은 인간의 글이 AI로 오인되는 사례가 적지 않으며, 탐지기 결과만으로 작품의 작성 방식을 단정할 수 없다는 주장이다. 주최 측 역시 신중한 입장을 보였다. 커먼웰스 재단은 검토를 거친 뒤 수상 결과를 유지하겠다고 밝혔다.
하퍼스 바자 UK 사례는 조금 다르다. 이 글을 작성하는 시점까지 우승자 카비아타 카이는 공식 입장을 내놓지 않았다. 심사위원단은 AI 관여 사실을 인지하지 못했다는 입장이다. 결국 두 사건 모두 명확한 결론은 내려지지 않았다.
AI 사용 의혹은 제기됐지만 이를 입증할 결정적인 증거는 없고, 작가와 주최 측 역시 수상 결과를 뒤집을 만한 근거는 확인되지 않았다고 보고 있다. 논란은 이어지고 있지만, 적어도 현재까지는 ‘AI가 쓴 작품이 문학상을 받았다’고 단정할 수 있는 상황은 아닌 셈이다.
AI 탐지기로는 결론을 낼 수 없다
더 근본적인 문제도 있다. AI 생성 기술과 AI 탐지 기술은 끊임없이 서로를 따라잡는 경쟁 관계에 있다. 새로운 생성 모델이 등장할 때마다 AI가 만들어내는 문장은 더욱 자연스러워지고, 탐지 도구는 그 흔적을 찾아내기 위해 다시 진화한다.
문제는 생성 기술의 발전 속도가 탐지 기술보다 빠르다는 점이다. 같은 글이라도 탐지 모델이 바뀌면 결과가 달라질 수 있고, 오늘 높은 확률로 AI 생성물로 분류된 글이 미래에는 다른 평가를 받을 수도 있다.
그래서 대부분의 문학상이나 교육기관, 기업은 탐지기 결과만으로 최종 판단을 내리지 않는다. AI 탐지 결과는 참고 자료가 될 수는 있지만, 그것만으로 창작 과정 전체를 증명하거나 부정할 수는 없기 때문이다.
결국 이번 논란이 보여준 것은 AI가 글을 잘 쓰게 됐다는 사실만이 아니다. 우리는 이제 AI가 만든 결과뿐 아니라 AI가 내린 판단 역시 비판적으로 바라봐야 하는 시대에 들어서고 있다.
AI가 잘 쓰는 글과 좋은 글은 얼마나 닮았을까
이번 논란에서 주목할 부분은 AI 탐지 결과가 아니다. 두 작품 모두 전문 심사위원단이 직접 선정한 수상작이었다는 사실이다.
커먼웰스 심사위원단은 「The Serpent in the Grove」를 선정하며 “정밀하면서도 풍부하게 환기적인 언어”를 높이 평가했다. 하퍼스 바자 UK 역시 여러 작가와 편집자들로 구성된 심사위원단이 「Back and Forth」를 우승작으로 선택했다.
여기서 한 가지 질문이 생긴다. 만약 AI가 이 작품들을 작성하는 데 일부 관여했다면, 심사위원들은 무엇을 보고 좋은 글이라고 판단한 것일까.
의혹을 제기한 AI 연구자 에단 몰릭은 이번 논란을 언급하며 흥미로운 관찰을 남겼다. AI는 모든 종류의 글을 잘 쓰는 것은 아니지만, 특정한 문체와 분위기를 구현하는 데는 상당히 능숙하다는 것이다.
짧고 리듬감 있는 문장, 풍부한 은유, 감정을 섬세하게 묘사하는 표현, 분위기를 중심으로 전개되는 서사. 이런 특징들은 최근 생성형 AI가 비교적 잘 재현하는 영역으로 꼽힌다. 그리고 이 스타일이 공모전 심사위원들이 “좋은 글”이라고 평가하는 스타일과 상당 부분 겹친다.
물론 이것이 해당 작품들이 AI로 작성됐다는 의미는 아니다. 다만 논란을 통해 한 가지 사실은 분명해졌다. AI가 만들어내는 글의 수준이 인간 독자뿐 아니라 전문 심사위원들의 기대치와도 점점 가까워지고 있다는 점이다. 그래서 이번 사건은 단순히 “AI가 썼느냐”의 문제가 아니다.
어떤 글을 좋은 글이라고 평가하는지, 그리고 그 기준은 앞으로도 그대로 유지될 수 있는지에 대한 질문으로 이어진다. AI가 인간의 문체를 학습하는 시대를 넘어, 인간이 선호하는 문체 자체를 재현할 수 있는 단계에 가까워지고 있기 때문이다.
문학 산업이 맞닥뜨린 선택
현재까지 두 사건 모두 명확한 결론은 나오지 않았다. 수상작이 실제로 AI의 도움을 받았는지, 어느 정도까지 활용됐는지, 혹은 전적으로 인간이 작성한 작품인지는 여전히 논쟁의 영역에 있다.
하지만 한 가지는 분명하다. 생성형 AI는 이제 인간이 높게 평가하는 문체와 분위기까지 상당 수준 재현할 수 있게 됐다. 반면 AI를 판별하는 기술은 아직 그 속도를 따라가지 못하고 있다.
AI가 만든 결과물은 물론, AI가 내린 판단까지 함께 검토해야 하는 시대가 왔다는 사실을 보여주는 사례에 가깝다. AI가 문학상을 받았는지는 아직 알 수 없다. 하지만 AI 때문에 우리가 ‘창작’과 ‘판단’을 바라보는 방식이 달라지고 있다는 사실만큼은 분명해 보인다.
FAQ
팽그램은 텍스트가 AI로 작성됐는지 탐지하는 도구로, 2024년 미국에서 설립됐다. ChatGPT, Claude, Gemini 등 주요 언어 모델이 생성한 글의 문장 패턴을 분석해 AI 생성 여부와 비율을 수치로 제시한다.
그렇지 않다. AI 탐지기는 확률을 제시하는 도구일 뿐, 작성 과정을 증명하는 기술은 아니다. 실제로 사람이 쓴 글이 AI로 오인되거나, AI가 생성한 글이 인간의 글로 판정되는 사례도 보고되고 있다.
공모전마다 다르다. 대부분의 문학 공모전은 AI 사용을 명시적으로 금지하거나 허용하는 규정을 아직 갖추지 못했다. 이번 논란은 문학 공모전들이 AI 창작 허용 여부를 명확히 할 필요성을 직접적으로 드러낸 사건이다.
최신 AI 모델은 방대한 양의 문학 작품과 글을 학습해 인간의 문체를 매우 자연스럽게 재현할 수 있다. 반면 이를 판별하는 기술은 아직 완벽하지 않아, 글만 보고 작성 주체를 단정하기 점점 어려워지고 있다.
AiLit에서 더 알아보기
구독을 신청하면 최신 게시물을 이메일로 받아볼 수 있습니다.

