
요약(TL;DR):
- AI 탐지는 텍스트가 AI에 의해 생성되었는지 식별하는 기술이지만, 현재의 도구들은 확률에 의존하며 신뢰성이 떨어지는 경우가 많습니다.
- 교육자는 학생의 과제를 공정하게 평가하기 위해 사람의 직접 검토, 작성 과정에 대한 증거, 그리고 문맥에 대한 이해를 결합해야 합니다.
AI 탐지는 텍스트가 사람이 아닌 인공지능에 의해 작성되었는지 식별하는 과정입니다. 학생, 교육자, 연구자에게 이 구분은 매우 실질적인 결과를 초래합니다. 기관의 신뢰도, 성적 평가의 공정성, 출판된 학술 자료의 신뢰성이 모두 여기에 달려 있기 때문입니다. GPTZero나 현재는 서비스가 중단된 OpenAI의 분류기(classifier) 같은 도구들은 이 기술의 1세대를 대표하며, 이들이 가진 한계는 AI 탐지의 역할이 얼마나 복잡해졌는지를 여실히 보여줍니다. 이러한 도구들을 뒷받침하는 과학 기술은 빠르게 발전하고 있지만, 그로 인해 발생하는 문제들 역시 빠르게 늘어나고 있습니다.
AI 탐지 기술은 주로 워터마킹, 구조적 마킹, 메타데이터 분석, 로깅, AI 텍스트 분류라는 다섯 가지 방법론에 의존합니다. 각각의 방법은 기계가 생성한 텍스트와 사람이 쓴 글을 구분하는 각기 다른 신호를 표적으로 삼습니다. 이러한 방법들이 어떻게 작동하는지 이해하면, 특정 도구가 무엇을 알려줄 수 있고 무엇을 알려줄 수 없는지 평가하는 데 도움이 됩니다.

**워터마킹(Watermarking)**은 텍스트 생성 단계에서 보이지 않는 패턴을 삽입하여 특정 모델을 추적할 수 있게 합니다. **구조적 마킹(Structural marking)**은 AI 시스템이 만들어내는 경향이 있는 형식적 규칙성을 찾습니다. **메타데이터 분석(Metadata analysis)**은 파일 속성과 생성 타임스탬프를 검사합니다. **로깅(Logging)**은 어떤 계정이나 API 키가 특정 결과물을 생성했는지 추적합니다. 가장 널리 사용되는 방식인 **AI 텍스트 분류(AI text classification)**는 사람과 AI가 작성한 방대한 텍스트 코퍼스(말뭉치)로 훈련된 머신러닝 모델을 사용하여 확률 점수를 부여합니다.
이 분류 방식은 주로 *퍼플렉서티(Perplexity, 당혹도)*와 *버스티니스(Burstiness, 집중성)*라는 두 가지 언어적 특징에 크게 의존합니다. 퍼플렉서티는 단어의 배열이 얼마나 예측 가능한지를 측정합니다. 언어 모델은 통계적으로 확률이 높은 단어 선택을 선호하기 때문에, AI가 생성한 텍스트는 퍼플렉서티가 낮은 경향이 있습니다. 버스티니스는 문장 길이와 복잡성의 변동성을 포착합니다. 사람이 쓴 글은 짧고 강렬한 문장과 길고 분석적인 문장이 섞여 나타나는(burst) 경향이 있는 반면, AI의 결과물은 훨씬 더 균일한 형태를 유지합니다. 이러한 신호를 바탕으로 훈련된 탐지기는 사람의 눈에는 보이지 않는 패턴을 식별할 수 있습니다.
전문가의 팁: 탐지기의 결과를 확인할 때는 단순히 AI냐 사람이냐의 이분법적 판정만 보지 말고 신뢰도 점수(confidence score)를 확인하세요. AI일 확률이 55%인 것과 95%인 것은 어떤 결정을 내리든 그 의미가 완전히 다릅니다.
GPTZero와 같은 도구의 기반이 되는 머신러닝 분류기는 수천 개의 특징에 걸친 통계적 패턴을 동시에 분석합니다. 이들은 글의 의미를 읽는 것이 아니라, 확률 분포의 지문을 읽어냅니다. 이러한 차이는 이 도구들이 어떤 부분에서 오류를 범하는지 이해할 때 매우 중요합니다.

AI 탐지 기술의 한계는 꽤 심각해서, 여러 연구자들은 현재의 도구들을 학문적 부정행위 사건의 유일한 증거로 사용해서는 안 된다고 주장합니다. 그리고 데이터가 이러한 주장을 뒷받침합니다.
OpenAI의 분류기는 민감도가 26%에 불과했습니다. 즉, AI가 생성한 텍스트의 약 74%를 놓쳤다는 뜻입니다. 또한 사람이 쓴 글의 9%를 AI가 작성한 것으로 잘못 분류했습니다. 정확도가 너무 낮아 실효성이 없다고 판단한 OpenAI는 2023년에 이 도구의 서비스를 중단했습니다. 이는 단순한 미세 조정의 문제가 아닙니다. AI 텍스트 4개 중 3개를 놓치면서, 사람이 쓴 글 11개 중 1개를 AI로 억울하게 지목하는 도구는 신뢰할 수 있는 제재 수단이 될 수 없습니다.
공정성 문제는 영어가 모국어가 아닌 사람(비원어민)에게 훨씬 더 심각하게 나타납니다. 스탠퍼드 HAI 연구에 따르면, 토플(TOEFL) 에세이의 61.3%가 최소 한 개의 탐지기에서 AI가 작성한 것으로 분류되었으며, 19.8%는 테스트한 7개의 탐지기 모두에서 AI로 지목되었습니다. 반면 미국 태생 학생들이 쓴 에세이에서는 위양성(오탐)이 거의 0에 가까웠습니다. 이러한 격차가 발생하는 이유는 비원어민들이 더 단순하고 예측 가능한 문장 구조를 선호하여 퍼플렉서티가 낮은 패턴으로 글을 쓰는 경우가 많기 때문입니다. 탐지기는 이렇게 신중하고 의도적으로 쓰인 글을 오히려 의심스럽게 판독합니다.
아래 표는 교육자가 탐지 결과를 바탕으로 조치를 취하기 전에 반드시 이해해야 할 핵심 진단 지표를 요약한 것입니다.
| 지표 | 정의 | 중요한 이유 |
|---|---|---|
| 민감도(Sensitivity) | AI 텍스트를 정확히 식별한 비율(%) | 민감도가 낮으면 많은 AI 텍스트를 놓치게 됨 |
| 특이도(Specificity) | 사람이 쓴 글을 정확히 통과시킨 비율(%) | 특이도가 낮으면 억울한 학생이 부정행위자로 지목됨 |
| 위발견율(False discovery rate) | AI로 지목된 텍스트 중 실제로는 사람이 쓴 비율(%) | 이 비율이 높으면 탐지 결과를 신뢰할 수 없음 |
| 보급률(Prevalence) | 특정 집단 내 예상 AI 사용 비율(%) | 탐지 점수가 실제로 얼마나 유의미한지 결정함 |
AI 탐지를 선별 도구로 사용하려면 특정 학생 집단 내에서 AI 사용의 보급률을 알아야 합니다. 만약 학생의 5%만이 AI를 사용한다면, 아무리 정확도가 높은 탐지기라도 진짜 AI 글을 찾아내는 것보다 억울한 오탐(위양성)을 더 많이 만들어낼 것입니다. 이는 의료 검진에 적용되는 논리와 같습니다. 90%의 정확도를 가진 검사는 신뢰할 만해 보이지만, 해당 질병이 매우 드문 집단에 적용하면 이야기가 달라집니다.
세 번째 주요 과제는 견고성(Robustness)입니다. 실제 에세이 작성 환경에서 학생들에게 주어지는 프롬프트의 지시사항 다양성(Instruction diversity)은 탐지기 성능의 편차를 F1 점수 기준 최대 14.4 표준편차까지 증가시킵니다. 학생들이 각기 다른 제약 조건, 단어 수 제한, 또는 문체 지시사항을 가지고 글을 쓸 때, 동일한 기반의 AI 모델이 생성한 텍스트라도 탐지기는 이를 매우 다르게 평가합니다. 즉, 탐지 정확도는 도구의 고정된 속성이 아니며, 과제마다 달라진다는 뜻입니다.
전문가의 팁: 기관에서 AI 탐지기를 도입하기 전에, 비원어민의 영어 글쓰기에 대한 해당 도구의 공식적인 민감도, 특이도, 위양성률(오탐률) 데이터를 요청하세요. 공급업체가 이 수치를 제공하지 못한다면, 해당 도구의 결과는 검증되지 않은 것으로 간주해야 합니다.
규제 기관과 기술 커뮤니티는 이러한 한계에 대응하기 위해 새로운 프레임워크를 내놓고 있지만, 아직 핵심적인 문제를 완벽히 해결한 곳은 없습니다.
EU AI 법(EU AI Act), 특히 제50조 2항은 AI가 생성한 콘텐츠를 기계가 읽을 수 있는 방식으로 표시하도록 요구합니다. 유럽연합 집행위원회(European Commission)의 기술 평가는 효과성, 신뢰성, 견고성, 접근성, 상호운용성이라는 다섯 가지 기준에 따라 탐지 방법론을 평가합니다. 이는 지금까지 AI 탐지에 적용된 가장 체계적인 규제 프레임워크이며, 단일 방법론만으로는 충분하다는 생각을 명시적으로 거부합니다.
C2PA(콘텐츠 출처 및 진위 확인을 위한 연합) 시스템은 다른 접근 방식을 취합니다. 사후에 텍스트를 분석하는 대신, C2PA는 생성 시점에 암호화된 출처 데이터를 삽입하여 디지털 콘텐츠에 대한 검증 가능한 관리망(chain of custody)을 만듭니다. 개념 자체는 훌륭하지만, C2PA의 현재 구현 상태를 보면 일관성 없는 타임스탬프와 충돌하는 검증기 출력 등 보안상의 결함이 나타납니다. 이러한 불일치는 신뢰할 수 있는 검증이라는 시스템의 핵심 약속을 훼손합니다.
연구자들 역시 AI냐 사람이냐의 이분법적 판정을 넘어 다중 지표 평가 프레임워크를 도입할 것을 촉구하고 있습니다. 이 분야를 형성하는 주요 발전 사항은 다음과 같습니다.
방향성은 명확합니다. 규제 기관과 연구자 모두 AI 탐지를 자동화된 판결 시스템이 아니라, 사람의 해석이 필요한 확률적 신호로 보고 있습니다.
기술적 상황을 실질적인 지침으로 전환하려면 한 가지 불편한 진실을 받아들여야 합니다. 현재 사용 가능한 어떤 AI 탐지기도 학문적 부정행위를 판정하는 유일한 근거로 삼을 만큼 신뢰할 수 없다는 것입니다. 그렇다고 탐지 도구가 쓸모없다는 뜻은 아닙니다. 올바르게 사용해야 한다는 의미입니다.
책임감 있는 사용을 위한 프레임워크는 다음과 같습니다.
탐지 점수를 확률적 신호로 취급하세요. AI일 확률이 높게 나왔다는 것은 조사의 시작을 의미할 뿐, 결론을 의미하지 않습니다. 결론을 내리기 전에 초안, 노트, 작성 과정에 대한 증거를 요구하세요.
문제가 제기된 모든 제출물은 사람이 직접 검토하세요. 위양성(오탐)은 스스로 글을 쓴 학생에게 부당한 부정행위 혐의를 씌우고 명예를 훼손하는 등 실질적인 피해를 줍니다. 사람만이 알고리즘이 포착하지 못하는 문맥을 평가할 수 있습니다.
ESL(비원어민) 및 기술 문서 작성자에 대한 해석 기준을 조정하세요. 영어가 모국어가 아닌 학생이나 제약이 많은 장르(실험 보고서, 법률 문서, 기술 요약본 등)의 작성자는 구조적으로 AI 확률 점수가 더 높게 나오는 텍스트를 생성합니다. 모든 학생 집단에 동일한 기준을 적용하는 것은 공정하지 않습니다.
여러 도구를 사용하여 교차 검증하세요. 어떤 단일 탐지기도 모든 글쓰기 상황에서 일관된 정확도를 입증하지 못했습니다. GPTZero를 다른 분류기와 함께 사용하고 결과를 비교하면 단일 점수보다 훨씬 더 종합적인 상황을 파악할 수 있습니다.
작성 과정의 증거를 중심으로 정책을 수립하세요. 학생들에게 최종 논문과 함께 개요, 주석이 달린 초안 또는 수정 내역을 제출하도록 요구하세요. 과정에 대한 증거는 깔끔한 최종 문서보다 조작하기 어려우며, 교육자에게 더 풍부한 평가 기준을 제공합니다.
학계의 AI 글쓰기 트렌드를 지속적으로 파악하세요. 탐지 기술과 AI 글쓰기 도구는 모두 빠르게 진화하고 있습니다. 2024년에 작성된 정책은 여러분이 이 글을 읽을 때쯤이면 이미 구식이 되어 있을지도 모릅니다.
연구자들에게 이러한 시사점은 동료 심사(peer review) 과정까지 확장됩니다. 제출된 논문을 걸러내기 위해 AI 탐지기를 사용하는 학술지 역시 대학과 동일한 위양성(오탐) 위험에 직면합니다. 비원어민이 기술적인 주제로 작성한 논문은 토플 에세이와 동일한 구조적 이유로 AI 확률 점수가 높게 나올 수 있습니다. 편집 위원회 역시 교육자들과 마찬가지로 이러한 진단 도구를 제대로 이해하고 활용할 수 있는 능력이 필요합니다.
AI 탐지 도구는 진실을 판별하는 기계가 아니라 확률적 도구이며, 이를 다르게 취급하는 모든 기관의 정책은 실질적인 피해를 초래합니다.
| 핵심 포인트 | 세부 내용 |
|---|---|
| 탐지는 확률적이다 | 현재 어떤 도구도 부정행위 사건의 단독 증거로 사용할 수 있을 만큼 충분한 정확도로 AI와 사람의 텍스트를 신뢰성 있게 구분하지 못합니다. |
| 위양성(오탐)은 ESL 작성자에게 집중된다 | 영어가 모국어가 아닌 사람들은 불균형적으로 높은 위양성률에 직면하며, 이로 인해 일률적인 기준 적용은 불공정합니다. |
| 보급률이 해석을 좌우한다 | 탐지 점수를 올바르게 해석하려면 학생 집단 내에서 AI 사용이 얼마나 흔한지 알아야 합니다. |
| 규제 표준이 등장하고 있다 | EU AI 법과 C2PA는 초기 프레임워크를 제시하지만, 둘 다 핵심적인 신뢰성 및 상호운용성 격차를 해결하지는 못했습니다. |
| 사람의 검토는 타협할 수 없다 | 문제가 제기된 모든 제출물은 기관의 조치가 취해지기 전에 사람의 평가와 작성 과정에 대한 증거가 반드시 필요합니다. |
AI 탐지에 대한 연구를 통해 저는 대부분의 기관 정책이 아직 받아들이지 못한 한 가지 사실을 확신하게 되었습니다. 바로 우리가 이 도구들을 과정의 잘못된 단계에 배치하고 있다는 것입니다. 교육자들은 제출 후 학생들을 적발하는 데 탐지기를 사용하고 있지만, 단어 하나를 쓰기 전부터 AI 리터러시와 과정의 투명성을 구축하는 것이 훨씬 더 생산적인 활용법입니다.
위양성(오탐) 데이터는 단순한 기술적 불편함이 아닙니다. 이는 우리가 공정성을 집행하기 위해 신뢰하는 도구 자체가 대규모로 불공정한 결과를 낳고 있다는 증거입니다. 토플 에세이의 61.3%가 최소 하나의 탐지기에 걸리는 반면, 미국 태생 학생들의 에세이는 거의 걸리지 않는다면, 우리는 부정행위자를 잡고 있는 것이 아닙니다. 학문적 진실성 인프라에 언어적 편견을 암호화해 넣고 있는 것입니다.
또한 저는 AI냐 사람이냐라는 이분법적 프레임이 더 흥미롭고 정직한 질문, 즉 이 학생이 글쓰기 과정에 어떻게 참여했는가?라는 질문을 놓치고 있다는 것을 발견했습니다. AI 도구를 사용해 개요를 작성한 다음 모든 문장을 직접 쓰고 수정한 학생은, 모델의 원시 출력물을 그대로 제출한 학생과는 근본적으로 다른 일을 한 것입니다. 현재의 탐지기는 이 두 가지 경우를 구별할 수 없습니다. 하지만 작성 과정의 증거와 결합된 사람의 판단은 이를 구별할 수 있습니다.
탐지를 이분법적 판결이 아닌 위험 관리 워크플로우로 구성한 EU AI 법의 프레임워크가 올바른 모델입니다. 지금 이 프레임워크를 채택하는 기관은 차세대 AI 글쓰기 도구로 인해 오늘날의 탐지기가 더욱 신뢰성을 잃게 될 때 훨씬 더 유리한 위치에 서게 될 것입니다. 우리의 목표는 AI와의 군비 경쟁에서 이기는 것이 아닙니다. 학생이 실제로 무엇을 알고 무엇을 할 수 있는지 이해하는 것입니다.
— 틸렌(Tilen)
학문적 진실성을 지키기 위해 AI를 완전히 피할 필요는 없습니다. 완벽한 투명성과 진정한 지적 참여를 바탕으로 AI를 책임감 있게 사용하는 것이 중요합니다.

Samwell은 정확히 이러한 균형을 위해 만들어졌습니다. Samwell의 표절 없는 에세이 도구는 Semihuman.ai 기술과 실시간 AI 탐지 검사를 결합하여, 제출하기 전에 내 논문의 상태를 미리 파악할 수 있게 해줍니다. 파워 에디터(Power Editor)를 사용하면 주장을 외부에 맡기지 않고 스스로 다듬고 확장할 수 있습니다. 가이드 에세이(Guided Essays)는 구조화된 개요를 제공하여 여러분의 생각이 작업의 중심에 있도록 돕습니다. 주요 대학의 100만 명 이상의 학생들이 독창적이고 신뢰할 수 있는 학술 글쓰기를 위해 Samwell을 사용하고 있습니다. 학생을 위한 AI 탐지를 이해하고 자신 있게 글을 쓰고 싶다면, Samwell이 그 두 가지를 모두 해낼 수 있는 도구를 제공합니다.
AI 탐지는 제출된 텍스트가 학생이 직접 쓴 것이 아니라 AI 모델에 의해 생성되었는지 식별합니다. 그 역할은 학문적 진실성 정책을 지원하는 것이지만, 현재의 도구들은 부정행위를 판정하기 전에 사람의 검토와 작성 과정에 대한 증거를 필요로 합니다.
탐지기는 신중하고 의도적인 사람의 글쓰기와 겹치는 퍼플렉서티(당혹도) 및 버스티니스(집중성) 지표에 의존합니다. 특히 영어가 모국어가 아닌 사람들이 큰 영향을 받는데, 연구에 따르면 미국 태생 학생들의 에세이에서는 위양성률이 거의 0에 가까운 반면, 토플 에세이에서는 61.3%의 위양성률을 보였습니다.
정확도는 도구와 글쓰기 문맥에 따라 크게 다릅니다. OpenAI의 분류기는 민감도가 26%에 불과해 AI가 생성한 텍스트의 거의 4분의 3을 놓쳤습니다. 현재 어떤 도구도 모든 학생 집단과 과제 유형에 걸쳐 일관된 정확도를 입증하지 못했습니다.
지시사항의 다양성과 글쓰기 제약 조건은 탐지기 성능의 편차를 F1 점수 기준 최대 14.4 표준편차까지 증가시킵니다. 즉, 프롬프트가 어떻게 작성되었느냐에 따라 동일한 AI 모델이 매우 다른 점수의 텍스트를 생성할 수 있습니다. 적대적 편집(Adversarial editing)은 탐지 신뢰성을 더욱 떨어뜨립니다.
탐지 결과를 결론이 아닌 조사의 출발점으로 삼으세요. 초안, 개요, 수정 내역을 요구하십시오. 제출물의 전체적인 문맥에 사람의 판단을 적용하고, 공식적인 조치를 취하기 전에 소속 기관의 AI 정책을 참고하세요.




