[백재파의 생각+] AI 시대의 평가 방향

부산닷컴 기사퍼가기

동아대 교양대학 교수·공모 칼럼니스트

최근 국내 최고 대학으로 손꼽히는 서울대, 고려대, 연세대 등에서 생성형 AI(인공지능)를 활용한 부정행위 사례가 언론을 통해 잇따라 보도됐다. 서울대에서는 ‘통계학실험’ 대면 중간고사 과정에서 다수의 학생이 AI를 이용해 답안을 작성한 정황이 확인됐고, 연세대와 고려대에서도 온라인 비대면 시험 중 많은 학생이 생성형 AI를 활용한 사례가 드러나 큰 충격을 주었다. 이제 일상의 필수 도구로 자리 잡은 AI가 대학의 평가 영역에까지 빠르게 침투해 대학가는 전례 없는 혼란에 빠지고 있다.

AI 활용 부정행위로 인한 혼란에 대학들이 선택한 대응 방식은 크게 두 가지로 나뉜다. 첫째는 시험과 과제에서 생성형 AI 활용을 원천적으로 차단하려는 시도다. AI 생성물 탐지 프로그램을 활용, 생성형 AI 사용이 의심되는 결과물을 식별하고 적발될 경우 0점 처리나 징계를 적용하는 방식이다. 둘째는 AI 활용 가이드라인을 마련해 사용 범위와 방법을 구체적으로 제시하고 이를 준수하도록 유도하는 접근이다.

대학서 AI 활용한 부정행위 사례 충격

시대 흐름에 맞는 평가 시스템 준비를

이해도·기초 지식 묻는 영역에선 제한

이용한 결과물엔 설명 요구 방식 필요

그러나 생성형 AI 활용을 원천적으로 차단하려는 첫 번째 방식은 현실적으로 뚜렷한 한계를 지니고 있다. 현재의 AI 생성물 탐지 프로그램은 기술적으로 완벽하지 않아 단어나 문장을 일부 수정하는 것만으로도 의심률을 크게 낮출 수 있다. 또 반대로 학생 스스로 작성한 글이 AI 생성물로 오인돼 부정행위로 판단될 가능성도 존재한다.

이에 비해 AI 활용 가이드라인을 제정해 올바른 사용을 유도하자는 두 번째 방식은 첫 번째 방식보다 유연하고 근본적 해결 방식으로 보이지만 실효성 측면에서 큰 효용이 없다. 대부분의 가이드라인은 AI를 보조적 도구로만 활용해 참고만 하고 최종 결과물에 대한 책임은 오로지 학생에게 있다는 원칙을 제시하는 수준에서 그친다. 이처럼 판단 기준이 모호하고 강제력이 없는 가이드라인은 원론적 선언 이상의 의미를 담보하기 힘들다.

결국 기존의 평가 틀을 유지한 채 AI 활용을 통제하려는 방식은 구조적으로 실효성을 갖기 어렵다. AI 시대 대학이 고민해야 할 질문은 AI 사용에 대한 통제 여부가 아니라, 이 시대에 학생에게 요구되는 역량은 무엇이며 이를 어떻게 가르치고 어떤 방식으로 평가할 것인가에 있다. 다시 말해 대학 교육은 AI 시대에 학생에게 요구되는 역량을 중심으로 교육의 목표와 평가 기준을 근본적으로 재정립하고, 이에 걸맞은 평가 시스템으로의 전환을 본격적으로 준비해야 할 시점에 와 있다는 것이다.

AI 시대에도 학생은 여전히 자신의 학문 분야에 대한 기초 지식과 핵심 개념을 정확히 이해하고 있어야 한다. AI가 생성한 결과물이 타당한지, 오류나 할루시네이션은 없는지를 판별하기 위해서는 이를 사용하는 인간의 지식과 비판적 사고가 필수적으로 요구되기 때문이다. 이러한 기초 지식과 비판적 사고가 전제되지 않은 AI 활용은 학습이 아니라 단순한 의존에 지나지 않는다.

이러한 관점에서 학문 분야의 기초 지식과 이해도를 평가해야 하는 영역에서는 생성형 AI의 사용을 엄격히 제한할 필요가 있다. 핵심 개념과 원리, 기본적인 문제 해결 능력은 AI의 도움 없이도 스스로 설명하고 적용할 수 있어야 하기 때문이다. 이를 위해 기존의 대면 시험이 유지되는 것이 바람직하다. 이러한 평가를 통해 학생이 실제로 무엇을 알고 있는지, 어느 수준까지 이해하고 있는지를 직접적으로 확인할 수 있다.

AI 시대의 대학 교육에서는 학문 기초 지식에 더해 AI를 적절하게 활용할 수 있는 능력 역시 중요한 역량으로 평가해야 한다. 여기에서 말하는 AI 활용 능력은 단순히 AI를 사용해 결과물을 만들어내는 기술이 아니라 목적에 맞게 질문을 설계하고 생성된 결과를 비판적으로 검토하며, 이를 자신의 사고와 결합해 창의적 결과물로 재구성할 수 있는 역량을 의미한다.

이러한 역량을 평가하기 위해서는 AI를 활용해 도출한 결과물과 함께 그 과정과 판단 근거를 설명하도록 요구하는 평가 방식이 필요하다. 특히 결과물 제출에 그치지 않고 구술 설명이나 발표, 토론 등을 병행해 AI를 어떻게 활용했는지, 그리고 그 결과를 얼마나 깊이 이해하고 있는지를 보다 정확하게 검증할 수 있다.

물론 구술 시험을 비롯한 발표, 토론 중심의 평가는 기존의 평가 방식보다 더 많은 시간과 노력을 요구한다. 그러나 이러한 부담을 이유로 평가 방식의 전환을 미루는 한 대학 교육의 신뢰를 유지하기 어렵다. 강좌의 소규모화와 교수 인력 확충 등 구조적 투자가 병행되지 않는다면 어떤 AI 활용 정책이나 가이드라인도 교육 현장에서 실질적인 효과를 거두기 힘들 것이다.


당신을 위한 AI 추천 기사