SMATh 3/7/26 SMATh 3/7/26

학부모 89%가 원한다, AI와 교사가 함께 채점

89.3%.
이 숫자 보고 솔직히 뭔가 헛웃음이 났다.

학부모 10명 중 약 9명이 인공지능(AI)과 교사가 함께 평가하는 방식을 선호한다.
맞아, 거의 전원 동의.
그게 왜 놀랍냐면, 우리 집 아이가 지금 받는 수학 과제 평가는 아직 ‘교사가 검토한 후 데스크톱으로 파일 업로드’ 수준인데, 논술 평가는 이미 인공지능(AI)이 먼저 걸러냈다고?

서울교육청은 2026년까지 인공지능(AI)을 활용한 서술형 및 논술형 평가를 전면 확대하기로 결정했다.
그것보다 더 무섭게 느껴졌던 건…
학부모들 스스로가 “인공지능(AI)은 너무 차갑다”면서 “내가 보기에도 헷갈릴 정도니까 사람이 봐줘야 한다”고 말했다는 거지.

89.3%는 대교솔루니의 설문 결과인데, 이건 그냥 통계가 아니라, 사회적 합의처럼 느껴짐.
“인공지능(AI)은 객관적이지만, 인간은 맥락을 안다.”
이게 이제는 믿음의 경계가 아니라, 현실의 기준이 되었어.

그런데 문제는, 인공지능(AI)이 정말로 ‘객관적’일까?
인지과학 및 윤리 전문가들 사이에서는 ‘편향 문제’가 지속적으로 제기되고 있으며, 특히 특정 지역이나 문화권 배경의 아이들이 불리할 수 있다고 우려된다.
인공지능(AI)이 ‘표준 답안’만 기억하면, 그림을 그리는 아이의 상상력은 어떻게 평가하겠어?

그럼 교사가 다 보완할 수 있을까?
당연히 아니지.
교사들도 자기 기준으로 편향되기 쉽다.
게다가 학급당 학생 수가 35명이 넘는 현실에서, 누구도 모든 아이의 말투나 생김새, 가족 환경까지 세밀하게 파악하지는 않으니까.

그렇다면, 왜 89.3%가 ‘혼합 평가’를 원하는 걸까?
혹시 우리가 오랫동안 믿었던 ‘교사의 판단력’이라는 게, 사실은 ‘그림자 같은 편견’이었을지도 몰라.
인공지능(AI)은 그런 것이 없다고 생각했는데, 알고 보면 그 자체도 그림자들을 뚫고 살아남았다는 게 참 뻔뻔하더라.

이게 결국은 ‘신뢰’의 문제가 아닐까.
인공지능(AI)이 정확하게 점수를 매겨도, 학부모가 마음이 안 편하다면 의미가 없고,
교사가 감정을 담아 코멘트를 써도, 그게 ‘왜 저 점수가 나오는지’ 설명해주지 않으면 또 헛소리지.

그래서 내가 궁금한 건,
이제부터는 인공지능(AI)이 “이 글은 감정의 진실성이 부족하다”고 하면,
교사는 그게 무슨 의미인지,
어떻게 증명하고,
어떤 기준으로 다시 보여줄 수 있을까?

아직은 답이 안 나왔지만,
‘인공지능(AI) + 교사’라는 조합이,
이제는 단순한 기술 협업이 아니라,
‘공감’과 ‘정확성’의 새로운 균형을 만들어가고 있다는 건 분명해.

그런데, 진짜로 잘 작동한다면,
학생들은 이제 ‘내가 왜 이렇게 썼는지’,
‘어떤 부분이 좋아서 어떤 부분이 안 좋았는지’를
이젠 명확히 알 수 있을까?

그게 가능하다면,
이 혼합 평가 방식은,
단순한 채점 방법의 변화가 아니라,
교육의 본질을 다시 묻는 시작점이 될지도 몰라.

🎧이 글의 오디오 버전

전체 에피소드 보기 →