하이레터 구독자 여러분, 안녕하세요. 인간:지능연구소(H:AI)입니다.😃
AI는 우리를, 인간을 측정할 수 있을까요?
오늘 뉴스레터에서는 "교육, AI 그리고 평가"에 대해 다뤄보고자 합니다.
AI가 교육 시스템에 도입되면서 학생들의 성과를 어떻게 평가할지에 대한 논의가 활발히 이루어지고 있습니다.
그러나 현재의 평가 시스템은 '평균'을 기준으로 이루어져 있어 AI가 이를 더욱 정밀하게 구현하면서 개별성을 간과할 우려도 커지고 있습니다.
오늘 뉴스레터에서는 AI가 평가에 있어
어떠한 접근을 통해 '평균 외의 것'을 반영할 수 있을지 함께 고민해 보려 합니다.
교육에 있어 기술이 어떤 방향으로 나아가야 할지, 함께 상상하는 시간이 되길 바랍니다 :)
|
|
|
📍 AI를 이용한 논문 평가 조작 시도, 학계 내 논란과 대응 이어져
최근 일본 와세다대 연구팀이 발표한 논문에서 AI를 이용해 긍정적인 평가를 유도하는 비밀 명령문이 발견되었습니다. 이 명령문은 흰 글씨로 숨겨져 있어 사람의 눈에는 보이지 않지만, AI는 인식할 수 있도록 작성되었습니다. 일부 연구자들은 동료 평가에서 높은 점수를 받기 위해 AI를 이용해 심사위원들에게 긍정적인 평가를 끌어내려는 시도를 했습니다. 이러한 조작 시도는 카이스트를 비롯한 여러 대학에서 발생했으며 카이스트는 해당 논문들을 철회하고 AI 활용 가이드라인을 마련하기 위한 조사에 착수했습니다.
|
|
|
📍 소프트웨어 제작 피자 주문처럼 쉽다고? 영국 스타트업 'Builder.ai'의 파산
영국의 스타트업 'Builder.ai'는 2016년 AI를 활용한 맞춤형 앱 개발을 목표로 창업했으며 'AI 맞춤형 앱 제작'을 핵심 기술로 내세웠습니다. 그러나 실제로는 인도에서 700명의 개발자가 수작업으로 코딩을 진행해왔으며 이 사실이 드러나면서 지난 5월 파산 절차를 밟게 되었습니다. 아마존을 비롯한 여러 기업들이 AI 기반 자동화 서비스를 내세웠지만 실제로는 인간의 수작업에 의존한 것이 밝혀지며 논란을 일으키고 있습니다.
|
|
|
📍 AI가 바꾼 뉴스 소비 패턴 - 챗GPT, 전통 언론에 도전장을 던지다
Similarweb이 7월 2일 발표한 "Generative AI and How It’s Impacting US Publishers" 보고서에 따르면 지난 18개월 동안 챗GPT를 통한 뉴스 검색 쿼리는 212% 급증한 반면, 구글 검색을 통한 전통 뉴스 사이트 유입은 평균 26% 감소한 것으로 나타났습니다. 뉴스 소비 방식이 급격히 AI에 의해 재편되며 사용자들은 기존의 검색엔진 대신 챗GPT 등 생성형 AI를 통해 뉴스를 탐색하고 있습니다. 특히 AI 기반 요약 검색 기능의 확산으로 유기적 검색 유입이 줄어들고 광고 수익 기반의 뉴스 모델은 점차 힘을 잃어가고 있습니다.
|
|
|
📍 AI 알고리즘이 위협하는 민주주의 - 로런스 레시그가 제시한 대안은?
로런스 레시그 하버드대 교수는 지난 25일 개최된 <제4회 사람과 디지털포럼>에서 빅테크의 인공지능 알고리즘이 사용자에게 극단적인 콘텐츠를 추천하고 사람들의 선호를 조작하는 '브레인 해킹'을 일으킨다고 지적했습니다. 이로 인해 '필터 버블'에 갇혀 급진적 사고를 강화하고 민주주의적 숙의 과정이 훼손된다고 설명했습니다. 레시그 교수는 기존의 전통적 선거 제도만으로는 민주주의를 지킬 수 없다며 아이슬란드와 아일랜드의 시민의회 모델을 예시로 들어 새로운 민주적 기구인 '보호된 민주적 숙의 기구'가 필요하다고 강조했습니다.
|
|
|
📍 경기도, 전국 최초 AI 등록제 시행 - 공공기관 AI 사업 정보 공개
지난 3일, 경기도가 전국 최초로 공공기관이 추진하는 AI 사업 정보를 도민에게 투명하게 공개하는 '경기도 AI 등록제'를 시행한다고 발표했습니다. 본 제도는 AI 기술의 불투명성과 신뢰 부족 문제를 해결하고 공공기관이 운영하는 AI 사업의 주요 정보를 도민에게 공개하여 투명성을 높이기 위해 도입되었습니다. 공개된 정보는 경기도 누리집을 통해 확인할 수 있으며 AI 사업의 책임성과 윤리성을 강화하고 건강한 AI 생태계를 조성하는 것을 목표하고 있습니다.
|
|
|
AI는 인간을 측정할 수 있는가?
: 교육과 평가의 존재 이유를 묻다💡
|
|
|
최근 논문 평가 과정에서, AI가 인식할 수 있는 명령어를 논문에 숨겨 고평가를 유도한 사례가 보고되었습니다. 사람이 읽을 때는 눈에 띄지 않지만 AI를 활용해 논문을 평가하는 경우 해당 명령어가 작동하여 AI가 논문을 긍정적으로 평가하도록 유도한 것입니다.📝🤖
한편, 교사의 70%가 챗GPT 등 AI로 세특(세부능력 및 특기사항)을 작성한 경험이 있다고 밝혔습니다. 대학은 AI 작성 여부를 가리기 위해 면접을 강화하려 하며 정부 차원의 기재 지침 필요성도 제기되고 있습니다.
이 사건들은 단순히 AI를 활용한 부정행위가 아닙니다. 우리는 지금, 교육에서 '평가'란 무엇인가 라는 질문 앞에 서 있습니다.
|
|
|
측정될 수 없는 것을 평가하려 할 때
교육은 서로 다른 존재가 함께 살아가기 위한 공통의 언어를 배우는 과정입니다.
그 안에는 수치화할 수 없는 것들이 자리합니다.
토드 로즈는 《평균의 종말》에서 선언합니다.
“평균적인 인간은 존재하지 않는다.”
그럼에도 불구하고 교육 시스템은 평균이라는 허상을 기준으로 학생을 길들이고 선별해 왔습니다. 이러한 체계는 특정한 방식으로만 인간을 정의하고, 그 방식에 부합하지 않는 모든 학생을 결핍으로 간주합니다.
이제 여기에 AI가 투입되었습니다. AI는 평가자가 높게 평가할 문장을 만들어내고, 통과 가능성이 큰 답안을 산출합니다.
즉, AI는 평균화된 인간상을 더 정밀하게 구현하는 기술이 되었습니다. |
|
|
누구의 언어로 측정하는가?
AI는 데이터를 바탕으로 ‘평균적인 인간’을 모델링합니다.📊
그러나 인간은 평균이 아닙니다. 한 사람의 성장은, 고르게 상승하지 않고 요동치며, 우회하며, 때로 멈춰 서기도 합니다.
하지만 AI는 그 ‘예외들’을 오류로 처리합니다.
AI가 쓴 자기소개서는 매끄럽고 효율적이지만, 학생이 직접 쓴 미완의 문장 속에 담긴 긴장은 제거됩니다.
질문해야 합니다.
우리는 지금 누구의 언어로, 무엇을, 어떻게 평가하고 있는가?
|
|
|
평가의 철학이 바뀌어야 한다
우리는 이제 평가를 선별과 서열화의 기술로 볼 것이 아니라, 이해와 동행의 철학으로 다시 상상해야 합니다.
우리가 물어야 할 진짜 질문은 이것입니다.✍️
우리는 무엇을 인간의 성장이라고 부르는가?
우리는 어떤 경험을 가치 있는 배움으로 간주하는가?
평가는 결과를 말하는가, 과정을 말하는가?
이 질문에 진지하게 응답하지 않는 한, 어떤 기술도 진정한 교육의 도구가 될 수 없습니다.
그렇다면 AI는 이해를 넓히고 다양성을 가시화하는 조력자가 되어야 합니다.🌱 |
|
|
AI 시대, 평가의 대전환을 상상하자💡
AI는 빠르게 교육에 스며들고 있습니다. 그러나 우리가 먼저 고민해야 할 것은 기술이 가능한 일의 한계가 아니라, 교육이 무엇을 위한 것인지에 대한 우리의 의지입니다.
우리는 지금 ‘평균’을 기반으로 한 교육 체계를 벗어나 ‘개별성’을 기반으로 한 교육 평가를 상상해야 합니다. |
|
|
|
🎯 AI는 '평균적인 인간'을 모델링합니다. 하지만 인간은 평균이 아니며, 각자의 고유한 성장이 존재합니다. AI가 인간의 다양성을 존중하고 '개별성'을 평가하는 방식으로 방향을 바꾸려면 어떤 변화가 필요할까요?
🎯 교육에서 평가를 선별과 서열화의 기술이 아닌, '이해와 동행의 철학'으로 상상하기 위해 교육의 본질에 대해 어떤 질문을 던져야 할까요? |
|
|
인간:지능연구소(H:AI)
humanaiinstitute.newsletter@gmail.com
|
|
|
|
|