본문 바로가기
홍인기교육정책 칼럼

[AI 디지털 교과서 학급데이터 누가 어떻게 소유학고 관리하나?]

by 조은아빠9 2023. 6. 8.
728x90
 
 
 
오늘 장관의 브리핑 질문중 가장 중요한 부분은 아래 질문이다.
 
===============================
<기자 질문> 학습데이터 관리에 대해서 우려가 큰 것 같은데요. 어떤 가이드라인을 갖고 계신지 궁금합니다. 
 
<장관 답변> 학습데이터가 AI 기능의 핵심이죠. 그래서 AI 디지털교과서 회사가 데이터를 가지고 계속 AI 플랫폼 기능을 향상시킬 수 있도록 해줘야만 디지털교과서의 생태계가 구축될 수 있다고 생각합니다.
그렇지만 또 국가적으로 관리해야 되는 데이터 부분이 일정 부분이 있을 수가 있고요. 그래서 그런 부분들을 국가의 역할, 또 민간 기업의 역할 이런 것들을 잘, 역할의 분담을 잘 디자인해서 한편으로는 민간이 데이터를 잘 충분히 활용해서 소위 AI 교과서 플랫폼을 계속 발전시킬 수 있도록 하고, 또 한편으로는 국가가 공정성이라든가 데이터의 여러 가지, 데이터 관리에 따른 공익성을 충분히 확보하도록 하겠습니다.
 
<기자질문> 아까 디지털교과서 데이터 관련해서 질문이 나오기는 했는데요. 그러면 향후에 디지털교과서를 개발하거나 플랫폼을 더 업그레이드시키는 데에만 이 학습 데이터를 활용할 수 있는 것인지, 데이터를 각 개발사에서 상업적으로 활용을 하는 것을 기술적으로 차단하는 방법이 있는지 그 데이터 관리하는 부분에 있어서 대책에 대해서 조금 더 여쭙고 싶습니다.
 
<장관 답변> 우리가 기대하는 에듀테크 생태계의 전환되는 모습은 에듀테크 기업들이 기본적으로 B2C, 그러니까 개인의 사교육 시장에서 제품을 팔기보다는 B2B로 해서 학교에 공급하는 쪽으로 시장이 훨씬 더 커지고, 또 더 나아가서는 국가의 수출산업으로 해외에 수출하는 그런 쪽으로 해서 에듀테크 산업이 육성될 수 있다, 이렇게 생각을 합니다.
그래서 이제 그런 맥락에서 데이터를 기업들이 얼마나 효과적으로 그거를 활용할 수 있느냐는 경쟁력이 직결되기 때문에 소위 AI 에듀테크 기업의 경쟁력이 있어야 사실은 교과서도 질이 좋아지는 거거든요.
그래서 그런 부분에서 일단 우선적으로 고려가 돼야 되지만 또 여러분들이 우려하는 공익성이 있거든요, 데이터에. 그런 부분도 같이, 같은 비중을 두고 훼손... 공익성이 훼손되지 않도록 그렇게 노력해 나가겠습니다. 그래서 균형점을 찾아나갈 수 있는 방법이 있다고 생각을 하고요.
그런 부분은 지금 우리 가이드라인 때 구체화될 것입니다. 그때 가서 또 자세하게 말씀드리겠습니다.
 
<질문> 데이터가 축적이 돼야 학생이 학습을 맞춤형으로 할 수가 있는데요.
 
<답변> 맞습니다.
 
<질문> 2025년에 우선 네 과목을 처음 실시를 하게 되면 데이터가 축적이 안 된 상태인데 어떻게 학습자에 맞는 맞춤형이 가능하다 하는 건지 그림이 잘 떠오르지 않는데요. 우선, 발행사와 에듀테크 기업의 데이터를 기반으로 해서 초반에는 할 수 있다 치더라도 그 데이터는 그 제품을 사용한 학습자에 한한 데이터이지 않나, 그래서 초 3·4학년 데이터가 전체가 아니기 때문에 어떻게 보면 바이스, 그러니까 편향성이 나타날 수도 있을 텐데 그 부분에 대해서는 어떻게 고민하고 계시는지 궁금합니다.
<심민철 디지털교육기획관 답변> 말씀하신 부분 정확합니다. 왜냐하면 검정 교과서라는 것이 선택은 학교별로 선택하기 때문에 발행사별로 선택되는 그 채택률 자체가 다를 수 있고 규모가 다를 수 있습니다.
즉, 전체 학생 대비해서는 몇 퍼센티지씩 1/N 가져가는 부분이 되겠죠. 그러다 보니 각각의 발행사가 갖고 있는 과목별 AI가 학습할 수 있는 데이터는 제한된 부분들이 있기 때문에 저희들이 그런 점에서 별도로 학습 저장 데이터, 저장할 수 있는 데이터, 저장소를 만들려는 이유가 거기에 있습니다.
그래서 거기에는 각 발행사별로 채택된 아이들의 데이터들이 어느 정도 축적이 되면 그 데이터를 국가 차원에서 중앙 단위로 모아서 그 데이터들을 비식별 상태에서 모든 발행사들한테 제공해서 발행사만 선택한 아이들의 데이터만 가지고, 편향성 있는 데이터만 가지고 AI가 학습하는 게 아니라 전체 학생 데이터를 가지고 공정하게 다 AI를 학습시킬 수 있도록 그렇게 정보를 제공할 계획으로 있습니다.
 
<기자 질문> 아까 나왔던 질문에서 조금 더 추가 질문드리겠습니다. 데이터 축적되어서 발행사들에게 전국적인 데이터를 전송해서 전체적인 것을 참고할 수 있게 하겠다, 하셨는데 그렇게 되면 우리 발행사들이 전국 학생들의 교육 데이터를 갖게 되는 것 아닙니까?

<장관 답변> 비식별 자료니까요.

<기자 질문> 그렇게 됐을 때는 뭔가 발행사들이 그 정보를 다른 쪽으로 활용할 수 있는 그런 여지가 생기게 되는데 여기에 대한 보완책이 있어야 될 것 같고요.

그리고 아까 교사들의 참여를 높이기 위해서 여러 가지 방안을 강구하시겠다고 했는데 뭔가 좀 구체적인 방안을 언제까지 내놓겠다, 하는 그런 플랜이 있으신지 궁금합니다.

<장관 답변> 지금 사실 에듀테크 생태계의 조성도 앞에서 제가 말씀드렸지만 지금 에듀테크 기업들이 이제는 학교에 공급하는 상품들을 그 역할에 주력을 하고 더 나아가서는 세계 수출을 하는 식으로 해서 정말 번듯한 미래 먹거리 산업으로 커 나갈 수 있도록 하겠다는 것이고요.

우리가 걱정하는 사교육 부분은 최소화시킬 수 있다고 생각을 합니다, 여러 가지 정책적인 수단을 통해서. 그래서 그런 부분들은 아직 지금 일어나지 않은 일이기 때문에 저희들이 계속 추진하면서 그런 방향으로 계속 고민하면서 정책을 집행하겠다는 말씀을 드리고요. 그다음에...
==================================
 
사교육업체가 가장 탐내는 부분인데 이 데이터를 교과서가 채택된 사기업이 가지게 되는 부분에 대해 페친 여러분은 어떻게 생각하세요? 제 전문 분야가 아니라 도움을 청합니다.
AI 디지털 교과서 시장이 학생수 감소로 성장이 안되더라도 기업의 입장에서는 대규모의 학습데이터를 얻을 수 있다면 많은 투자를 해서 독과점이 되길 바라지 않을까 걱정입니다.
교육부는 학생들의 학급데이터를 모아서 비식별 상태에서 모든 발행사에게 제공한다고 하는데 이건 문제가 없는지 걱정입니다.
AI 디지털 교과서가 과목별로 전체를 개발하기 보다는 단원별로 쪼개서 개발해야 소자본의 기업의 진입이 쉽고 교사들도 개발에 적극적으로 참여하는 구조가 될 거 같습니다.
이럴 경우 AI 디지털 교과서 플랫폼에서 학습데이터를 여러 회사가 가지게 되는 문제도 있어 보입니다.
교과서 체제를 뛰어넘는 학습관리시스템(LMS)을 구축하자는 의견도 있는데 이 역시 학습데이터의 축척과 관리 공유가 핵심이슈입니다.
좋은 방법이 있을까요?
 
 
 
728x90