메트로人 머니 산업 IT·과학 정치&정책 생활경제 사회 에듀&JOB 기획연재 오피니언 라이프 AI영상 플러스
글로벌 메트로신문
로그인
회원가입

    머니

  • 증권
  • 은행
  • 보험
  • 카드
  • 부동산
  • 경제일반

    산업

  • 재계
  • 자동차
  • 전기전자
  • 물류항공
  • 산업일반

    IT·과학

  • 인터넷
  • 게임
  • 방송통신
  • IT·과학일반

    사회

  • 지방행정
  • 국제
  • 사회일반

    플러스

  • 한줄뉴스
  • 포토
  • 영상
  • 운세/사주
오피니언>기자수첩

[기자수첩] 제2의 '이루다' 사태 막으려면

인공지능(AI) 챗봇 '이루다' 사태는 서비스 종료로 결국 끝이 났지만, 성희롱·혐오·개인정보 유출 등 수많은 논란을 야기한 '이루다'를 개발한 스캐터랩과 김종윤 대표에 대한 비난은 아직도 이어지고 있다.

 

스캐터랩은 2019년 8월 친구와 대화를 나누듯 대화가 가능한 일상대화 AI 챗봇을 만드는 빌더인 '핑퐁 빌더'를 선보였다. 기자가 사이트에 공개된 '핑퐁'과 대화를 해보면서 처음 접한 스캐터랩의 기술은 혁신적이었다. 핑퐁이 내 대답에 아무 말도 하지 않는 장애가 가끔씩 있기는 했지만, 당시 기술력을 자랑하던 챗봇을 사용해보면 내가 묻는 말에 엉뚱한 대답을 하는 경우가 대부분이었기 때문에 성능이 더 놀라워보였다. 핑퐁은 2010년 앱으로 출시돼 해외서 더 큰 인기를 끈 감성대화 챗봇 '심심이'를 떠올리게 했다.

 

'이루다'는 핑퐁의 기술력을 진화시킨 것으로 이용자와 주고받는 세션당 대화수(CPS)가 과거 4턴에서 10턴까지 길어졌다는 점에서 AI 챗봇의 발전을 보여줬다. 다만, AI 학습 과정에서 사용한 '연예의 과학' 앱에서 수집된 카톡 데이터에 대해 이용자에게 AI 개발에 대한 제대로 된 동의를 받지 않았고, 실명·주소·계좌 등 사적 정보가 제대로 익명화되지 못해 큰 문제를 일으켰다.

 

스캐터랩은 학습에 사용된 데이터베이스(DB)를 폐기하기로 해 이루다는 역사 속으로 사라지게 된다. 하지만 스캐터랩은 대화·언어 AI에서 업계 최고 수준의 기술력을 보여줬다는 점에서, 이번 사태를 전화위복의 계기로 삼아 충분한 시간을 거쳐 AI 윤리 원칙을 제대로 적용한 새로운 '이루다'를 선보이는 것이 한국의 AI 발전 측면에서도 바람직하다.

 

이번 사태는 AI에 학습시킬 공공의 대화 데이터가 지극히 부족하다는 점에서도 원인을 찾을 수 있다. 챗봇이 성능이 나오지 않았던 이유도 데이터가 극히 부족하다는 점이었다는 것을 감안하면 정부도 '데이터 댐' 사업에 공공의 착한 대화 데이터셋을 구축하는 것을 올해의 과제로 삼아야 한다. 과기정통부는 올해 사업계획 브리핑에서 "'이루다' 문제를 해결하기 위해 편향성 없는 데이터를 더 많이 구축해야 한다"고 밝혀 기대가 모아진다.

 

또 국립국어원이 204억원을 투입해 진행한 '모두의 말뭉치' 데이터에서조차, 실명이 나오고 혐오 표현이 나온다는 문제가 제기되는 만큼, 공공의 데이터를 제대로 검수해 이 같은 표현을 배제하는 작업이 중요하다. 그렇지 않으면 잘못된 데이터를 학습한 또 다른 '이루다'가 만들어질 수 밖에 없기 때문이다.

트위터 페이스북 카카오스토리 Copyright ⓒ 메트로신문 & metroseoul.co.kr