메트로人 머니 산업 IT·과학 정치&정책 생활경제 사회 에듀&JOB 기획연재 오피니언 라이프 AI영상 플러스
글로벌 메트로신문
로그인
회원가입

    머니

  • 증권
  • 은행
  • 보험
  • 카드
  • 부동산
  • 경제일반

    산업

  • 재계
  • 자동차
  • 전기전자
  • 물류항공
  • 산업일반

    IT·과학

  • 인터넷
  • 게임
  • 방송통신
  • IT·과학일반

    사회

  • 지방행정
  • 국제
  • 사회일반

    플러스

  • 한줄뉴스
  • 포토
  • 영상
  • 운세/사주
IT/과학>IT/인터넷

스캐터랩, '이루다' 개발 사용된 1700개 카톡 문장 15개월 간 오픈소스 플랫폼서 공유

스캐터랩의 AI 챗봇 '이루다' /이루다 페이스북

AI 스타트업 스캐터랩이 인공지능 대화형 챗봇 '이루다' 개발에 사용된 카톡 대화 문장을 오픈소스 공유 플랫폼인 '깃허브'에 공유했다는 사실이 알려지면서 논란이 일고 있는 가운데 스캐터랩이 이 사실을 시인했다.

 

특히, 1700개의 카톡 문장이 15개월 간 오픈소스 플랫폼에서 공개돼 충격을 주고 있다.

 

스캐터랩은 13일 밤 "자체 조사 결과, 개발팀이 2019년 '깃허브'에 오픈 소스로 공개한 'KG-CVAE -인공지능 한국어 자연어처리(NLP) 연구 모델'에 내부 테스트 샘플이 포함된 사실을 확인했다"며 "문제를 발견한 즉시, 해당 깃허브 레파지토리는 비공개 처리가 됐다"고 밝혔다.

 

스캐터랩은 "이 연구에는 내부 테스트를 위해 샘플로 추출한 100건의 데이터와 개별 문장 환산시 1700건이 포함돼 있었다"며 "기본적으로 대화 중 실명은 ' ', 숫자는 ' '으로 자동화 비식별 처리를 했으나 기계적인 필터링 과정에서 미처 걸러지지 못한 부분이 일부 존재했음을 확인했다"고 설명했다.

 

100건의 데이터를 공유하면서 20여건의 실명은 물론 지역, 직장명 등이 포함된 것으로 확인돼 큰 논란을 불러일으켰다. 스캐터랩은 카톡 대화 내용을 기반으로 연애 상황을 분석해주는 '연애의 과학' 이용자들이 올린 카톡 데이터 100억 건을 데이터로 AI에 학습시켜 이루다를 개발했다.

 

스캐터랩은 "이는 한국어 자연어처리 관련 기술 개발 및 공유를 위한 것이었으나, 데이터 관리에 신중하지 못했고, 일부 민감할 수 있는 정보가 포함된 대화 패턴이 노출된 점에 대해 사과드린다"고 밝혔다.

 

스캐터랩은 하지만 '사내 대화방에서 수집된 대화를 직원끼리 돌려봤다'는 전 직원의 증언에 대해서는 "개인정보와 관련된 원 데이터에 접근할 수 있는 권한은 엄격하게 제한해 철저히 관리하고 있다"며 "그럼에도 회사의 방침을 위반한 불미스러운 행동이 있었다는 보도가 있었는데, 진상을 신속히 조사하고, 만에 하나 의혹이 사실로 드러나는 경우, 엄중히 책임을 물을 것"이라고 밝혔다.

 

회사측은 현재 진상조사위원회가 구성돼 조사를 진행하고 있으며, 스캐터랩 전 팀원이 참여하는 카카오톡 대화에서는 해당 내용이 발견되지 않았고, 다른 사내 메신저 채널인 '슬랙'에 대해 현재 계속 조사하고 있다고 설명했다.

 

스캐터랩은 현재 개인정보보호위원회 및 한국인터넷진흥원(KISA)에서 조사가 진행 중에 있으며 "최선을 다해 조사에 임하겠다"고 밝혔다. 개인정보위와 KISA는 지난 13일 서울 성동구 소재 스캐터랩 사무실을 방문해 관련 조사에 착수했다.

 

스캐터랩은 또 사과문을 통해 "이번 사안에 대해 깊은 책임감을 느끼고 있으며, 그동안 저희 서비스를 이용해 주신 이용자 여러분들께 진심으로 사과드린다"며 "이용자분들의 마음이 흡족하실 때까지 뼈를 깎는 노력을 통해 해당 사항들을 보완하도록 최선의 노력을 다할 것"이라고 밝혔다.

 

스캐터랩은 "외부 전문가를 포함한 상시개인정보보호체계를 구축하고, 재발 방지를 위한 강화된 보안 교육을 실시하는 등 자체적인 노력도 게을리하지 않을 것"이라며 "인공지능 산업계에 계신 기업들, 연구자분들, 파트너들 분께도 조금이라도 누를 끼치지 않기를 바라는 마음"이라고 언급했다.

 

하지만 이 같은 사과에도 '연애의 과학' 이용자 300여명이 오픈채팅방을 개설해 집단소송 등을 준비 중이어서 큰 파장이 예상된다. 또 청와대 국민청원에도 이루다를 통해 피해를 봤다는 이용자의 '개인정보가 유출돼 데이터를 폐기해야 한다'는 청원이 올라와 화제가 되고 있다.

트위터 페이스북 카카오스토리 Copyright ⓒ 메트로신문 & metroseoul.co.kr