AI 스타트업 스캐터랩이 인공지능 대화형 챗봇 '이루다' 개발에 사용된 카톡 대화 문장을 오픈소스 공유 플랫폼인 '깃허브'에 공유했다는 사실이 알려지면서 논란이 일고 있는 가운데 스캐터랩이 이 사실을 시인했다.
특히, 1700개의 카톡 문장이 15개월 간 오픈소스 플랫폼에서 공개돼 충격을 주고 있다.
스캐터랩은 13일 밤 "자체 조사 결과, 개발팀이 2019년 '깃허브'에 오픈 소스로 공개한 'KG-CVAE -인공지능 한국어 자연어처리(NLP) 연구 모델'에 내부 테스트 샘플이 포함된 사실을 확인했다"며 "문제를 발견한 즉시, 해당 깃허브 레파지토리는 비공개 처리가 됐다"고 밝혔다.
스캐터랩은 "이 연구에는 내부 테스트를 위해 샘플로 추출한 100건의 데이터와 개별 문장 환산시 1700건이 포함돼 있었다"며 "기본적으로 대화 중 실명은 '
100건의 데이터를 공유하면서 20여건의 실명은 물론 지역, 직장명 등이 포함된 것으로 확인돼 큰 논란을 불러일으켰다. 스캐터랩은 카톡 대화 내용을 기반으로 연애 상황을 분석해주는 '연애의 과학' 이용자들이 올린 카톡 데이터 100억 건을 데이터로 AI에 학습시켜 이루다를 개발했다.
스캐터랩은 "이는 한국어 자연어처리 관련 기술 개발 및 공유를 위한 것이었으나, 데이터 관리에 신중하지 못했고, 일부 민감할 수 있는 정보가 포함된 대화 패턴이 노출된 점에 대해 사과드린다"고 밝혔다.
스캐터랩은 하지만 '사내 대화방에서 수집된 대화를 직원끼리 돌려봤다'는 전 직원의 증언에 대해서는 "개인정보와 관련된 원 데이터에 접근할 수 있는 권한은 엄격하게 제한해 철저히 관리하고 있다"며 "그럼에도 회사의 방침을 위반한 불미스러운 행동이 있었다는 보도가 있었는데, 진상을 신속히 조사하고, 만에 하나 의혹이 사실로 드러나는 경우, 엄중히 책임을 물을 것"이라고 밝혔다.
회사측은 현재 진상조사위원회가 구성돼 조사를 진행하고 있으며, 스캐터랩 전 팀원이 참여하는 카카오톡 대화에서는 해당 내용이 발견되지 않았고, 다른 사내 메신저 채널인 '슬랙'에 대해 현재 계속 조사하고 있다고 설명했다.
스캐터랩은 현재 개인정보보호위원회 및 한국인터넷진흥원(KISA)에서 조사가 진행 중에 있으며 "최선을 다해 조사에 임하겠다"고 밝혔다. 개인정보위와 KISA는 지난 13일 서울 성동구 소재 스캐터랩 사무실을 방문해 관련 조사에 착수했다.
스캐터랩은 또 사과문을 통해 "이번 사안에 대해 깊은 책임감을 느끼고 있으며, 그동안 저희 서비스를 이용해 주신 이용자 여러분들께 진심으로 사과드린다"며 "이용자분들의 마음이 흡족하실 때까지 뼈를 깎는 노력을 통해 해당 사항들을 보완하도록 최선의 노력을 다할 것"이라고 밝혔다.
스캐터랩은 "외부 전문가를 포함한 상시개인정보보호체계를 구축하고, 재발 방지를 위한 강화된 보안 교육을 실시하는 등 자체적인 노력도 게을리하지 않을 것"이라며 "인공지능 산업계에 계신 기업들, 연구자분들, 파트너들 분께도 조금이라도 누를 끼치지 않기를 바라는 마음"이라고 언급했다.
하지만 이 같은 사과에도 '연애의 과학' 이용자 300여명이 오픈채팅방을 개설해 집단소송 등을 준비 중이어서 큰 파장이 예상된다. 또 청와대 국민청원에도 이루다를 통해 피해를 봤다는 이용자의 '개인정보가 유출돼 데이터를 폐기해야 한다'는 청원이 올라와 화제가 되고 있다.
Copyright ⓒ Metro. All rights reserved. (주)메트로미디어의 모든 기사 또는 컨텐츠에 대한 무단 전재ㆍ복사ㆍ배포를 금합니다.
주식회사 메트로미디어 · 서울특별시 종로구 자하문로17길 18 ㅣ Tel : 02. 721. 9800 / Fax : 02. 730. 2882
문의메일 : webmaster@metroseoul.co.kr ㅣ 대표이사 · 발행인 · 편집인 : 이장규 ㅣ 신문사업 등록번호 : 서울, 가00206
인터넷신문 등록번호 : 서울, 아02546 ㅣ 등록일 : 2013년 3월 20일 ㅣ 제호 : 메트로신문
사업자등록번호 : 242-88-00131 ISSN : 2635-9219 ㅣ 청소년 보호책임자 및 고충처리인 : 안대성