정부가 인공지능(AI) 학습용 데이터를 구축하는 '데이터 댐' 사업에만 올해 추경으로 5000억원 규모 투자에 나서면서, 데이터 라벨링을 자동화하는 '데이터 오토라벨링' 기술이 급부상하고 있다.
18일 관련업계에 따르면 에이아이스튜디오·슈퍼브에이아이·에이모·디에스랩글로벌 등 데이터 및 AI 기업들은 AI에 학습을 시킬 수 있는 형태로 데이터를 가공해주는 데이터 라벨링 과정을 자동화하는 오토 라벨링 기술을 속속 선보이고 있다.
이 같은 사업은 정부의 대규모 투자와 맞물려 오토라벨링 수요가 크게 증가할 것으로 전망된다.
데이터 라벨링은 AI 학습용 데이터를 위해 사람이 사물의 테두리에 일일이 점을 찍어 어떤 사물인지 이름을 붙이는 작업을 말한다. '현대판 인형 눈알 붙이기'로 불릴 정도로 손이 많이 가고 수고스러운 작업으로 많은 시간이 소요된다. 이를 오토 라벨링 솔루션을 활용해 자동화함으로써 최대 10배까지 작업 속도를 늘릴 수 있게 된다.
에이아이스튜디오는 지난 8월 크라우드소싱 플랫폼 '마이크라우드'를 론칭했는데, 오토 라벨링의 일종으로 자체 개발한 오토 세그멘테이션(자동분할) 기능의 '매직핀' 솔루션을 도입했다. 이 솔루션은 사진, 영상 등 비정형 데이터의 배경과 오브젝트(사물)를 구분하는 어노테이션 작업을 자동으로 진행해 사람이 수동으로 할 때와 비교해 10배 이상 빠른 작업 속도로 시간을 크게 절약할 수 있다.
회사측은 보편적인 오토세그멘테이션 기능은 선처리할 오브젝트에 대해 미리 학습해 학습된 오브젝트에서만 선처리 가능해, 학습되지 않은 오브젝트는 선처리가 불가능한 단점이 있었고, 해외에서는 이미징 프로세싱 기법으로 외곽선을 추출하는 방식도 있지만, 정확도가 떨어져 실제 작업에 사용하기 힘든 문제가 있었다고 설명했다.
에이아이스튜디오 관계자는 "매직핀 기능은 오브젝트의 외곽선을 추출하는 방식으로, 딥러닝 기술로 배경과 오브젝트를 구분한다"며 "학습하지 않은 오브젝트도 선처리가 가능하며, 이미지 프로세싱과 달리 실제 작업에도 사용할 수 있는 것이 장점"이라고 설명했다.
슈퍼브에이아이도 지난 8월부터 B2B(기업간) SaaS(서비스형 소프트웨어) 서비스인 '스위트'를 통해 오토라벨링 기술을 제공하고 있다.
스위트는 데이터 프로세스의 전 처리 과정을 수행하는 올인원 플랫폼으로, 오토라벨링은 전체 데이터에 대해 자동으로 라벨링 작업을 진행하는 단계에서 최대 약 6배의 생산성을 향상시킬 수 있다.
또 기존에는 데이터 가공 결과물 전체에 대한 사람의 검수 작업이 필요했지만, 특허 기술이 적용된 오토라벨링은 작업별 난이도를 산출하고, 사람의 검수가 필요한 작업이 무엇인지 스스로 판단해 작업량을 줄여준다.
특히, 검수 후 수정된 라벨링 결과값은 오토라벨링의 성능을 향상시키는 학습용 데이터로 활용돼, 추후 작업 시 더 정교하고 빠른 작업이 가능해지고 이 작업이 반복되면 AI가 사전에 학습하지 못한 물체에 대해서도 데이터 라벨링을 지원할 수 있게 된다.
슈퍼브에이아이는 지난 8월 '이미지 분석 및 오토라벨링 디바이스 활용에 사용 가능한 딥러닝 네트워크를 훈련시키는 학습용 데이터를 생성하는 방법' 등 오토라벨링 기술 5개의 특허를 미국에서 출원 완료했다.
AI 데이터 라벨링 협업 플랫폼인 '에이모 엔터프라이즈'를 운영하는 에이모는 지난해부터 AI 학습데이터 가공에 오토라벨링 기술인 'AI 어시스트'를 활용하고 있다.
AI 어시스트는 시간당 자율주행 2D 객체 인식 데이터 대상 탐지를 7200장까지 진행할 수 있으며, 자율주행 공간 의미 인식 시맨틱 분할 1만8000장을 가공할 수 있도록 지원한다. 또 3D 객체 인식 라이다 3D 큐보이드(Cuboid) 1만8000개 프레임과 OCR(광학식문자인식) 텍스트 영역 자동 인식 A4 2만8800장 가공을 도와주는 데, 에이모는 이 같은 오토 라벨링 기술을 더욱 고도화할 계획이다.
AI 자동화 솔루션 기업인 디에스랩글로벌은 최근 코딩 없이 클릭만으로 딥러닝 기반 AI를 개발하고 배포할 수 있는 개발 툴인 '클릭 AI' 서비스를 시작했으며 이 서비스에 데이터 오토 라벨링 기능을 도입했다.
'클릭AI'에 적용된 오토 라벨링 기술은 액티브 러닝이 접목된 라벨링 툴로, 일부 데이터를 학습해 만들어진 물체 인식 AI로 나머지 데이터를 라벨링할 수 있도록 하는 자동 라벨링 기법이다.
또 다양한 채널의 DB(데이터베이스) 데이터를 연동하는 기능을 제공해 '데이터 불러오기'를 통해 외부 DB나 오프라인 데이터를 가져올 수 있으며, 데이터 전처리까지 지원해 데이터 분석을 위한 준비 작업을 제공한다.
Copyright ⓒ Metro. All rights reserved. (주)메트로미디어의 모든 기사 또는 컨텐츠에 대한 무단 전재ㆍ복사ㆍ배포를 금합니다.
주식회사 메트로미디어 · 서울특별시 종로구 자하문로17길 18 ㅣ Tel : 02. 721. 9800 / Fax : 02. 730. 2882
문의메일 : webmaster@metroseoul.co.kr ㅣ 대표이사 · 발행인 · 편집인 : 이장규 ㅣ 신문사업 등록번호 : 서울, 가00206
인터넷신문 등록번호 : 서울, 아02546 ㅣ 등록일 : 2013년 3월 20일 ㅣ 제호 : 메트로신문
사업자등록번호 : 242-88-00131 ISSN : 2635-9219 ㅣ 청소년 보호책임자 및 고충처리인 : 안대성