메트로人 머니 산업 IT·과학 정치&정책 생활경제 사회 에듀&JOB 기획연재 오피니언 라이프 AI영상 플러스
글로벌 메트로신문
로그인
회원가입

    머니

  • 증권
  • 은행
  • 보험
  • 카드
  • 부동산
  • 경제일반

    산업

  • 재계
  • 자동차
  • 전기전자
  • 물류항공
  • 산업일반

    IT·과학

  • 인터넷
  • 게임
  • 방송통신
  • IT·과학일반

    사회

  • 지방행정
  • 국제
  • 사회일반

    플러스

  • 한줄뉴스
  • 포토
  • 영상
  • 운세/사주
IT/과학>IT/인터넷

'데이터 오토 라벨링' 기술 급부상...정부 올해 데이터 구축 수천억 투자 맞물려 호응

에이아이스튜디오 '마이크라우드' 플랫폼의 '매직핀' 활용 사례. /에이아이스튜디오

정부가 인공지능(AI) 학습용 데이터를 구축하는 '데이터 댐' 사업에만 올해 추경으로 5000억원 규모 투자에 나서면서, 데이터 라벨링을 자동화하는 '데이터 오토라벨링' 기술이 급부상하고 있다.

 

18일 관련업계에 따르면 에이아이스튜디오·슈퍼브에이아이·에이모·디에스랩글로벌 등 데이터 및 AI 기업들은 AI에 학습을 시킬 수 있는 형태로 데이터를 가공해주는 데이터 라벨링 과정을 자동화하는 오토 라벨링 기술을 속속 선보이고 있다.

 

이 같은 사업은 정부의 대규모 투자와 맞물려 오토라벨링 수요가 크게 증가할 것으로 전망된다.

 

데이터 라벨링은 AI 학습용 데이터를 위해 사람이 사물의 테두리에 일일이 점을 찍어 어떤 사물인지 이름을 붙이는 작업을 말한다. '현대판 인형 눈알 붙이기'로 불릴 정도로 손이 많이 가고 수고스러운 작업으로 많은 시간이 소요된다. 이를 오토 라벨링 솔루션을 활용해 자동화함으로써 최대 10배까지 작업 속도를 늘릴 수 있게 된다.

 

에이아이스튜디오는 지난 8월 크라우드소싱 플랫폼 '마이크라우드'를 론칭했는데, 오토 라벨링의 일종으로 자체 개발한 오토 세그멘테이션(자동분할) 기능의 '매직핀' 솔루션을 도입했다. 이 솔루션은 사진, 영상 등 비정형 데이터의 배경과 오브젝트(사물)를 구분하는 어노테이션 작업을 자동으로 진행해 사람이 수동으로 할 때와 비교해 10배 이상 빠른 작업 속도로 시간을 크게 절약할 수 있다.

 

회사측은 보편적인 오토세그멘테이션 기능은 선처리할 오브젝트에 대해 미리 학습해 학습된 오브젝트에서만 선처리 가능해, 학습되지 않은 오브젝트는 선처리가 불가능한 단점이 있었고, 해외에서는 이미징 프로세싱 기법으로 외곽선을 추출하는 방식도 있지만, 정확도가 떨어져 실제 작업에 사용하기 힘든 문제가 있었다고 설명했다.

 

에이아이스튜디오 관계자는 "매직핀 기능은 오브젝트의 외곽선을 추출하는 방식으로, 딥러닝 기술로 배경과 오브젝트를 구분한다"며 "학습하지 않은 오브젝트도 선처리가 가능하며, 이미지 프로세싱과 달리 실제 작업에도 사용할 수 있는 것이 장점"이라고 설명했다.

 

슈퍼브에이아이 '스위트 1.0' 서비스에서 제공하고 있는 오토라벨링 기능. /슈퍼브에이아이

슈퍼브에이아이도 지난 8월부터 B2B(기업간) SaaS(서비스형 소프트웨어) 서비스인 '스위트'를 통해 오토라벨링 기술을 제공하고 있다.

 

스위트는 데이터 프로세스의 전 처리 과정을 수행하는 올인원 플랫폼으로, 오토라벨링은 전체 데이터에 대해 자동으로 라벨링 작업을 진행하는 단계에서 최대 약 6배의 생산성을 향상시킬 수 있다.

 

또 기존에는 데이터 가공 결과물 전체에 대한 사람의 검수 작업이 필요했지만, 특허 기술이 적용된 오토라벨링은 작업별 난이도를 산출하고, 사람의 검수가 필요한 작업이 무엇인지 스스로 판단해 작업량을 줄여준다.

 

특히, 검수 후 수정된 라벨링 결과값은 오토라벨링의 성능을 향상시키는 학습용 데이터로 활용돼, 추후 작업 시 더 정교하고 빠른 작업이 가능해지고 이 작업이 반복되면 AI가 사전에 학습하지 못한 물체에 대해서도 데이터 라벨링을 지원할 수 있게 된다.

 

슈퍼브에이아이는 지난 8월 '이미지 분석 및 오토라벨링 디바이스 활용에 사용 가능한 딥러닝 네트워크를 훈련시키는 학습용 데이터를 생성하는 방법' 등 오토라벨링 기술 5개의 특허를 미국에서 출원 완료했다.

 

AI 데이터 라벨링 협업 플랫폼인 '에이모 엔터프라이즈'를 운영하는 에이모는 지난해부터 AI 학습데이터 가공에 오토라벨링 기술인 'AI 어시스트'를 활용하고 있다.

 

AI 어시스트는 시간당 자율주행 2D 객체 인식 데이터 대상 탐지를 7200장까지 진행할 수 있으며, 자율주행 공간 의미 인식 시맨틱 분할 1만8000장을 가공할 수 있도록 지원한다. 또 3D 객체 인식 라이다 3D 큐보이드(Cuboid) 1만8000개 프레임과 OCR(광학식문자인식) 텍스트 영역 자동 인식 A4 2만8800장 가공을 도와주는 데, 에이모는 이 같은 오토 라벨링 기술을 더욱 고도화할 계획이다.

 

AI 자동화 솔루션 기업인 디에스랩글로벌은 최근 코딩 없이 클릭만으로 딥러닝 기반 AI를 개발하고 배포할 수 있는 개발 툴인 '클릭 AI' 서비스를 시작했으며 이 서비스에 데이터 오토 라벨링 기능을 도입했다.

 

'클릭AI'에 적용된 오토 라벨링 기술은 액티브 러닝이 접목된 라벨링 툴로, 일부 데이터를 학습해 만들어진 물체 인식 AI로 나머지 데이터를 라벨링할 수 있도록 하는 자동 라벨링 기법이다.

 

또 다양한 채널의 DB(데이터베이스) 데이터를 연동하는 기능을 제공해 '데이터 불러오기'를 통해 외부 DB나 오프라인 데이터를 가져올 수 있으며, 데이터 전처리까지 지원해 데이터 분석을 위한 준비 작업을 제공한다.

트위터 페이스북 카카오스토리 Copyright ⓒ 메트로신문 & metroseoul.co.kr