모비젠, 빅데이터 품질 평가 및 보정 자동화 연구개발 추진

모비젠은 빅데이터 구축 및 인공지능 분석에 집중하고 있습니다. 빅데이터가 구축되어 인공지능이 적용되려면 해당 데이터가 일정 수준 이상의 품질과 편향성이 없는 데이터일 필요가 있습니다. 데이터 품질 관리 솔루션들이 개발되어 있지만, 수작업 개입을 요구하는 수준이 높아서 별도의 품질관리 전문 인력을 투입해야 겨우 솔루션이 활용될 수 있을 뿐입니다.

모비젠에서 추진하는 빅데이터 품질평가 및 보정 연구과제는 데이터를 입수한 직후부터 AI분석에 활용되는 단계까지 들어가는 데이터 품질 및 편향성 이슈를 해결하는 각종 수작업 개입을 최소화하여 현장에서 수집되는 데이터를 지능적으로 활용하는 사이클을 단축시킵니다.

 

과제의 산출물은 모비젠에서 수행하는 각종 빅데이터 구축 사업에 적용되어 그 유효성을 검증할 예정입니다. 

2020년 1차년도 연구 추진의 결과로, 품질 평가 및 보정을 자동화에 관련된 특허, 기존의 IRIS 솔루션에 Add-On으로 덧붙여서 쓸 수 있는 데이터 품질 평가 및 관리 툴의 개발등이 추진되었으며, 해당 결과물은 오픈소스로 공유되고 있습니다. 

 

특히, 이 연구는 인공지능에 활용되는 데이터의 공정성이나 편향성을 제거하는 방법에 대한 연구를 포함하고 있습니다. 향후 인공지능이 널리 활용될 경우, 자동화된 시스템에서 편향된 데이터를 이용한 학습 때문에 발생하는 사회적 불평등 또는 시스템 운영상의 차질 등 인공지능의 부작용을 방지하기 위한 기초 연구입니다. 

 

이 연구는 모비젠의 IRIS 빅데이터 플랫폼과 공동연구기관인 한국전자기술연구원(KETI)의 서버리스 서비스 플랫폼인 OpenFX 플랫폼이 활용되고, 그 기반 위에 중앙대학교/세종대학교에서 개발하는 각종 데이터 품질 평가 관련 프로세스들을 구축됩니다

 

그림. 빅데이터 품질평가 및 보정 연구 과제 개요

 


※ 이 과제는 과학기술 정보통신부의 연구지원을 받아서 2020년부터 2022년까지 3개년간 추진하는 과제입니다.