최근 머신러닝, 딥러닝이 화두가 되고, 데이터 과학자의 수요가 폭발하면서 주목받는 기술이 있다. 자동화된 머신러닝이라는 뜻의 AutoML(Automated Machine Learning)이다.
AutoML 이란?
머신러닝은 데이터의 획득, 분석, 전처리, 모델에 입력할 데이터의 특징 설계, 적합한 모델 선택, 모델의 매개변수 최적화 등을 거쳐 최종 모델에 의한 예측으로 이어진다. 이러한 모든 학습 과정에서 사람이 다양한 기법을 일일이 적용해 나가며 모델의 성능을 적절히 평가하고, 최적의 성능을 내는 모델을 개발하는 데 상당한 시간이 소요된다.
자동화된 머신러닝인 AutoML은 시간 소모적이고 반복적인 머신러닝 모델 개발 작업의 상당 부분을 자동화할 수 있도록 설계된 AI 기반의 머신러닝 개발도구이다.
또한, AutoML은 머신러닝과 딥러닝 모델을 구축하는 데 있어 기술력을 갖춘 데이터 과학자란 필요조건을 제거하는 데 목적을 둔다.
AutoML의 사례
AutoML은 오픈소스 프로젝트, 상업용 소프트웨어 및 API의 형태로 상당수의 공급자가 서비스를 제공하고 있다. 일부 유명 솔루션을 소개한다.
오픈 소스
Auto-sklearnTPOTH2O AutoMLAuto-kerasPycaretCaret
상용 소프트웨어
AutoML은 비전문가도 쉽게 사용하도록 하는 것이기 때문에 대부분 간단한 방식으로 체험해 볼 수 있다. R이나 파이썬을 사용할 줄 안다면, Auto-sklearn, Caret, Pycaret 등 튜토리얼 코드를 참고할 것을 추천한다.
AutoML, 데이터 과학자를 대체할 수 있는가?
현재, AutoML의 데이터 과학자 대체에 대한 의견은 갈리고 있다. 향후 AutoML은 숙련된 데이터 과학자의 업무영역까지 대체할 수 있어, 현재 주목받고 있는 데이터 과학자에 대한 수요가 점점 줄어들 것이라는 의견이 존재한다. 대신 다양한 분야에서 전문지식을 활용해 AI 모델의 품질 향상을 도모하는 ‘AutoML 실무자’라는 직업이 대체할 것으로 보는 시각이다.
반대로 AutoML을 완전한 기술보다는 모델링 과정을 지원하는 보조적 수단으로 이해하는 시각이 존재한다. AutoML은 모델링 과정에서 다양한 조건으로 진행하는 시행착오를 대신 수행하는 도구이자 데이터 과학자와 인공지능 전문가를 대체하는 것이 아닌 일부 과정을 지원하는 자동화 도구이다.
즉, AutoML이 개발의 소모적인 부분을 담당하고 전문가는 창의적이고 생산적인 영역에 집중할 수 있게 한다는 의견이다.
빅데이터와 머신러닝, 딥러닝이 지속해서 떠오르고 있는 상황에서 AutoML이 데이터 과학자에 대한 수요에 영향을 미칠 수 있는지 귀추가 주목된다.
[저작권자ⓒ CWN(CHANGE WITH NEWS). 무단전재-재배포 금지]