인공지능(AI)은 인간이 하는 사고나 행동의 과정을 따라 기능하도록 구현한 시스템을 말한다. 우리가 좋아할 만한 동영상을 추천해주는 유튜브 알고리즘도, 얼굴을 인식해서 잠금을 풀어주는 스마트폰도 인공지능이다. 직관적인 판단이 필요한 바둑에서 최고의 실력을 자랑한 프로 기사를 꺾어 수많은 사람에게 충격을 주었던 '알파고' 역시 인공지능이다.
하지만, 역설적이게도 인간이 할 수 없는 일을 해내는 인공지능 역시 사람이 만든 것이다. 어떻게 된 것일까? 이 질문에 대한 대답의 핵심에는 인공지능의 '학습 방법'이 있다. 그리고 놀랍게도 인공지능을 학습시키는 방법은 강아지를 학습시키는 방법과 아주 비슷하다.
강아지의 '뇌', 인공지능의 '인공신경망'
강아지를 훈련하려면 당연히 강아지가 있어야 할 것이다. 더 정확히 말하자면, 강아지의 '뇌'가 있어야 한다. 강아지의 뇌는 수많은 뉴런(뇌세포)이 그물망처럼 연결된 모양을 지닌다. 뉴런이 전기신호로 영향을 주고받는 것이 생각이 되고, 명령이 된다.
인공지능에서는 강아지의 '뇌' 역할로 '인공신경망'을 사용한다. 프로그래밍으로 여러 개의 가상의 뉴런을 만들고, 그것을 그물망처럼 연결한다. 여기서 뉴런들은 각자 직선 그래프를 간직하고 있다.
만약, 인공지능에 '앉아!'라는 데이터가 들어온다면, '앉아!'는 신경망 가장 앞에 있는 뉴런에 전달된다. 뉴런은 자신의 직선 그래프를 통해 다른 뉴런에 신호를 전달한다. 전달이 계속해서 반복되어 가장 끝에 있는 뉴런에 도달하면, '앉아!'가 신경망을 통과하며 얻은 결론을 확인할 수 있다.
강아지의 '간식', 인공지능의 '보상'
강아지에게 '앉아!'라고 훈련해보자. 아무것도 훈련되지 않은 강아지에게 손짓하며 앉으라고 해도, 강아지는 사람의 손짓을 이해하지 못한다.
하지만, 강아지가 어쩌다 엉덩이를 땅에 붙였을 때, 주인이 간식을 준다면 어떨까? 처음에는 앉는 것과 간식의 연관성을 이해하는 데 조금 헤맬 수 있다. 그러나 이러한 과정이 반복된다면, 강아지도 '아, 저 손짓, 저 말에는 엉덩이를 붙이고 앉으라는 거구나!' 알게 될 것이다.
인공지능도 마찬가지이다. 만약, 학습하지 않았다면 어떤 데이터가 들어와도 아무 결론이나 내놓을 것이다. 이때 내놓은 엉뚱한 결론과 관련, '이것은 잘못됐어'라고 피드백을 준다. 그러면, 인공지능은 조금씩 각자 자기 뉴런에 있던 직선 그래프의 기울기나 평행이동 값에 대해서 조금씩 바꾼다. 이때, 주는 피드백을 '보상'이라고 한다.
적절한 보상이 계속해서 반복된다면, 인공신경망의 뉴런이 최적의 직선 그래프를 갖게 될 것이다. 이렇게 학습된 인공신경망에 데이터를 통과시키면, '앉아!'라는 명령을 받고 앉을 수 있는 인공지능이 탄생하는 것이다.
사실 다양한 인공지능이 존재하는 만큼, 위의 예시는 인공지능의 다양한 학습 방법 중 한 가지인 강화 학습의 예시이다. 위와 같은 학습 방법이 구현됐다면, 양질의 데이터가 얼마나 많은가가 중요해진다. 이세돌 9단을 이긴 알파고 역시 인터넷 바둑 사이트에서 수천 판을 두며, 자신이 놓은 돌에 대해 끊임없이 보상을 받고 인공신경망을 학습시켰을 것이다.
우리 역시 마찬가지이다. 일단 시도해서 수많은 실패를 겪어도, 결국 그것이 더욱 나를 성장시킬 수 있는 밑거름이 될 것이다. 만약 자신이 목표만 세워놓고 우물쭈물하고 있다면, 강화 학습의 정신으로 살아보는 것이 어떨까!
[저작권자ⓒ CWN(CHANGE WITH NEWS). 무단전재-재배포 금지]