누구나 사이트에 회원가입을 하면서 '자동가입방지 문자'를 입력해본 경험이 있을 것이다. 이것을 캡차라고 일컫는다. 우리는 왜 캡차를 입력해야 할까?
캡차(Completely Automated Public Turing test to tell Computers and Humans Apart)의 의의
캡차를 해석하면 '컴퓨터와 사람을 구별해내기 위한 자동테스트'라는 뜻이다. 이처럼, 캡차는 회원가입 혹은 로그인 등 악용의 소지가 있는 행위에서 '봇'을 구별해내고 이를 막는다.
캡차 프로그램이 임의의 텍스트를 이미지로 변환 후 왜곡하여 제시하면, 사람은 그 이미지를 보고 본래의 텍스트를 맞추는 형식이다. 마치 '닮은 살걀', '도둑이 촌 쏭에 맞아' 처럼, 제시어는 엉망이지만 사람은 자연스럽게 뜻을 유추해낼 수 있는 것과 유사하다.
물론 다양한 사람을 위해 캡차의 종류도 다양하다. 대표적인 텍스트 캡차 이외에도, 오디오 캡차, 이미지 캡차, 슬라이드 캡차 등이 그 예시이다.
캡차는 대표적으로 광고성 댓글, 게시글 방지, 아이디 자동생성 방지, 계정 해킹 방지 등에 활용된다.
혹은 IP주소를 통해 중복을 가려내는 온라인 선거, 인공지능 개발 등에 활용되기도 한다.
리캡차(reCAPTCHA)
고문서 등 오래된 종이 문서들은 일부 글자가 왜곡되어 그 뜻을 파악하기 힘든 상황도 있다. 이러한 글자들을 사람들이 하나하나 판독하려면 그 노동력은 어마어마해진다. 바로 이런 어려움을 해결하기 위해 리캡차가 등장했다.
리캡차는 캡차와 비슷한 과정을 거친다. 만약 사용자가 캡차를 통과했다면, 판독이 필요한 문자를 제시하여 사용자에게 답을 받아 간다. 이 데이터들을 모아 많은 사람이 판독한 단어로 해당 텍스트를 대치한다.
캡차 프로그램을 활용하여 엄청난 노동력과 인건비를 절감시킨 효과적인 시스템이라고 할 수 있겠다.
캡차는 현재에도 잘 활용되고 있다. 그런데 이런 의문이 들 수밖에 없을 것이다. '누군가는 분명 캡차를 푸는 프로그램도 만들어내지 않았을까?'
안타깝지만 맞는 말이다. 이미 캡차를 풀어내는 프로그램들이 제법 많이 개발되었다. 덧대어, 만약 AI가 사람의 직관적인 능력을 흉내 내는 수준까지 도달한다면 캡차는 의미가 없을 것이다. 캡차를 능가하는 다음 세대의 보안 프로그램이 상용화되길 기대해본다.
[저작권자ⓒ CWN(CHANGE WITH NEWS). 무단전재-재배포 금지]