[매드사이언스] 천하제일넷카마대회, 튜링테스트란 무엇인가
0월 첫 연재를 시작하는 매스사이언스코너에서는 비약과 과장을 통해 어려운 개발개념에 대해 정리해보고자 한다. 먼저 많이 들었고 쉽게 접하지만 막상 알고자 하면 어려운 인공지능에 대한 잡설들로 시작을 해볼까 한다.
인공지능의 개념은 1950년대 컴퓨터의 등장과 함께 탄생했다.
1960년부터 90년까지는 철학적 합리론에 기초하며 지식 프로그래밍을 통해 지능을 구현하고자한 기호주의 인공지능 패러다임이 지배적이였다. 이후 현재까지는 연결주의 인공지능이라고 하는 데이터로부터 학습을 통한 패러다임이 지배적으로 시도되고 있다. 특히 후기의 패러다임은 최근 딥러닝을 통해 빠르게 발전하고 있다. 인공신경망을 활용한 기호주의 인공지능 모델은 해석은 쉽지만 학습난이도가 높다는 한계를 갖고 있다.

인공지능을 판단하는 기법으로 튜링테스트가 손꼽히고 있다. 튜링테스트란 기계가 얼마나 인간과 비슷하게 대화할수 있는지에 대한 기순을 세우고 이를 판별하고자 하는 실험이다.
1950년 10월 튜링은 맨체스터 대학에서 "계산기계와 지능"이라는 논문을 발표했다.
"기계가 생각할 수 있는가? 라는 질문을 고려해 볼 것을 제안한다."
라는 철학적 물음으로 시작하는 본 논문은 "이미테이션 게임"이라는 사고실험을 제안한다.

기계넷카마만이 AI 로 인정받을수 있다(출처=테크타겟)
튜링테스트의 "이미테이션게임"의 주요 내용은 다음과 같다. 여자인척 하는 오카마와 여자를 배치한뒤 둘에게 질문을 해서 평가하는 심판이 이를 판단한다. 첫번째 실험을 근거로 두번째 실험에서는 여자인간인척하는 기계와 여자를 구분해 심판이 이를 판단해 인공지능을 판별하는 테스트 기법이다. 이는 인공지능이 인간인척 할 뿐만 아니라 성적 역할까지 모방할수 있는 지성인지 확인할수 있다는 사고실험이다.


물론 위와같은 튜링테스트는 만들어진지 60년이 넘어가는 아주 오래된 개념이므로 테스트의 유효성에 대해서 수많은 반박이 있어왔다.
1980년 철학자 존 설은 자신이 발표한 논문"마음, 두뇌 및 프로그램"을 통해 튜링테스트는 기계가 지능을 가졌는지 판단할 수 없다고 주장했다. 존 설은 이를 뒷받침 하기 위해 "중국어 방 논증"을 제시했다.
방 안에 중국어를 전혀 모르는 기호학자가 들어가고 중국어로 된 질문이 들어갔을때 중국어 질문을 언어학적이 아닌 기호와 규칙으로 된 방대한 자료를 통해 답변하였고 이를 심판에게 전달 했을때 심판에게 만족스러운 답변을 방안의 기호학자가 했다면 방 안에 있는 사람은 중국어를 할 줄 아는것으로 판단하려는 견해가 있다는 내용이다.
이런저런 논란이 있었지만 튜링테스트는 현재까지도 인공지능을 실험하는 방법으로 쓰이고 있다. 1991년 첫 시상을 시작으로 매년 개최하는 뢰브너 상(Loebner Prize)은 튜링테스트에서 착안한 대회로 인간과 비슷하게 대화하는 챗봇을 대상으로 판단을 하는 대회다. 우승자에게는 Most Human Computer 상을 준다.
인지능력과 성 역할 모두를 수행하려는 AI의 대결은 현재진행형이라는 것이다. 지난 2019년 새로운 경연이 펼쳐졌는데 일본의 지능형 챗봇 미츠쿠(Mitsuku)가 우승하였습니다. 미츠쿠는 올해까지 총 5번 수상을 할 정도로 상당한 수준의 챗봇이다. 다만뢰브너상은 구글, 페이스북, 아마존 같은 글로벌 기업들이 참여를 하지 않아서 권위가 많이 떨어지는 편이다.
튜링테스트를 통과하기 위한 AI들의 각축전은 2020년에도 현재진행형으로 보인다.