티스토리 뷰

인간과 AI의 대결은 늘 흥미로운 이야깃거리입니다. 2016년 알파고와 이세돌 9단의 명승부 이후 데이터 연산과 학습 능력 면에서는 인공지능이 이미 인간을 넘어섰다는 것이 정평이지만, 여전히 섣불리 판단하기 어려운 영역이 있습니다. 바로 언어 영역인데요. 단순히 숫자와 경우의 수를 계산하는 것을 넘어, 언어에는 '맥락'이 존재하기 때문입니다. 문법상 올바른 단어나 글자를 조합할 수 있다 해도, 문맥에 맞지 않으면 의미가 없죠.

인공지능 OCR(광학 문자 인식) '텍스트센스(TextSense)'의 AI는 문장 단위의 데이터를 학습하는 과정에서 스스로 문맥까지 자연스럽게 익혔습니다. 이를 통해서 기존 OCR은 잘 읽지 못하는 구김이 심하거나 오염된 문서, 인쇄 상태가 좋지 않은 문서의 글자도 맥락상 자연스럽게 추측해 낸다고 하는데요. 

'텍스트센스'의 성능을 시험하기 위해 초등학생, 중학생, 대학생까지 세 명으로 구성된 '인간 팀'이 뭉쳤습니다. 한 눈에 보기에도 읽기 쉽지 않아 보이는 흐릿하고 얼룩진 문서를 더 정확히 읽어내고 승리를 거머쥐는 것은 과연 인간과 AI 중 어느 쪽일까요? 아래 영상에서 확인해 보세요 :)

▶관련글

OCR이 사람처럼 문맥을 이해한다고요? 비결은 ‘통문장 학습법’!
다 같은 인공지능 OCR이 아니랍니다, 텍스트센스 vs 타사 OCR