티스토리 뷰

이전 포스팅에서 문맥을 이해하는 AI OCR ‘텍스트센스(TextSense)’를 소개해 드렸습니다. 단어가 아닌 문장 단위의 데이터를 학습함으로서 문맥을 이해하고, 이를 통해 알아보기 힘든 글씨도 문맥상 자연스러운 글자로 정확하게 추출하는 제품인데요.

과연 기존 전통적 방식의 OCR에 비해서는, 그리고 시중에 나와있는 다른 인공지능 OCR에 비해서는 얼마나 더 정확할까요?

백문이 불여일견, 실제 동일한 문서 이미지로 테스트를 진행한 결과들을 소개합니다.

AI를 적용하지 않은 기존 OCR 제품과 텍스트센스를 비교한 샘플입니다. 기존 방식의 OCR 제품들은 지면 이미지가 얼룩지거나 구겨져 있으면 인식률이 떨어지는 것이 일반적이었습니다. 반면 텍스트센스는 문맥상 최대한 자연스러운 글자로 인식해낸 것을 볼 수 있습니다.

회계 RPA에서 OCR은 빼놓을 수 없습니다. 영수증 데이터를 추출해야 하기 때문이죠. 영수증은 일반적인 문서와는 레이아웃이 많이 다른데요, 이처럼 문서 형태가 복잡해질수록 글자를 인식하기도 더욱 어려워집니다. ‘텍스트센스의 경우 글자 영역을 문단 형태에 알맞게 문장 단위로 나누어 정확하게 인식합니다. 기존 OCR 방식과는 인식 정확도가 대폭 차이나는 것을 볼 수 있죠.

다른 AI OCR 제품과도 비교해 볼까요? 영수증 이상으로 복잡한 신문 지면을 가져와 봤습니다. 온갖 글꼴에 사진까지 뒤섞여 있고, 다단도 너무나 복잡해서 사람이 읽어도 한눈에 들어오지 않는 수준인데요. ‘텍스트센스의 문장 단위 인식 방식은 여기서도 빛을 발합니다. 타사 대비 두 배 이상으로 정확하게 인식해 내는 것을 확인할 수 있습니다.

표 이미지 인식은 OCR 성능을 판가름하는 중요한 포인트입니다. 중요한 데이터를 품은 많은 문서들이 표를 포함하고 있으니까요. 게다가 표 안의 글씨를 그냥 인식하는 것을 넘어 셀의 구조에 맞게 추출해내야 데이터로서 활용 가치가 있습니다. 위의 테스트 결과를 보면텍스트센스는 표 안의 글씨들을 셀 단위별로 하나하나 올바르게 인식한 것을 알 수 있습니다.

얼룩지고 구겨진 문서, 복잡한 구조의 문서도 깔끔하고 정확하게 읽어내는 텍스트센스’!

아래 링크에서 직접 체험해 보실 수 있습니다😊

데모 바로가기