티스토리 뷰

<게티이미지뱅크>

OCR은 사람이 쓰거나 기계로 인쇄한 문자 영상을 이미지 스캐너로 획득해 기계가 읽을 수 있는 문자로 변환하는 기술이다. 당초 사람이 직접 입력하는 것과 비교해 정확도가 떨어진다는 지적이 있었으나 AI 기술에 힘입어 정확도가 높아졌다.

문의와 도입 사례가 잇따르고 있다. 이파피루스는 지난 6월 출시한 AI OCR 솔루션 '텍스트센스'에 대한 도입 문의가 쇄도하고 있다. '텍스트센스'는 딥러닝 기반 AI 기술을 적용해 대용량 문서 이미지를 해석하는 솔루션이다. 사람이 손으로 썼거나 인쇄한 이미지를 스캔해 문자 데이터로 변환한다. 핵심어 검출 기능을 통해 필요한 정보만 추출할 수 있다. 지속 학습을 통해 쓸수록 문자 인식 정확도가 향상된다. 한국어, 영어, 숫자, 특수기호를 지원하며 이미지 보정, 굴곡 보정, 문서 방향 보정, 문서 영역 자동 추출 등 문서 전처리 과정을 거쳐 문서를 자동으로 분류한다.

이파피루스 관계자는 "출시 이래 '텍스트센스'에 대한 문의와 도입이 꾸준히 늘고 있다"면서 "한 건설사에서는 기존에 보유한 공문과 거래처 코드 등에 '텍스트센스'를 적용, 데이터 추출과 통합 검색, 데이터 자동 입력에 활용하고 있다"고 말했다.

기사 전문은 아래 링크에서 확인하실 수 있습니다.

www.etnews.com/20200903000067

 

출입명부 전산화도 '일사천리'…AI 광학문자판독(OCR) 기술 관심↑

인공지능(AI) 기반 광학문자판독(OCR) 기술이 전자문서 핵심 기술로 부상했다. 명함 등 인쇄물부터 출입명부 같은 수기 문서까지 전산화를 지원, 사회적 비용을 줄인다. 3일 업계에 따르면 AI OCR 솔

www.etnews.com