▲ 이파피루스가 인공지능 특화 문서 데이터 추출 기술을 앞세워 시장 확대를 위한 전략을 밝혔다. 문의 65%가 문서 AI 기술 관련 내용..전년 대비 2배 이상 증가이파피루스가 AI 특화 문서 데이터 추출 기술을 앞세워 시장 확대를 위한 전략을 밝혔다. 이파피루스는 올해 1분기 글로벌 고객 문의 중 65%가 문서 AI 기술에 관련된 내용으로, 전년 동기 대비 2배 이상 증가했다고 발표했다. 특히 지난 연말 오픈AI의 ‘챗GPT’에 학습 및 문서 처리 서비스를 위한 PDF 기술을 공급하면서 오픈AI의 기업 고객까지 해당 기술을 사용하게 되는 등 AI 업계에서의 영향력을 한층 강화했다. 기사 전문은 아래 링크에서 확인하실 수 있습니다.https://www.hellot.net/news/article.htm..
안녕하세요, 이파피루스입니다. 오늘은 깜짝 놀랄만한 성과를 소개하려고 합니다 😊 대표적인 생성형 AI 서비스인 챗GPT를 개발한 OpenAI에 이파피루스의 미국 자회사인 아티펙스의 기술, ‘PyMuPDF(파이뮤피디에프)’가 공급되었다는 소식입니다 🎉🎉🎉 아티펙스의 PyMuPDF는 복잡한 문서 내 텍스트, 이미지, 표 등의 정보를 정확하게 추출해 주고, 최소한의 사전 처리만으로 AI를 위한 학습 데이터를 만들 수 있는 파이썬 기반 고급 전자문서 처리 라이브러리인데요, 이번에 오픈AI에 공급하게 된 PyMuPDF는 챗GPT의 학습뿐만 아니라, 서비스 과정에서 이루어지는 다양한 PDF 문서 처리에 쓰이고 있습니다. 오픈소스 커뮤니티에서는 일간 다운로드 수가 1백만 건에 달할 정도로 인정받고 있는 기술이라고 하..
일손 줄이려고 OCR 도입했다가 엉망으로 깨진 표 부분 수정하느라 시간만 낭비한 경험, 있으시나요? 새로워진 텍스트센스 2.0의 강력한 표 인식 기능을 소개합니다 :D 텍스트센스 2.0의 표 인식 기능은 인식 대상 문서 내에서 표만 자동으로 찾아 빠르게 텍스트 데이터로 추출합니다. 셀 안의 내용을 데이터로 추출할 때 표의 행과 열 순서가 그대로 반영됩니다. 병합된 셀 구조도 파악하여 원본 표 형태가 그대로 유지됩니다. 표 부분을 원본 구조와 내용 그대로 변환한 엑셀 파일을 내려받을 수 있습니다. 표 인식뿐만 아니라 일반 문서 인식 기능도, 키워드 검출 기능도 더 강력해진 TextSense 2.0 ! 아래 링크에서 그 성능을 직접 체험해 보세요 :) ▶데모 바로가기
인간과 AI의 대결은 늘 흥미로운 이야깃거리입니다. 2016년 알파고와 이세돌 9단의 명승부 이후 데이터 연산과 학습 능력 면에서는 인공지능이 이미 인간을 넘어섰다는 것이 정평이지만, 여전히 섣불리 판단하기 어려운 영역이 있습니다. 바로 언어 영역인데요. 단순히 숫자와 경우의 수를 계산하는 것을 넘어, 언어에는 '맥락'이 존재하기 때문입니다. 문법상 올바른 단어나 글자를 조합할 수 있다 해도, 문맥에 맞지 않으면 의미가 없죠. 인공지능 OCR(광학 문자 인식) '텍스트센스(TextSense)'의 AI는 문장 단위의 데이터를 학습하는 과정에서 스스로 문맥까지 자연스럽게 익혔습니다. 이를 통해서 기존 OCR은 잘 읽지 못하는 구김이 심하거나 오염된 문서, 인쇄 상태가 좋지 않은 문서의 글자도 맥락상 자연스럽..
이전 포스팅에서 문맥을 이해하는 AI OCR ‘텍스트센스(TextSense)’를 소개해 드렸습니다. 단어가 아닌 문장 단위의 데이터를 학습함으로서 문맥을 이해하고, 이를 통해 알아보기 힘든 글씨도 문맥상 자연스러운 글자로 정확하게 추출하는 제품인데요. 과연 기존 전통적 방식의 OCR에 비해서는, 그리고 시중에 나와있는 다른 인공지능 OCR에 비해서는 얼마나 더 정확할까요? 백문이 불여일견, 실제 동일한 문서 이미지로 테스트를 진행한 결과들을 소개합니다. AI를 적용하지 않은 기존 OCR 제품과 ‘텍스트센스’를 비교한 샘플입니다. 기존 방식의 OCR 제품들은 지면 이미지가 얼룩지거나 구겨져 있으면 인식률이 떨어지는 것이 일반적이었습니다. 반면 텍스트센스는 문맥상 최대한 자연스러운 글자로 인식해낸 것을 볼 ..
극장에서 외국 영화를 본다고 생각해 봅시다. 자리에 앉았는데 아뿔싸, 하필 앞에 유독 키가 큰 사람이 앉아 화면의 자막이 자꾸 가려집니다. 주인공이 운전을 하며 어디론가 전화를 거네요. “출발했어. 20분 정도면 도OOOO.” “알았어. 그럼 약속대로 거기서 OOO”. 앞사람에게 비켜달라고 하고 싶은 마음은 굴뚝같지만, 흐름상 대충 “20분 정도면 도착할 거야”, “거기서 보자구”, 정도의 대화가 오갔다고 추측할 수 있습니다. 어떻게 아냐고요? 이런 대화와 문장들은 이미 일상 생활에서도 수없이 접해 보았으니까요. 우리는 문장을 읽을 때 무의식 중에 이미 접했던 문장들과 비교합니다. 만약 문장에 빈칸이 있거나 알아보기 어려운 글자가 있다면 과거의 경험에 비추어 문맥상 자연스러운 단어나 표현으로 추측해서 읽..
- Total
- Today
- Yesterday
- 강소기업
- IOT
- 체육대회
- 스트림닥스
- 스마트공장
- 고장예측
- 페이퍼리스
- 피터팬
- pdf뷰어
- 아티펙스
- 인공지능
- 이파피루스
- 전자서명
- 데자뷰
- 예지보전
- 전자서식
- PDF-Pro
- djvu
- 이벤트
- pdf프로
- PDF변환
- 전자문서
- 피터펜
- paperless
- 모터센스
- PDFpro
- pdf프로그램
- PDF편집
- epapyrus
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |