ePapyrus는 법률, 금융, 의료, 공공, 물류 등 다양한 산업 군에서 연간 수백만 건의 문서를 처리하는 고객들과 함께 일하고 있습니다. 그런데 여러분, 이 정도 대규모 스케일의 조직에서 모든 페이지를 아무 생각 없이 OCR 엔진이나 LLM(대형 언어 모델)으로 그냥 밀어 넣으면 어떻게 될까요? 당연히 시간과 비용 면에서 비효율적일 수밖에 없습니다.그렇기 때문에 문서를 먼저 영리하게 분류하고 걸러내는 '사전 필터링' 작업이 반드시 필요합니다."이 페이지는 스캔한 이미지일까, 아니면 디지털 텍스트일까?""단순 서식 양식일까, 표가 빽빽한 보고서일까, 아니면 그냥 평범한 줄글일까?""애초에 비용을 써가며 처리할 만한 가치가 있는 페이지인가?""이 페이지에서 콘텐츠를 가장 효율적으로 뽑아내는 방법은 뭘까?..
수만 건의 계약서를 분석해 핵심 날짜, 이름, 의무 조항을 깔끔한 스프레드시트로 정리해 줄 팀을 고용했다고 상상해 보겠습니다.그런데 그 결과물이 맞는지 확인할 방법이 전혀 없다면 어떨까요? 무작위로 샘플을 뽑아볼 수도 없고, 원본과 대조할 수도 없습니다. 그저 출력 결과를 믿고, 시스템에 입력하고, 다음 단계로 넘어갈 뿐입니다.오늘날 대부분의 기업이 문서 추출에 AI를 도입하는 방식이 바로 이렇습니다. 이는 생각보다 심각한 문제가 되고 있죠.이 모든 것을 바꿔줄 개념이 바로 그라운딩(Grounding) 입니다.그라운딩이란?그라운딩이란 출력 결과를 원본 근거에 연결하는 것입니다. 즉, 추출된 모든 정보가 원본 문서의 검증 가능한 위치로 추적될 수 있도록 보장하는 것입니다.문서 데이터 추출에서 그라운딩은 모..
안녕하세요! 이파피루스 마케팅팀입니다.황금 같은 연휴를 앞둔 5월 23일, 이파피루스가 22번째 생일을 축하하는 자리를 가졌습니다 🎂결코 짧지 않은 22년이라는 시간, 함께해온 이파피루스 임직원분들과 특별한 자리를 마련했는데요. 오늘은 그 따뜻한 현장을 살짝 공개해 보려 합니다. 🍴 평소와는 다른 특별한 자리로!이번 창립기념행사는 호텔 레스토랑에서 진행되었습니다. 평소와는 조금 다른 분위기에 다들 들뜬 마음으로 모이셨다는 후문입니다 😄 일상의 공간을 벗어나 근사한 곳에서 함께하니, 그것만으로도 이미 기념일 느낌이 물씬 났습니다. 📺 미국에서도 함께해주신 대표님이번 행사의 특별한 포인트! 현재 미국에 계신 대표님께서 영상으로 함께해주셨습니다. 짧고 굵은(?) 덕담과 함께 22년의 여정을 되돌아보..
안녕하세요, 이파피루스 마케팅입니다.최근 LLM(거대언어모델)을 활용한 문서 AI 구축이 기업들의 핵심 과제로 떠오르고 있습니다. 하지만 정작 AI가 읽어야 할 문서의 상태가 제각각이라 데이터 추출 단계에서 어려움을 겪는 경우가 많죠.이파피루스는 이러한 고민을 해결하기 위해, 글로벌 다운로드 수 누적 5억 8천만 건을 자랑하는 PyMuPDF Pro와 웹 기반 PDF SDK인 MuPDF Web Viewer의 대규모 업데이트를 진행했습니다. "더 빠르게, 더 정확하게, 그리고 더 믿을 수 있게" 변모한 주요 기능을 소개합니다.하이브리드 OCR : "모든 페이지를 이미지로 변환하던 시대는 끝났습니다"기존의 OCR 방식은 텍스트가 이미 포함된 디지털 PDF조차 전체를 이미지로 굽고 다시 읽어내는 비효율적인 과정..
- Total
- Today
- Yesterday
- 파이썬라이브러리
- 이벤트
- ocr
- PDF-Pro
- 스마트공장
- paperless
- 피터펜
- 예지보전
- pdf추출
- 모터센스
- PDFpro
- 이파피루스
- LLM
- PDF변환
- 페이퍼리스
- 전자서식
- pdf프로
- 고장예측
- 인공지능
- PyMuPDFPro
- Ai
- 피터팬
- 전자문서
- djvu
- PDF편집
- epapyrus
- pdf뷰어
- pdf프로그램
- 문서ai
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | |
| 7 | 8 | 9 | 10 | 11 | 12 | 13 |
| 14 | 15 | 16 | 17 | 18 | 19 | 20 |
| 21 | 22 | 23 | 24 | 25 | 26 | 27 |
| 28 | 29 | 30 |
