본문 바로가기 메뉴 바로가기

(주)이파피루스 블로그

프로필사진
  • 글쓰기
  • 관리
  • 태그
  • 방명록
  • RSS

(주)이파피루스 블로그

검색하기 폼
  • 전체보기 (324)
    • 이파피루스 소식 (79)
    • 페이퍼리스 (16)
    • 언론보도 (120)
    • 구축사례 (17)
    • PyMuPDF Pro (21)
    • PDF-Pro (31)
    • LIFE (20)
  • 방명록

전체 글 (324)
PyMuPDF4LLM을 사용하여 멀티모달 LLM 애플리케이션 구축하기

PDF에서 텍스트를 추출하는 것은 많은 AI 및 LLM(대규모 언어 모델) 애플리케이션에서 매우 중요하면서도 종종 어려운 단계입니다. 고품질 텍스트 추출은 토큰화, 임베딩 생성, 벡터 데이터베이스 인덱싱과 같은 후속 프로세스를 개선하여 애플리케이션의 전반적인 성능을 향상시키는 데 중요한 역할을 합니다. PyMuPDF는 간편함, 빠른 속도, 그리고 안정적인 텍스트 추출 품질 덕분에 이 작업에 널리 사용되는 라이브러리입니다.이 블로그에서는 PyMuPDF 개발사인 Artifex에서 최근 출시한 무료 라이브러리인 PyMuPDF4LLM에 대해 살펴보겠습니다 . 이 새로운 라이브러리는 PDF에서 텍스트를 추출하는 과정을 간소화하도록 설계되었으며, 특히 LLM(텍스트 언어 관리) 및 RAG(Retrieval-Augm..

PyMuPDF Pro 2026. 4. 14. 09:50
50% 더 빨라진 OCR과 AI 답변의 '근거'를 찾는 법

안녕하세요, 이파피루스 마케팅입니다.최근 LLM(거대언어모델)을 활용한 문서 AI 구축이 기업들의 핵심 과제로 떠오르고 있습니다. 하지만 정작 AI가 읽어야 할 문서의 상태가 제각각이라 데이터 추출 단계에서 어려움을 겪는 경우가 많죠.이파피루스는 이러한 고민을 해결하기 위해, 글로벌 다운로드 수 누적 5억 8천만 건을 자랑하는 PyMuPDF Pro와 웹 기반 PDF SDK인 MuPDF Web Viewer의 대규모 업데이트를 진행했습니다. "더 빠르게, 더 정확하게, 그리고 더 믿을 수 있게" 변모한 주요 기능을 소개합니다.하이브리드 OCR : "모든 페이지를 이미지로 변환하던 시대는 끝났습니다"기존의 OCR 방식은 텍스트가 이미 포함된 디지털 PDF조차 전체를 이미지로 굽고 다시 읽어내는 비효율적인 과정..

PyMuPDF Pro 2026. 4. 9. 10:43
[현장스케치] "AI에 진심인 편" 사내 AI 해커톤 뒷이야기 🚀

안녕하세요! 이파피루스 마케팅팀입니다. 판교에 벚꽃이 만개하던 지난 4월 4일, 이파피루스 본사에서는 아주 뜨겁고 특별한 이벤트가 열렸습니다. 바로 ‘2026 이파피루스 사내 AI 해커톤 대회’**인데요! 단순히 업무의 연장이 아니라, AI 기술로 일상의 문제를 해결하고 창의적인 아이디어를 자유롭게 펼쳐 보았던 이파피루스인들의 생생한 현장을 공개합니다. --- 💻 "몰입의 즐거움, 아이디어가 현실이 되는 공간" 행사장은 시작 전부터 팽팽한 긴장감과 설렘이 가득했습니다. 이번 해커톤의 주제는 **'AI를 활용한 업무 효율화 및 서비스 혁신'**. 개발자뿐만 아니라 영업, 마케팅, 인사, 재경, 총무 등 다양한 직군의 팀원들이 섞여 머리를 맞대고 아이디어를 짜냈습니다.[현장 사진 팀원들이 회의실에 모여 각..

이파피루스 소식 2026. 4. 7. 13:56
PyMuPDF4LLM의 하이브리드 OCR

정확도는 더 높고 속도는 50% 더 빠릅니다. 실제 PDF 환경에 맞춰 설계되었습니다.PyMuPDF4LLM은 PDF 페이지의 전체 텍스트를 추출해야 할 경우에만 OCR을 적용합니다. 페이지에 이미 추출 가능한 텍스트가 충분히 포함되어 있는 경우 OCR은 완전히 건너뛰어 불필요한 작업을 방지하고 고품질 디지털 텍스트의 품질 저하 위험을 제거합니다.OCR이 필요한 경우 , PyMuPDF4LLM은 런타임 환경에서 사용 가능한 OCR 플러그인 중 가장 적합한 것을 자동으로 선택하여 감지 정확도와 처리 속도 사이의 균형을 유지합니다.내장된 OCR 플러그인은 하이브리드 OCR 전략을 구현합니다. 즉, 추출 가능하고 읽을 수 있는 텍스트가 없는 영역만 OCR 엔진으로 전달합니다. 이러한 선택적 접근 방식은 일반적으로..

PyMuPDF Pro 2026. 4. 6. 14:11
이전 1 2 3 4 ··· 81 다음
이전 다음
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
  • 이파피루스 홈페이지
  • 이파피루스 페이스북
  • 이파피루스 채용페이지
TAG
  • epapyrus
  • pdf프로
  • 아티펙스
  • PyMuPDFPro
  • 이벤트
  • 예지보전
  • pdf프로그램
  • paperless
  • 스마트공장
  • djvu
  • PDF편집
  • 문서ai
  • 인공지능
  • PDF
  • 전자문서
  • 고장예측
  • PDFpro
  • 이파피루스
  • ocr
  • 파이썬라이브러리
  • PDF변환
  • 피터펜
  • 피터팬
  • Ai
  • pdf추출
  • PDF-Pro
  • 페이퍼리스
  • 전자서식
  • pdf뷰어
  • 모터센스
more
«   2026/04   »
일 월 화 수 목 금 토
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30
글 보관함

Blog is powered by Tistory / Designed by Tistory

티스토리툴바