본문 바로가기 메뉴 바로가기

(주)이파피루스 블로그

프로필사진
  • 글쓰기
  • 관리
  • 태그
  • 방명록
  • RSS

(주)이파피루스 블로그

검색하기 폼
  • 전체보기 (324)
    • 이파피루스 소식 (79)
    • 페이퍼리스 (16)
    • 언론보도 (120)
    • 구축사례 (17)
    • PyMuPDF Pro (21)
    • PDF-Pro (31)
    • LIFE (20)
  • 방명록

pymupdf (4)
PyMuPDF4LLM을 사용하여 멀티모달 LLM 애플리케이션 구축하기

PDF에서 텍스트를 추출하는 것은 많은 AI 및 LLM(대규모 언어 모델) 애플리케이션에서 매우 중요하면서도 종종 어려운 단계입니다. 고품질 텍스트 추출은 토큰화, 임베딩 생성, 벡터 데이터베이스 인덱싱과 같은 후속 프로세스를 개선하여 애플리케이션의 전반적인 성능을 향상시키는 데 중요한 역할을 합니다. PyMuPDF는 간편함, 빠른 속도, 그리고 안정적인 텍스트 추출 품질 덕분에 이 작업에 널리 사용되는 라이브러리입니다.이 블로그에서는 PyMuPDF 개발사인 Artifex에서 최근 출시한 무료 라이브러리인 PyMuPDF4LLM에 대해 살펴보겠습니다 . 이 새로운 라이브러리는 PDF에서 텍스트를 추출하는 과정을 간소화하도록 설계되었으며, 특히 LLM(텍스트 언어 관리) 및 RAG(Retrieval-Augm..

PyMuPDF Pro 2026. 4. 14. 09:50
PyMuPDF4LLM의 하이브리드 OCR

정확도는 더 높고 속도는 50% 더 빠릅니다. 실제 PDF 환경에 맞춰 설계되었습니다.PyMuPDF4LLM은 PDF 페이지의 전체 텍스트를 추출해야 할 경우에만 OCR을 적용합니다. 페이지에 이미 추출 가능한 텍스트가 충분히 포함되어 있는 경우 OCR은 완전히 건너뛰어 불필요한 작업을 방지하고 고품질 디지털 텍스트의 품질 저하 위험을 제거합니다.OCR이 필요한 경우 , PyMuPDF4LLM은 런타임 환경에서 사용 가능한 OCR 플러그인 중 가장 적합한 것을 자동으로 선택하여 감지 정확도와 처리 속도 사이의 균형을 유지합니다.내장된 OCR 플러그인은 하이브리드 OCR 전략을 구현합니다. 즉, 추출 가능하고 읽을 수 있는 텍스트가 없는 영역만 OCR 엔진으로 전달합니다. 이러한 선택적 접근 방식은 일반적으로..

PyMuPDF Pro 2026. 4. 6. 14:11
Python PDF 라이브러리: 개발자 최다 사용 사례 10가지를 공유드려요🫡

아래의 포스팅은 이파피루스 미국 자회사인 아티펙스의 시니어 매니저 'Jamie Lemon'이 일본 개발자 커뮤니티인 Qiita에 업로드한 내용을 바탕으로 작성했습니다. 원문을 확인하고 싶으신 분들은 아래 url을 확인해주세요:)https://qiita.com/jamie-lemon/items/344d7098cc586f88d835 개발자가 자주 쓰는 Python PDF 라이브러리의 상위 10가지 사용 사례Python은 PDF 워크플로우 자동화에서 핵심 언어로 자리 잡고 있습니다. 단순한 추출부터 복잡한 문서 조작까지, 개발자들은 PyMuPDF 같은 라이브러리를 통해 비즈니스 프로세스부터 학술 연구까지 다양한 분야를 효율화하고 있습니다. 이 글에서는 개발자들이 자주 찾는 PDF 관련 작업 10가지를 정리하며,..

구축사례 2025. 7. 10. 10:29
[챗GPT 활용사례] 2023 DevDay 오픈AI 기조발표에서 찾아보는 이파피루스 PyMuPDF 기술!

안녕하세요, 이파피루스입니다.저번 포스팅에서 자회사 아티펙스의 PyMuPDF 기술이 챗GPT에 사용되고 있다고 소개해 드렸었는데요!저번 포스팅 보러가기 > 이번 포스팅에서는 오픈 AI의 데브데이(DevDay) 키노트연설에 나타난 구체적인 사례를 가져와 봤습니다 😊2023년 11월6일 샌프란시스코에서는 첫번째 개발자 컨퍼런스인 OpenAI DevDay가 있었습니다.샘 알트먼이 새로운 GPT-4 Turbor의 신 기능을 설명하고 중간에 OpenAI Developer Experience 부서의 책임자인 로만이 나와 어시스턴트 API에 대해 소개하였는데요,이때 소개된 내용을 통해 PyMuPDF 기술을 좀 더 와 닿게 확인하실 수 있답니다.발표영상 (18:54~) 확인하기 > 상황1: 휴가를 떠나기 위해 파리..

구축사례 2023. 12. 6. 10:09
이전 1 다음
이전 다음
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
  • 이파피루스 홈페이지
  • 이파피루스 페이스북
  • 이파피루스 채용페이지
TAG
  • ocr
  • PyMuPDFPro
  • PDFpro
  • pdf추출
  • 전자문서
  • djvu
  • paperless
  • pdf뷰어
  • 아티펙스
  • 파이썬라이브러리
  • 페이퍼리스
  • 문서ai
  • 인공지능
  • PDF
  • 고장예측
  • 이벤트
  • epapyrus
  • PDF편집
  • Ai
  • 전자서식
  • 스마트공장
  • 피터팬
  • 모터센스
  • PDF변환
  • 이파피루스
  • pdf프로
  • 예지보전
  • pdf프로그램
  • 피터펜
  • PDF-Pro
more
«   2026/04   »
일 월 화 수 목 금 토
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30
글 보관함

Blog is powered by Tistory / Designed by Tistory

티스토리툴바