
PDF 텍스트 검색 및 치환: PyMuPDF Pro로 간단하게 해결하기PDF 편집은 오래전부터 개발자들에게 까다로운 작업이었지만, PyMuPDF Pro를 사용하면 훨씬 간단하게 처리할 수 있습니다.회사 이름을 업데이트하거나, 오타를 수정하거나, 여러 문서에 걸쳐 오래된 정보를 교체해야 할 때 PyMuPDF Pro는 강력한 검색 및 치환 기능을 제공합니다.PyMuPDF Pro란?PyMuPDF Pro는 MuPDF의 파이썬 바인딩으로, 가볍고 빠른 PDF 툴킷입니다.속도가 빠르고 메모리 효율이 뛰어나며, 텍스트 추출·렌더링·수정까지 다양한 기능을 제공합니다.특히 일부 라이브러리처럼 새 문서를 생성하지 않고, 기존 PDF의 구조와 포맷을 유지한 채 직접 수정할 수 있다는 장점이 있습니다.설치아래와 같이 pip으..

PyMuPDF Pro로 PDF를 이미지로 변환하기: 완벽 가이드PDF는 어디서나 쓰이지만, 프레젠테이션이나 웹에 올리거나 추가 가공을 위해 이미지로 변환해야 할 때가 있습니다.PyMuPDF Pro는 이 과정을 빠르고 효율적으로 처리할 수 있는 파워풀한 파이썬 라이브러리입니다.PyMuPDF Pro란?PyMuPDF Pro는 MuPDF의 파이썬 바인딩으로, 가볍고 빠르며 메모리 효율성이 뛰어난 PDF/XPS 처리 도구입니다.폰트, 이미지, 벡터 그래픽이 복잡하게 섞인 PDF도 고품질로 다룰 수 있다는 점이 강점입니다.설치 방법설치는 간단합니다. pip으로 바로 설치할 수 있습니다.pip install PyMuPDF추가적인 이미지 형식을 다루려면 Pillow 라이브러리 설치도 권장됩니다.pip install P..

코드 한 줄만 삽입하면 웹에서 PDF 열람 및 편집 가능한 SDK '뮤PDF 웹뷰어' 구독챗GPT 이어 두 번째 초대형 글로벌 AI 기업 고객…AI 서비스 필수 요소로 각광문서 AI 기업 이파피루스(대표 김정희)는 최근 AI 기반 대화형 검색 엔진 퍼플렉시티가 자사의 문서 뷰어 개발 키트(SDK)인 '뮤피디에프 웹뷰어'의 첫 구독 고객이 됐다고 13일 밝혔다.'뮤피디에프 웹뷰어'는 이파피루스의 대표 제품인 PDF 스트리밍 뷰어 '스트림닥스(StreamDocs)'를 기반으로 한 뷰어 SDK다. 코드 한 줄만 입력하면 별도의 서버 구축 없이도 브라우저 내에서 작동하는 PDF 뷰어를 구현할 수 있다. 문서 열람은 물론 강조 표시, 주석 달기, 양식 작성, 서명, 콘텐츠 삭제 등의 편집 작업도 가능하다. 올해 ..

문서 AI 기업 이파피루스(대표 김정희)는 최근 자사 제품 관련 정보를 빠르게 찾아볼 수 있는 AI 챗봇을 개발, 7월 중 고객 및 파트너사에 제공할 예정이라고 23일 밝혔다.이번에 개발한 AI 챗봇은 이파피루스가 현재 개발·판매 중인 문서 AI 솔루션에 대한 정보를 총망라한 sLLM(소형 언어모델)을 기반으로 한다. 제품 정보부터 자주 묻는 질문(FAQ), 개발 문서에 이르기까지 다양하고 복잡한 정보 중 필요한 내용만 질의응답 형태로 빠르게 찾아볼 수 있다. 이파피루스 내부 업무에 먼저 적용하여 테스트를 거친 후, 파트너사와 고객들을 위한 개발 문서 포털 '테크넷(Tech Net)'에 이달 중 적용될 예정이다.김정아 이파피루스 부사장은 “고객과 파트너사의 기술 관련 문의에 보다 신속 정확하게 대응하기 ..

문서 AI 기업 이파피루스(대표 김정희)는 민감정보 비식별화 모듈 '블랙마커(BlackMarker)'의 성능을 업그레이드, 대표 제품인 PDF 스트리밍 뷰어 '스트림닥스(StreamDocs)'와 PDF 변환 솔루션 '피디에프 게이트웨이(PDF Gateway)'의 부가기능으로 제공한다고 18일 밝혔다.이파피루스 자체 개발 모듈인 '블랙마커'는 PDF 문서에 포함된 민감정보를 찾아내고 마스킹(Masking) 처리한 후, 원본 데이터를 삭제하여 정보 유출 위험을 원천 차단한다. 이번 업그레이드를 통해 기존의 전화번호, 주민등록번호, 이메일과 같이 일정한 형식을 갖춘 정형화된 데이터는 물론, 인명이나 주소와 같은 비정형 개인정보도 자동으로 감지하여 일괄 비식별 처리할 수 있게 됐다.이러한 성능 향상의 비결은 방..

📌 PyMuPDF Pro로 PDF 병합하기: 기본부터 고급 기능까지PDF 병합은 보고서 통합, 연구 자료 합본, 문서 묶음 제작 등 다양한 작업에서 자주 필요한 기능입니다. PyMuPDF Pro는 빠르고 가벼우면서도 세밀한 제어가 가능해, 간단한 결합부터 페이지 범위 지정, 메타데이터 추가까지 모두 처리할 수 있습니다.이 가이드에서는 PyMuPDF Pro로 PDF를 병합하는 방법을 다룹니다.기본 병합 (Concatenation)페이지 범위를 지정한 병합북마크와 메타데이터 유지 등 고급 병합1. 기본 PDF 병합가장 단순한 방법은 여러 PDF를 순서대로 합치는 것입니다.12345678910111213141516171819202122232425262728293031import pymupdf def merg..

PDF 분할과 PyMuPDF Pro문서 처리 업무에서 PDF 파일을 다루는 일은 매우 흔한데요,그중에서도 여러 페이지로 구성된 PDF를 페이지별 개별 파일로 나누는 작업은 특히 자주 하게됩니다.PyMuPDF Pro는 이러한 작업을 쉽고 빠르게 처리할 수 있는 강력한 파이썬 라이브러리입니다.PyMuPDF Pro란?PyMuPDF Pro는 MuPDF라는 경량 PDF 엔진을 파이썬에서 사용할 수 있도록 만든 라이브러리입니다.PDF 문서를 읽기, 작성, 편집, 가공하는 다양한 기능을 제공하며, 속도와 안정성이 뛰어나 PDF 작업에 널리 사용됩니다.설치 방법PyMuPDF Pro는 pip 명령어로 간단히 설치할 수 있습니다.pip install PyMuPDF💡기본 PDF 분할아래는 하나의 PDF 파일을 페이지별로..

'주석(Annotation)' 왜 중요한가요?주석과 하이라이트 기능은 현대적인 문서 작업 흐름에서 필수적인 도구가 되었습니다.학계, 법률 문서, 협업 기반의 문서 검토 등 다양한 분야에서 마크업 도구는 피드백을 구조화하고, 문서의 가독성을 높이는 데 중요한 역할을 합니다.주석은 단순한 표시 그 이상입니다. PDF에 주석을 추가한다는 것은 단순한 밑줄이나 강조 표시를 넘어,디지털 텍스트와의 정밀한 상호작용을 가능하게 합니다. 법률 전문가의 경우 계약서에서 특정 조항을 강조하고, 삭제선을 넣거나 맥락별 의견을 남깁니다. 연구자는 논문 초안을 공동으로 검토하며 중요한 내용을 표시합니다. 학생의 경우 학습 자료에 동적으로 참여하면서 하이라이트와 메모를 추가하는 등 다양하게 활용될 수 있습니다.✨ 대표적인 활용 ..

✅ 업무 흐름을 방해하는 무거운 PDF, PyMuPDF Pro로 가볍게 최적화하세요 고해상도 이미지, 삽입된 폰트, 숨겨진 메타데이터 등으로 인해 PDF 파일이 과도하게 커지면 이메일 첨부 전송이 느려지고, 저장 공간을 낭비하며, 모바일 사용자에게 불편을 주는 등 업무 흐름 전체에 영향을 미칠 수 있습니다. 이럴 때는 명확한 목표를 가진 최적화 전략이 필요합니다.이 글에서는 다음의 세 가지 핵심 기법을 중심으로, PyMuPDF Pro를 활용해 과도하게 커진 PDF를 더 작고 빠르게 만드는 방법을 소개합니다:메타데이터 및 불필요한 요소 제거이미지 압축폰트 서브세팅(Font Subsetting)PyMuPDF Pro는 직관적인 API를 제공하여,복잡한 PDF 최적화 작업도 간단한 코드 몇 줄로 처리할 수 있습..

📄 PDF 워터마킹 완전 가이드: PyMuPDF Pro로 구현하는 텍스트/이미지 워터마크워터마킹이 중요한 이유PDF 워터마킹은 지적 재산권 보호, 브랜딩, 문서 보안 유지를 위해 필수적인 기술입니다.기밀 비즈니스 문서에 'CONFIDENTIAL' 표시를 하거나, 보고서에 회사 로고를 삽입하거나, 창작물을 보호하기 위해 워터마크를 추가하는 경우 등 워터마크는 문서 보안에 빼놓을 수 없는 전문적이고 효과적인 수단입니다.🐍 PyMuPDF Pro: 빠르고 강력한 PDF 워터마킹 도구기능이 제한적인 다른 라이브러리 제품과 달리, PyMuPDF Pro는 다음과 같은 장점을 제공합니다:빠른 처리 속도텍스트 및 이미지 워터마크 모두 지원광범위한 사용자 정의 옵션대량 처리(batch processing)까지 지원⚙️..

📄 PyMuPDF Pro를 활용한 PDF 표 추출: 실무 중심 활용 가이드오늘은 PyMuPDF Pro를 이용해 PDF 문서에서 표를 추출하는 과정을 살펴보고, 이를 다양한 실무 환경에서 어떻게 활용할 수 있는지에 대해 설명합니다.많은 PDF 문서(특히 스프레드시트나 데이터 내보내기 결과물에서 생성된 문서)는 **구조화된 표(table)**를 포함하고 있으며, 이를 가공 가능한 형식으로 변환하는 것이 중요합니다.이 글에서는 표 추출의 중요성과 대표적인 활용 사례, 그리고 PyMuPDF Pro의 향상된 기능(예: Markdown 변환, pandas DataFrame 내보내기 등)이 이 과정을 어떻게 지원하는지를 설명합니다.✅ 표 추출이 중요한 이유금융, 학계, 기업 환경 등에서 접하게 되는 많은 문서들은 ..

플래튼(Flatten, 평면화) 왜 중요한가요?세금 신고서, 계약서, 인사 서류처럼 각종 양식을 자주 다루는 업무를 하다 보면, 반복적인 수작업 입력이 얼마나 번거로운지 잘 아실 겁니다.이런 작업을 자동화하면 시간을 절약할 수 있고, 입력 오류를 줄이며, 문서 전반에 걸쳐 일관성을 유지할 수 있습니다.하지만 양식을 한 번 작성한 뒤에도 계속 수정 가능하게 두는 것이 과연 바람직할까요?많은 업무 흐름에서는 실수로 인한 편집을 방지하고, 데이터 무결성을 유지하며, 서명된 문서를 안전하게 보호하기 위해 양식 필드를 잠그는 작업이 필요합니다.이때 사용하는 방식이 바로 **플래튼(Flattening, 평면화)**입니다.PyMuPDF Pro는 PDF 양식을 자동으로 작성하고, 사용 목적에 따라 다양한 방식으로 플래..

안녕하세요, 이파피루스입니다.앞으로 이파피루스의 신제품 데이터 추출 파이썬 라이브러리 PyMuPDF Pro의 유용하고도 다양한 활용법을 실제 코드 예시를 포함하여 시리즈로 전해드릴 예정입니다. 많은 관심 부탁드립니다😊 추출된 데이터가 부족하게 느껴지거나 문서 전체의 내용이 잘 추출되지 않았던 경험,혹은 문서 처리 시간이 너무 길어 파이프라인이 불필요하게 지연된 경험이 있으신가요?이파피루스에서 텍스트 추출의 두 가지 주요 접근 방식인 ‘네이티브(Native)’와 ‘OCR’을 소개하고, 이를 어떻게 그리고 언제 활용하면 효율적일지 소개합니다!1. 네이티브 텍스트 추출이란?이 방식은 PyMuPDF Pro의 핵심 기능을 이용해 문서에서 텍스트를 직접 추출하는 방법입니다. Page.get_text() 메서드를 ..
아래의 포스팅은 이파피루스 미국 자회사인 아티펙스의 시니어 매니저 'Jamie Lemon'이 일본 개발자 커뮤니티인 Qiita에 업로드한 내용을 바탕으로 작성했습니다. 원문을 확인하고 싶으신 분들은 아래 url을 확인해주세요:)https://qiita.com/jamie-lemon/items/344d7098cc586f88d835 개발자가 자주 쓰는 Python PDF 라이브러리의 상위 10가지 사용 사례Python은 PDF 워크플로우 자동화에서 핵심 언어로 자리 잡고 있습니다. 단순한 추출부터 복잡한 문서 조작까지, 개발자들은 PyMuPDF 같은 라이브러리를 통해 비즈니스 프로세스부터 학술 연구까지 다양한 분야를 효율화하고 있습니다. 이 글에서는 개발자들이 자주 찾는 PDF 관련 작업 10가지를 정리하며,..

문서 AI 전문 기업 이파피루스(대표 김정희)는 2023년 인수한 자사의 글로벌 SaaS 플랫폼 'PDF.co(피디에프닷코)' 이용 고객 수가 2년 만에 약 3배 증가했다고 밝혔다.'PDF.co'는 PDF 문서 처리에 필요한 제반 기능을 API로 제공하는 클라우드 서비스 플랫폼이다. 문서 업무 시스템 구축과 서비스 구현에 필요한 기능을 두루 갖추고 있어 전 세계 기업 및 개발자들의 사랑을 받고 있다. 2023년 6월 모회사인 문서 기술 전문 기업 '바이트스카우트(ByteScout, Inc.)'와 함께 이파피루스에 인수될 당시 1215명이었던 서비스 구독 고객 수는 2025년 6월 현재 3638명으로 3배 이상 증가했다. 구독 고객을 통해 발생하는 월 반복 매출(MRR) 또한 2년 새 60만달러에서 144..

안녕하세요, 이파피루스입니다. 오늘은 좋은 소식과 함께 찾아왔습니다~지난 5월 22일은 이파피루스의 21주년 창립기념일이었답니다🎉🎉모든 임직원분들+강아지까지 참석해 창립기념일 축하 행사를 진행했는데요,사진과 함께 자세히 전달드릴게요 🥰예쁜 케이크와함께 오늘의 자리를 빛내준 귀여운 강아지들✨의 인증샷부터 보고가세요.🐶🐶: 이파피루스 21주년 축하한다개🐕 먼저, 김정아 부사장님의 깜짝 발표가 있었습니다.늘 노고가 많으신 이파피루스 임직원분들을 위한 깜짝 선물🎁같은 발표와이파피루스의 향후 발전 방향에 대한 공유가 있었는데요,모두 집중해서 잘 들어주시고 뜻밖의 좋은 소식에 화기애애한 분위기 였다고..🤗 부사장님의 발표 이후 간단한 다과와 함께 샴페인 한잔🍾으로 다같이 21주년을 축하했습니..

문서 AI 전문 기업 이파피루스(대표 김정희)는 서울대학교 중앙도서관에 PDF 스트리밍 뷰어 '스트림닥스(StreamDocs)'를 납품했다고 밝혔다. 스트림닥스는 PDF 문서를 다운로드 없이 웹 브라우저에서 실시간 스트리밍 방식으로 열람할 수 있는 솔루션이다. 이를 통해 강의자료 유출을 방지하면서도 학생들은 태블릿이나 노트북 등에서 별도 프로그램 설치 없이 자료를 열람할 수 있다.스트림닥스는 강의자료에 워터마크 삽입이 가능해 저작권 보호를 한층 강화하며, 동시 접속자가 많아도 안정적인 열람 속도를 유지한다. 또한 주석 편집 및 저장, 공유 기능을 통해 강의자료 집필진 간의 피드백 교환이 가능하고, 완성된 자료는 중앙 관리가 용이하다. 자세한 내용은 아래에서 확인해주세요 :)https://www.etnew..

안녕하세요, 이파피루스입니다.2025년 3월 28일 금요일, 공공솔루션 마켓에 참가한 이파피루스의 소식을 전해드립니다!작년에도 저희 부스가 뜨거운 관심을 받았었는데요,올해도 마찬가지로 많은 성원을 보내주셔서 알차게 마무리할 수 있었다는 소식입니다 🔥🔥🔥사진과 함께 더 자세하게 소개해드려요 :)전년과 마찬가지로 코엑스 그랜드볼룸에서 개최 된 공공솔루션 마켓!한국 IT서비스 산업협회와 전자신문 주최로 공공기관 관계자분들을 비롯한 IT 업계 담당자분들이 참여한 행사입니다.공공기관에 재직하고 계신 분들, 전산 및 정보화 관련 부서, 민간 IT 그룹 관계자분들께서 많이 찾아주셨습니다. 이번전시회의 출품제품은AI 비식별화 솔루션 AI BlackMarker문서 기반 AI 질의응답 서비스 StreamDocsAI홈..

문서 AI 전문 기업 이파피루스(대표 김정희)의 미국 자회사 아티펙스(Artifex)가 글로벌 정보보안 인증 'SOC2(Service Organization Control 2) Type 2'를 획득했다고 1일 밝혔다.SOC2 인증 제도는 미국공인회계사협회(AICPA)가 개발한 글로벌 정보보안 감사 표준이다. 기업의 고객 데이터 통제 및 프로세스를 보안, 가용성, 처리 무결성, 기밀성, 개인정보 보호의 다섯 가지 측면에서 평가한다. 특정 시점에서의 서비스 설계 적정성만을 평가하는 Type 1과 달리, Type 2는 시스템 설계 뿐만 아니라 실제 운영 과정의 보안성과 신뢰성까지 최소 6개월에 걸쳐 심사한다. 아티펙스는 약 1년에 걸친 엄격한 심사를 통해 인증을 획득했다. 자세한 내용은 아래에서 확인해주세요 ..

문서 요약 AI 서비스, AI 기반 비식별화 솔루션, 웹 접근성 높은 통합뷰어 3개 제품 소개기관 업무 효율 개선하고 AX 실현…현장서 데모 체험 가능문서 AI 전문 기업 이파피루스(대표 김정희)는 오늘 8일 서울 강남구 삼성동 코엑스 그랜드볼룸에서 열리는 '제25회 공공솔루션마켓'에 참가한다고 밝혔다.전자신문사와 한국IT서비스산업협회가 공동 주최하는 공공솔루션마켓은 공공기관 정보화 담당자들과 민간기업 교류를 위해 마련된 국내 최대 규모 공공 정보화 시장 행사다. 인공지능(AI), 클라우드, 닫기빅데이터 (Big Data): 다양하고 복잡한데다 양도 많아 제대로 관리하기 어려운 데이터상세보기▶빅데이터, 보안 등 최신 기술을 기반으로 공공 시장에 도입할 수 있는 솔루션을 한 자리에서 만나볼 수 있는 기회다..
- Total
- Today
- Yesterday
- 예지보전
- 이파피루스
- PDFpro
- Ai
- pdf프로그램
- 인공지능
- 피터펜
- IOT
- 페이퍼리스
- 피터팬
- 문서ai
- 고장예측
- 모터센스
- 아티펙스
- djvu
- paperless
- 강소기업
- 전자문서
- PyMuPDFPro
- PDF-Pro
- epapyrus
- pdf뷰어
- pdf프로
- 스마트공장
- 파이썬라이브러리
- 이벤트
- 전자서식
- PDF편집
- PDF변환
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
31 |