Udtræk sider fra PDF-filer i Linux: Ghostscript, qpdf, pdftk-java og flere værktøjer

Hvilke muligheder findes der for at udtrække sider fra en PDF-fil til en ny PDF-fil ved hjælp af kommandolinjen i Linux, når PDFtk og Multivalent fejler, og værktøjer som pdfjam ønskes undgået?

Muligheder for at udtrække sider fra en PDF-fil til en ny PDF-fil ved hjælp af kommandolinjen i Linux inkluderer værktøjer som Ghostscript, qpdf, pdftk-java, poppler-utils og PyPDF2. Disse alternativer er nyttige, når PDFtk og Multivalent fejler, og pdfjam ønskes undgået.

Muligheder for at udtrække sider fra en PDF-fil til en ny PDF-fil ved hjælp af kommandolinjen i Linux

Når PDFtk og Multivalent fejler, og værktøjer som pdfjam ønskes undgået, er der stadig flere alternativer til at udtrække sider fra en PDF-fil til en ny PDF-fil ved hjælp af kommandolinjen i Linux. Her er nogle af de mest anvendelige værktøjer:

  • Ghostscript (gs)
    • Ghostscript er et kraftfuldt værktøj til at manipulere PDF-filer.
    • Eksempel på kommando:
      gs -sDEVICE=pdfwrite -dNOPAUSE -dBATCH -dSAFER -dFirstPage=1 -dLastPage=5 -sOutputFile=output.pdf input.pdf
  • qpdf
    • qpdf er et letvægtsværktøj til at transformere og analysere PDF-filer.
    • Eksempel på kommando:
      qpdf input.pdf --pages . 1-5 -- output.pdf
  • pdftk-java
    • pdftk-java er en Java-baseret version af PDFtk, som kan være mere stabil.
    • Eksempel på kommando:
      pdftk-java input.pdf cat 1-5 output output.pdf
  • poppler-utils (pdfseparate)
    • poppler-utils er en samling af værktøjer til at arbejde med PDF-filer, og pdfseparate kan bruges til at udtrække sider.
    • Eksempel på kommando:
      pdfseparate -f 1 -l 5 input.pdf output-%d.pdf
    • Derefter kan du samle de udtrukne sider til en enkelt PDF-fil med pdfunite:
      pdfunite output-*.pdf output.pdf
  • PyPDF2 (Python-bibliotek)
    • PyPDF2 er et Python-bibliotek, der kan bruges til at manipulere PDF-filer.
    • Eksempel på Python-script:
      import PyPDF2
      
      input_pdf = 'input.pdf'
      output_pdf = 'output.pdf'
      start_page = 1
      end_page = 5
      
      with open(input_pdf, 'rb') as infile:
          reader = PyPDF2.PdfFileReader(infile)
          writer = PyPDF2.PdfFileWriter()
          for i in range(start_page-1, end_page):
              writer.addPage(reader.getPage(i))
          with open(output_pdf, 'wb') as outfile:
              writer.write(outfile)
              

Disse værktøjer giver dig flere muligheder for at udtrække sider fra en PDF-fil til en ny PDF-fil ved hjælp af kommandolinjen i Linux, selv når PDFtk og Multivalent fejler, og værktøjer som pdfjam ønskes undgået.