Tôi đã cố gắng làm việc với pdftk để kiểm tra thông tin từ các dòng pdf nén được tạo bởi Nitro Reader, nhưng pdftk sẽ không làm lệch luồng. Nó tạo ra không có lỗi, nhưng nó dường như không làm bất cứ điều gì ngoài việc sắp xếp lại các đối tượng pdf. Here là một ví dụ tối thiểu về một trong các tệp pdf này.pdftk sẽ không giải nén các dòng dữ liệu
pdftk test.pdf output test-d.pdf uncompress
Khi tôi thử pdftk trên các tệp pdf khác, có vẻ như nó hoạt động tốt. Nếu tôi tự trích xuất các luồng dữ liệu và giải nén chúng bằng cách sử dụng zlib trong Python, chúng giải nén đúng cách. Ngoài ra, nếu tôi mở pdf trong Adobe Reader và lưu lại, pdftk hoạt động tốt trên pdf kết quả.
Tôi đã kiểm tra thủ công bản pdf Nitro theo khả năng tốt nhất của mình và có vẻ như đây là pdf hợp lệ. Tôi rất bối rối về những gì đang xảy ra ở đây.
Là nền tảng cho vấn đề, tôi có hàng trăm tệp pdf này và tôi đang tìm kiếm các từ khóa nhất định mà tôi có thể thực hiện nếu tôi có thể tự động giải nén.
pdftk phiên bản 1,45
Windows 7 Home Premium SP1
Nitro đọc 2 phiên bản 2.5.0.36
Cảm ơn, James