Tôi phải phân tích các tệp PDF, có trong HDFS trong Chương trình giảm thiểu bản đồ trong Hadoop. Vì vậy, tôi nhận được tệp PDF từ HDFS dưới dạng Phân tách đầu vào và nó phải được phân tích cú pháp và
Tôi không thể phát hiện trang trống trong tệp pdf. Tôi đã tìm kiếm trên internet cho nó nhưng không thể tìm thấy một giải pháp tốt. Sử dụng Itextsharp Tôi đã thử với kích thước trang, Xobjects. Nhưng
Tôi cần phải phân tích cú pháp tài liệu PDF. Tôi đã triển khai trình phân tích cú pháp và đã sử dụng Thư viện iText và cho đến bây giờ nó đã hoạt động mà không có bất kỳ vấn đề gì. Nhưng tôi không cần