Tôi đã dành một ngày nghiên cứu một thư viện mà có thể được sử dụng để thực hiện những điều sau:Android Web Nạo với một trình duyệt Headless
- Lấy đầy đủ nội dung của một trang web như thế nào trong nền mà không render kết quả đến một lượt xem.
- Thư viện phải hỗ trợ các trang kích hoạt yêu cầu ajax để tải một số dữ liệu kết quả bổ sung sau khi HTML ban đầu được tải chẳng hạn.
- Từ html kết quả, tôi cần lấy các phần tử trong biểu mẫu chọn xpath hoặc css.
- Trong tương lai tôi cũng có thể cần phải điều hướng đến một trang tiếp theo (bắn ra các sự kiện, trình nút/liên kết vv)
Dưới đây là những gì tôi đã cố gắng nhưng không thành công:
- Jsoup: Công trình tuyệt vời nhưng không hỗ trợ javascript/ajax (vì vậy nó không tải đầy đủ trang)
- Android được xây dựng trong HttpEntity: cùng một vấn đề với javascript/ajax là jsoup
- HtmlUnit: Nhìn chính xác những gì tôi cần nhưng sau giờ không thể làm việc trên roid (Những người dùng khác không thành công bằng cách cố gắng tải các tệp jar 12MB +. Bản thân tôi đã tải mã nguồn đầy đủ và tham chiếu nó như một thư viện dự án chỉ để thấy rằng những thứ như Applet và java.awt (được sử dụng bởi HtmlUnit) không tồn tại trong Android).
- Tê giác - Tôi thấy điều này rất khó hiểu và không biết cách làm cho nó hoạt động trong Android và ngay cả khi đó là những gì tôi đang tìm kiếm.
- Trình điều khiển Selenium: Có vẻ như nó có thể hoạt động nhưng bạn không có cách đơn giản để triển khai nó theo cách không đầu để bạn không hiển thị html thực tế cho chế độ xem.
Tôi thực sự muốn HtmlUnit hoạt động vì nó có vẻ phù hợp nhất với giải pháp của tôi. Có cách nào hay ít nhất một thư viện khác mà tôi đã bỏ lỡ, phù hợp với nhu cầu của tôi không?
Tôi hiện đang sử dụng Android Studio 0.1.7 và có thể chuyển sang Ellipse nếu cần.
Cảm ơn trước!
Có vẻ rằng không có gì có thể được sử dụng cho các kịch bản của tôi là. Tôi đã bắt đầu làm việc trên một cổng Android cho HTMLUnit và hy vọng sẽ có một cái gì đó làm việc sớm. Tôi sẽ đăng bài ở đây ngay sau khi tôi đã kiểm tra trong một chi nhánh HtmlUnit mà bất kỳ ai cũng có thể tải xuống. Hy vọng rằng tôi có thể nhận được các nhà phát triển HtmlUnit tham gia vì có vẻ như có rất nhiều sự quan tâm đối với một cổng Android. – Pierre
FYI: [PhantomJS.org] (http://phantomjs.org) có thể hữu ích cho những người khác, về "trình duyệt không đầu" – MiStr
Đã 4 năm và chúng tôi đã dừng ở đây! TÔI ĐANG ĐỂ XÁC NHẬN CÂU HỎI! – mehulmpt