2009-10-06 8 views
8

Bất kỳ ai biết về trình phân tích cú pháp nguồn cấp dữ liệu tốt cho python 3.1? Tôi đã sử dụng feedparser cho 2.5 nhưng nó dường như không được chuyển sang 3.1, và nó có vẻ phức tạp hơn là chỉ chạy 2to3.py trên đó. Bất kỳ trợ giúp nào?Python 3.1 Trình phân tích cú pháp RSS?

Trả lời

4

Bạn có thể xem bài đăng trên blog Atom Models của Ian Bicking. Ông đề xuất không sử dụng bất kỳ thư viện "phân tích cú pháp nguồn cấp dữ liệu" đặc biệt nào vì Atom và RSS là chỉ XML để mô hình của bạn thực sự là một cây XML chứ không phải một số lớp ưa thích. Bạn có thể thử his code trong Python 3.

+3

Những ngày này, bất cứ lúc nào ai đó nói "chỉ XML", tôi thường nghi ngờ họ đang thực hiện một trò đùa. Cách tiếp cận này sẽ làm việc tốt nếu bạn đang kéo vào nguồn cấp dữ liệu được sản xuất bởi một bên duy nhất một cách rất nhất quán. Nhưng nếu thực sự có bất kỳ yếu tố con người nào, nó sẽ không hoạt động. Nguồn cấp dữ liệu nổi tiếng là xấu khi nói đến không tuân theo các tiêu chuẩn, hoặc cho vấn đề đó, thậm chí là XML hợp lệ. Đôi khi, ai đó đưa bạn URI của trang HTML thay vì nguồn cấp dữ liệu. Xử lý tất cả những điều đó một cách duyên dáng là thứ bạn muốn có một thư viện như 'feedparser' để chăm sóc. –

+0

Có, tôi biết các tính năng của 'feedparser'. Đó chỉ là một ý kiến ​​khác về chủ đề này. –

+0

Tôi sẽ cung cấp cho nó một shot, cảm ơn! – matthew

0

Bắt đầu chuyển feedparser sang Python 3.1.

+0

hehe, tôi đã thử. Thất bại thảm hại. Tôi là một "python" python hơn là một lập trình viên. – matthew

1

Tôi đã làm việc để chuyển feedparser sang Python 3 và tôi đã xuất bản a feedparser/Python 3 development branch tại GitHub với kết quả của công việc đó cho đến nay.

Ngoài ra còn có một báo cáo lỗi mở về chuyển feedparser cho Python 3, nhưng vì tôi là người dùng mới tại StackOverflow, tôi hiện bị giới hạn chỉ là một liên kết duy nhất. Bạn sẽ tìm thấy liên kết đến báo cáo lỗi ở đầu trang GitHub (liên kết tới code.google.com).