2008-11-17 16 views
10

Hiện tại tôi có hai MediaWikis, một phiên bản hơi cũ hơn phiên bản cũ hơn. Tôi muốn hợp nhất nội dung của cả hai với nhau mà không loại bỏ các trang trùng lặp. Cho đến nay lựa chọn tốt nhất tôi có thể nghĩ là sử dụng bot (như pywikipedia) để xem tất cả các trang của một wiki và thử chèn chúng vào một trang khác, đổi tên các trang trùng lặp.Hợp nhất nội dung MediaWiki với nhau

Giải pháp này có vẻ như sẽ mất một lúc để hoàn thành. Có cách nào dễ chịu hơn để làm điều này mà tôi không biết? Tôi đã không làm việc trực tiếp với cơ sở dữ liệu MediaWiki, vì vậy tôi không phải là rất thoải mái với nó mà không biết tôi đang làm gì.

Trả lời

8

MediaWiki có các tính năng importexport mà bạn có thể sử dụng để di chuyển nội dung. Nó trộn lịch sử của các trang hiện có (xem liên kết nhập).

Tuy nhiên, nó không xử lý các biến thể của hai trang khác nhau có cùng tên, do đó bạn sẽ phải tự xử lý việc di chuyển các trang. Theo như tôi có thể thấy trong phần mô tả của MediaWiki page table, bạn có thể tìm và đổi tên các trang trùng lặp trực tiếp trong SQL, nhưng pywikipedia cũng sẽ hoạt động (nhưng bạn sẽ cần phải xóa các chuyển hướng đó là kết quả của việc di chuyển trang "đúng", nếu không họ sẽ gây rối với các trang được nhập từ wiki khác).

+0

Tôi đồng ý - trừ khi có tới vài trăm trang trùng lặp, tôi khuyên bạn nên sử dụng tính năng nhập/xuất XML. – HanClinto

+0

Từ những gì tôi thấy về tính năng Nhập, có vẻ như nó hữu ích cho các tập hợp nhỏ, nhưng không hữu ích cho các tập lớn hơn. Có vẻ như các trang trùng lặp phải được người dùng xử lý và tùy chọn nhập tùy chỉnh có vẻ bị giới hạn. Ngay bây giờ, pywikipedia đang tìm cách trở thành lựa chọn tốt nhất ... – spelchec