Đối với chương trình liên kết cào của tôi (viết bằng python3.3) Tôi muốn sử dụng một cơ sở dữ liệu để lưu trữ khoảng 100.000 trang web:cơ sở dữ liệu quan hệ nhanh để sử dụng đơn giản với Python
- chỉ URL,
- một thời gian đóng dấu
- và cho mỗi trang web một danh sách các thuộc tính
tôi không có kiến thức về cơ sở dữ liệu, nhưng không tìm thấy những điều sau đây có thể phù hợp với mục đích của tôi:
- PostgreSQL
- SQLite
- Firebird
Tôi quan tâm đến tốc độ (để truy cập cơ sở dữ liệu và để có được thông tin truy nã). Ví dụ: đối với trang web x có thuộc tính y tồn tại và nếu có đọc nó. Tốc độ viết cũng là điều quan trọng.
Câu hỏi của tôi: Có sự khác biệt lớn về tốc độ hay không quan trọng đối với chương trình nhỏ của tôi? Có lẽ ai đó có thể biết cơ sở dữ liệu nào phù hợp với yêu cầu của tôi (và dễ xử lý với Python).
Có lẽ tôi chưa đủ rõ ràng. Chương trình của tôi sẽ chạy trên máy chủ 24/7 và có thể kết nối với db từ các máy khác. – zwieback86
trong trường hợp đó, bạn nên sử dụng một cách tiếp cận lai hơn như mongodb. nơi db là bộ nhớ ánh xạ để bạn có thể truy cập nhanh và nó cũng nằm trên đĩa. http://docs.mongodb.org/manual/faq/storage/ – v2b