2012-01-18 14 views
7

Tôi được yêu cầu thử nghiệm hai khung ETL. Các yêu cầu như sau:Khuôn khổ ETL mã nguồn mở

  • Open Source
  • sẵn sang Linux
  • Duy trì
  • Logs có thể được xem trên trình duyệt web (tốt đẹp để có)
  • Được viết bằng Perl, Python, Ruby hay Java

Tệp thô có thể là bất kỳ thứ gì (excel, csv, html page, v.v.) Cơ sở dữ liệu đích là MySQL.

Không chỉ thả tên, vui lòng cho biết các ưu điểm/nhược điểm dựa trên trải nghiệm của bạn.

Cảm ơn!

Trả lời

3

Tôi đã sử dụng Kettle. Nó có giao diện riêng của nó, nhưng nếu bạn thích sử dụng API để tự thực hiện ETL nó cũng được hỗ trợ. Nó đã được chứng minh là rất hữu ích cho tôi và có một vài plugin đã có sẵn cho nó.

+0

tuyệt vời, cảm ơn tôi sẽ thử cái này – jchips12

6

Một trong những ETL dựa trên Java phổ biến nhất sẽ là Talend.

Jaspersoft ETL là một số khác được mở rộng từ Talend và có giao diện người dùng dựa trên eclipse đẹp.

+0

cảm ơn, tôi sẽ đánh giá điều này. – jchips12

2

Tùy chọn khác là CloverETL. Nó được viết bằng Java và có một mã nguồn mở, phiên bản LGPL của Engine của nó. Nó cũng có một phiên bản GUI miễn phí có tên là CloverETL Community.

Nó có thể xử lý bất kỳ nguồn được chỉ định nào và kết nối với một số cơ sở dữ liệu, bao gồm cả MySQL.