Chúng tôi muốn sử dụng Amazon Elastic MapReduce trên đầu trang DB hiện tại của chúng tôi (chúng tôi đang sử dụng Cassandra trên EC2). Nhìn vào Câu hỏi thường gặp về EMR của Amazon, có thể: Amazon EMR FAQ: Q: Can I load my data from the internet or somewhere other than Amazon S3?Định cấu hình nguồn dữ liệu ngoài cho Elastic MapReduce
Tuy nhiên, khi tạo luồng công việc mới, chúng tôi chỉ có thể định cấu hình thùng S3 làm nguồn dữ liệu đầu vào.
Bất kỳ ý tưởng/mẫu nào về cách thực hiện việc này?
Cảm ơn!
P .: Tôi đã nhìn thấy câu hỏi này How to use external data with Elastic MapReduce nhưng câu trả lời không thực sự giải thích cách thực hiện/cấu hình nó, đơn giản là điều đó là có thể.