Hey Tôi là khá mới với thế giới của Big Data. Tôi đã xem qua hướng dẫn này trên http://musicmachinery.com/2011/09/04/how-to-process-a-million-songs-in-20-minutes/ Nó mô tả một cách chi tiết làm thế nà
Tôi đang viết một hàm bản đồ bằng cách sử dụng mrjob. Đầu vào của tôi sẽ đến từ các tệp trong một thư mục trên HDFS. Tên của các tập tin chứa một thông tin mảnh nhỏ nhưng rất quan trọng mà không có tr
Tôi đang cố gắng tìm hiểu cách sử dụng API Python của Yelp cho MapReduce, MRJob. Ví dụ truy cập từ đơn giản của chúng có ý nghĩa, nhưng tôi tò mò về cách mà một người sẽ xử lý một ứng dụng liên quan đ
Sử dụng mrjob để chạy mã python trên Bản đồ Đàn hồi của AmazonReduce của Amazon Tôi đã tìm thấy thành công một cách để nâng cấp hình ảnh và vệt bẩn của hình ảnh EMR. Chạy từ giao diện điều khiển các l