2010-05-12 7 views

Trả lời

9

Có thể bạn có thể đọc một số giấy tờ liên quan đến MapReduce và máy tính phân tán trước, để hiểu rõ hơn về nó. Dưới đây là một số tôi muốn recommand:

Mặt khác, nếu bạn muốn biết rõ hơn về Hadoop, có lẽ bạn có thể bắt đầu đọc Hadoop MapReduce mã nguồn khuôn khổ.

3

Hiện nay, bookwise tôi sẽ kiểm tra - Hadoop A Definitive Guide. Được viết bởi Tom White, người đã từng làm việc trên Hadoop trong một thời gian dài, và làm việc tại Cloudera với Doug Cutting (người tạo Hadoop).

Ngoài ra ở bên miễn phí, Jimmy Lin từ UMD đã viết một cuốn sách có tên: Data-Intensive Text Processing with MapReduce. Đây là liên kết đến nhà tù tiền sản xuất cuối cùng (liên kết được cung cấp bởi tác giả trên số website) của anh ấy.

1

Mọi thứ Hadoop Podcast http://allthingshadoop.com/podcast có một số nội dung tốt và khách tốt. Phần lớn nó được thiết kế để bắt đầu với Máy tính phân tán.

1

MIT 6.824 là công cụ tốt nhất. Chỉ đọc các giấy tờ google liên quan đến Hadoop là không đủ. Một khóa học có hệ thống là cần thiết nếu bạn muốn đi sâu hơn.

2

Hadoop không nhất thiết phải là công cụ tốt nhất cho tất cả các vấn đề về máy tính phân tán. Mặc dù sức mạnh của nó, nó cũng có một đường cong học tập khá dốc và chi phí sở hữu. Bạn có thể muốn làm rõ các yêu cầu của mình và tìm kiếm các giải pháp thay thế phù hợp trong thế giới Java, chẳng hạn như HTCondor, JPPF hoặc GridGain (xin lỗi những điều tôi không đề cập đến).

1

Nếu bạn đang tìm kiếm để tìm hiểu một nền tảng điện toán phân tán ít phức tạp hơn Hadoop, bạn có thể thử Zillabyte. Bạn chỉ cần biết một số Ruby hoặc Python để xây dựng các ứng dụng trên nền tảng này.

Như LoLo đã nói, Hadoop là một giải pháp mạnh mẽ, nhưng có thể khó khăn để bắt đầu.

Đối với tài liệu để tìm hiểu về tính toán phân tán, hãy thử http://ocw.mit.edu/courses/electrical-engineering-and-computer-science/6-824-distributed-computer-systems-engineering-spring-2006/syllabus/. Có một số tài nguyên được đề xuất bởi khóa học.