2013-09-27 294 views

Trả lời

1

Tôi nghĩ bạn sẽ thấy bài viết sau rất hữu ích cho suy nghĩ của bạn.

It’s important to divide the techniques of data warehousing from the implementation. Hadoop (and the advent of NoSQL databases) will auger the demise of data warehousing appliances and the “traditional” single database implementation of a data warehouse. 
It is safe to say that traditional, single server relational databases or database appliances are not the future of big data or data warehouses. 
On the other hand, the techniques of data warehousing to include Extract-Transform-and-Load (ETL), dimensional modeling and business intelligence will be adapted to the new Hadoop/NoSQL environments. 

Từ: http://gcn.com/blogs/reality-check/2014/01/hadoop-vs-data-warehousing.aspx

6

tôi biết rằng đây là một chủ đề cũ hơn nhưng đã có một số phát triển trong năm qua hoặc lâu hơn. So sánh kho dữ liệu với Hadoop giống như so sánh táo với cam. Kho dữ liệu là một khái niệm: sạch sẽ, tích hợp dữ liệu chất lượng cao. Tôi không nghĩ nhu cầu về kho dữ liệu sẽ biến mất sớm. Mặt khác, Hadoop là một công nghệ. Nó là một khung tính toán phân tán để xử lý khối lượng lớn dữ liệu. Trong kho dữ liệu trước đây thường được xây dựng trên cơ sở dữ liệu quan hệ và các thiết bị kho dữ liệu. Tuy nhiên, trong vài năm gần đây, những hạn chế khác nhau của RDBMS đã nổi lên (bùng nổ chi phí giấy phép khi đối mặt với khối lượng dữ liệu ngày càng tăng, phù hợp với mục đích truy vấn đồ thị và phân cấp và ăn các loại dữ liệu phi cấu trúc, vv). Đồng thời các công cụ truy vấn SQL của MPP trên Hadoop đã xuất hiện như là Apache Drill mà bây giờ làm cho nó có thể truy vấn dữ liệu nằm trên Hadoop.

Tôi đã viết toàn bộ chuỗi bài đăng về chủ đề nếu bạn quan tâm đến tất cả các chi tiết. Data Warehousing in the age of big data. The end of an era?

1

tôi thấy http://www.b-eye-network.com/view/17017 này trong đó mô tả sự khác biệt của dữ liệu lớn và dữ liệu đồ nhà

khi chúng ta so sánh một giải pháp dữ liệu lớn để một kho dữ liệu, những gì chúng ta tìm? Chúng tôi thấy rằng một giải pháp dữ liệu lớn là một công nghệ và dữ liệu đó là một cấu trúc. Chúng là hai thứ rất khác nhau. Công nghệ chỉ là vậy - một phương tiện để lưu trữ và quản lý một lượng lớn dữ liệu . Kho dữ liệu là cách tổ chức dữ liệu để có độ tin cậy và tính toàn vẹn của công ty. Khi ai đó lấy dữ liệu từ kho dữ liệu , người đó biết rằng những người khác đang sử dụng cùng một dữ liệu cho các mục đích khác. Có cơ sở cho khả năng điều chỉnh dữ liệu khi có kho dữ liệu.