bộ dữ liệu của tôi trông giống như sau:Flatten tuple giống như một túi
(A, (1,2))
(B, (2,9))
Tôi muốn "làm phẳng" các bản ghi trong Pig, về cơ bản lặp đi lặp lại mỗi bản ghi cho mỗi giá trị được tìm thấy trong khu vực nội-tuple, như vậy mà sản lượng dự kiến là:
(A, 1)
(A, 2)
(B, 2)
(B, 9)
Tôi biết điều này là có thể khi các bộ (1,2) và (2,9) là các túi thay thế.
Tốt! Trong trường hợp này, tuple có hai phần tử (b.b1, b.b2). Làm thế nào để làm điều này khi kích thước của bộ tuple có thể thay đổi? – Marquez
Tôi cũng muốn biết cách thực hiện điều này với Tuple có độ dài thay đổi. –
Bạn có thể tự viết UDF cho mục đích đó. 'Túi DataBag = BagFactory.getInstance(). NewDefaultBag(); cho (int i = 0; i
hobgoblin