Vì vậy, dữ liệu đầu vào của tôi có hai lĩnh vực/cột: id1 & id2, và mã của tôi là như sau:Scalding: Làm thế nào để giữ lại trường khác, sau một groupBy ('field) {. Size}?
TextLine(args("input"))
.read
.mapTo('line->('id1,'id2)) {line: String =>
val fields = line.split("\t")
(fields(0),fields(1))
}
.groupBy('id2){.size}
.write(Tsv(args("output")))
Các kết quả đầu ra trong (những gì tôi giả định) hai lĩnh vực: id2 * kích thước. Tôi là một chút khó khăn về việc tìm ra nếu nó có thể giữ lại giá trị id1 cũng được nhóm lại với id2 và thêm nó như là một lĩnh vực khác?
Vui lòng xem liệu điều đó có hợp lý không, tôi cảm thấy cùng một nỗi đau. http://stackoverflow.com/questions/25994879/scalding-flatten-fields-after-groupby – Sergey