Có thể gọi song song gnu theo cách nó sẽ lặp lại dòng đầu tiên của đầu vào gốc tới STDIN của mỗi công việc con không?xử lý tệp CSV có tiêu đề với gnu song song
Tôi có tệp CSV chứa dòng tiêu đề ở trên cùng. Ví dụ:
> cat large.csv
id,count
abc,123
def,456
Tôi có một công cụ có thể trích xuất các cột theo tên chứ không phải vị trí:
> csv_extract large.csv count
123
456
tôi có thể tóm tắt các giá trị nối tiếp như:
> csv_extract large.csv count | awk '{ SUM += $1 } END { print SUM }'
579
Các thực tập tôi có lớn hơn nhiều, và hoạt động phức tạp hơn tổng hợp, nhưng các nguyên tắc tương tự sẽ áp dụng. Tôi muốn sử dụng gnu song song để xử lý tệp, nhưng tôi không biết liệu có thể nói với gnu song song để lặp lại tiêu đề CSV cho mỗi công việc hay không.
Lý tưởng nhất là tôi có thể chạy các hoạt động với một cái gì đó như:
> cat large.csv | parallel --pipe --repeat-first-line "csv_extract /dev/stdin count | awk '{ SUM += $1 } END { print SUM }'"
579
Tôi đã thực hiện lên --repeat-đầu-line tùy chọn ở trên để đại diện cho các chức năng tôi không thể tìm ra. Tôi đã xem các video trên YouTube và đọc trang người đàn ông, nhưng tôi không thể xem nó có thể được thực hiện như thế nào, nếu có thể.
Cảm ơn!
- danboo
bạn có thể làm cho một chạy riêng biệt của 'parallel' rằng chỉ cần thêm các tiêu đề để tất cả các file khi chế biến được thực hiện? Hoặc thực sự là một vòng lặp 'for', nếu bạn kiểm soát vị trí và tên nào được sử dụng cho các tệp đầu ra' song song' của bạn. Chúc may mắn! – shellter