Tôi đang làm việc với Hadoop và tôi cần phải tìm thấy 100 tệp nào trong hệ thống tệp Hadoop của tôi chứa một chuỗi nhất định.Grep trên nhiều tệp trong Hệ thống tệp Hadoop
tôi có thể xem các tập tin Tôi muốn tìm kiếm như thế này:
bash-3.00$ hadoop fs -ls /apps/mdhi-technology/b_dps/real-time
đồi khế, đồi trả về một số mục như thế này:
-rw-r--r-- 3 b_dps mdhi-technology 1073741824 2012-07-18 22:50 /apps/mdhi-technology/b_dps/HADOOP_consolidated_RT_v1x0_20120716_aa
-rw-r--r-- 3 b_dps mdhi-technology 1073741824 2012-07-18 22:50 /apps/mdhi-technology/b_dps/HADOOP_consolidated_RT_v1x0_20120716_ab
Làm thế nào để tìm thấy trong đó những chứa chuỗi bcd4bc3e1380a56108f486a4fffbc8dc
? Khi tôi biết, tôi có thể chỉnh sửa chúng theo cách thủ công.
Grep hoặc Sed? Không? – plast1K
Vấn đề với điều này là, nó không phải là một hệ thống tập tin UNIX, một hệ thống tệp Hadoop của nó, bất cứ khi nào tôi cố gắng làm như thế này 'bash-3.00 $ cd/apps/hdmi-công nghệ/b_dps/thời gian thực bash: cd:/apps/hdmi-technology/b_dps/thời gian thực: Không có tệp hoặc thư mục nào' Tôi không nhận được tệp hoặc thư mục như vậy. Vì vậy, tôi cần một số cách khác để giải quyết vấn đề này. – ferhan