Tôi đang tìm một ví dụ đang sử dụng API mới để đọc và ghi các tệp chuỗi.Đọc và Viết Sequencefile bằng cách sử dụng Hadoop 2.0 Apis
hiệu quả Tôi cần phải biết làm thế nào để sử dụng các chức năng này
createWriter(Configuration conf, org.apache.hadoop.io.SequenceFile.Writer.Option... opts)
Định nghĩa Cũ không làm việc cho tôi:
SequenceFile.createWriter(fs, conf, path, key.getClass(), value.getClass());
Tương tự như vậy tôi cần phải biết những gì sẽ là mã cho đọc Tệp trình tự, vì phần đuôi không được chấp nhận:
SequenceFile.Reader(fs, path, conf);
Dưới đây là cách sử dụng giống nhau -
String uri = args[0];
Configuration conf = new Configuration();
Path path = new Path(uri);
IntWritable key = new IntWritable();
Text value = new Text();
CompressionCodec Codec = new GzipCodec();
SequenceFile.Writer writer = null;
Option optPath = SequenceFile.Writer.file(path);
Option optKey = SequenceFile.Writer.keyClass(key.getClass());
Option optVal = SequenceFile.Writer.valueClass(value.getClass());
Option optCom = SequenceFile.Writer.compression(CompressionType.RECORD, Codec);
writer = SequenceFile.createWriter(conf, optPath, optKey, optVal, optCom);
này vẫn còn sử dụng các API cũ 'SequenceFile.Reader đọc = đọc mới (fs, seqFilePath, conf);?' –
Cám ơn nỗ lực của bạn –
Ý anh là gì bởi API cũ (mapred vs MapReduce này? mã không sử dụng bất kỳ thứ gì từ các gói đó) –