2013-03-21 77 views
6

Tôi đã lưu một mô hình rừng ngẫu nhiên vào một tệp bằng cách sử dụng Weka 3.7.9 và bây giờ tôi đang cố gắng đánh giá nó với bộ (rất lớn) khác (trên một số máy lớn Amazon EC2). Tôi đang sử dụng dòng lệnh sau:Ma trận nhầm lẫn đầu ra trong Weka từ dòng lệnh

> java -server -Xmx60000m -cp weka.jar weka.classifiers.Evaluation 
weka.classifiers.trees.RandomForest -T test.arff -l random-forest.model 
-i -no-cv 

Tuy nhiên, sản lượng duy nhất tôi có là một cái gì đó như thế này:

=== Error on test data === 

Correctly Classified Instances  3252532    80.0686 % 
Incorrectly Classified Instances 809651    19.9314 % 
Kappa statistic       0.2884 
Mean absolute error      0.2539 
Root mean squared error     0.3608 
Coverage of cases (0.95 level)   98.7413 % 
Total Number of Instances   4062183 

Trong khi tôi đang tìm kiếm cái gì bên cạnh như thế này:

=== Detailed Accuracy By Class === 

       TP Rate FP Rate Precision Recall F-Measure MCC  ROC Area PRC Area Class 
       0.804 0.295 0.731  0.804 0.766  0.512 0.826  0.803  buyer 
       0.705 0.196 0.783  0.705 0.742  0.512 0.826  0.798  non-buyer 
Weighted Avg. 0.755 0.245 0.757  0.755 0.754  0.512 0.826  0.801  

=== Confusion Matrix === 

    a  b <-- classified as 
61728 15004 |  a = buyer 
22662 54066 |  b = non-buyer 

Xin lưu ý rằng, ngay cả khi tôi chạy lại phương thức đào tạo đầy đủ, như sau:

> java -Xmx60000m -cp weka.jar weka.classifiers.Evaluation 
weka.classifiers.trees.RandomForest -t train.arff -T test.arff 
-I 10 -K 0 -S 1 -num-slots 8 -d random-forest.model -i -no-cv 

Tôi vẫn không hiển thị ma trận nhầm lẫn cho dữ liệu thử nghiệm (chỉ dành cho dữ liệu được đào tạo).

+1

Nó hoạt động tốt cho tôi mà không có '-no-cv'. –

+0

Dumb me !! Bạn, thưa bạn, xứng đáng với danh tiếng +100 :-) Vui lòng trả lời để tôi có thể trao giải thưởng đó. –

+0

Cảm ơn, đã hoàn thành :) –

Trả lời

3

Tính năng này hoạt động khi bạn bỏ qua tùy chọn -no-cv.