Tôi đã lưu một mô hình rừng ngẫu nhiên vào một tệp bằng cách sử dụng Weka 3.7.9 và bây giờ tôi đang cố gắng đánh giá nó với bộ (rất lớn) khác (trên một số máy lớn Amazon EC2). Tôi đang sử dụng dòng lệnh sau:Ma trận nhầm lẫn đầu ra trong Weka từ dòng lệnh
> java -server -Xmx60000m -cp weka.jar weka.classifiers.Evaluation
weka.classifiers.trees.RandomForest -T test.arff -l random-forest.model
-i -no-cv
Tuy nhiên, sản lượng duy nhất tôi có là một cái gì đó như thế này:
=== Error on test data ===
Correctly Classified Instances 3252532 80.0686 %
Incorrectly Classified Instances 809651 19.9314 %
Kappa statistic 0.2884
Mean absolute error 0.2539
Root mean squared error 0.3608
Coverage of cases (0.95 level) 98.7413 %
Total Number of Instances 4062183
Trong khi tôi đang tìm kiếm cái gì bên cạnh như thế này:
=== Detailed Accuracy By Class ===
TP Rate FP Rate Precision Recall F-Measure MCC ROC Area PRC Area Class
0.804 0.295 0.731 0.804 0.766 0.512 0.826 0.803 buyer
0.705 0.196 0.783 0.705 0.742 0.512 0.826 0.798 non-buyer
Weighted Avg. 0.755 0.245 0.757 0.755 0.754 0.512 0.826 0.801
=== Confusion Matrix ===
a b <-- classified as
61728 15004 | a = buyer
22662 54066 | b = non-buyer
Xin lưu ý rằng, ngay cả khi tôi chạy lại phương thức đào tạo đầy đủ, như sau:
> java -Xmx60000m -cp weka.jar weka.classifiers.Evaluation
weka.classifiers.trees.RandomForest -t train.arff -T test.arff
-I 10 -K 0 -S 1 -num-slots 8 -d random-forest.model -i -no-cv
Tôi vẫn không hiển thị ma trận nhầm lẫn cho dữ liệu thử nghiệm (chỉ dành cho dữ liệu được đào tạo).
Nó hoạt động tốt cho tôi mà không có '-no-cv'. –
Dumb me !! Bạn, thưa bạn, xứng đáng với danh tiếng +100 :-) Vui lòng trả lời để tôi có thể trao giải thưởng đó. –
Cảm ơn, đã hoàn thành :) –