Làm thế nào để bạn gọi partial_fit()
trên một trình phân loại scikit-tìm hiểu được bọc bên trong một Pipeline()?Sử dụng partial_fit với Scikit Pipeline
Tôi đang cố gắng để xây dựng một phân loại văn bản từng bước khả năng huấn luyện sử dụng SGDClassifier
như:
from sklearn.linear_model import SGDClassifier
from sklearn.pipeline import Pipeline
from sklearn.feature_extraction.text import HashingVectorizer
from sklearn.feature_extraction.text import TfidfTransformer
from sklearn.multiclass import OneVsRestClassifier
classifier = Pipeline([
('vectorizer', HashingVectorizer(ngram_range=(1,4), non_negative=True)),
('tfidf', TfidfTransformer()),
('clf', OneVsRestClassifier(SGDClassifier())),
])
nhưng tôi nhận được một AttributeError
cố gắng gọi classifier.partial_fit(x,y)
.
Nó hỗ trợ fit()
, vì vậy tôi không thấy lý do tại sao partial_fit()
không khả dụng. Liệu có thể nhìn vào đường ống, gọi các máy biến áp dữ liệu, và sau đó gọi trực tiếp partial_fit()
trên máy phân loại của tôi?
Cậu cuối cùng đưa ra một solu tion cho điều này? – GreenGodot