Tôi là người mới bắt đầu NTLK/Python và đã quản lý tải kho văn bản của riêng mình bằng CategorPlaintextCorpusReader nhưng làm cách nào để thực sự đào tạo và sử dụng dữ liệu để phân loại văn bản?Sử dụng kho văn bản riêng của tôi để phân loại danh mục bằng Python NLTK
>>> from nltk.corpus.reader import CategorizedPlaintextCorpusReader
>>> reader = CategorizedPlaintextCorpusReader('/ebs/category', r'.*\.txt', cat_pattern=r'(.*)\.txt')
>>> len(reader.categories())
234
thấy http://stackoverflow.com/questions/29275614/using-my-own-corpus-thay vì-phim-đánh giá-corpus-cho-phân loại-in-nltk – alvas