Tôi là "lập trình viên" của một nhóm học sinh nhằm mục đích điều tra sự hài lòng và các vấn đề chung trong trường ngữ pháp của tôi. Chúng tôi có một câu hỏi được xây dựng dựa trên thang điểm từ 1-6 và chúng tôi giải thích các câu trả lời này bằng một phần mềm biểu đồ mà tôi đã viết bằng python.Làm cách nào để sử dụng phân tích văn bản để điều tra câu trả lời câu hỏi?
Bây giờ, có <textarea>
ở cuối câu hỏi của chúng tôi mà người dùng có thể sử dụng tùy thích. Tôi hiện đang nghĩ cách để làm cho dữ liệu này có thể sử dụng được (chúng tôi không muốn đọc hơn 800 câu trả lời).
Tôi có thể sử dụng phân tích văn bản bằng Python để điều tra những gì học sinh viết? Tôi đã nghĩ đến việc một cách để "tag" bất kỳ câu nói đó được viết xuống, như:
I don't like being in school. [wellbeing][negative]
I have way too much homework. [homework][much]
I think there should be more interesting projects. [projects][more]
Có bất kỳ phương pháp có thể sử dụng để có được điều đó? Sử dụng trình mã thông báo hiện tại có ý nghĩa không?
Cảm ơn sự giúp đỡ của bạn!
800 câu trả lời sẽ không cung cấp cho bạn đủ để làm NLP. Bạn nên đọc các câu trả lời theo cách thủ công. Bạn có thể huấn luyện một trình phân loại Bayes ngây thơ với 600, và kiểm tra nó trên 200, nhưng điều đó sẽ giúp bạn có 2 chiều-- và trong khi có thể thực hiện điều này cho nhiều thẻ hơn, bạn sẽ cần nhiều mục hơn. – kreativitea
Nó sẽ giúp nếu bạn nói với chúng tôi là hộp bình luận hoàn toàn freeform, hoặc là có một tập hợp các chủ đề được biết họ sẽ được trên? (hoặc sử dụng clustering để trả lời rằng, hoặc thậm chí chỉ grep cũ đồng bằng, hoặc chỉ là nhãn cầu nó cho mình) – smci