Câu hỏi phỏng vấn:Thiết kế một thuật toán, tìm từ thường dùng nhất trong sách
Tìm từ thường dùng nhất trong sách.
Ý tưởng của tôi:
Sử dụng bảng băm, di chuyển và đánh dấu bảng băm.
Nếu kích thước của sách được biết, nếu sử dụng bất kỳ từ nào> 50%, hãy bỏ qua bất kỳ từ mới nào trong quá trình truyền tải sau đây và chỉ đếm các từ cũ. Điều gì sẽ xảy ra nếu kích thước sách không xác định?
Đó là thời gian và không gian O (n) và O (n).
Bất kỳ ý tưởng nào tốt hơn?
Cảm ơn
Đã thay đổi thẻ, cho tôi biết nếu không thích hợp. Có vẻ như không phải là một câu hỏi cụ thể về ngôn ngữ. –
Hashing là tốt heuristic, nhưng nó không nhận được câu trả lời chính xác (trong thực tế, hai chuỗi có thể được băm để cùng int) Ngoài ra, nếu bạn muốn tìm từ tần số nhất, tôi nghĩ rằng bạn nên bỏ qua các từ như 'the, sau đó ,. ..' bởi vì họ sẽ có tần suất cao nhất với xác suất cao, nhưng đây không phải là tin tốt để mọi người biết cuốn sách này có 'the' như là từ tần số nhất. –
user1002288, bạn đang nhận được rất nhiều lời khuyên xấu về chủ đề này. Hầu như tất cả các câu trả lời đều đến từ một quan điểm thực tế/thực hiện mà có lẽ không phải là những gì người phỏng vấn đang tìm kiếm. Bạn có thể muốn xem xét điều này từ một quan điểm lý thuyết. Nếu bạn đặt câu hỏi này trên http://cstheory.stackexchange.com/ bạn có thể sẽ nhận được câu trả lời tốt hơn. – Spike