thể trùng lặp:
PHP - How to split a paragraph into sentences.biểu hiện thường xuyên cho đếm câu trong một khối văn bản
Tôi có một khối văn bản mà tôi muốn để tách thành câu, những gì sẽ là cách tốt nhất để làm điều này? Tôi đã nghĩ đến việc tìm kiếm '.', '!', '?' nhân vật, nhưng tôi nhận ra có một số vấn đề với điều này, chẳng hạn như khi mọi người sử dụng từ viết tắt, hoặc kết thúc một câu với một cái gì đó như thế nào? Điều gì sẽ là cách tốt nhất để xử lý việc này? Tôi figured sẽ có một số regex có thể xử lý này, nhưng tôi mở cửa cho một giải pháp không regex nếu phù hợp với vấn đề tốt hơn.
Hoặc, khó chịu, bạn có thể nhận được những thứ như '" Bạn có chắc chắn "? anh ta hỏi.' đó là ngữ nghĩa chính xác nhưng nhìn oh quá sai. Ngoài ra, danh từ chứa dấu chấm câu cũng xấu: 'Cái nào? khuyên bạn nên mua .... ' –
Trên thực tế? nên ở bên trong dấu ngoặc kép. –