Tôi cần một khớp như thế này:Đặt hai lá cờ trong Java regex.Pattern
Matcher kuchen = Pattern.compile("gibt es Kuchen in der K\u00FCche",Pattern.CASE_INSENSITIVE).matcher("");
và vấn đề là nó không phải là ASCII đơn giản. Tôi biết rằng trong trường hợp cụ thể này, tôi có thể sử dụng [\ u00FC \ u00DC] cho ü, nhưng tôi cần phải tổng quát hơn một chút (xây dựng regex từ các nhóm đối sánh khác). Vì vậy, theo số javadocs:
Theo mặc định, kết hợp phân biệt chữ hoa chữ thường giả định rằng chỉ các ký tự trong bộ ký tự US-ASCII mới được khớp. Có thể bật tính năng khớp không xác định dạng chữ Unicode bằng cách chỉ định cờ UNICODE_CASE kết hợp với cờ này.
Ai có thể cho tôi biết cách chỉ định hai cờ kết hợp?
Thực tiễn tốt hơn là áp dụng cờ trong chính mẫu đó hoặc sử dụng tham số cờ trong biên dịch như được hiển thị trong câu trả lời của bạn? – Deco
Sử dụng nó như được hiển thị trong câu trả lời :) –
Không bao gồm nó trong mô hình như trong câu trả lời của Joop giữ bất kỳ bất lợi hoặc là nó hoàn toàn ưu tiên? Một chuyên gia tiềm năng để bao gồm nó trong chuỗi mẫu là khả năng chuyển nhượng. Một đồng nghiệp của tôi đã tái sử dụng một trong các chế độ PCRE của tôi mà không đặt cờ không phân biệt chữ hoa chữ thường, điều đó sẽ không thành vấn đề nếu tôi đưa nó vào trong khuôn mẫu. – Deco