Phiên bản GNU sed 4.1.5 dường như không thành công với các ký tự quốc tế. Đây là tệp đầu vào của tôi:Tại sao sed thất bại với các ký tự Quốc tế và cách khắc phục?
Gras Och Stenar Trad - Từ Moja đến Minneapolis DVD [G2007DVD] 7812 | X
Gras Och Stenar Trad - Từ Möja đến Minneapolis DVD [G2007DVD] 7812 | Y
(Lưu ý các âm sắc trong dòng thứ hai.)
Và khi tôi làm
sed 's /.* | // '< in
Tôi sẽ chỉ thấy X và Y, vì tôi đã yêu cầu xóa TẤT CẢ ký tự lên đến' | ' và không gian bên ngoài nó. Thay vào đó, tôi nhận được:
X
Gras Och Stenar Trad - Từ M? Y
Tôi biết tôi có thể sử dụng tr để xóa ký tự quốc tế. đầu tiên, nhưng có cách nào để sử dụng sed?
Vấn đề này dường như đã được giải quyết bằng GNU sed (được thử nghiệm trên phiên bản 4.2.2). – sorontar