Tôi đang cố gắng viết một cụm từ thông dụng để loại bỏ tất cả HTML ngoại trừ các liên kết (các thẻ <a href
và </a>
tương ứng. Nó không phải an toàn 100% (Tôi không lo lắng về việc tiêm) các cuộc tấn công hoặc bất cứ điều gì như tôi phân tích nội dung đã được phê duyệt và công bố vào một bộ phim SWF).Chặn tất cả các thẻ HTML ngoại trừ các liên kết
"thẻ dải" ban đầu biểu hiện thường xuyên tôi đang sử dụng là <(.|\n)+?>
, và tôi đã cố gắng để sửa đổi nó để <([^a]|\n)+?>
, nhưng tất nhiên, điều đó sẽ cho phép bất kỳ thẻ nào có một số một số trong đó thay vì thẻ có nó ở đầu, với một khoảng trắng.
Không phải là nó thực sự quan trọng, nhưng trong trường hợp bất cứ ai quan tâm để biết tôi viết này trong ActionScript 3.0 cho một bộ phim Flash.
này không làm việc cho tôi với 'sed' ... – Geremia