Tôi đang sử dụng phương pháp sau để gỡ bỏ tất cả html từ chuỗi:HTMLagilitypack không xóa tất cả các thẻ html Làm thế nào tôi có thể giải quyết vấn đề này một cách hiệu quả?
public static string StripHtmlTags(string html)
{
if (String.IsNullOrEmpty(html)) return "";
HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();
doc.LoadHtml(html);
return doc.DocumentNode.InnerText;
}
Nhưng nó dường như bỏ qua thẻ sau này: […]
Vì vậy, chuỗi trả về cơ bản:
> A hungry thief who stole a rack of pork ribs from a grocery store has
> been sentenced to spend 50 years in prison. Willie Smith Ward felt the
> full force of the law after being convicted of the crime in Waco,
> Texas, on Wednesday. The 43-year-old may feel slightly aggrieved over
> the severity of the […]
thế nào có thể Tôi đảm bảo rằng các loại thẻ này bị tước bỏ?
Bất kỳ loại trợ giúp nào đều được đánh giá cao, cảm ơn.
'… 'không là một thẻ HTML. Thẻ có dấu ngoặc nhọn. Đây là thực thể được mã hóa. – jessehouwing