Tôi đang sử dụng Nokogiri để kéo <h1>
và <title>
thẻ, nhưng tôi gặp khó khăn sau đây:Làm cách nào để phân tích cú pháp và xóa các thẻ meta của URL bằng Nokogiri?
<meta name="description" content="I design and develop websites and applications.">
<meta name="keywords" content="web designer,web developer">
tôi có mã này:
url = 'https://en.wikipedia.org/wiki/Emma_Watson'
page = Nokogiri::HTML(open(url))
puts page.css('title')[0].text puts page.css('h1')[0].text
puts page.css('description')
puts META DESCRIPTION
puts META KEYWORDS
tôi nhìn vào tài liệu và didn' t tìm thấy bất cứ điều gì. Tôi có sử dụng regex để làm điều này không?
Cảm ơn.
cung cấp đầy đủ html .. nhu cầu của bạn chưa rõ ràng .. –
Chỉ cần làm rõ: Nokogiri không thu thập thông tin gì cả. Nó chỉ phân tích cú pháp. Mã của bạn, kết hợp với đá quý như OpenURI và Nokogiri, có bò không. –