Mã này gần như làm những gì tôi cần nó để ..Python split() mà không cần tháo delimiter
for line in all_lines:
s = line.split('>')
Trừ nó loại bỏ tất cả các '>' delimiters.
Vì vậy,
<html><head>
Hóa vào
['<html','<head']
Có cách nào để sử dụng split() phương pháp nhưng giữ dấu phân cách, thay vì loại bỏ nó?
Với những kết quả này ..
['<html>','<head>']
này không thực sự trả lời câu hỏi của bạn, nhưng nếu bạn đang cố gắng phân tích cú pháp HTML trong Python, tôi khuyên bạn nên [Beautiful Soup] (http://www.crummy.com/software/BeautifulSoup/). –
Xem thêm [Trong Python, làm cách nào để tách một chuỗi và giữ các dấu tách?] (Http://stackoverflow.com/questions/2136556/in-python-how-do-i-split-a-string-and- giữ dấu phân cách). – outis