Xin lỗi nếu đây là một câu hỏi đơn giản, tôi vẫn còn khá mới mẻ với điều này, nhưng tôi đã dành một lúc để tìm kiếm câu trả lời và không tìm thấy gì cả. Tôi có một danh sách giống như một cái gì đó lộn xộn kinh hoàng này:Trong Python, làm cách nào để xóa khỏi danh sách bất kỳ phần tử nào chứa các loại ký tự nhất định?
['Organization name} ', '> (777) 777-7777} ', ' class="lsn-mB6 adr">1 Address, MA 02114 } ', ' class="lsn-serpListRadius lsn-fr">.2 Miles} MORE INFO YOUR LISTING MAP if (typeof(serps) !== \'undefined\') serps.arrArticleIds.push(\'4603114\'); ', 'Other organization} ', '> (555) 555-5555} ', ' class="lsn-mB6 adr">301 Address, MA 02121 } ', ' class="lsn-serpListRadius lsn-fr">.2 Miles} MORE INFO CLAIM YOUR LISTING MAP if (typeof(serps) !== \'undefined\') serps.arrArticleIds.push(\'4715945\'); ', 'Organization} ']
Và tôi cần phải xử lý nó để HTML.py có thể biến các thông tin trong đó vào một bảng. Đối với một số lý do, HTML.py không thể xử lý các phần tử quái vật (ví dụ: 'class = "lsn-serpListRadius lsn-fr">. 2 Miles} THÊM THÔNG TIN BẢN ĐỒ DANH SÁCH CỦA BẠN nếu (typeof (serps)! == \' undefined \ ') serps.arrArticleIds.push (\' 4603114 \ ');', v.v.) May mắn cho tôi, tôi không thực sự quan tâm đến thông tin trong các yếu tố quái vật và muốn loại bỏ chúng.
Tôi cố gắng viết một regex mà sẽ phù hợp với tất cả hơn hơn hai chữ hoàn toàn mũ từ, để xác định các yếu tố con quái vật, và nhận điều này:
re.compile('[^a-z]*[A-Z][^a-z]*\w{3,}')
Nhưng tôi không biết làm thế nào để áp dụng điều đó để xóa các phần tử chứa các đối sánh với regex đó khỏi danh sách. Làm thế nào tôi sẽ làm điều đó/đó là đúng cách để đi về nó?
Có sự khác biệt về tốc độ giữa hai dòng không? – NumenorForLife