Tôi muốn đếm số lần xuất hiện của một số từ nhất định trong một khung dữ liệu. Tôi biết sử dụng "str.contains"Số lần xuất hiện của các từ nhất định trong khung dữ liệu gấu trúc
a = df2[df2['col1'].str.contains("sample")].groupby('col2').size()
n = a.apply(lambda x: 1).sum()
Hiện tại tôi đang sử dụng mã ở trên. Có phương pháp nào phù hợp với cụm từ thông dụng và nhận số lần xuất hiện không? Trong trường hợp của tôi, tôi có một khung dữ liệu lớn và tôi muốn khớp khoảng 100 chuỗi.
Đây là nhiều neater và có lẽ nhanh hơn, obviating sự cần thiết cho '' get''. –
@Andy Hayden: Cho phép nói rằng tôi muốn đếm 'hello' và 'word' và in '"hello" count = 1', '"word" count = 1'? Tôi có thể làm điều đó trong một dòng mã không? –
Điều gì về 'word_regexs = [r'he ', r'wo']' và sau đó tạo một Series với 'pd.Series ((df.words.str.contains (r) .sum() cho r trong word_regexs), word_regexs, name = 'count') '? –