Trong đoạn mã sau data
là pandas.DataFrame
và indices
là một tập hợp các cột của data
. Sau khi nhóm dữ liệu với groupby
Tôi quan tâm đến các id của các nhóm, nhưng chỉ những người có kích thước lớn hơn một ngưỡng (nói: 3).Nhóm gấu trúc: nhận kích thước của một nhóm biết id của nó (từ .grouper.group_info [0])
group_ids=data.groupby(list(data.columns[list(indices)])).grouper.group_info[0]
Bây giờ, làm cách nào để tìm nhóm nào có kích thước lớn hơn hoặc bằng 3 biết id của nhóm? Tôi chỉ muốn id của các nhóm với một kích thước nhất định.
#TODO: filter out ids from group_ids which correspond to groups with sizes < 3
đây là thách thức truy cập của nhân viên Amazon của Kaggle, phải =)) – herrfz
Vâng, đúng vậy. Đó là một thế giới nhỏ bé, Eriza, phải không? ;) – piokuc