Hàm pandas factorize
gán mỗi giá trị duy nhất trong một chuỗi cho một chỉ mục dựa trên 0, và tính chỉ mục mà mỗi mục nhập thuộc về chuỗi đó.hệ số đa cột trong gấu trúc
Tôi muốn hoàn thành tương đương với pandas.factorize
trên nhiều cột:
import pandas as pd
df = pd.DataFrame({'x': [1, 1, 2, 2, 1, 1], 'y':[1, 2, 2, 2, 2, 1]})
pd.factorize(df)[0] # would like [0, 1, 2, 2, 1, 0]
Đó là, tôi muốn xác định mỗi tuple độc đáo của các giá trị trong nhiều cột của một khung dữ liệu, gán một chỉ số tuần tự để và tính toán chỉ mục mỗi hàng trong khung dữ liệu thuộc về.
Factorize
chỉ hoạt động trên các cột đơn lẻ. Có chức năng tương đương đa cột trong gấu trúc không?
kết quả mong muốn của bạn là gì? – waitingkuo
danh sách trong nhận xét - chỉ mục tuần tự duy nhất cho mỗi giá trị khác biệt (x, y) – ChrisB