Từ data.table
dẫn sử dụng:lý do tại sao "nhân vật thường được ưu tiên yếu tố" trong data.table cho khóa?
Trong thực tế, chúng tôi thích nó rất nhiều mà data.table chứa một loại đếm thuật toán cho vectơ nhân vật sử dụng nội bộ chuỗi toàn cầu bộ nhớ cache R. Điều này đặc biệt nhanh đối với các vectơ ký tự chứa nhiều các bản sao, chẳng hạn như dữ liệu được nhóm trong cột khóa. Điều này có nghĩa là ký tự thường được ưu tiên hơn. Các yếu tố vẫn còn đầy đủ được hỗ trợ, trong các yếu tố đặt hàng cụ thể (trong đó các cấp không nằm trong số thứ tự chữ cái).
Không phải là factor
chỉ là số nguyên cần dễ dàng hơn để làm counting sort
hơn character
?
Tôi nghĩ rằng điều này có thể giúp đỡ từ Data.table FAQ 2.17 'Vì bộ đệm chuỗi toàn cục được thêm vào R, các ký tự là một con trỏ tới bộ nhớ đệm đơn. chuỗi và không còn hiệu suất của việc coverting thành yếu tố' nữa. – agstudy