Tôi muốn viết một chương trình cho GPU (tốt nhất là OpenCL) và một phần lớn của tính toán bao gồm đếm số lượng 1 trong một mảng bit (đóng gói là dài hoặc int).OpenCL: Hướng dẫn popcnt 32 bit và 64 bit trên GPU?
Vì vậy, trên các CPU hiện đại, tôi rõ ràng sẽ chỉ sử dụng lệnh __popcnt nguyên gốc. Tôi đọc trên một số nơi trên internet rằng các GPU hiện đại, hướng dẫn này cũng có mặt trong phần cứng, đó sẽ là một sự tăng tốc rất lớn đối với tôi. (ít nhất là cho 32-bit, không chắc chắn về 64)
Tuy nhiên, tôi không tìm thấy cách nào để hướng dẫn cho chúng tôi. Vì vậy:
1) Tôi nên tìm hiểu xem GPU nào có hướng dẫn này? (Tôi vẫn cần mua GPU của mình, vì vậy nó sẽ là một chiếc cao cấp hiện đại ... có lẽ là Radeon HD7000 series hoặc nVidia Kepler)
2) cách gọi hướng dẫn này từ OpenCL (hoặc ngôn ngữ GPU tương tự) ?