Có cách nào trên các thiết bị CUDA 2.0 để vô hiệu hóa bộ đệm L1 chỉ cho một biến cụ thể không? Tôi biết rằng người ta có thể vô hiệu hóa bộ nhớ cache L1 tại thời gian biên dịch thêm cờ -Xptxas -dlcm=cg
đến nvcc
cho tất cả các hoạt động bộ nhớ. Tuy nhiên, tôi muốn vô hiệu hóa bộ nhớ cache chỉ cho bộ nhớ đọc trên một biến toàn cầu cụ thể để tất cả phần còn lại của bộ nhớ đọc để đi qua bộ đệm L1.CUDA chỉ tắt bộ đệm L1 cho một biến
Dựa trên tìm kiếm tôi đã thực hiện trên web, giải pháp có thể là thông qua mã lắp ráp PTX.
Cảm ơn! Đó là làm việc tuyệt vời! – zeus2
@Reguj, điều này không được cung cấp bởi tiêu đề của NVIDIA ở bất kỳ đâu? – einpoklum
[this] (https://nvlabs.github.io/cub/classcub_1_1_cache_modified_input_iterator.html#details) có thể được quan tâm –