sse

    7Nhiệt

    1Trả lời

    Tôi đang thực hiện phép nội suy song tuyến trong một vòng lặp chặt chẽ và cố gắng tối ưu hóa nó với SSE, nhưng tôi không tăng tốc từ nó. Đây là mã, phiên bản phi SIMD sử dụng một cấu trúc đơn giản vec

    5Nhiệt

    2Trả lời

    Tôi đã theo dõi lỗi để sử dụng __m128 (vector SSE) dưới dạng giá trị trong std :: unordered_map. Điều này gây ra lỗi phân đoạn thời gian chạy với mingw32 g ++ 4.7.2. Vui lòng xem ví dụ bên dưới. Có lý

    5Nhiệt

    1Trả lời

    Tôi muốn sử dụng lệnh _mm_prefetch. MSDN specifies rằng nó nằm trong tiêu đề mmintrin.h, nhưng không có. Tôi sử dụng Visual Studio 2012.

    5Nhiệt

    1Trả lời

    float a[4] = {1,2,3,4}, b[4] = {4,3,2,1}; uint32_t c[4]; int main() { __m128 pa = _mm_loadu_ps(a); __m128 pb = _mm_loadu_ps(b); __m128 pc = _mm_cmpgt_ps(pa, pb); _mm_storeu_ps

    5Nhiệt

    1Trả lời

    Tôi có thể tạo nhị phân chung cho Mac OS X có chứa hai phiên bản ứng dụng của tôi, phiên bản được biên dịch bằng SSE4.2 và một phiên bản được biên dịch bằng SSE3 không? Trong trường hợp này, tôi sẽ ph

    5Nhiệt

    1Trả lời

    Làm cách nào để SIMID mã hóa sau trong C (sử dụng nội tại SIMD của khóa học)? Tôi đang gặp khó khăn hiểu intrinsics SIMD và điều này sẽ giúp rất nhiều: int sum_naive(int n, int *a) { int sum = 0

    6Nhiệt

    2Trả lời

    Giả sử tôi có một vector 2 yếu tố định nghĩa như sau (bằng cách sử dụng cú pháp GCC cho vectơ đóng gói) // packed vector of 2-elements typedef double v2d __attribute__((vector_size(sizeof(double)*2))

    6Nhiệt

    1Trả lời

    Tôi hiện đang điều tra cách sử dụng Hướng dẫn xử lý văn bản và chuỗi SSE 4.2 STTNI (http://software.intel.com/en-us/articles/xml-parsing-accelerator-with- intel-streaming-simd-extensions-4-intel-sse4

    6Nhiệt

    1Trả lời

    Tôi đang cố gắng trích xuất 4 byte ra khỏi thanh ghi 128 bit một cách hiệu quả. Vấn đề là mỗi giá trị nằm trong 32 bit {120,0,0,0,55,0,0,0,42,0,0,0,120,0,0,0}. Tôi muốn biến đổi 128 bit thành 32 bit t

    6Nhiệt

    1Trả lời

    Trong SSE, nếu tôi có một thanh ghi 128-bit chứa 4 nổi tức A = a b c d ('a','b','c','d' are floats and 'A' is a 128-bit SSE register) và B = e f g h sau đó nếu tôi muốn C = a e b f tôi chỉ đơn g