simd

    11Nhiệt

    2Trả lời

    Tôi muốn chuyển đổi một mảng các số ngắn chưa ký sang nổi bằng SSE. Giả sử __m128i xVal; // Has 8 16-bit unsigned integers __m128 y1, y2; // 2 xmm registers for 8 float values Tôi muốn 4 uint16 đầ

    10Nhiệt

    2Trả lời

    Tôi cần làm rõ một số. Tôi đang phát triển OpenCL trên máy tính xách tay chạy một GPU nvidia nhỏ (310M). Khi tôi truy vấn thiết bị cho CL_DEVICE_MAX_COMPUTE_UNITS, kết quả là 2. Tôi đọc số nhóm công v

    6Nhiệt

    1Trả lời

    Tên của nội dung gcc đối với việc so sánh __m256 và __m256i (bộ chỉ dẫn AVX) là gì?

    14Nhiệt

    3Trả lời

    Việc thực hiện GCC (4.6+) __builtin_clz là gì? Liệu nó có tương ứng với một số lệnh CPU trên Intel x86_64 (AVX)?

    12Nhiệt

    1Trả lời

    Có cách nào để đẩy số nguyên từ kép được đóng gói từ đăng ký XMM vào ngăn xếp không? và sau đó bật nó lại khi cần thiết? Lý tưởng nhất Tôi đang tìm kiếm một cái gì đó giống như PUSH hoặc POP cho thanh

    6Nhiệt

    1Trả lời

    Tôi đang học cách sử dụng các khả năng SIMD bằng cách viết lại thư viện xử lý hình ảnh cá nhân của mình bằng nội tại vectơ. Một chức năng cơ bản là một đơn giản "mảng +=," tức là void arrayAdd(unsigne

    10Nhiệt

    2Trả lời

    Có cách nào để kiểm tra xem tất cả bit/byte/từ, vv trong biến __m128i là 0 không? Trong ứng dụng của tôi, tôi phải kiểm tra xem tất cả các số nguyên được đóng gói trong một biến __m128i là số không. T

    12Nhiệt

    3Trả lời

    Tôi có một véc-tơ đóng gói gồm bốn giá trị dấu phẩy động 64 bit. Tôi muốn lấy tổng các phần tử của vectơ. Với SSE (và sử dụng phao nổi 32-bit) Tôi chỉ có thể làm như sau: v_sum = _mm_hadd_ps(v_sum, v_

    16Nhiệt

    2Trả lời

    Cách nhân bốn số nguyên 32 bit bằng 4 số nguyên khác? Tôi không tìm thấy bất kỳ hướng dẫn nào có thể thực hiện được.

    17Nhiệt

    4Trả lời

    Khi sử dụng các chỉ lệnh SSE2 như PADDD (tức là, _mm_add_epi32 nội tại), có cách nào để kiểm tra xem có bất kỳ thao tác nào bị tràn không? Tôi nghĩ rằng có thể một lá cờ trên thanh ghi điều khiển MXCS