Tôi có bộ dữ liệu với hai mảng dữ liệu dài, hoặc tôi có thể tạo một mảng các mục hai mục và tôi muốn tính tương quan và ý nghĩa thống kê được đại diện bởi dữ liệu (có thể tương quan chặt chẽ hoặc có thể không có mối tương quan có ý nghĩa thống kê).Trong Python, làm thế nào tôi có thể tính toán mối tương quan và ý nghĩa thống kê giữa hai mảng dữ liệu?
Tôi đang lập trình bằng Python và đã cài đặt scipy và gọn gàng. Tôi nhìn và tìm thấy Calculating Pearson correlation and significance in Python, nhưng điều đó dường như muốn dữ liệu được thao tác để nó rơi vào một phạm vi được chỉ định.
Cách thích hợp để, tôi giả sử, yêu cầu scipy hoặc gumpy để cho tôi mối tương quan và ý nghĩa thống kê của hai mảng là gì?
Tại sao bạn nghĩ rằng 'scipy.stats.pearsonr' muốn dữ liệu được thao tác vì vậy nó rơi vào một phạm vi nhất định? – ecatmur
Hệ số _correlation_ nằm trong khoảng từ -1 đến +1. Đó là đầu ra, không phải đầu vào. –