Tôi muốn kết hợp một vài số liệu của các nút trong biểu đồ mạng xã hội thành một giá trị duy nhất cho thứ tự sắp xếp các nút:Cách chính xác để chuẩn hóa/chia tỷ lệ/chuẩn hóa nhiều biến sau phân phối pháp luật quyền lực để sử dụng trong kết hợp tuyến tính
in_degree + betweenness_centrality = informal_power_index
vấn đề là in_degree
và betweenness_centrality
được đo trên quy mô khác nhau, nói 0-15 vs 0-35.000 và làm theo một bản phân phối định luật hàm mũ (ít nhất là chắc chắn không phải là phân phối chuẩn)
có một cách tốt để rescale các biến để một w không thống trị người khác trong việc xác định informal_power_index
?
Ba cách tiếp cận rõ ràng là:
- Chuẩn hoá các biến (trừ
mean
và chiastddev
). Điều này dường như nó sẽ đè bẹp phân phối quá nhiều, che giấu sự khác biệt lớn giữa một giá trị ở đuôi dài và một ở gần đỉnh. - Biến tỷ lệ lại thành phạm vi [0,1] bằng cách trừ
min(variable)
và chia chomax(variable)
. Điều này có vẻ gần hơn để khắc phục vấn đề vì nó sẽ không thay đổi hình dạng của bản phân phối, nhưng có lẽ nó sẽ không thực sự giải quyết vấn đề? Đặc biệt, các phương tiện sẽ khác nhau. - Cân bằng phương tiện bằng cách chia từng giá trị cho
mean(variable)
. Điều này sẽ không giải quyết sự khác biệt về tỷ lệ, nhưng có lẽ giá trị trung bình quan trọng hơn cho so sánh?
Bất kỳ ý tưởng nào khác?
Không cách tiếp cận này có cùng vấn đề với phương pháp chuẩn hóa, nó sẽ phân phối phân phối sao cho phần trăm 95 và 99 trông khá gần mặc dù chúng là thế giới ngoài (nghĩ rằng tài khoản ngân hàng của Bill Gate so với ... của tôi!) –
Phương pháp này đặt mọi thứ trong một tỷ lệ phần trăm. Nó không dựa trên cách số lượng lệch khỏi giá trị trung bình. Nhưng, tôi có thể không rõ ràng về bạn phương pháp đó. 2000 đã bị phong toả. Lớn hơn nó là các giá trị duy nhất có thể được tạo ra. – Thad