2011-07-09 28 views
5

Tôi đang cố gắng chạy một chương trình MPI đơn giản trên 4 nút. Tôi đang sử dụng OpenMPI 1.4.3 chạy trên Centos 5.5. Khi tôi gửi lệnh MPIRUN với hostfile/machinefile, tôi không nhận được kết quả đầu ra nào, nhận một màn hình trống. Do đó, Tôi phải giết công việc..Lỗi OpenMPI 1.4.3 mpirun hostfile

tôi sử dụng lệnh chạy sau:: mpirun --hostfile hostfile -np 4 new46

OUTPUT ON KILLING JOB: 
mpirun: killing job... 
-------------------------------------------------------------------------- 
    mpirun noticed that the job aborted, but has no info as to the process that caused 
    that situation. 
    -------------------------------------------------------------------------- 
    mpirun was unable to cleanly terminate the daemons on the nodes shown 
    below. Additional manual cleanup may be required - please refer to 
    the "orte-clean" tool for assistance. 
    -------------------------------------------------------------------------- 
    myocyte46 - daemon did not report back when launched 
    myocyte47 - daemon did not report back when launched 
    myocyte49 - daemon did not report back when launched 

Dưới đây là chương trình MPI Tôi cố gắng để thực hiện vào ngày 4 nút

************************** 

    if (my_rank != 0) 
    { 
    sprintf(message, "Greetings from the process %d!", my_rank); 
    dest = 0; 
    MPI_Send(message, strlen(message)+1, MPI_CHAR, dest, tag, MPI_COMM_WORLD); 
    } 
    else 
    { 
    for (source = 1;source < p; source++) 
    { 
    MPI_Recv(message, 100, MPI_CHAR, source, tag, MPI_COMM_WORLD, &status); 
    printf("%s\n", message); 
    } 

    **************************** 

hostfile My trông giống như sau:

[[email protected] ~]$ cat hostfile 
    myocyte46 
    myocyte47 
    myocyte48 
    myocyte49 
    ******************************* 

Tôi đã chạy chương trình MPI ở trên một cách độc lập trên mỗi nút và nó compi dẫn đầu và chạy tốt. Tôi gặp vấn đề này "Daemon đã không báo cáo lại khi khởi chạy" khi tôi sử dụng hostfile. Tôi đang cố gắng tìm ra những gì có thể là vấn đề.

Cảm ơn!

Trả lời

1

Tôi nghĩ rằng những dòng này

myocyte46 - daemon did not report back when launched 

là khá rõ ràng - bạn gặp sự cố hoặc tung ra các daemon mpi hoặc giao tiếp với họ sau đó. Vì vậy, bạn cần phải bắt đầu xem xét kết nối mạng. Bạn có thể ssh mà không cần mật khẩu vào các nút này? Bạn có thể quay lại không? Bỏ qua chương trình MPI, bạn có thể

mpirun -np 4 hostname 

và nhận bất kỳ thứ gì?

+0

Cảm ơn. Có, tôi đã có thể ssh qua lại giữa các nút. Có vẻ như quản trị viên đã rời khỏi tường lửa đang chạy và chuyển xuống dường như hoạt động. Ngoài ra, tôi lưu ý trên một số diễn đàn Linux mà họ đề xuất thêm./etc/bashrc là mục đầu tiên trên hồ sơ bashrc. – Ashmohan