<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">
<HTML><HEAD>
<META http-equiv=Content-Type content="text/html; charset=iso-8859-1">
<META content="MSHTML 6.00.2900.2722" name=GENERATOR>
<STYLE></STYLE>
</HEAD>
<BODY bgColor=#ffffff>
<DIV><FONT face=Arial size=2>Dear all,</FONT></DIV>
<DIV><FONT face=Arial size=2></FONT>&nbsp;</DIV>
<DIV><FONT face=Arial size=2>I am using mpich2 on linux cluster, I kept having 
errors like the following</FONT></DIV>
<DIV><FONT face=Arial size=2></FONT>&nbsp;</DIV>
<DIV><FONT face=Arial size=2>rank 14 in job 2&nbsp; cn128_57798&nbsp;&nbsp; 
caused collective abort of all ranks<BR>&nbsp; exit status of rank 14: killed by 
signal 9<BR></FONT></DIV>
<DIV><FONT face=Arial size=2>or</FONT></DIV>
<DIV><FONT face=Arial size=2></FONT>&nbsp;</DIV>
<DIV><FONT face=Arial size=2>mpdrun_cn145: cannot connect to local mpd 
(/tmp/mpd2.console_lrz); possible causes:<BR>&nbsp; 1. no mpd is running on this 
host<BR>&nbsp; 2. an mpd is running but was started without a "console" (-n 
option)<BR></FONT></DIV>
<DIV><FONT face=Arial size=2>there are 160 nodes on the cluster, I used "mpdboot 
-n -f" to initiate the mpi, and since there are always errors when i tried to 
boot every nodes, so i only defined 64 nodes in&nbsp;mpd.hosts file, and in the 
errors above, I dont have them in the mpd.hosts file or the command where i used 
my application (mpiexec command)</FONT></DIV>
<DIV><FONT face=Arial size=2></FONT>&nbsp;</DIV>
<DIV><FONT face=Arial size=2>does anybody have any experience in this? Thanks a 
lot!</FONT></DIV>
<DIV><FONT face=Arial size=2></FONT>&nbsp;</DIV>
<DIV><FONT face=Arial size=2>Best regards,</FONT></DIV>
<DIV><FONT face=Arial size=2></FONT>&nbsp;</DIV>
<DIV><FONT face=Arial size=2>ruzhen</DIV></FONT></BODY></HTML>