<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 3.2//EN">
<HTML>
<HEAD>
<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=iso-8859-1">
<META NAME="Generator" CONTENT="MS Exchange Server version 5.5.2650.12">
<TITLE>RE: Why not NT clusters? Need arguments.</TITLE>
</HEAD>
<BODY>

<P><FONT SIZE=2>Nice!&nbsp; This is the type of thing that corporate types need to hear.&nbsp; It is a difficult task to try and convince many managers/supervisors why they should steer away from NT.&nbsp; Microsoft, although they have come up short on enterprise-grade &quot;clusterable&quot; machines, has done a great job of convincing many execs that NT is &quot;good enough&quot;, and attainable.&nbsp; Convincing them otherwise is what you're most likely up against here.</FONT></P>

<P><FONT SIZE=2>Great data and anecdotes is what it's going to take. . . .</FONT>
</P>
<BR>

<P><FONT SIZE=2>Richard Schilling</FONT>
<BR><FONT SIZE=2>Lake Stevens, WA</FONT>
</P>
<BR>

<P><FONT SIZE=2>&gt; -----Original Message-----</FONT>
<BR><FONT SIZE=2>&gt; From: Robert G. Brown [<A HREF="mailto:rgb@phy.duke.edu">mailto:rgb@phy.duke.edu</A>]</FONT>
<BR><FONT SIZE=2>&gt; Sent: Friday, October 06, 2000 1:10 PM</FONT>
<BR><FONT SIZE=2>&gt; To: Dan Yocum</FONT>
<BR><FONT SIZE=2>&gt; Cc: Jon Tegner; beowulf@beowulf.org</FONT>
<BR><FONT SIZE=2>&gt; Subject: Re: Why not NT clusters? Need arguments.</FONT>
<BR><FONT SIZE=2>&gt; </FONT>
<BR><FONT SIZE=2>&gt; </FONT>
<BR><FONT SIZE=2>&gt; On Fri, 6 Oct 2000, Dan Yocum wrote:</FONT>
<BR><FONT SIZE=2>&gt; </FONT>
<BR><FONT SIZE=2>&gt; &gt; Jon Tegner wrote:</FONT>
<BR><FONT SIZE=2>&gt; &gt; &gt; </FONT>
<BR><FONT SIZE=2>&gt; &gt; &gt; In a disussion of clusters I got the question why not </FONT>
<BR><FONT SIZE=2>&gt; using systems</FONT>
<BR><FONT SIZE=2>&gt; &gt; &gt; running microsoft NT. I only came up with cost and stability in a</FONT>
<BR><FONT SIZE=2>&gt; &gt; &gt; sweeping way, and I couldnt present more quantitative </FONT>
<BR><FONT SIZE=2>&gt; arguments. Later,</FONT>
<BR><FONT SIZE=2>&gt; &gt; </FONT>
<BR><FONT SIZE=2>&gt; &gt; </FONT>
<BR><FONT SIZE=2>&gt; &gt; And that wasn't enough?&nbsp; </FONT>
<BR><FONT SIZE=2>&gt; </FONT>
<BR><FONT SIZE=2>&gt; To be more specific, to have a good chance of COMPLETING a longrunning</FONT>
<BR><FONT SIZE=2>&gt; parallel computation on N hosts, it really helps if the probability of</FONT>
<BR><FONT SIZE=2>&gt; single host failure is considerably less than 1/N over the </FONT>
<BR><FONT SIZE=2>&gt; time required</FONT>
<BR><FONT SIZE=2>&gt; for completion.&nbsp; This is extremely quantitative.&nbsp; If you estimate that</FONT>
<BR><FONT SIZE=2>&gt; the mean time between crashes of your NT boxes is ten days, then you</FONT>
<BR><FONT SIZE=2>&gt; typically will almost NEVER complete a computation that runs for a day</FONT>
<BR><FONT SIZE=2>&gt; on 20 boxes.&nbsp; This alone is why you won't see many really big clusters</FONT>
<BR><FONT SIZE=2>&gt; running NT.</FONT>
<BR><FONT SIZE=2>&gt; </FONT>
<BR><FONT SIZE=2>&gt; I've heard anecdotally that an organization has excellently skilled NT</FONT>
<BR><FONT SIZE=2>&gt; people that devote enough time to the project they can tune and</FONT>
<BR><FONT SIZE=2>&gt; configure NT well enough to be stable out at 30-60 days (or even more)</FONT>
<BR><FONT SIZE=2>&gt; and build a workable cluster out of it.&nbsp; This often limits to some</FONT>
<BR><FONT SIZE=2>&gt; extent the applications they'll allow to be run, as some applications</FONT>
<BR><FONT SIZE=2>&gt; are more destabilizing than others.&nbsp; If this point is raised, you can</FONT>
<BR><FONT SIZE=2>&gt; counter that:</FONT>
<BR><FONT SIZE=2>&gt; </FONT>
<BR><FONT SIZE=2>&gt;&nbsp;&nbsp; a) That extra time and skill costs money.&nbsp; Quite a lot of </FONT>
<BR><FONT SIZE=2>&gt; it -- humans</FONT>
<BR><FONT SIZE=2>&gt; are often more expensive than hardware, and really skilled NT SE's are</FONT>
<BR><FONT SIZE=2>&gt; no more common than any other variety, however many &quot;MCSE&quot;'s there are</FONT>
<BR><FONT SIZE=2>&gt; floating around in the world.&nbsp; We all know that one cannot learn to</FONT>
<BR><FONT SIZE=2>&gt; stabilize a complex operating system in a correspondance course or</FONT>
<BR><FONT SIZE=2>&gt; community college type environment.</FONT>
<BR><FONT SIZE=2>&gt; </FONT>
<BR><FONT SIZE=2>&gt;&nbsp;&nbsp; b) Linux is more stable than the most stable NT platforms </FONT>
<BR><FONT SIZE=2>&gt; you're ever</FONT>
<BR><FONT SIZE=2>&gt; likely see right out of the box.&nbsp; The latter 2.2 kernels are </FONT>
<BR><FONT SIZE=2>&gt; simply rock</FONT>
<BR><FONT SIZE=2>&gt; solid on all but a few very rare hardware combinations.&nbsp; It still</FONT>
<BR><FONT SIZE=2>&gt; requires a skilled individual to install and administer it, but</FONT>
<BR><FONT SIZE=2>&gt; stabilizing it isn't rocket science.&nbsp; It also scales very well</FONT>
<BR><FONT SIZE=2>&gt; administratively, especially using tools like kickstart or some of the</FONT>
<BR><FONT SIZE=2>&gt; diskless boot mechanisms described on this list.</FONT>
<BR><FONT SIZE=2>&gt; </FONT>
<BR><FONT SIZE=2>&gt;&nbsp;&nbsp; c) THEN you can point out the hundreds of dollars per platform you</FONT>
<BR><FONT SIZE=2>&gt; save on OS software and other software.&nbsp; This is actually not </FONT>
<BR><FONT SIZE=2>&gt; that much,</FONT>
<BR><FONT SIZE=2>&gt; compared to the human costs, unless you have a lot of platforms -- one</FONT>
<BR><FONT SIZE=2>&gt; reason a lot of institutions might reasonably give for not making a</FONT>
<BR><FONT SIZE=2>&gt; switch.</FONT>
<BR><FONT SIZE=2>&gt; </FONT>
<BR><FONT SIZE=2>&gt; &gt; &gt; I even found that an nt cluster sits on place 207 on the </FONT>
<BR><FONT SIZE=2>&gt; top500 list</FONT>
<BR><FONT SIZE=2>&gt; &gt; &gt; (see <A HREF="http://www.top500.org/lists/TOP500List.php3?Y=2000&M=06" TARGET="_blank">http://www.top500.org/lists/TOP500List.php3?Y=2000&M=06</A>)</FONT>
<BR><FONT SIZE=2>&gt; &gt; &gt; is that an exception, or are there many of these beasts around?</FONT>
<BR><FONT SIZE=2>&gt; &gt; </FONT>
<BR><FONT SIZE=2>&gt; &gt; </FONT>
<BR><FONT SIZE=2>&gt; &gt; Check out how many linux cluster are far above that on the list...</FONT>
<BR><FONT SIZE=2>&gt; &gt; actually, I'm sure you'll find many more Linux clusters </FONT>
<BR><FONT SIZE=2>&gt; there than NT</FONT>
<BR><FONT SIZE=2>&gt; &gt; clusters.</FONT>
<BR><FONT SIZE=2>&gt; </FONT>
<BR><FONT SIZE=2>&gt; The top500 list ranking per se also doesn't address the usability of</FONT>
<BR><FONT SIZE=2>&gt; that cluster.&nbsp; There have been systems on that list before </FONT>
<BR><FONT SIZE=2>&gt; that were so</FONT>
<BR><FONT SIZE=2>&gt; unstable they (according to rumor, anyway) could barely get through</FONT>
<BR><FONT SIZE=2>&gt; benchmarking runs and were used more for computer science (short runs)</FONT>
<BR><FONT SIZE=2>&gt; than for parallel application production (long runs).&nbsp; I </FONT>
<BR><FONT SIZE=2>&gt; don't know what</FONT>
<BR><FONT SIZE=2>&gt; fraction of them were NT systems (if any) but the </FONT>
<BR><FONT SIZE=2>&gt; preponderance of linux</FONT>
<BR><FONT SIZE=2>&gt; is due to its lower cost and higher stability.&nbsp; People &quot;vote&quot; </FONT>
<BR><FONT SIZE=2>&gt; with their</FONT>
<BR><FONT SIZE=2>&gt; purchase decisions, and your people would be most unwise to ignore the</FONT>
<BR><FONT SIZE=2>&gt; wisdom of the masses, especially when the masses who build top500</FONT>
<BR><FONT SIZE=2>&gt; machines in the first place are among the best and brightest (cluster</FONT>
<BR><FONT SIZE=2>&gt; computing) computer people in the world.</FONT>
<BR><FONT SIZE=2>&gt; </FONT>
<BR><FONT SIZE=2>&gt;&nbsp;&nbsp;&nbsp; rgb</FONT>
<BR><FONT SIZE=2>&gt; </FONT>
<BR><FONT SIZE=2>&gt; -- </FONT>
<BR><FONT SIZE=2>&gt; Robert G. Brown&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; </FONT>
<BR><FONT SIZE=2>&gt; <A HREF="http://www.phy.duke.edu/~rgb/" TARGET="_blank">http://www.phy.duke.edu/~rgb/</A></FONT>
<BR><FONT SIZE=2>&gt; Duke University Dept. of </FONT>
<BR><FONT SIZE=2>&gt; Physics, Box 90305</FONT>
<BR><FONT SIZE=2>&gt; Durham, N.C. 27708-0305</FONT>
<BR><FONT SIZE=2>&gt; Phone: 1-919-660-2567&nbsp; Fax: 919-660-2525&nbsp;&nbsp;&nbsp;&nbsp; email:rgb@phy.duke.edu</FONT>
<BR><FONT SIZE=2>&gt; </FONT>
<BR><FONT SIZE=2>&gt; </FONT>
<BR><FONT SIZE=2>&gt; </FONT>
<BR><FONT SIZE=2>&gt; </FONT>
<BR><FONT SIZE=2>&gt; _______________________________________________</FONT>
<BR><FONT SIZE=2>&gt; Beowulf mailing list</FONT>
<BR><FONT SIZE=2>&gt; Beowulf@beowulf.org</FONT>
<BR><FONT SIZE=2>&gt; <A HREF="http://www.beowulf.org/mailman/listinfo/beowulf" TARGET="_blank">http://www.beowulf.org/mailman/listinfo/beowulf</A></FONT>
<BR><FONT SIZE=2>&gt; </FONT>
</P>

</BODY>
</HTML>