<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 3.2//EN">
<HTML>
<HEAD>
<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=iso-8859-1">
<META NAME="Generator" CONTENT="MS Exchange Server version 5.5.2650.12">
<TITLE>RE: Why not NT clusters? Need arguments.</TITLE>
</HEAD>
<BODY>

<P><FONT SIZE=2>O.K. Let's try this again . . . let me rephrase my original message so that I don't get misunderstood:</FONT>
</P>

<P><FONT SIZE=2>NT sucks as a platform upon which to build distributed processing architectures such as a beowulf class machine.&nbsp; It's nice to see some strong data to support that because convincing people in an organization to steer away from it is difficult.&nbsp; For example, our software vendors and administrators &quot;bought into&quot; the Windows platform and NT because of marketing . . . and we live with the shortcommings of the platform.</FONT></P>

<P><FONT SIZE=2>The unfortunate situation is that many business execs have bought into NT so far that it's really expensive for them to switch.</FONT></P>

<P><FONT SIZE=2>I cringe whenever I hear about a company's &quot;clustered NT software&quot;.&nbsp; I achieved more parallelism as an undergraduate using a Parallaxis virtual machine!&nbsp; </FONT></P>

<P><FONT SIZE=2>Does that help?</FONT>
</P>
<BR>

<P><FONT SIZE=2>Let me add to that:</FONT>
</P>

<P><FONT SIZE=2>1) Developing even simple parallel processing software, (e.g. PVM library) for NT can easily become futile, because Microsoft routinely changes system services so that you have to rewrite your code whenever &quot;new functionality&quot; comes out.</FONT></P>

<P><FONT SIZE=2>2) The &quot;service packs&quot; for NT usually introduce problems for NT applications - especially when you have several applications (all built by different) vendors running on the same machine.&nbsp; Really difficult to manage multiple products when a service pack causes some products to fail.</FONT></P>

<P><FONT SIZE=2>3) Much credit goes to Dave Cutler and crew from Digital, who helped build NT with some of Digital's OS technology.&nbsp; But, the system has fallen to cheap marketing ploys - not much substance there, folks.</FONT></P>

<P><FONT SIZE=2>4) Robert is correct about the fact that NT &quot;clustering&quot; products are merely a clever approach to backup applications: if one box fails, the other picks up the slack.&nbsp; A far cry from the massively parallel computations that beowulf class machines promise (and are producing).</FONT></P>
<BR>

<P><FONT SIZE=2>Richard Schilling</FONT>
</P>
<BR>

<P><FONT SIZE=2>&gt; -----Original Message-----</FONT>
<BR><FONT SIZE=2>&gt; From: Robert G. Brown [<A HREF="mailto:rgb@phy.duke.edu">mailto:rgb@phy.duke.edu</A>]</FONT>
<BR><FONT SIZE=2>&gt; Sent: Friday, October 06, 2000 4:31 PM</FONT>
<BR><FONT SIZE=2>&gt; To: Schilling, Richard</FONT>
<BR><FONT SIZE=2>&gt; Cc: 'beowulf@beowulf.org'</FONT>
<BR><FONT SIZE=2>&gt; Subject: RE: Why not NT clusters? Need arguments.</FONT>
<BR><FONT SIZE=2>&gt; </FONT>
<BR><FONT SIZE=2>&gt; </FONT>
<BR><FONT SIZE=2>&gt; On Fri, 6 Oct 2000, Schilling, Richard wrote:</FONT>
<BR><FONT SIZE=2>&gt; </FONT>
<BR><FONT SIZE=2>&gt; &gt; Nice!&nbsp; This is the type of thing that corporate types need </FONT>
<BR><FONT SIZE=2>&gt; to hear.&nbsp; It is a</FONT>
<BR><FONT SIZE=2>&gt; &gt; difficult task to try and convince many </FONT>
<BR><FONT SIZE=2>&gt; managers/supervisors why they should</FONT>
<BR><FONT SIZE=2>&gt; &gt; steer away from NT.&nbsp; Microsoft, although they have come up short on</FONT>
<BR><FONT SIZE=2>&gt; &gt; enterprise-grade &quot;clusterable&quot; machines, has done a great </FONT>
<BR><FONT SIZE=2>&gt; job of convincing</FONT>
<BR><FONT SIZE=2>&gt; &gt; many execs that NT is &quot;good enough&quot;, and attainable.&nbsp; </FONT>
<BR><FONT SIZE=2>&gt; Convincing them</FONT>
<BR><FONT SIZE=2>&gt; &gt; otherwise is what you're most likely up against here.</FONT>
<BR><FONT SIZE=2>&gt; &gt; </FONT>
<BR><FONT SIZE=2>&gt; &gt; Great data and anecdotes is what it's going to take. . . .</FONT>
<BR><FONT SIZE=2>&gt; &gt; </FONT>
<BR><FONT SIZE=2>&gt; &gt; </FONT>
<BR><FONT SIZE=2>&gt; &gt; Richard Schilling</FONT>
<BR><FONT SIZE=2>&gt; &gt; Lake Stevens, WA</FONT>
<BR><FONT SIZE=2>&gt; </FONT>
<BR><FONT SIZE=2>&gt; You have to be careful here.&nbsp; I know that you understand the implied</FONT>
<BR><FONT SIZE=2>&gt; meaning of &quot;clusterable&quot; because you've been on the list a fair while</FONT>
<BR><FONT SIZE=2>&gt; but I'm a bit uncomfortable with the use of the word </FONT>
<BR><FONT SIZE=2>&gt; &quot;cluster&quot; as it has</FONT>
<BR><FONT SIZE=2>&gt; been used in the thread so far.&nbsp; As Greg Lindahl (IIRC) </FONT>
<BR><FONT SIZE=2>&gt; pointed out in a</FONT>
<BR><FONT SIZE=2>&gt; recent relevant thread, &quot;clustering&quot; means different things </FONT>
<BR><FONT SIZE=2>&gt; to different</FONT>
<BR><FONT SIZE=2>&gt; people.&nbsp; NT does support some very (again anecdotally, as I personally</FONT>
<BR><FONT SIZE=2>&gt; would rather have my teeth drilled with an almost discharged</FONT>
<BR><FONT SIZE=2>&gt; Black&amp;Decker rechargable drill and a dull bit than work with any MS</FONT>
<BR><FONT SIZE=2>&gt; product including NT) nicely implemented failover solutions </FONT>
<BR><FONT SIZE=2>&gt; -- the kind</FONT>
<BR><FONT SIZE=2>&gt; of application where you can run the application in a distributed/load</FONT>
<BR><FONT SIZE=2>&gt; balanced mode and yank the plug on a box and have the application keep</FONT>
<BR><FONT SIZE=2>&gt; ticking.</FONT>
<BR><FONT SIZE=2>&gt; </FONT>
<BR><FONT SIZE=2>&gt; This is very different from the kind of parallel application I was</FONT>
<BR><FONT SIZE=2>&gt; describing (with Greg Warnes inestimable detailed quantitative help:-)</FONT>
<BR><FONT SIZE=2>&gt; in my previous response, the kind that is generally discussed on this</FONT>
<BR><FONT SIZE=2>&gt; list.&nbsp; It is still useful to differentiate the two in discussions with</FONT>
<BR><FONT SIZE=2>&gt; corporate managers to avoid being trumped by MS sales reps.&nbsp; If your</FONT>
<BR><FONT SIZE=2>&gt; job/application is computationally intensive, moderately </FONT>
<BR><FONT SIZE=2>&gt; tightly coupled</FONT>
<BR><FONT SIZE=2>&gt; (enough so that node failure causes failure of the job) and </FONT>
<BR><FONT SIZE=2>&gt; distributed,</FONT>
<BR><FONT SIZE=2>&gt; then stability becomes a critical issue unless you REALLY spend</FONT>
<BR><FONT SIZE=2>&gt; money/time to make your application robust to node failure.&nbsp; If your</FONT>
<BR><FONT SIZE=2>&gt; application is something like a distributed web server or DB server or</FONT>
<BR><FONT SIZE=2>&gt; transaction processor, the SOFTWARE is often loosely coupled </FONT>
<BR><FONT SIZE=2>&gt; and written</FONT>
<BR><FONT SIZE=2>&gt; to be robust against node failure (however expensive and </FONT>
<BR><FONT SIZE=2>&gt; difficult that</FONT>
<BR><FONT SIZE=2>&gt; was originally to accomplish).&nbsp; There is NT software that is indeed</FONT>
<BR><FONT SIZE=2>&gt; robust in this way.&nbsp; </FONT>
<BR><FONT SIZE=2>&gt; </FONT>
<BR><FONT SIZE=2>&gt; Linux is just beginning to come up with failover-toughened OS variants</FONT>
<BR><FONT SIZE=2>&gt; (e.g. Turbolinux and some variants of Red Hat) and associated</FONT>
<BR><FONT SIZE=2>&gt; applications.&nbsp; There's money there (Turbolinux is easily one </FONT>
<BR><FONT SIZE=2>&gt; of the most</FONT>
<BR><FONT SIZE=2>&gt; expensive box-set linuxes) and there will be more there, but </FONT>
<BR><FONT SIZE=2>&gt; this isn't</FONT>
<BR><FONT SIZE=2>&gt; really a traditional forte of Linux.&nbsp; Part of this is pure economics.</FONT>
<BR><FONT SIZE=2>&gt; Failover robustness is a pain in the ass to accomplish and it </FONT>
<BR><FONT SIZE=2>&gt; requires a</FONT>
<BR><FONT SIZE=2>&gt; lot of real work and investment to accomplish it.&nbsp; Folks </FONT>
<BR><FONT SIZE=2>&gt; don't even try</FONT>
<BR><FONT SIZE=2>&gt; unless real money is at stake, and up to a couple of years </FONT>
<BR><FONT SIZE=2>&gt; ago there was</FONT>
<BR><FONT SIZE=2>&gt; little or no &quot;real money&quot; in Linux.&nbsp; This is also </FONT>
<BR><FONT SIZE=2>&gt; (incidentally) one of</FONT>
<BR><FONT SIZE=2>&gt; the differentiating features of Extreme Linux vs Beowulfery.&nbsp; Extreme</FONT>
<BR><FONT SIZE=2>&gt; includes both beowulfery and failover clustering and other exotic</FONT>
<BR><FONT SIZE=2>&gt; clustering or non-clustering applications of linux and exists </FONT>
<BR><FONT SIZE=2>&gt; in part to</FONT>
<BR><FONT SIZE=2>&gt; foster the development of those applications.&nbsp; Beowulfery, as Greg L.</FONT>
<BR><FONT SIZE=2>&gt; recently pointed out, is basically high &gt;&gt;performance&lt;&lt; (as opposed to</FONT>
<BR><FONT SIZE=2>&gt; high reliability) computing on COTS Linux clusters.&nbsp; It is thus the</FONT>
<BR><FONT SIZE=2>&gt; best-known subset of the Extreme, but the two are not identical.</FONT>
<BR><FONT SIZE=2>&gt; </FONT>
<BR><FONT SIZE=2>&gt; A useful rule of thumb is that if you are rolling the parallel/cluster</FONT>
<BR><FONT SIZE=2>&gt; application yourself it is almost certainly not failover </FONT>
<BR><FONT SIZE=2>&gt; robust (unless</FONT>
<BR><FONT SIZE=2>&gt; you work quite hard and expensively to make it so) and NT </FONT>
<BR><FONT SIZE=2>&gt; will be a poor</FONT>
<BR><FONT SIZE=2>&gt; choice if it also runs for long times.&nbsp; Actually, NT is </FONT>
<BR><FONT SIZE=2>&gt; probably a poor</FONT>
<BR><FONT SIZE=2>&gt; choice for lots of reasons, only one of which is the robustness of the</FONT>
<BR><FONT SIZE=2>&gt; application.&nbsp; I personally would not like to develop a parallel</FONT>
<BR><FONT SIZE=2>&gt; application on an NT cluster because all my favorite tools are missing</FONT>
<BR><FONT SIZE=2>&gt; and all the tools available cost a lot of money and are highly</FONT>
<BR><FONT SIZE=2>&gt; nonstandard (unless you view MS's efforts in code development software</FONT>
<BR><FONT SIZE=2>&gt; &quot;standard&quot;).</FONT>
<BR><FONT SIZE=2>&gt; </FONT>
<BR><FONT SIZE=2>&gt; If somebody else wrote it and made it robust against node </FONT>
<BR><FONT SIZE=2>&gt; failure, then</FONT>
<BR><FONT SIZE=2>&gt; it is a pure cost-benefit issue.&nbsp; If you have a choice (e.g. the</FONT>
<BR><FONT SIZE=2>&gt; application is available for both linux and NT) compare the </FONT>
<BR><FONT SIZE=2>&gt; costs of the</FONT>
<BR><FONT SIZE=2>&gt; application, the OS, and the admin staff for the two choices, </FONT>
<BR><FONT SIZE=2>&gt; since the</FONT>
<BR><FONT SIZE=2>&gt; failover engineering insulates you from NT's instability (in </FONT>
<BR><FONT SIZE=2>&gt; principle).</FONT>
<BR><FONT SIZE=2>&gt; You'll still almost always find the linux solution to be the </FONT>
<BR><FONT SIZE=2>&gt; cheaper one</FONT>
<BR><FONT SIZE=2>&gt; if it exists.</FONT>
<BR><FONT SIZE=2>&gt; </FONT>
<BR><FONT SIZE=2>&gt; In other cases (where maybe somebody else wrote it, but it </FONT>
<BR><FONT SIZE=2>&gt; isn't robust</FONT>
<BR><FONT SIZE=2>&gt; against node failure) you have to think a bit, but linux is </FONT>
<BR><FONT SIZE=2>&gt; still likely</FONT>
<BR><FONT SIZE=2>&gt; to be the best choice if a linux-based version of the application is</FONT>
<BR><FONT SIZE=2>&gt; available, because literally everything is cheaper and more </FONT>
<BR><FONT SIZE=2>&gt; stable with</FONT>
<BR><FONT SIZE=2>&gt; linux than with NT.&nbsp; </FONT>
<BR><FONT SIZE=2>&gt; </FONT>
<BR><FONT SIZE=2>&gt; We seem to find a theme here that is worth repeating -- Linux </FONT>
<BR><FONT SIZE=2>&gt; is across</FONT>
<BR><FONT SIZE=2>&gt; the board far cheaper than NT and is generally far more stable and</FONT>
<BR><FONT SIZE=2>&gt; robust at the OS level.&nbsp; Only if a particular clustering </FONT>
<BR><FONT SIZE=2>&gt; application is</FONT>
<BR><FONT SIZE=2>&gt; available only for NT, or if an organization is rich in NT experts so</FONT>
<BR><FONT SIZE=2>&gt; that there are really significant personnel costs associated with</FONT>
<BR><FONT SIZE=2>&gt; conversion is a deliberate selection of NT over Linux still </FONT>
<BR><FONT SIZE=2>&gt; worthwhile.</FONT>
<BR><FONT SIZE=2>&gt; </FONT>
<BR><FONT SIZE=2>&gt; This can happen and will continue to happen as long as there are niche</FONT>
<BR><FONT SIZE=2>&gt; products that &quot;only&quot; run on NT and as long as there are organizations</FONT>
<BR><FONT SIZE=2>&gt; with a stong core NT staff (and significant capital </FONT>
<BR><FONT SIZE=2>&gt; investment in those</FONT>
<BR><FONT SIZE=2>&gt; individuals).</FONT>
<BR><FONT SIZE=2>&gt; </FONT>
<BR><FONT SIZE=2>&gt; Also, much as I personally dislike MS, there are a few arenas where</FONT>
<BR><FONT SIZE=2>&gt; their products enjoy a decent reputation that isn't wholly </FONT>
<BR><FONT SIZE=2>&gt; ill-deserved.</FONT>
<BR><FONT SIZE=2>&gt; They just tend to be expensive (and hence cost-benefit </FONT>
<BR><FONT SIZE=2>&gt; losers) and very,</FONT>
<BR><FONT SIZE=2>&gt; very proprietary so that committing to them is like getting married to</FONT>
<BR><FONT SIZE=2>&gt; somebody glamourous and expensive to keep that you aren't at all sure</FONT>
<BR><FONT SIZE=2>&gt; that you really like.&nbsp; Sure they're attractive and even good </FONT>
<BR><FONT SIZE=2>&gt; in bed, but</FONT>
<BR><FONT SIZE=2>&gt; somehow you know that eventually, you're gonna pay for it...</FONT>
<BR><FONT SIZE=2>&gt; </FONT>
<BR><FONT SIZE=2>&gt;&nbsp;&nbsp;&nbsp; rgb</FONT>
<BR><FONT SIZE=2>&gt; </FONT>
<BR><FONT SIZE=2>&gt; [P.C.-P.S.: Please note that the previous analogy, however tasteless,</FONT>
<BR><FONT SIZE=2>&gt; wasn't a &lt;it&gt;sexist&lt;/it&gt; analogy.&nbsp; I didn't specify whether the</FONT>
<BR><FONT SIZE=2>&gt; individual(s) involved were male, female, neither or both.&nbsp; I </FONT>
<BR><FONT SIZE=2>&gt; think that</FONT>
<BR><FONT SIZE=2>&gt; the experience of marrying the personality disordered but momentarily</FONT>
<BR><FONT SIZE=2>&gt; &quot;beautiful/handsome/available&quot; when one doesn't really like them and</FONT>
<BR><FONT SIZE=2>&gt; eventually discovering one's horrible mistake probably occurs on the</FONT>
<BR><FONT SIZE=2>&gt; planet of a distant star where the creatures that are mating have six</FONT>
<BR><FONT SIZE=2>&gt; sexes.&nbsp; Or even just one, in the case of a highly narcissistic (but</FONT>
<BR><FONT SIZE=2>&gt; evolved) species of yeast...;-)]</FONT>
<BR><FONT SIZE=2>&gt; </FONT>
<BR><FONT SIZE=2>&gt; -- </FONT>
<BR><FONT SIZE=2>&gt; Robert G. Brown&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; </FONT>
<BR><FONT SIZE=2>&gt; <A HREF="http://www.phy.duke.edu/~rgb/" TARGET="_blank">http://www.phy.duke.edu/~rgb/</A></FONT>
<BR><FONT SIZE=2>&gt; Duke University Dept. of </FONT>
<BR><FONT SIZE=2>&gt; Physics, Box 90305</FONT>
<BR><FONT SIZE=2>&gt; Durham, N.C. 27708-0305</FONT>
<BR><FONT SIZE=2>&gt; Phone: 1-919-660-2567&nbsp; Fax: 919-660-2525&nbsp;&nbsp;&nbsp;&nbsp; email:rgb@phy.duke.edu</FONT>
<BR><FONT SIZE=2>&gt; </FONT>
<BR><FONT SIZE=2>&gt; </FONT>
<BR><FONT SIZE=2>&gt; </FONT>
<BR><FONT SIZE=2>&gt; </FONT>
<BR><FONT SIZE=2>&gt; _______________________________________________</FONT>
<BR><FONT SIZE=2>&gt; Beowulf mailing list</FONT>
<BR><FONT SIZE=2>&gt; Beowulf@beowulf.org</FONT>
<BR><FONT SIZE=2>&gt; <A HREF="http://www.beowulf.org/mailman/listinfo/beowulf" TARGET="_blank">http://www.beowulf.org/mailman/listinfo/beowulf</A></FONT>
<BR><FONT SIZE=2>&gt; </FONT>
</P>

</BODY>
</HTML>