then why not just run vm&#39;s on the host. also then in that case would it be possible to point pxe and tell it when booting the nodes which image to use?<br><br><div class="gmail_quote">On Fri, Jan 29, 2010 at 10:55 PM, Ashley Pittman <span dir="ltr">&lt;<a href="mailto:ashley@pittman.co.uk">ashley@pittman.co.uk</a>&gt;</span> wrote:<br>

<blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;"><br>
On 26 Jan 2010, at 19:37, Paul Van Allsburg wrote:<br>
&gt; Ashley Pittman wrote:<br>
&gt;&gt; On 25 Jan 2010, at 15:28, Jonathan Aquilina wrote:<br>
&gt;&gt;&gt; has anyone tried clustering using xen based vm&#39;s. what is everyones take on that? its something that popped into my head while in my lectures today.<br>
&gt;&gt;&gt;<br>
&gt;&gt;<br>
&gt;&gt; I&#39;ve been using Amazon ec2 for clustering for months now, from a software perspective it&#39;s very similar to running real hardware.  For my needs (development) it&#39;s perfectly adequate, I&#39;ve not benchmarked it against running the same code on the raw hardware though.<br>


&gt;<br>
&gt; I&#39;d love to try clustering on Amazon.<br>
<br>
It&#39;s really easy.<br>
<br>
&gt; Is there a good writeup somewhere on how to configure &amp; use mpi in the cloud?<br>
<br>
<br>
I&#39;m not sure one is needed.  As a bit of background I develop and support an open source debugging tool for parallel applications (see my sig for details), as such I run a lot of parallel apps but I run them purely to have something to test padb against hence I&#39;m not bothered about performance, I just need a running job to interrogate.  What is important for me (or rather my tool) is that it works in different environments so I run with a variety of clustering software.<br>


<br>
With Amazon I can boot any numbers of machine &quot;instances&quot; and pay $0.85c/h for each one, typically I run four at a time but I&#39;ve run with up to twenty.  Once the instances are booted there is no difference between using them and using real machines.  I regularly use Slurm, OpenMPI (ORTE and under Slurm), MPICH2 (mpd, hydra and under slurm) and I&#39;ve yet to find any way in which the setup differs from running on real metal.  For persistent storage I pay for a &#39;EBS&#39; volume which I attach to one vm and nfs export to the others which use as a shared /home, each instance also comes with a large scratch partition but I typically don&#39;t use this at all.  I have a bunch of scripts for populating the hosts files and adding user accounts and that&#39;s all there is to it.  For the EBS volume you simply pick the size you need, create the volume, attach it to a vm and them mkfs.ext3 as normal, this volume is persistent and is charged for by Gb by calendar month rather than instance hour.<br>


<br>
I can also choose what distro and indeed OS to run, the default is FC8 but it&#39;s easy enough to pick something else, I tend to flip between FC8, debian and Solaris every few weeks, this is mostly to ensure my code is well tested in different machines - it does mean re-compiling everything each time I switch which can take a while.<br>


<br>
I also noticed that over-committing virtual machines doesn&#39;t have the same negative impact as over-commiting the CPU&#39;s on virtual machines, sure the application performance plummets in either case but the virtual machine is still usable where as a real machine can stop responding almost completely.  This means I can over-commit my vm&#39;s by running 32 procs per node and run 512 process jobs at a cost of only $1.36 an hour.  Cheap enough to be able to try something, see if it works and not have to worry about the cost.<br>


<br>
In short, Amazon makes a really good development or test system for small scale clusters, it&#39;s good for testing code correctness and experimenting with different distos.  I&#39;m not convinced about the performance and I&#39;m not convinced about the cost effectiveness or larger or longer running applications but as a place to start it&#39;s ideal.<br>


<br>
Ashley,<br>
<font color="#888888"><br>
--<br>
<br>
Ashley Pittman, Bath, UK.<br>
<br>
Padb - A parallel job inspection tool for cluster computing<br>
<a href="http://padb.pittman.org.uk" target="_blank">http://padb.pittman.org.uk</a><br>
</font><div><div></div><div class="h5"><br>
<br>
_______________________________________________<br>
Beowulf mailing list, <a href="mailto:Beowulf@beowulf.org">Beowulf@beowulf.org</a> sponsored by Penguin Computing<br>
To change your subscription (digest mode or unsubscribe) visit <a href="http://www.beowulf.org/mailman/listinfo/beowulf" target="_blank">http://www.beowulf.org/mailman/listinfo/beowulf</a><br>
</div></div></blockquote></div><br><br clear="all"><br>-- <br>Jonathan Aquilina<br>