Hi Greg et al,<div><br></div><div>As you say largest known is not largest possible.  Internally within Basho, the largest cluster we've experimented with so far had 50 nodes.</div><div><br></div><div>Going beyond that it's speculation from me about pain points.</div>
<div><br></div><div><div>1) It is true that you need enough file descriptors to start up all partitions when a node restarts - Riak checks if there is any handoff data pending for each partition.  We have work scheduled to address that in the medium term. The plan is to only spin up partitions the node owns and any that have been started as fallbacks that handoff has not completed for. Until that work is done you will need a high ulimit with large ring sizes.</div>
<div><br></div><div>2) It is also true that Erlang runs a fully connected network, so there will be connections between each node pair in the cluster.  We haven't determined the point at which it becomes a problem.</div>
<div><br></div><div>So it looks like you'll be pushing the known limits.  Basho will do our very best to help overcome any obstacles as you encounter them.</div><div><br></div><div>Jon Meredith</div><div>Basho Technologies.</div>
<br><div class="gmail_quote">On Wed, Apr 13, 2011 at 1:41 PM, Greg Nelson <span dir="ltr"><<a href="mailto:grourk@dropcam.com">grourk@dropcam.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;">
<div>
            <div><span>The largest known riak cluster != the largest possible riak cluster.  ;-)</span></div><div><span><br></span></div><div><span>The inter node communication of the cluster depends on the data set and usage pattern, doesn't it?  Or is there some constant overhead that tops out at a few hundred nodes?  I should point out that we'll have big data, but not a huge number of keys.</span></div>
<div><span><br></span></div><div><span>The number of vnodes in the cluster should be equal to the ring_creation_size under normal circumstances, shouldn't it?  So when I have a one node cluster, that node is running ring_creation_size vnodes...  File descriptors probably isn't a problem -- these machines won't be doing anything else, and the limits are set to 65536.</span></div>
<div><span><br></span></div><div><span>Thinking about the internode communication you mentioned, that's probably where the resource hog is..  socket buffers, etc.</span></div><div><span><br></span></div><div><span>Anyway, I'd also love to hear more from basho.  :)<br>

                </span><div class="im">
                <span></span>
                
                <p style="color:#a0a0a0">On Wednesday, April 13, 2011 at 12:33 PM, <a href="mailto:siculars@gmail.com" target="_blank">siculars@gmail.com</a> wrote:</p>
                <blockquote type="cite" style="border-left-style:solid;border-width:1px;margin-left:0px;padding-left:10px">
                    <span><div><div>Ill just chime in and say that this is not practical for a few reasons. The largest known riak cluster has like 50 or 60 nodes. Afaik, inter node communication of erlang clusters top out at a few hundred nodes. I'm also under the impression that each physical node has to have enough file descriptors to accommodate every virtual node in the cluster. <br>
<br>I'd love to hear more from basho. <br><br>-alexander <br><br><br>Sent from my Verizon Wireless BlackBerry<br><br>-----Original Message-----<br>From: Greg Nelson <<a href="mailto:grourk@dropcam.com" target="_blank">grourk@dropcam.com</a>><br>
Sender: <a href="mailto:riak-users-bounces@lists.basho.com" target="_blank">riak-users-bounces@lists.basho.com</a><br>Date: Wed, 13 Apr 2011 12:13:34 <br>To: <<a href="mailto:riak-users@lists.basho.com" target="_blank">riak-users@lists.basho.com</a>><br>
Subject: Large ring_creation_size<br><br>_______________________________________________<br>riak-users mailing list<br><a href="mailto:riak-users@lists.basho.com" target="_blank">riak-users@lists.basho.com</a><br><a href="http://lists.basho.com/mailman/listinfo/riak-users_lists.basho.com" target="_blank">http://lists.basho.com/mailman/listinfo/riak-users_lists.basho.com</a><br>
</div></div></span>
                
                
                
                
                </blockquote>
                
                <div>
                    <br>
                </div>
            </div></div>
        </div><br>_______________________________________________<br>
riak-users mailing list<br>
<a href="mailto:riak-users@lists.basho.com">riak-users@lists.basho.com</a><br>
<a href="http://lists.basho.com/mailman/listinfo/riak-users_lists.basho.com" target="_blank">http://lists.basho.com/mailman/listinfo/riak-users_lists.basho.com</a><br>
<br></blockquote></div><br></div>