Hi Elias,<div><br></div><div>I believe this issue is caused by interaction between the JSON extractor and the noop analyzer.<div><br></div><div>The JSON extractor, when it sees multiple fields with the same value, it merges them into a single value separated by a space. (This reflects Search's view that documents are prose.)</div>
<div><br></div><div>Normally, the default analyzer would split on whitespace, but since your schema overrides the field to use the noop analyzer, the value is left untokenized. </div><div><br></div><div>Does that make sense?</div>
<div><br></div><div>Best,</div><div>Rusty</div></div><br><div class="gmail_quote">On Fri, Nov 11, 2011 at 2:21 AM, Elias Levy <span dir="ltr"><<a href="mailto:fearsome.lucidity@gmail.com">fearsome.lucidity@gmail.com</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;">I am seeing some strange someone behavior that maybe someone can explain.  <div><br></div><div>Using a modified default search schema, so that these fields are tokenized using the noop analyzer, if I index something like:<div>

<br></div></div><blockquote style="margin:0 0 0 40px;border:none;padding:0px"><div><div>{"i":{"bg":[{"dnm":"generic"},{"dnm":"onlinegamesfva"},{"dnm":"8ffa6"}]}}</div>

</div></blockquote><div><br></div><div>and I try searching for it with</div><div><br></div><blockquote style="margin:0 0 0 40px;border:none;padding:0px"><div>search-cmd search mybucket i_bg_dnm:'generic'</div>
</blockquote><br>
<div>it finds no matches.</div><div><br></div><div>But if I search for:</div><div><br></div><blockquote style="margin:0 0 0 40px;border:none;padding:0px"><div>search-cmd search mybucket i_bg_dnm:'generic*'</div>
</blockquote><br><div>it finds the document.  </div><div><br></div><div><div>What gives?  Why does the specific match returns no matches but the wild card query does? </div></div><div><br></div><div>Oddly, the output of search-cmd shows:</div>

<div><br></div><blockquote style="margin:0 0 0 40px;border:none;padding:0px"><div><div>index/id: mybucket/mykey2</div></div><div><div><<"i_bg_dnm">> -> <<"generic onlinegamesfva 8ffa6">></div>

</div></blockquote><div><div><br></div><div>which appears to show that the values of key dnm in each dict in the array have been concatenated with spaces in between, which would explain the lack of a exact match, but matches with the wildcard.</div>

<div><br></div><div>The example of indexing dict in an array that Rusty sent in reply to my message on that topic does not show this behavior.  Searching for a specific match returns a result, and searching with a wild card does not show the values of the matching fields in the dicts in the array being concatenated in this way:</div>

<div><br></div></div><blockquote style="margin:0 0 0 40px;border:none;padding:0px"><div><div>search-cmd search mybucket menu_popup_menuitem_value:'Ne*'</div></div><div><br></div><div><div>index/id: mybucket/mykey1</div>

<div><<"menu_popup_menuitem_value">> -> <<"New">></div></div></blockquote><div><div><br></div></div><div><br></div><div><br></div>
<br>_______________________________________________<br>
riak-users mailing list<br>
<a href="mailto:riak-users@lists.basho.com">riak-users@lists.basho.com</a><br>
<a href="http://lists.basho.com/mailman/listinfo/riak-users_lists.basho.com" target="_blank">http://lists.basho.com/mailman/listinfo/riak-users_lists.basho.com</a><br>
<br></blockquote></div><br><br clear="all"><div><br></div>-- <br><span style="font-family:arial, sans-serif;background-color:rgb(255, 255, 255)"><div>Rusty Klophaus (@rustyio)</div><div><span style="font-family:arial, sans-serif;border-collapse:collapse"><font><b>Basho Technologies, Inc.</b></font></span></div>
</span><span style="font-family:arial, sans-serif;background-color:rgb(255, 255, 255)"><a href="http://www.basho.com/" style="color:rgb(51, 51, 51)" target="_blank">www.basho.com</a></span><span style="font-family:arial, sans-serif;background-color:rgb(255, 255, 255)"><div style="color:rgb(51, 51, 51)">
<br></div></span><br>