<div class="gmail_quote">On Sat, Dec 31, 2011 at 22:11, Sean Hunt <span dir="ltr"><<a href="mailto:scshunt@csclub.uwaterloo.ca">scshunt@csclub.uwaterloo.ca</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">

Hey folks,<br>
<br>
Attached is a proof of concept for the handling of UTF-8 in<br>
identifiers. Aside from the terrible isIdentifierBody function, which<br>
should be optimized where possible (possibly into a lookup table for<br>
the BMP, since that would be 8kb, and using the simple bitwise<br>
operation in there for other planes), I think the approach is the<br>
correct one. Given that this is sensitive code, however, I would like<br>
to ensure no one has any issues with this approach before I convert<br>
more of the lexer code over.<br>
<span class="HOEnZb"><font color="#888888"><br>
Sean<br>
</font></span></blockquote></div><br>This patch still applies reasonably cleanly; any feedback?<br><br>Sean<br>