<div dir="ltr"><div class="gmail_extra"><div class="gmail_quote">On Thu, Nov 28, 2013 at 12:32 PM, Alp Toker <span dir="ltr"><<a href="mailto:alp@nuanti.com" target="_blank">alp@nuanti.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
So, I think XML is just the wrong format to use here. There have been various XML implementations in LLVM and they all started like this, then went downhill as the need for more entity escaping rules came up until finally getting removed.<br>

<br>
clang-format deals primarily with whitespace, and that's ironically one of the hardest things to preserve effectively in XML.<br>
<br>
How about getting clang-format to generate an edit script? They're dead simple to generate in C++, easy to parse in C#, and can be applied with standard tools like ed or diffutils for testing. No escaping needed.<br>

<br>
Alternatively, could expose a libFormat entry point, deploy as a DLL and P/Invoke it directly from the VS extension.<br>
<br>
I can help out with either of these -- let's put an end to "XML" implementations in clang :-)<br></blockquote><div><br></div><div>I would also have preferred to not to produce XML in clang-format. Note that it was not done for VS, but for the Eclipse integration.</div>
<div><br></div><div>I read up on the XML spec, and whitespace doesn't seem hard to preserve here - an XML implementation must provide all whitespace as-is; the one problem is that the XML spec actually enforces normalization of newlines to \n before parsing, which makes it look like this is the only XML specific thing we need.</div>
<div><br></div><div>Cheers,</div><div>/Manuel</div><div> </div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<br>
Alp.<div><div class="h5"><br>
<br>
<br>
<br>
On 28/11/2013 10:36, Manuel Klimek wrote:<br>
</div></div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div><div class="h5">
Index: tools/clang-format/<u></u>ClangFormat.cpp<br>
==============================<u></u>==============================<u></u>=======<br>
--- tools/clang-format/<u></u>ClangFormat.cpp  (revision 195826)<br>
+++ tools/clang-format/<u></u>ClangFormat.cpp  (working copy)<br>
@@ -173,6 +173,27 @@<br>
   return false;<br>
 }<br>
+static void outputReplacementXML(StringRef Text) {<br>
+  const char *Data = Text.data();<br>
<br>
There's usually no need to go back to raw char *'s when you have StringRef's (they kinda replace raw char *s).<br>
<br>
+  size_t From = 0;<br>
<br>
Any reason to have different types for From and Index?<br>
<br>
+  StringRef::size_type Index;<br>
+  while ((Index = Text.find_first_of("\n\r", From)) != StringRef::npos) {<br>
+    llvm::outs().write(Data + From, Index - From);<br>
<br>
llvm::outs() << Text.substr(From, Index - From);<br>
<br>
+    switch (Data[Index]) {<br>
+    case '\n':<br>
+      llvm::outs() << "&#10;";<br>
+      break;<br>
+    case '\r':<br>
+      llvm::outs() << "&#13;";<br>
+      break;<br>
+    default:<br>
+      llvm::errs() << "error: unexpected character encountered\n";<br>
<br>
As this would be a logic error, I'd use llvm_unreachable(...);<br>
<br>
+    }<br>
+    From = Index + 1;<br>
+  }<br>
+  llvm::outs().write(Data + From, Text.size() - From);<br>
<br>
llvm::outs() << Text.substr(From);<br>
<br>
+}<br>
+<br>
 // Returns true on error.<br>
 static bool format(StringRef FileName) {<br>
   FileManager Files((FileSystemOptions()));<br>
@@ -205,8 +226,9 @@<br>
          I != E; ++I) {<br>
       llvm::outs() << "<replacement "<br>
                    << "offset='" << I->getOffset() << "' "<br>
-                   << "length='" << I->getLength() << "'>"<br>
-                   << I->getReplacementText() << "</replacement>\n";<br>
+                   << "length='" << I->getLength() << "'>";<br>
+      outputReplacementXML(I-><u></u>getReplacementText());<br>
+      llvm::outs() << "</replacement>\n";<br>
     }<br>
     llvm::outs() << "</replacements>\n";<br>
   } else {<br>
<br>
<br>
<br></div></div><div class="im">
On Thu, Nov 28, 2013 at 12:42 AM, jpark37 . <<a href="mailto:jpark37@gmail.com" target="_blank">jpark37@gmail.com</a> <mailto:<a href="mailto:jpark37@gmail.com" target="_blank">jpark37@gmail.com</a>>> wrote:<br>

<br>
    Oops, sorry; the attached patch is updated and retested. I ran<br>
    clang-format, and it created more diffs than just my changes;<br>
    those have been undone to keep the patch focused. I've also<br>
    switched the cascading if to a switch statement.<br>
<br>
    - James<br>
<br>
<br>
    On Wed, Nov 27, 2013 at 5:24 PM, Daniel Jasper <<a href="mailto:djasper@google.com" target="_blank">djasper@google.com</a><br></div><div class="im">
    <mailto:<a href="mailto:djasper@google.com" target="_blank">djasper@google.com</a>>> wrote:<br>
<br>
        I'd like Manuel to take a look, but in general, please format<br>
        Clang/LLVM files with the correct style (i.e. "clang-format<br>
        -style LLVM") :-).<br>
<br>
<br>
        On Wed, Nov 27, 2013 at 11:28 AM, jpark37 . <<a href="mailto:jpark37@gmail.com" target="_blank">jpark37@gmail.com</a><br></div><div class="im">
        <mailto:<a href="mailto:jpark37@gmail.com" target="_blank">jpark37@gmail.com</a>>> wrote:<br>
<br>
            Hello there,<br>
<br>
            I'm seeing newlines without carriage returns when using<br>
            the clang-format plugin for Visual Studio. The issue seems<br>
            to be that clang-format is not escaping newline characters<br>
            when run with -output-replacements-xml, so the .NET XML<br>
            stuff ends up collapsing \r\n down to \n. I've attached a<br>
            patch that I've tested and appears to address the problem.<br>
<br>
            - James<br>
<br>
            ______________________________<u></u>_________________<br>
            cfe-commits mailing list<br></div>
            <a href="mailto:cfe-commits@cs.uiuc.edu" target="_blank">cfe-commits@cs.uiuc.edu</a> <mailto:<a href="mailto:cfe-commits@cs.uiuc.edu" target="_blank">cfe-commits@cs.uiuc.<u></u>edu</a>><br>
            <a href="http://lists.cs.uiuc.edu/mailman/listinfo/cfe-commits" target="_blank">http://lists.cs.uiuc.edu/<u></u>mailman/listinfo/cfe-commits</a><div class="im"><br>
<br>
<br>
<br>
<br>
<br>
<br>
______________________________<u></u>_________________<br>
cfe-commits mailing list<br>
<a href="mailto:cfe-commits@cs.uiuc.edu" target="_blank">cfe-commits@cs.uiuc.edu</a><br>
<a href="http://lists.cs.uiuc.edu/mailman/listinfo/cfe-commits" target="_blank">http://lists.cs.uiuc.edu/<u></u>mailman/listinfo/cfe-commits</a><br>
</div></blockquote><span class="HOEnZb"><font color="#888888">
<br>
-- <br>
<a href="http://www.nuanti.com" target="_blank">http://www.nuanti.com</a><br>
the browser experts<br>
<br>
</font></span></blockquote></div><br></div></div>