<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
<meta name="Generator" content="Microsoft Word 15 (filtered medium)">
<style><!--
/* Font Definitions */
@font-face
        {font-family:Wingdings;
        panose-1:5 0 0 0 0 0 0 0 0 0;}
@font-face
        {font-family:"Cambria Math";
        panose-1:2 4 5 3 5 4 6 3 2 4;}
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0cm;
        margin-bottom:.0001pt;
        font-size:11.0pt;
        font-family:"Calibri",sans-serif;}
a:link, span.MsoHyperlink
        {mso-style-priority:99;
        color:blue;
        text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
        {mso-style-priority:99;
        color:purple;
        text-decoration:underline;}
p.MsoListParagraph, li.MsoListParagraph, div.MsoListParagraph
        {mso-style-priority:34;
        margin-top:0cm;
        margin-right:0cm;
        margin-bottom:0cm;
        margin-left:36.0pt;
        margin-bottom:.0001pt;
        font-size:11.0pt;
        font-family:"Calibri",sans-serif;}
p.msonormal0, li.msonormal0, div.msonormal0
        {mso-style-name:msonormal;
        mso-margin-top-alt:auto;
        margin-right:0cm;
        mso-margin-bottom-alt:auto;
        margin-left:0cm;
        font-size:11.0pt;
        font-family:"Calibri",sans-serif;}
p.m-8826874704487089657msolistparagraph, li.m-8826874704487089657msolistparagraph, div.m-8826874704487089657msolistparagraph
        {mso-style-name:m_-8826874704487089657msolistparagraph;
        mso-margin-top-alt:auto;
        margin-right:0cm;
        mso-margin-bottom-alt:auto;
        margin-left:0cm;
        font-size:11.0pt;
        font-family:"Calibri",sans-serif;}
span.EmailStyle19
        {mso-style-type:personal-reply;
        font-family:"Calibri",sans-serif;
        color:windowtext;}
.MsoChpDefault
        {mso-style-type:export-only;
        font-family:"Calibri",sans-serif;
        mso-fareast-language:EN-US;}
@page WordSection1
        {size:612.0pt 792.0pt;
        margin:72.0pt 72.0pt 72.0pt 72.0pt;}
div.WordSection1
        {page:WordSection1;}
/* List Definitions */
@list l0
        {mso-list-id:252015352;
        mso-list-type:hybrid;
        mso-list-template-ids:-1076337638 134807553 134807555 134807557 134807553 134807555 134807557 134807553 134807555 134807557;}
@list l0:level1
        {mso-level-number-format:bullet;
        mso-level-text:;
        mso-level-tab-stop:none;
        mso-level-number-position:left;
        text-indent:-18.0pt;
        font-family:Symbol;}
@list l0:level2
        {mso-level-number-format:bullet;
        mso-level-text:o;
        mso-level-tab-stop:none;
        mso-level-number-position:left;
        text-indent:-18.0pt;
        font-family:"Courier New";}
@list l0:level3
        {mso-level-number-format:bullet;
        mso-level-text:;
        mso-level-tab-stop:none;
        mso-level-number-position:left;
        text-indent:-18.0pt;
        font-family:Wingdings;}
@list l0:level4
        {mso-level-number-format:bullet;
        mso-level-text:;
        mso-level-tab-stop:none;
        mso-level-number-position:left;
        text-indent:-18.0pt;
        font-family:Symbol;}
@list l0:level5
        {mso-level-number-format:bullet;
        mso-level-text:o;
        mso-level-tab-stop:none;
        mso-level-number-position:left;
        text-indent:-18.0pt;
        font-family:"Courier New";}
@list l0:level6
        {mso-level-number-format:bullet;
        mso-level-text:;
        mso-level-tab-stop:none;
        mso-level-number-position:left;
        text-indent:-18.0pt;
        font-family:Wingdings;}
@list l0:level7
        {mso-level-number-format:bullet;
        mso-level-text:;
        mso-level-tab-stop:none;
        mso-level-number-position:left;
        text-indent:-18.0pt;
        font-family:Symbol;}
@list l0:level8
        {mso-level-number-format:bullet;
        mso-level-text:o;
        mso-level-tab-stop:none;
        mso-level-number-position:left;
        text-indent:-18.0pt;
        font-family:"Courier New";}
@list l0:level9
        {mso-level-number-format:bullet;
        mso-level-text:;
        mso-level-tab-stop:none;
        mso-level-number-position:left;
        text-indent:-18.0pt;
        font-family:Wingdings;}
@list l1
        {mso-list-id:1785928536;
        mso-list-template-ids:-1889003078;}
ol
        {margin-bottom:0cm;}
ul
        {margin-bottom:0cm;}
--></style><!--[if gte mso 9]><xml>
<o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
<o:shapelayout v:ext="edit">
<o:idmap v:ext="edit" data="1" />
</o:shapelayout></xml><![endif]-->
</head>
<body lang="EN-GB" link="blue" vlink="purple">
<div class="WordSection1">
<p class="MsoNormal"><span style="mso-fareast-language:EN-US">Thanks for this, it confirms what I expected from the behaviour of clang-format. I think that for our use-case we would need more than raw tokens (although I may look into doing it all with tokens
 only). I guess the next question I would have is:<o:p></o:p></span></p>
<p class="MsoNormal"><span style="mso-fareast-language:EN-US"><o:p> </o:p></span></p>
<ul style="margin-top:0cm" type="disc">
<li class="MsoListParagraph" style="margin-left:0cm;mso-list:l0 level1 lfo2"><span style="mso-fareast-language:EN-US">Is there currently some way to sensibly produce partial ASTs?<o:p></o:p></span></li></ul>
<p class="MsoNormal"><span style="mso-fareast-language:EN-US"><o:p> </o:p></span></p>
<p class="MsoNormal"><span style="mso-fareast-language:EN-US">I understand that clang uses a recursive descent parser and I was wondering if there is any sensible way to halt the descent – I’m not really sure if the grammar of C++ would even allow for such
 a thing to make sense. I’ve been looking online for some kind of document explaining how the clang parser actually works and the stages it goes through from source > token > AST; I’ve found it difficult to get an understanding by looking at the clang source
 code.<o:p></o:p></span></p>
<p class="MsoNormal"><span style="mso-fareast-language:EN-US"><o:p> </o:p></span></p>
<p class="MsoNormal"><span style="mso-fareast-language:EN-US">Thanks,<o:p></o:p></span></p>
<p class="MsoNormal"><span style="mso-fareast-language:EN-US">Stuart<o:p></o:p></span></p>
<p class="MsoNormal"><span style="mso-fareast-language:EN-US"><o:p> </o:p></span></p>
<p class="MsoNormal"><span style="mso-fareast-language:EN-US"><o:p> </o:p></span></p>
<p class="MsoNormal"><b><span lang="EN-US">From:</span></b><span lang="EN-US"> Nico Weber <thakis@chromium.org>
<br>
<b>Sent:</b> 01 August 2018 14:01<br>
<b>To:</b> Stuart Thomson <Stuart.Thomson@eu.medical.canon><br>
<b>Cc:</b> cfe-dev <cfe-dev@lists.llvm.org><br>
<b>Subject:</b> Re: [cfe-dev] How does clang-format parse snippets?<o:p></o:p></span></p>
<p class="MsoNormal"><o:p> </o:p></p>
<div>
<p class="MsoNormal">clang-format is token-based, it sees the raw token stream (without even running the preprocessor, which is why it doesn't need -I and -D flags). clang's cc1 flag -dump-raw-tokens shows you what clang-format sees as input. Note how it #if
 0 gets printed instead of evaluated:<o:p></o:p></p>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<div>
<div>
<p class="MsoNormal">$ cat foo.cc<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal">#if 0<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal">asdf<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal">#endif<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal">int f();<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<div>
<p class="MsoNormal">$ bin/clang -c -Xclang -dump-raw-tokens foo.cc<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal">hash '#' [StartOfLine]     Loc=<foo.cc:1:1><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal">raw_identifier 'if'                            Loc=<foo.cc:1:2><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal">unknown ' '                        Loc=<foo.cc:1:4><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal">numeric_constant '0'                     Loc=<foo.cc:1:5><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal">unknown '<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal">'                             Loc=<foo.cc:1:6><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal">raw_identifier 'asdf'        [StartOfLine]     Loc=<foo.cc:2:1><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal">unknown '<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal">'                             Loc=<foo.cc:2:5><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal">hash '#' [StartOfLine]     Loc=<foo.cc:3:1><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal">raw_identifier 'endif'                     Loc=<foo.cc:3:2><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal">unknown '<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<div>
<p class="MsoNormal">'                             Loc=<foo.cc:3:7><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal">raw_identifier 'int'           [StartOfLine]     Loc=<foo.cc:5:1><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal">unknown ' '                        Loc=<foo.cc:5:4><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal">raw_identifier 'f'                             Loc=<foo.cc:5:5><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal">l_paren '('                           Loc=<foo.cc:5:6><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal">r_paren ')'                          Loc=<foo.cc:5:7><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal">semi ';'                 Loc=<foo.cc:5:8><o:p></o:p></p>
</div>
<div>
<p class="MsoNormal">unknown '<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal">'                             Loc=<foo.cc:5:9><o:p></o:p></p>
</div>
</div>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<div>
<p class="MsoNormal">clang-format then has a bunch of heuristics to decide if `a * b` is a multiplication or a declaration, but since it doesn't build an AST as you say, it doesn't know if "a" in two different places refer to the same variable. So in general
 it can't be used for most automated refactorings, since you usually need ASTs for that.<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<div>
<p class="MsoNormal">(clang-format works great for formatting the output of an automated refactoring though.)<o:p></o:p></p>
</div>
</div>
<p class="MsoNormal"><o:p> </o:p></p>
<div>
<div>
<p class="MsoNormal">On Wed, Aug 1, 2018 at 5:25 AM Stuart Thomson via cfe-dev <<a href="mailto:cfe-dev@lists.llvm.org">cfe-dev@lists.llvm.org</a>> wrote:<o:p></o:p></p>
</div>
<blockquote style="border:none;border-left:solid #CCCCCC 1.0pt;padding:0cm 0cm 0cm 6.0pt;margin-left:4.8pt;margin-right:0cm">
<div>
<div>
<p class="MsoNormal" style="mso-margin-top-alt:auto;mso-margin-bottom-alt:auto">Hi,<o:p></o:p></p>
<p class="MsoNormal" style="mso-margin-top-alt:auto;mso-margin-bottom-alt:auto"> <o:p></o:p></p>
<p class="MsoNormal" style="mso-margin-top-alt:auto;mso-margin-bottom-alt:auto">I’m interested in using clang to refactor snippets of C++ for which I can’t produce an AST. AFAIK this precludes the use of clang tools like clang-check and I wondered if clang-format
 could be used instead as it doesn’t seem to require the production of an AST. I don’t quite understand how clang-format works and have a couple of questions:<o:p></o:p></p>
<p class="MsoNormal" style="mso-margin-top-alt:auto;mso-margin-bottom-alt:auto"> <o:p></o:p></p>
<ol start="1" type="1">
<li class="m-8826874704487089657msolistparagraph" style="mso-list:l1 level1 lfo1">
Is it possible to somehow use clang-format for refactoring C++ according to custom rules? These refactors would be larger scale things than it seems to usually be used for.<o:p></o:p></li><li class="m-8826874704487089657msolistparagraph" style="mso-list:l1 level1 lfo1">
How does clang-format parse C++ without e.g. parsing the includes?<o:p></o:p></li></ol>
<p class="MsoNormal" style="mso-margin-top-alt:auto;mso-margin-bottom-alt:auto"> <o:p></o:p></p>
<p class="MsoNormal" style="mso-margin-top-alt:auto;mso-margin-bottom-alt:auto">Thanks,<o:p></o:p></p>
<p class="MsoNormal" style="mso-margin-top-alt:auto;mso-margin-bottom-alt:auto">Stuart<o:p></o:p></p>
</div>
</div>
<p class="MsoNormal">_______________________________________________<br>
cfe-dev mailing list<br>
<a href="mailto:cfe-dev@lists.llvm.org" target="_blank">cfe-dev@lists.llvm.org</a><br>
<a href="http://lists.llvm.org/cgi-bin/mailman/listinfo/cfe-dev" target="_blank">http://lists.llvm.org/cgi-bin/mailman/listinfo/cfe-dev</a><o:p></o:p></p>
</blockquote>
</div>
</div>
</body>
</html>