<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
<meta name="Generator" content="Microsoft Word 15 (filtered medium)">
<style><!--
/* Font Definitions */
@font-face
        {font-family:"Cambria Math";
        panose-1:2 4 5 3 5 4 6 3 2 4;}
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0in;
        margin-bottom:.0001pt;
        font-size:11.0pt;
        font-family:"Calibri",sans-serif;}
a:link, span.MsoHyperlink
        {mso-style-priority:99;
        color:blue;
        text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
        {mso-style-priority:99;
        color:purple;
        text-decoration:underline;}
p.msonormal0, li.msonormal0, div.msonormal0
        {mso-style-name:msonormal;
        mso-margin-top-alt:auto;
        margin-right:0in;
        mso-margin-bottom-alt:auto;
        margin-left:0in;
        font-size:11.0pt;
        font-family:"Calibri",sans-serif;}
span.EmailStyle18
        {mso-style-type:personal-reply;
        font-family:"Calibri",sans-serif;
        color:windowtext;}
.MsoChpDefault
        {mso-style-type:export-only;
        font-family:"Calibri",sans-serif;}
@page WordSection1
        {size:8.5in 11.0in;
        margin:1.0in 1.0in 1.0in 1.0in;}
div.WordSection1
        {page:WordSection1;}
--></style><!--[if gte mso 9]><xml>
<o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
<o:shapelayout v:ext="edit">
<o:idmap v:ext="edit" data="1" />
</o:shapelayout></xml><![endif]-->
</head>
<body lang="EN-US" link="blue" vlink="purple">
<div class="WordSection1">
<p class="MsoNormal">First of all, thanks for working on this. In my opinion, filecheck needs help, and anybody trying to make it better is a hero.<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">That said, from skimming the review thread, it seems to me that perhaps automatically detecting bad CHECKs might not be feasible. Perhaps better debugging tools might be a solution. If I could ask filecheck to list all directives in a file,
 I could easily find this stuff manually. If I used this hypothetical filecheck --list-directives, and I don’t see the one I just added, then I know it’s bad. This would be much easier to catch in code review in the future.<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Such a debugging framework could be expanded in the future to do more fancy things. I’d love it if there were some sort of REPL like functionality where I can throw inputs at a directive and see what it finds.<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal"><b>From:</b> llvm-dev <llvm-dev-bounces@lists.llvm.org> <b>On Behalf Of
</b>Jon Roelofs via llvm-dev<br>
<b>Sent:</b> Friday, April 3, 2020 9:58 AM<br>
<b>To:</b> llvm-dev@lists.llvm.org<br>
<b>Subject:</b> [EXT] [llvm-dev] [RFC] Improving FileCheck<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<div>
<p class="MsoNormal">I'd like to (re)start a discussion on a few gotchas in FileCheck that I've noticed working on various tests in llvm's suites. This begain in a review [1], but I'll try to summarize here so it gets the right audience before decisions are
 made on it (so to speak).<br>
<br>
1: <a href="https://reviews.llvm.org/D77227">https://reviews.llvm.org/D77227</a><br>
<br>
The main sticking point is the abundance of checks in FileCheck tests that appear to be checking something, but are in fact silently hiding failures. The biggest class of this bug appears to be CHECK lines that omit the trailing colon, though there are a few
 others.<br>
<br>
CHECK:            legitimate test<br>
CHECK             gotcha A<br>
CHECK :           gotcha B<br>
CHECKNEXT:        gotcha C<br>
CHECKDAG:         gotcha D<br>
CHECK_NOT:        gotcha E<br>
CHECK-LABEL-NOT:  ??? F<br>
CHECK-SAME-DAG:   ??? G<br>
<br>
<br>
Gotcha A<br>
--------<br>
<br>
CHECK  gotcha A<br>
<br>
A lot of cases of (A) are benign, but buried in there are cases where we have tests that don't check what they intend to, which are broken when the missing colons are added [2]. Some grep analysis from paulr in [3] found some 178 tests across 72 test files
 that seem like likely mistakes, suggesting that having some automated tooling to catch this is probably not a bad idea.<br>
<br>
In the review thread, a couple of issues surfaced with simply matching on `${CHECKNAME}\b`, making that less attractive as a remedy:<br>
<br>
A1) There are quite a lot of RUN: lines that have CHECK names on them from their --check-prefix/--check-prefixes arguments, and we don't want tooling to match on those. This could be addressed with a script that quotes them all, but that would mean touching
 pretty much every test file, which is less than ideal.<br>
<br>
A2) There are a few RUN lines with missing colons, though those seem infrequent enough to not worry about [5].<br>
<br>
A3) There are quite a lot of mentions of CHECK names in comments that are clearly not meant to be tests [6]. Any solution to this, as far as I can tell, will likely need to reword many of those.<br>
<br>
A4) We need some way to comment out CHECK lines that conveys intent better than removing the colon. This appears to be intentional in some testcases, but unintentional in the vast majority of them.<br>
<br>
To address (A1), a number of rules were proposed in [1], the best of which seems to be that we look for lines matching `[#/;*!]\s*CHECK[ \t]`, and emit a diagnostic of some form to help correct it. This gave a pretty good false positive rate of 25% on the 186
 tests it "broke" [7].<br>
<br>
An open question here from jdenny is whether it makes sense to require all checks to follow that pattern (with the colon, of course) to make things less user-hostile [8]:
<br>
<br>
> Consider this example that has a well formed directive that doesn't follow the rule:<br>
> <br>
> // FIXME(201806L) CHECK: assert: 0<br>
> Approach A (from a previous comment): FileCheck executes the directive. If the user later accidentally removes the :, FileCheck won't execute the directive and won't diagnose the error unless the user is wiling to endure false positives by opting into the
 more verbose mode Paul suggested.<br>
> <br>
> Approach B (from that some comment): FileCheck ignores the directive. That just makes things worse because the above otherwise well formed directive is then an undiagnosed malformed directive (unless the user opts into a more verbose mode).<br>
> <br>
> Approach C (new proposal): FileCheck reports the directive as an error (in any mode). The more verbose mode is still needed to catch the case that the : is missing here, but at least users are guaranteed to get a slap when they write them with :<br>
2: llvm/test/Transforms/InstCombine/phi-preserve-ir-flags.ll<br>
3: <a href="https://reviews.llvm.org/D77227#1955596">https://reviews.llvm.org/D77227#1955596</a><br>
4: <a href="https://github.com/llvm/llvm-project/blob/56decd982dc03a74d1796d9d4dbd7d9e0cea98dc/llvm/lib/Support/FileCheck.cpp#L1141">
https://github.com/llvm/llvm-project/blob/56decd982dc03a74d1796d9d4dbd7d9e0cea98dc/llvm/lib/Support/FileCheck.cpp#L1141</a><br>
5: llvm/test/CodeGen/AArch64/speculation-hardening.ll<br>
6: llvm/test/MC/ARM/dwarf-asm-multiple-sections.s:88<br>
7: <a href="https://reviews.llvm.org/differential/diff/254562">https://reviews.llvm.org/differential/diff/254562</a><br>
8: <a href="https://reviews.llvm.org/D77227#1958228">https://reviews.llvm.org/D77227#1958228</a><br>
<br>
<br>
Gotcha B<br>
--------<br>
<br>
CHECK :  gotcha B<br>
<br>
This pattern is a variant of (A) that also disables perfectly good tests, but in a way that isn't obvious that it doesn't work. jhenderson brings up some good points [9] in favor of extending FileCheck to make FileCheck do what the user intended here. Luckily,
 that doesn't seem to conflict with the rules proposed in (A).<br>
<br>
9: <a href="https://reviews.llvm.org/D77227#1959041">https://reviews.llvm.org/D77227#1959041</a><br>
<br>
<br>
Gotchas C, D, E<br>
---------------<br>
<br>
I believe these can be handled pretty simply in FileCheck itself, but I have not spent much time trying to estimate how many tests are affected by this class of bug.<br>
<br>
<br>
??? F, G<br>
--------<br>
<br>
There are a number of check suffix combinations that are not explicitly supported (in the docs), but appear (maybe) useful. For these, there is some precedent on mitigating them within FileCheck itself [4], though the combinatorial explosion warrants being
 careful about how we go about detecting them (if at all).<br>
<br>
<br>
-- <br>
Jon Roelofs<br>
<a href="mailto:jroelofs@jroelofs.com">jroelofs@jroelofs.com</a><o:p></o:p></p>
</div>
</div>
</body>
</html>