<div dir="ltr"><div class="gmail_default" style="font-family:monospace;font-size:small;color:#000000">The format of the filtering file sounds good to me.</div><div class="gmail_default" style="font-family:monospace;font-size:small;color:#000000"><br></div><div class="gmail_default" style="font-family:monospace;font-size:small;color:#000000">In terms of training runtime performance (with instrumented binary), this feature probably won't help much as we don't want skip hot functions, but skipping cold functions does not make much difference. However there is one case where it is useful. Some users may hit the size limit of the linking step, so skipping known cold functions helps in that case.</div><div class="gmail_default" style="font-family:monospace;font-size:small;color:#000000"><br></div><div class="gmail_default" style="font-family:monospace;font-size:small;color:#000000">Having an attribute as suggested by vedant is one way to handle this -- but I think it is better to negate attribute -- by default all functions will be instrumented, but functions with 'no-instrument' attribute will be skipped.</div><div class="gmail_default" style="font-family:monospace;font-size:small;color:#000000"><br></div><div class="gmail_default" style="font-family:monospace;font-size:small;color:#000000">David</div><div class="gmail_default" style="font-family:monospace;font-size:small;color:#000000"><br></div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Tue, Mar 31, 2020 at 3:31 PM Petr Hosek <<a href="mailto:phosek@chromium.org">phosek@chromium.org</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div dir="ltr">We'd like to implement support for selectively enabling profile instrumentation only for certain files/functions.<div><br></div><div>The motivation is collecting code coverage information in presubmit testing, where we want to avoid instrumenting the entire build which would introduce a lot of overhead. Rather, we only want to instrument files/functions that were modified by the patch by passing this information to Clang.<br></div><div><br></div><div>Clang already has -fprofile-filter-files= and -fprofile-exclude-files=, but those flags are currently only supported by GCOV. Furthermore, they only work at the granularity of entire files. I'm also not a fan of using flags which increases the size of the command line as you keep adding more files.</div><div><br></div><div>The solution I'm considering for source-code coverage is use the special case list (see <a href="https://github.com/llvm/llvm-project/blob/master/llvm/include/llvm/Support/SpecialCaseList.h" target="_blank">https://github.com/llvm/llvm-project/blob/master/llvm/include/llvm/Support/SpecialCaseList.h</a>) which is already used by sanitizers and XRay and seems like a great fit for this case. Concretely, we would add a new flag, e.g. -fprofile-flter=path/to/special/case/list. The file would have the following format:</div><div><br></div><div>[include]</div><div>src:src:/path/to/source/*</div>fun:MyFooBar<div>[exclude]</div><div>src:src:/path/to/source/file.c<br></div><div><br></div><div>This is similar to <a href="https://clang.llvm.org/docs/SanitizerSpecialCaseList.html" target="_blank">https://clang.llvm.org/docs/SanitizerSpecialCaseList.html</a> and <a href="https://llvm.org/docs/XRay.html#special-case-file" target="_blank">https://llvm.org/docs/XRay.html#special-case-file</a>.</div><div><br></div><div>Does this sound reasonable?</div><div><br></div><div>Related question is whether this option should apply to both AST and IR based instrumentation and where to perform the filtering. We could do the filtering either when inserting the instrumentation instructions, i.e. in PGOInstrumentation.cpp and CodeGenPGO.cpp, or when lowering these instructions InstrProfiling.cpp (where we would just discard these instructions). The advantage of the latter approach is that we only need to implement the filtering once and it'd support both AST and IR based instrumentation, but it also means that we would unnecessarily insert extra instructions only to drop them later.</div><div><br></div><div>Does anyone have any preference or suggestion?</div></div>
</blockquote></div>