<html><head><meta http-equiv="Content-Type" content="text/html; charset=utf-8"></head><body style="word-wrap: break-word; -webkit-nbsp-mode: space; line-break: after-white-space;" class=""><div class="">The test doesn’t seem to be flakey in the “run it a bunch of times and it will eventually fail” type flakey.  I ran the test 200 times on my machine and didn’t get a failure.</div><div class=""><br class=""></div><div class="">Another weird fact is that there are two ways to auto-continue from a stop-hook, either pass the —auto-continue flag when adding the stop hook, or returning False from the handle_stop.  All the failures that I have seen on the bots are the “return False” test, the auto-continue test never fails.  </div><div class="">That’s relevant because the failure is that “returning false from the stop hook” doesn’t cause us to continue.</div><div class=""><br class=""></div><div class=""><div class="">Those two scenario’s differ in only two ways: </div><div class=""><br class=""></div><div class="">1) In the “return False” case, we have to get the false result from the return of the callback invocation in Python through the ScriptInterpreter and back to C.  In the “auto-continue” case we’re just reading a flag in the StopHook.</div><div class=""><br class=""></div><div class="">2) When we go to decide whether to auto-continue or not we do:</div><div class=""><br class=""></div><div class=""><div style="margin: 0px; font-stretch: normal; font-size: 12px; line-height: normal; font-family: Menlo; color: rgba(0, 0, 0, 0.85); background-color: rgb(255, 255, 255);" class="">  <span style="color: #9b2393" class=""><b class="">if</b></span> (!somebody_restarted && ((hooks_ran && !should_stop) || auto_continue))</div><div style="margin: 0px; font-stretch: normal; font-size: 12px; line-height: normal; font-family: Menlo; color: rgba(0, 0, 0, 0.85); background-color: rgb(255, 255, 255);" class="">    m_process_sp->PrivateResume();</div></div><div class=""><br class=""></div><div class=""><span style="background-color: rgb(255, 255, 255);" class="">where the auto_continue case is controlled by the setting of the auto_continue flag, but the handle_stop return is computed from the handle_stop return value.  If we’re fetching the return value correctly, then I can’t see how the “return False” could be flakey and not the “auto-continue” one.</span></div><div class=""><span style="background-color: rgb(255, 255, 255);" class=""><br class=""></span></div><div class="">When I resubmitted this patch, I added a print of the return value from the stop hook’s handle_stop.  Even in the failing case the hook is running and reports that it is returning false from the Python side of the hook correctly.  So we’re right up to there.  After that I don’t have any visibility into why this is failing.<br class=""></div><div class=""><br class=""></div><div class=""><span style="background-color: rgb(255, 255, 255);" class="">BTW, a</span><span style="background-color: rgb(255, 255, 255);" class="">nother obvious cause of “flakiness” is if you have uninitialized variables lying around, but there aren’t that many variables in this code and so far as I can see everything is initialized before use.</span></div><div class=""><span style="background-color: rgb(255, 255, 255);" class=""><br class=""></span></div><div class=""><div class=""><span style="background-color: rgb(255, 255, 255);" class="">Anyway, if people don’t mind, I’ll check in a change that makes the stop hooks a little noisier by reporting the result passing through the ScriptInterpreter to RunStopHooks.  That will come to the test log, so with any luck I’ll be able to narrow down the cause of the failure that way.</span></div></div><div class=""><span style="background-color: rgb(255, 255, 255);" class=""><br class=""></span></div><div class=""><span style="background-color: rgb(255, 255, 255);" class="">Jim</span></div><div class=""><div class=""><div><br class=""><blockquote type="cite" class=""><div class="">On Sep 30, 2020, at 12:01 PM, Pavel Labath <<a href="mailto:pavel@labath.sk" class="">pavel@labath.sk</a>> wrote:</div><br class="Apple-interchange-newline"><div class=""><div class="">On 30/09/2020 20:45, Jim Ingham wrote:<br class=""><blockquote type="cite" class="">I also used to get e-mails when a test failed and I was on the changes list.  But I haven’t gotten any failure e-mails.  Does that only happen for some of the bots (or has that stopped working) or should I look to my filters?<br class=""><br class="">Jim<br class=""><br class=""></blockquote><br class="">You didn't get an email when the patch was committed, because the test<br class="">happened to pass the first time around and only fail in some of the<br class="">later builds. That's the problem with flaky tests -- whenever they fail<br class="">(flake) a random person gets a breakage email for their unrelated change.<br class=""><br class="">As the test flaps on and off nondeterministically, I very much doubt<br class="">this is a problem with the incremental build. E.g. the only change in<br class="">build <a href="http://lab.llvm.org:8011/builders/lldb-x86_64-debian/builds/18360" class="">http://lab.llvm.org:8011/builders/lldb-x86_64-debian/builds/18360</a><br class="">was a change to the gn build files, which is a noop for regular cmake<br class="">build. Both builds before it and after it were green.<br class=""><br class="">Though it's possible, I would be surprised if this problem is limited to<br class="">linux systems -- a more likely explanation is that the linux buildbots<br class="">have a much higher throughput (lldb-x86_64-debian clocks 70 builds per<br class="">day vs. 13 builds/day for lldb-cmake on green dragon), and so flaky<br class="">tests get noticed sooner there.<br class=""><br class="">pl<br class=""></div></div></blockquote></div><br class=""></div></div></div></body></html>