<div dir="ltr"><div dir="ltr">Hi Greg, <div><br></div><div>Thanks for the advice! </div><div><br></div><div>> [...] I would suggest just submitting a bug and attaching stack traces of your deadlock. Loading a core file is very similar across all targets, so I can't imagine this being hard to reproduce with another core file? <br><br>Glad to hear this - I'll do so soon then. I also imagine that this bug affects other "backends", but I can't confirm that myself (due to lack of experience with other lldb backends), so hopefully others will be able to verify it if I file a bug. <br><br> > Is there something special about your core file or setup? <br><br>As I understand it there is not that much "weird" about our LLDB integrations. We have made some specific additions to be able to debug threads/processes running on our co-processor and allow printf/debugging information to be passed back to the host, but aside from that we haven't touched any of the core code.</div><div><br></div><div>It is, however, possible that we've incorrectly subclassed one of the native thread/process classes incorrectly and violated some concurrency invariant. This is part of my hesitation for filing a bug report, as I'm not sure whether the commit itself was at fault, or whether we accidentally relied on some incorrect concurrency behaviour which has now been corrected, leaving our plugin broken.<br><br>> I would go ahead and debug the deadlock, attach repro steps for how you are loading your core file (exact commands or APIs that are being used) and then maybe attach the output "bt all" so we can see all of the threads and see what is deadlocking your LLDB.</div><div><br></div><div>Okay, thanks for the advice regarding what would be good to include. I'll make sure to add as much of this as I can when I file the bug report. </div><div><br></div><div>Thanks again,</div><div>Adam</div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Tue, 22 Jun 2021 at 18:34, Greg Clayton <<a href="mailto:clayborg@gmail.com">clayborg@gmail.com</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div style="overflow-wrap: break-word;"><br><div><br><blockquote type="cite"><div>On Jun 22, 2021, at 10:10 AM, Adam HARRIES via lldb-dev <<a href="mailto:lldb-dev@lists.llvm.org" target="_blank">lldb-dev@lists.llvm.org</a>> wrote:</div><br><div><div dir="ltr">Hi all, <div><br></div><div>I've recently taken over maintenance of my company's llvm+lldb branch, where we have added support for our in-house architecture (in llvm) as well as support for debugging through both hardware and our simulator. Our llvm fork is public/open source, however many of our runtime libraries and drivers (which are linked into lldb, clang, etc, and provide built-ins and driver support etc) are not. <br><br>While attempting to update our branch from llvm-11 to llvm-12 we came across a commit[1] in lldb which quite reliably causes a deadlock when we launch a process to debug a core dump. Luckily, said commit simply modifies some concurrency primitives, and reverting it is sufficient to fix the bug without any further effects. We are quite confident that the commit is the issue, as we performed a thorough bisect which maintained "our" code unchanged throughout.<br><br>Unfortunately, however, we are unable to reproduce this bug in any "open" architectures (such as x86-64, AArch64, etc), so are not entirely sure how we should go about reporting the bug. Additionally, it makes it difficult to open a discussion regarding whether the commit is correct (and thus we may need to modify our additions to lldb to match new implicit behaviour), as third parties may be unable to reproduce the issue. Finally, as the bug results in a deadlock (which requires a sigkill to end) we won't (as I understand it) be able to use a "Reproducer" to demonstrate the bug to third parties. </div><div><br></div><div>Although we are able to "solve" the issue locally (by reverting the commit), we feel that the better solution would be to feed back our findings to the community and solve the issue, rather than (privately) sweeping it under the rug. As components of our compiler are proprietary, however, this process becomes difficult due to the reasons listed above.</div><div><br>To summarise, there are two main questions that I feel unable to answer: </div><div>- Is there an existing process for reporting bugs that only affect third parties, and which cannot be reproduced in "core" targets. </div></div></div></blockquote><div><br></div>I don't believe there is a formal process for this. Though I would suggest just submitting a bug and attaching stack traces of your deadlock. Loading a core file is very similar across all targets, so I can't imagine this being hard to reproduce with another core file? Is there something special about your core file or setup? I know that logging used to be able to cause deadlocks due to the Module::GetDescription(...) that tried to take the module lock. It no longer does this on top of tree. <br><blockquote type="cite"><div><div dir="ltr"><div>- To what extend is it possible to discuss (or report) bugs "on faith" - as in without any concrete evidence that a third party can reproduce.</div><div><br></div><div>We are currently looking into opening up our build process so that we are able to distribute binary libraries to enable third parties to build our compiler + debugger, but as this is currently a work-in-progress it is unfortunately not a solution to this issue. <br><br>Many thanks in advance for any and all advice.<br>Yours,</div></div></div></blockquote><div><br></div>I would go ahead and debug the deadlock, attach repro steps for how you are loading your core file (exact commands or APIs that are being used) and then maybe attach the output "bt all" so we can see all of the threads and see what is deadlocking your LLDB.</div><div><br></div><div>Greg</div><div><br><blockquote type="cite"><div><div dir="ltr"><div><br>-- <br><div dir="ltr"><div dir="ltr"><div><b><font color="#666666">Adam Brouwers-Harries</font></b><br></div><div><font color="#666666">Compiler Engineer</font></div><div><font color="#666666"><a href="mailto:aharries@upmem.com" target="_blank">aharries@upmem.com</a></font></div><div><br></div><div>[1] Please note, I have specifically not named this commit as I wish to better understand the "meta"-bug filing process, and I do not wish to publicly assign blame for any bugs without understanding how and why I can do so respectfully and properly.</div></div></div></div></div>
_______________________________________________<br>lldb-dev mailing list<br><a href="mailto:lldb-dev@lists.llvm.org" target="_blank">lldb-dev@lists.llvm.org</a><br><a href="https://lists.llvm.org/cgi-bin/mailman/listinfo/lldb-dev" target="_blank">https://lists.llvm.org/cgi-bin/mailman/listinfo/lldb-dev</a><br></div></blockquote></div><br></div></blockquote></div></div>