<div dir="ltr">Wouldn't it be preferable to try_lock in GetDescription (which is the one currently acquiring the mutex) instead? ReportError doesn't touch any mutex itself and will happily report the rest of the error if GetDescription bails out. For the test case I sent it would look like this:<div><br></div><span style="font-family:monospace">error:  {0x0000000b}: invalid abbreviation code 123, please file a bug and attach the file at the start of this error message</span><br><span style="font-family:monospace">error:  {0x0000000b}: invalid abbreviation code 123, please file a bug and attach the file at the start of this error message</span><br><div><font face="monospace">error:  {0x0000000b}: invalid abbreviation code 123, please file a bug and attach the file at the start of this error message</font></div><div><br></div><div>which is way better than a deadlock IMO.</div><div><br></div><div><br></div><div><br></div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Thu, Feb 4, 2021 at 12:16 PM Pavel Labath <<a href="mailto:pavel@labath.sk">pavel@labath.sk</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">Please have a look at <br>
<<a href="https://lists.llvm.org/pipermail/lldb-dev/2020-October/016479.html" rel="noreferrer" target="_blank">https://lists.llvm.org/pipermail/lldb-dev/2020-October/016479.html</a>>, <br>
which is the last time this came up.<br>
<br>
<br>
One quick'n'dirty solution would be to have `Module::ReportError` _try_ <br>
to get the module lock, and if it fails, just bail out. That obviously <br>
means you won't get to see the error message which triggerred the <br>
deadlock (though we could also play around with that and try printing <br>
the error message without the module description or something), but it <br>
will at least get you past that point...<br>
<br>
pl<br>
<br>
On 04/02/2021 21:04, Jorge Gorbe Moya via lldb-dev wrote:<br>
> Hi,<br>
> <br>
> I've found a deadlock in lldb (see attached test case, you can build it <br>
> with just `clang -o test test.s`), but I'm a total newbie and I have no <br>
> idea what's the right way to fix it.<br>
> <br>
> The problem happens when an error is found during DIE extraction when <br>
> preloading symbols. As far as I can tell, it goes like this:<br>
> <br>
> 1. Module::PreloadSymbols locks Module::m_mutex<br>
> 2. A few layers below it, we end up in ManualDWARFIndex::Index, which <br>
> dispatches DIE extractions to a thread pool:<br>
> <br>
> |for (size_t i = 0; i < units_to_index.size(); ++i) <br>
> pool.async(extract_fn, i); pool.wait(); |<br>
> <br>
> 3. extract_fn in the snippet above ends up executing <br>
> DWARFDebugInfoEntry::Extract and when there's an error during <br>
> extraction, Module::GetDescription is called while generating the error <br>
> message.<br>
> 4. Module::GetDescription tries to acquire Module::m_mutex from a <br>
> different thread, while the main thread has the mutex already locked and <br>
> it's waiting for DIE extraction to end, causing a deadlock.<br>
> <br>
> If we make Module::GetDescription not lock the problem disappears, so <br>
> the diagnosis looks correct, but I don't know what would be the right <br>
> way to fix it. Module::GetDescription looks more or less safe to call <br>
> without locking: it just prints m_arch, m_file, and m_object_name to a <br>
> string, and those look like fields that wouldn't change after the Module <br>
> is initialized, so maybe it's okay? But I feel like there must be a <br>
> better solution anyway. Any advice?<br>
> <br>
> Best,<br>
> Jorge<br>
> <br>
> <br>
> <br>
> <br>
> <br>
> <br>
> <br>
> <br>
> _______________________________________________<br>
> lldb-dev mailing list<br>
> <a href="mailto:lldb-dev@lists.llvm.org" target="_blank">lldb-dev@lists.llvm.org</a><br>
> <a href="https://lists.llvm.org/cgi-bin/mailman/listinfo/lldb-dev" rel="noreferrer" target="_blank">https://lists.llvm.org/cgi-bin/mailman/listinfo/lldb-dev</a><br>
> <br>
<br>
</blockquote></div>