<div dir="ltr"><div dir="auto"><div><br><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Tue, Nov 23, 2021, 1:59 AM Anton Korobeynikov <<a href="mailto:anton@korobeynikov.info" rel="noreferrer noreferrer" target="_blank">anton@korobeynikov.info</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">>> > If we can attribute it to an anonymous entity, e.g. by putting "Anonymous LLVM Contributor 123 wrote:" at the top of a comment by llvmbot, at least readers can understand whether two comments on a bug are from the same person or from different people, for example. Can we at least do something like that?<br>
>> We do this for issues. They are marked as submitted by "LLVM Bugzilla<br>
>> Contributor".<br>
> As I said, the purpose would be to allow disambiguating multiple anonymous contributors, e.g. by suffixing a unique number to each anonymous contributor. The reply misses that point.<br>
Thanks for the comment. However, no, it does not. We cannot suffix and<br>
separate different anonymous contributions. I do not want to dig deep<br>
into details, but some regulations require us to ensure that the<br>
author of the data cannot be traced back when the origin of anonymized<br>
data is removed. This requirement is quite vague and quite new, but<br>
still we have to comply with it. One way of doing this is to "pool"<br>
all anonymous contributions so they will be indistinguishable from<br>
each other from the author standpoint.</blockquote></div></div><div dir="auto"><br></div><div dir="auto">Thank you for this explanation! That is unfortunate, but it is now perfectly understandable why my suggestion is completely infeasible. (And I'm sorry you have had to become so deeply familiar with these regulations, it sounds quite annoying.)</div><div dir="auto"><br></div><div dir="auto">Is it also disallowed to disambiguate the speakers within a <i>single</i> bug/thread of conversation? (E.g. the first author who posts in a given bug thread is always "1", second is "2" -- not assigning a unique id to a person across the whole migration.) In that way, it's impossible to track an unidentified person across issues, but you still can still follow the flow of the conversation.</div><div dir="auto"><br></div><div dir="auto">It seems "reasonable" that it would be acceptable to de-identify a participant's contributions to a single conversation as a whole, rather than each individual statement separately. However, I don't know anything about what this regulation requires, and regulations are <i>definitely</i> not always reasonable or logical.</div><div dir="auto"></div></div>
</div>