<html>
    <head>
      <base href="https://bugs.llvm.org/">
    </head>
    <body><table border="1" cellspacing="0" cellpadding="8">
        <tr>
          <th>Bug ID</th>
          <td><a class="bz_bug_link 
          bz_status_NEW "
   title="NEW - Nondeterminism of iterators causes false ThinLTO cache misses"
   href="https://bugs.llvm.org/show_bug.cgi?id=45819">45819</a>
          </td>
        </tr>

        <tr>
          <th>Summary</th>
          <td>Nondeterminism of iterators causes false ThinLTO cache misses
          </td>
        </tr>

        <tr>
          <th>Product</th>
          <td>tools
          </td>
        </tr>

        <tr>
          <th>Version</th>
          <td>trunk
          </td>
        </tr>

        <tr>
          <th>Hardware</th>
          <td>PC
          </td>
        </tr>

        <tr>
          <th>OS</th>
          <td>Windows NT
          </td>
        </tr>

        <tr>
          <th>Status</th>
          <td>NEW
          </td>
        </tr>

        <tr>
          <th>Severity</th>
          <td>normal
          </td>
        </tr>

        <tr>
          <th>Priority</th>
          <td>P
          </td>
        </tr>

        <tr>
          <th>Component</th>
          <td>lto
          </td>
        </tr>

        <tr>
          <th>Assignee</th>
          <td>unassignedbugs@nondot.org
          </td>
        </tr>

        <tr>
          <th>Reporter</th>
          <td>katya.romanova@sony.com
          </td>
        </tr>

        <tr>
          <th>CC</th>
          <td>llvm-bugs@lists.llvm.org
          </td>
        </tr></table>
      <p>
        <div>
        <pre>We noticed that when building an executable with ThinLTO (cache enabled), from
time to time unexpected cache misses happening and new cache entries are
generated when not needed. It doesn't happen in a predictable manner (i.e. a
cache miss might or might not happen). I will provide an explanation of why it
happens sporadically.

==========================

REPRODUCING THE PROBLEM:

Pretty much any medium size project will reproduce the problem. 

Below is an example, where I link 9 bitcode files with ThinLTO (cache enabled).
9 cache entries are created. After I relink again (without any changes), 13
cache entries appear (i.e. ThinLTO decided to regenerate cache for 4 files).

// No cache directory yet
$ ls
bar.c  clean.bat    foo.c  har.c  hoo.c  lar.c  link-only.bat  loo.o   main.o 
mar.o  moo.o
bar.o  compile.bat  foo.o  har.o  hoo.o  lar.o  loo.c          main.c  mar.c  
moo.c  run.bat

// linking 9 bitcode files with ThinLTO and cache enabled.
$ D:/LLVM/Upstream_TOT_Windows/build/Release/bin/ld.lld.exe -v
--thinlto-cache-dir=CACHE main.o bar.o mar.o lar.o har.o foo.o moo.o loo.o
hoo.o -o main.exe
LLD 11.0.0 (<a href="https://github.com/llvm/llvm-project.git">https://github.com/llvm/llvm-project.git</a>
0e13a0331fb90078bf71cc0c4612492a6954a5d0) (compatible with GNU linkers)

// After linking, CACHE directory appears; it has 9 cache entries now
$ ls CACHE
llvmcache.timestamp                                
llvmcache-672ECABBAC96BA45430F348DFCE8E15491B55EB6
llvmcache-03A6D70AEC6CAD0212E34C0A503FBFC9FE5215F1 
llvmcache-992141653337693DA6421334203353861997FC36
llvmcache-309BAC6DAF777946CF2B27C3FD275A9068C05062 
llvmcache-B514E34E44F63329B217ECDBC11D3CA910D4C61C
llvmcache-4320D3E62841F1AF0ED4D2C750579F993CA6D990 
llvmcache-B68A1DC4F284712DC4A93C5ABC81D7F6004A8B44
llvmcache-50BC52B7A3DB8537B5803E65DD37EAFA66ED3909 
llvmcache-CFE77E094F6A065B944ECC2CB43C8E2CEF17BE3B

// re-linking the same way as before (no changes were made)
$ D:/LLVM/Upstream_TOT_Windows/build/Release/bin/ld.lld.exe -v
--thinlto-cache-dir=CACHE main.o bar.o mar.o lar.o har.o foo.o moo.o loo.o
hoo.o -o main.exe
LLD 11.0.0 (<a href="https://github.com/llvm/llvm-project.git">https://github.com/llvm/llvm-project.git</a>
0e13a0331fb90078bf71cc0c4612492a6954a5d0) (compatible with GNU linkers)

// Note that CACHE directory now has 13 cache entries, though only 9 cache
entries are expected.
$ ls CACHE
llvmcache.timestamp                                
llvmcache-672ECABBAC96BA45430F348DFCE8E15491B55EB6
llvmcache-03A6D70AEC6CAD0212E34C0A503FBFC9FE5215F1 
llvmcache-8EBFE11F8BD1F02A060B8A4AB2061C0442B64CF1
llvmcache-2EF2ADD5D8F0D727E460B6A94CA3A24C71C051CB 
llvmcache-992141653337693DA6421334203353861997FC36
llvmcache-309BAC6DAF777946CF2B27C3FD275A9068C05062 
llvmcache-B514E34E44F63329B217ECDBC11D3CA910D4C61C
llvmcache-41900E8308B2AB588B8EFDBFEE923C1F3BA154C8 
llvmcache-B68A1DC4F284712DC4A93C5ABC81D7F6004A8B44
llvmcache-4320D3E62841F1AF0ED4D2C750579F993CA6D990 
llvmcache-CFE77E094F6A065B944ECC2CB43C8E2CEF17BE3B
llvmcache-50BC52B7A3DB8537B5803E65DD37EAFA66ED3909 
llvmcache-D032EEB2A05D13816229E79B08CAFFE5526A0A22


ANALYSIS OF THE PROBLEM:

Look at the following excerpt in LTO.cpp, where we are calculating the LTO
cache entry key:

void llvm::computeLTOCacheKey(
    SmallString<40> &Key, const Config &Conf, const ModuleSummaryIndex &Index,
    StringRef ModuleID, const FunctionImporter::ImportMapTy &ImportList,
    const FunctionImporter::ExportSetTy &ExportList,
    const std::map<GlobalValue::GUID, GlobalValue::LinkageTypes> &ResolvedODR,
    const GVSummaryMapTy &DefinedGlobals,
    const std::set<GlobalValue::GUID> &CfiFunctionDefs,
    const std::set<GlobalValue::GUID> &CfiFunctionDecls) {

Note that ‘ExportList’ is a ‘DenseSet’ of ValueInfo's:
    using ExportSetTy = DenseSet<ValueInfo>;

‘ExportList’ is used for the calculation of a hash value (LTO Cache Key).

Though the elements of this DenseSet are the same all the time, the order in
which the iterator walks through the elements of this set might (or might not)
be different the next time when we relink with ThinLTO. If the order happens to
be different, we will generate a different hash value and a cache miss will
happen.

I wrote some code that looped through the elements of an ExportList
(DenseSet<ValueInfo>) using the iterator and printed GUID values (which is what
is used when a cache entry key is calculated).

For one of the files (bar.o in the example below), the order in which
ExportList elements are visited is different, so the cache entry key value is
different too. As a result, we will have a cache miss here.

Module ID: bar.o
Export: 16434608426314478903 13549030661878666305 5512409407375956689

Module ID: bar.o
Export: 16434608426314478903 5512409407375956689 13549030661878666305

Looking at the implementation of:
  template <> struct DenseMapInfo<ValueInfo> (see ModuleSummaryIndex.h)

we notice that the hash value that is being used by a DenseMap is a pointer:
  static unsigned getHashValue(ValueInfo I) { return (uintptr_t)I.getRef(); }

but we cannot guarantee that the compiler will allocate memory at the same
address for the object when we run the executable for the second time.

HOW WE COULD FIX IT:

(1) We could store GUIDs into a container and sort the values before we use
them to generate a hash value.

Before:
  for (const auto &VI : ExportList) {
    auto GUID = VI.getGUID();
    // The export list can impact the internalization, be conservative here
    Hasher.update(ArrayRef<uint8_t>((uint8_t *)&GUID, sizeof(GUID)));
  }

After:
  std::vector<uint64_t> exportsGUID;
  exportsGUID.reserve(ExportList.size());
  for (const auto &VI : ExportList) {
    auto GUID = VI.getGUID();
    exportsGUID.push_back(GUID);
  }

  // Sort the export list elemets GUIDs.
  std::stable_sort(exportsGUID.begin(), exportsGUID.end());
  for (uint64_t guid : exportsGUID) {
    // The export list can impact the internalization, be conservative here
     Hasher.update(ArrayRef<uint8_t>((uint8_t *)&guid, sizeof(guid)));
  }

(2) We could use a different hash function.  The current implementation:
  static unsigned getHashValue(ValueInfo I) { return (uintptr_t)I.getRef(); }
is based on an address (which can change from run to run, causing this
problem). If we decide to do this change, we need to discuss with hash function
to use.

(3) We could use a different container that guarantees that the order of
iteration matches the order of insertion. E.g. We could use SetVector instead
of DenseSet, i.e. change 
using ExportSetTy = DenseSet<ValueInfo>;
   into
using ExportSetTy = SetVector<ValueInfo>;
The code changes are minimal and that fix takes care of the problem. However,
SetVector is using more space and not as efficient. Potentially we could use
some other container, maybe std::vector or SmallVector. This might require more
code changes.


SOME ADDITIONAL NOTES:
(1) I only encountered this problem on Windows, where I use the lld linker more
frequently. The problem might exist on Unix as well, but since it is not
reproducible consistently, I may simply have not run into it.

(2) Another thought why it fails to work on Windows, but might work on Unix is
because of address space randomization (i.e. MSVC compiler has /HIGHENTROPYVA
enabled). 

(3) We might have a similar issue with ImportList as well. I haven't looked
into it yet.</pre>
        </div>
      </p>


      <hr>
      <span>You are receiving this mail because:</span>

      <ul>
          <li>You are on the CC list for the bug.</li>
      </ul>
    </body>
</html>