<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=us-ascii">
<meta name="Generator" content="Microsoft Word 15 (filtered medium)">
<style><!--
/* Font Definitions */
@font-face
        {font-family:Wingdings;
        panose-1:5 0 0 0 0 0 0 0 0 0;}
@font-face
        {font-family:"Cambria Math";
        panose-1:2 4 5 3 5 4 6 3 2 4;}
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
@font-face
        {font-family:"Malgun Gothic";
        panose-1:2 11 5 3 2 0 0 2 0 4;}
@font-face
        {font-family:"\@Malgun Gothic";}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0cm;
        font-size:11.0pt;
        font-family:"Calibri",sans-serif;}
span.EmailStyle17
        {mso-style-type:personal-compose;
        font-family:"Calibri",sans-serif;
        color:windowtext;}
.MsoChpDefault
        {mso-style-type:export-only;
        font-family:"Calibri",sans-serif;}
@page WordSection1
        {size:612.0pt 792.0pt;
        margin:72.0pt 72.0pt 72.0pt 72.0pt;}
div.WordSection1
        {page:WordSection1;}
--></style><!--[if gte mso 9]><xml>
<o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
<o:shapelayout v:ext="edit">
<o:idmap v:ext="edit" data="1" />
</o:shapelayout></xml><![endif]-->
</head>
<body lang="EN-US" link="#0563C1" vlink="#954F72" style="word-wrap:break-word">
<div class="WordSection1">
<p class="MsoNormal">Hi All,<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">I have a couple of questions about loop multiple latches and LICM. Let see a simple LLVM IR code snippet.<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">define void @test(i1 %a, i32 %b, i8* noalias %src, i8* noalias %dst) {<o:p></o:p></p>
<p class="MsoNormal">entry:<o:p></o:p></p>
<p class="MsoNormal">  br label %while.cond<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">while.cond:                                       ; preds = %sw.bb4001, %while.body, %while.body, %entry<o:p></o:p></p>
<p class="MsoNormal">  br i1 %a, label %while.end6895, label %while.body<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">while.body:                                       ; preds = %while.cond<o:p></o:p></p>
<p class="MsoNormal">  switch i32 %b, label %sw.default6833 [<o:p></o:p></p>
<p class="MsoNormal">    i32 82, label %no_ret<o:p></o:p></p>
<p class="MsoNormal">    i32 30, label %sw.bb4001<o:p></o:p></p>
<p class="MsoNormal">    i32 40, label %while.cond<o:p></o:p></p>
<p class="MsoNormal">    i32 41, label %while.cond<o:p></o:p></p>
<p class="MsoNormal">  ]<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">sw.bb4001:                                        ; preds = %while.body<o:p></o:p></p>
<p class="MsoNormal">  %addr = getelementptr i8, i8* %src, i32 31<o:p></o:p></p>
<p class="MsoNormal">  %res = load i8, i8* %addr<o:p></o:p></p>
<p class="MsoNormal">  store i8 %res, i8* %dst<o:p></o:p></p>
<p class="MsoNormal">  br label %while.cond<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">sw.default6833:                                   ; preds = %while.body<o:p></o:p></p>
<p class="MsoNormal">  unreachable<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">while.end6895:                                    ; preds = %while.cond<o:p></o:p></p>
<p class="MsoNormal">  unreachable<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">no_ret:                                        ; preds = %while.body<o:p></o:p></p>
<p class="MsoNormal">  ret void<o:p></o:p></p>
<p class="MsoNormal">}<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">LLVM detects loop as below.<o:p></o:p></p>
<p class="MsoNormal">Loop at depth 1 containing: %while.cond<header><exiting>,%while.body<latch><exiting>,%sw.bb4001<latch><o:p></o:p></p>
<p class="MsoNormal">Loop at depth 1 containing: <o:p></o:p></p>
<p class="MsoNormal"><header><exiting><o:p></o:p></p>
<p class="MsoNormal">while.cond:                                       ; preds = %sw.bb4001, %while.body, %while.body, %entry<o:p></o:p></p>
<p class="MsoNormal">  br i1 %a, label %while.end6895, label %while.body<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal"><latch><exiting><o:p></o:p></p>
<p class="MsoNormal">while.body:                                       ; preds = %while.cond<o:p></o:p></p>
<p class="MsoNormal">  switch i32 %b, label %sw.default6833 [<o:p></o:p></p>
<p class="MsoNormal">    i32 82, label %no_ret<o:p></o:p></p>
<p class="MsoNormal">    i32 30, label %sw.bb4001<o:p></o:p></p>
<p class="MsoNormal">    i32 40, label %while.cond<o:p></o:p></p>
<p class="MsoNormal">    i32 41, label %while.cond<o:p></o:p></p>
<p class="MsoNormal">  ]<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal"><latch><o:p></o:p></p>
<p class="MsoNormal">sw.bb4001:                                        ; preds = %while.body<o:p></o:p></p>
<p class="MsoNormal" style="text-indent:4.8pt">br label %while.cond<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">I can see llvm checks header and its backedges and goes through the predecessors of the latches. At this point, I wonder why llvm allows loops to have multiple latches. There is something good from it? Can we choose only one latch from
 multiple latches like closest one to header in domtree please?<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">After detecting the loop from above IR code, If we run LoopSimplify and LICM pass, we can see below output.<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">define void @test(i1 %a, i32 %b, i8* noalias %src, i8* noalias %dst) {<o:p></o:p></p>
<p class="MsoNormal">entry:<o:p></o:p></p>
<p class="MsoNormal">  %addr = getelementptr i8, i8* %src, i32 31     -<span style="font-family:Wingdings">à</span> Hoisted<o:p></o:p></p>
<p class="MsoNormal">  br label %while.cond<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">while.cond:                                       ; preds = %while.cond.backedge, %entry<o:p></o:p></p>
<p class="MsoNormal">  br i1 %a, label %while.end6895, label %while.body<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">while.body:                                       ; preds = %while.cond<o:p></o:p></p>
<p class="MsoNormal">  switch i32 %b, label %sw.default6833 [<o:p></o:p></p>
<p class="MsoNormal">    i32 82, label %no_ret<o:p></o:p></p>
<p class="MsoNormal">    i32 30, label %sw.bb4001<o:p></o:p></p>
<p class="MsoNormal">    i32 40, label %while.cond.backedge<o:p></o:p></p>
<p class="MsoNormal">    i32 41, label %while.cond.backedge<o:p></o:p></p>
<p class="MsoNormal">  ]<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">while.cond.backedge:                              ; preds = %while.body, %while.body, %sw.bb4001<o:p></o:p></p>
<p class="MsoNormal">  br label %while.cond<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">sw.bb4001:                                        ; preds = %while.body<o:p></o:p></p>
<p class="MsoNormal">  %res = load i8, i8* %addr, align 1<o:p></o:p></p>
<p class="MsoNormal">  store i8 %res, i8* %dst, align 1<o:p></o:p></p>
<p class="MsoNormal">  br label %while.cond.backedge<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">sw.default6833:                                   ; preds = %while.body<o:p></o:p></p>
<p class="MsoNormal">  unreachable<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">while.end6895:                                    ; preds = %while.cond<o:p></o:p></p>
<p class="MsoNormal">  unreachable<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">no_ret:                                           ; preds = %while.body<o:p></o:p></p>
<p class="MsoNormal">  ret void<o:p></o:p></p>
<p class="MsoNormal">} <o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">As you can see, the getelementptr instruction is hoisted to the preheader. If the control flow just reaches to the while.body, the gep is just redundant but it is executed at every iteration of the loop. I can see LICM pass checks the instructions
 with isSafeToSpeculativelyExecute but it looks like it is not good enough. At this point, I have other question. LICM pass need to consider something for the instructions which are conditionally executed? Rather than just checking safety of unconditional execution
 of the instruction.<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Additionally, goto statement causes above CFG.<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">If there is already something in llvm to handle above case correctly or I missed something, please let me know.<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Thanks<o:p></o:p></p>
<p class="MsoNormal">JinGu Kang<o:p></o:p></p>
</div>
</body>
</html>