1 ; RUN: llc -O2 < %s 2 target datalayout = "e-p:32:32:32-i64:64:64-i32:32:32-i16:16:16-i1:32:32-f64:64:64-f32:32:32-v64:64:64-v32:32:32-a0:0-n16:32" 3 target triple = "hexagon" 4 5 ; We would fail on this file with: 6 ; Unimplemented 7 ; UNREACHABLE executed at llvm/lib/Target/Hexagon/HexagonInstrInfo.cpp:615! 8 ; This happened because after unrolling a loop with a ldd_circ instruction we 9 ; would have several TFCR and ldd_circ instruction sequences. 10 ; %vreg0 (CRRegs) = TFCR %vreg0 (IntRegs) 11 ; = ldd_circ( , , vreg0) 12 ; %vreg1 (CRRegs) = TFCR %vreg1 (IntRegs) 13 ; = ldd_circ( , , vreg0) 14 ; The scheduler would move the CRRegs to the top of the loop. The allocator 15 ; would try to spill the CRRegs after running out of them. We don't have code to 16 ; spill CRRegs and the above assertion would be triggered. 17 declare i8* @llvm.hexagon.circ.ldd(i8*, i8*, i32, i32) nounwind 18 19 define i32 @test(i16 zeroext %var0, i16* %var1, i16 signext %var2, i16* nocapture %var3) nounwind { 20 entry: 21 %var4 = alloca i64, align 8 22 %conv = zext i16 %var0 to i32 23 %shr5 = lshr i32 %conv, 1 24 %idxprom = sext i16 %var2 to i32 25 %arrayidx = getelementptr inbounds i16, i16* %var1, i32 %idxprom 26 %0 = bitcast i16* %var3 to i64* 27 %1 = load i64, i64* %0, align 8, !tbaa !1 28 %2 = bitcast i16* %arrayidx to i8* 29 %3 = bitcast i64* %var4 to i8* 30 %shl = shl nuw nsw i32 %shr5, 3 31 %or = or i32 %shl, 83886080 32 %4 = call i8* @llvm.hexagon.circ.ldd(i8* %2, i8* %3, i32 %or, i32 -8) 33 %sub = add nsw i32 %shr5, -1 34 %cmp6 = icmp sgt i32 %sub, 0 35 %5 = load i64, i64* %var4, align 8, !tbaa !1 36 %6 = call i64 @llvm.hexagon.M2.vdmacs.s1(i64 0, i64 %1, i64 %5) 37 br i1 %cmp6, label %for.body.lr.ph, label %for.end 38 39 for.body.lr.ph: ; preds = %entry 40 %incdec.ptr = getelementptr inbounds i16, i16* %var3, i32 4 41 %7 = bitcast i16* %incdec.ptr to i64* 42 %8 = zext i16 %var0 to i32 43 %9 = lshr i32 %8, 1 44 %10 = add i32 %9, -1 45 %xtraiter = urem i32 %10, 8 46 %lcmp = icmp ne i32 %xtraiter, 0 47 br i1 %lcmp, label %unr.cmp60, label %for.body.lr.ph.split.split 48 49 unr.cmp60: ; preds = %for.body.lr.ph 50 %un.tmp61 = icmp eq i32 %xtraiter, 1 51 br i1 %un.tmp61, label %for.body.unr53, label %unr.cmp51 52 53 unr.cmp51: ; preds = %unr.cmp60 54 %un.tmp52 = icmp eq i32 %xtraiter, 2 55 br i1 %un.tmp52, label %for.body.unr44, label %unr.cmp42 56 57 unr.cmp42: ; preds = %unr.cmp51 58 %un.tmp43 = icmp eq i32 %xtraiter, 3 59 br i1 %un.tmp43, label %for.body.unr35, label %unr.cmp33 60 61 unr.cmp33: ; preds = %unr.cmp42 62 %un.tmp34 = icmp eq i32 %xtraiter, 4 63 br i1 %un.tmp34, label %for.body.unr26, label %unr.cmp24 64 65 unr.cmp24: ; preds = %unr.cmp33 66 %un.tmp25 = icmp eq i32 %xtraiter, 5 67 br i1 %un.tmp25, label %for.body.unr17, label %unr.cmp 68 69 unr.cmp: ; preds = %unr.cmp24 70 %un.tmp = icmp eq i32 %xtraiter, 6 71 br i1 %un.tmp, label %for.body.unr13, label %for.body.unr 72 73 for.body.unr: ; preds = %unr.cmp 74 %11 = call i8* @llvm.hexagon.circ.ldd(i8* %4, i8* %3, i32 %or, i32 -8) 75 %12 = load i64, i64* %7, align 8, !tbaa !1 76 %inc.unr = add nsw i32 0, 1 77 %incdec.ptr4.unr = getelementptr inbounds i64, i64* %7, i32 1 78 %cmp.unr = icmp slt i32 %inc.unr, %sub 79 %13 = load i64, i64* %var4, align 8, !tbaa !1 80 %14 = call i64 @llvm.hexagon.M2.vdmacs.s1(i64 %6, i64 %12, i64 %13) 81 br label %for.body.unr13 82 83 for.body.unr13: ; preds = %for.body.unr, %unr.cmp 84 %15 = phi i64 [ %6, %unr.cmp ], [ %14, %for.body.unr ] 85 %pvar6.09.unr = phi i64* [ %7, %unr.cmp ], [ %incdec.ptr4.unr, %for.body.unr ] 86 %var8.0.in8.unr = phi i8* [ %4, %unr.cmp ], [ %11, %for.body.unr ] 87 %i.07.unr = phi i32 [ 0, %unr.cmp ], [ %inc.unr, %for.body.unr ] 88 %16 = call i8* @llvm.hexagon.circ.ldd(i8* %var8.0.in8.unr, i8* %3, i32 %or, i32 -8) 89 %17 = load i64, i64* %pvar6.09.unr, align 8, !tbaa !1 90 %inc.unr14 = add nsw i32 %i.07.unr, 1 91 %incdec.ptr4.unr15 = getelementptr inbounds i64, i64* %pvar6.09.unr, i32 1 92 %cmp.unr16 = icmp slt i32 %inc.unr14, %sub 93 %18 = load i64, i64* %var4, align 8, !tbaa !1 94 %19 = call i64 @llvm.hexagon.M2.vdmacs.s1(i64 %15, i64 %17, i64 %18) 95 br label %for.body.unr17 96 97 for.body.unr17: ; preds = %for.body.unr13, %unr.cmp24 98 %20 = phi i64 [ %6, %unr.cmp24 ], [ %19, %for.body.unr13 ] 99 %pvar6.09.unr18 = phi i64* [ %7, %unr.cmp24 ], [ %incdec.ptr4.unr15, %for.body.unr13 ] 100 %var8.0.in8.unr19 = phi i8* [ %4, %unr.cmp24 ], [ %16, %for.body.unr13 ] 101 %i.07.unr20 = phi i32 [ 0, %unr.cmp24 ], [ %inc.unr14, %for.body.unr13 ] 102 %21 = call i8* @llvm.hexagon.circ.ldd(i8* %var8.0.in8.unr19, i8* %3, i32 %or, i32 -8) 103 %22 = load i64, i64* %pvar6.09.unr18, align 8, !tbaa !1 104 %inc.unr21 = add nsw i32 %i.07.unr20, 1 105 %incdec.ptr4.unr22 = getelementptr inbounds i64, i64* %pvar6.09.unr18, i32 1 106 %cmp.unr23 = icmp slt i32 %inc.unr21, %sub 107 %23 = load i64, i64* %var4, align 8, !tbaa !1 108 %24 = call i64 @llvm.hexagon.M2.vdmacs.s1(i64 %20, i64 %22, i64 %23) 109 br label %for.body.unr26 110 111 for.body.unr26: ; preds = %for.body.unr17, %unr.cmp33 112 %25 = phi i64 [ %6, %unr.cmp33 ], [ %24, %for.body.unr17 ] 113 %pvar6.09.unr27 = phi i64* [ %7, %unr.cmp33 ], [ %incdec.ptr4.unr22, %for.body.unr17 ] 114 %var8.0.in8.unr28 = phi i8* [ %4, %unr.cmp33 ], [ %21, %for.body.unr17 ] 115 %i.07.unr29 = phi i32 [ 0, %unr.cmp33 ], [ %inc.unr21, %for.body.unr17 ] 116 %26 = call i8* @llvm.hexagon.circ.ldd(i8* %var8.0.in8.unr28, i8* %3, i32 %or, i32 -8) 117 %27 = load i64, i64* %pvar6.09.unr27, align 8, !tbaa !1 118 %inc.unr30 = add nsw i32 %i.07.unr29, 1 119 %incdec.ptr4.unr31 = getelementptr inbounds i64, i64* %pvar6.09.unr27, i32 1 120 %cmp.unr32 = icmp slt i32 %inc.unr30, %sub 121 %28 = load i64, i64* %var4, align 8, !tbaa !1 122 %29 = call i64 @llvm.hexagon.M2.vdmacs.s1(i64 %25, i64 %27, i64 %28) 123 br label %for.body.unr35 124 125 for.body.unr35: ; preds = %for.body.unr26, %unr.cmp42 126 %30 = phi i64 [ %6, %unr.cmp42 ], [ %29, %for.body.unr26 ] 127 %pvar6.09.unr36 = phi i64* [ %7, %unr.cmp42 ], [ %incdec.ptr4.unr31, %for.body.unr26 ] 128 %var8.0.in8.unr37 = phi i8* [ %4, %unr.cmp42 ], [ %26, %for.body.unr26 ] 129 %i.07.unr38 = phi i32 [ 0, %unr.cmp42 ], [ %inc.unr30, %for.body.unr26 ] 130 %31 = call i8* @llvm.hexagon.circ.ldd(i8* %var8.0.in8.unr37, i8* %3, i32 %or, i32 -8) 131 %32 = load i64, i64* %pvar6.09.unr36, align 8, !tbaa !1 132 %inc.unr39 = add nsw i32 %i.07.unr38, 1 133 %incdec.ptr4.unr40 = getelementptr inbounds i64, i64* %pvar6.09.unr36, i32 1 134 %cmp.unr41 = icmp slt i32 %inc.unr39, %sub 135 %33 = load i64, i64* %var4, align 8, !tbaa !1 136 %34 = call i64 @llvm.hexagon.M2.vdmacs.s1(i64 %30, i64 %32, i64 %33) 137 br label %for.body.unr44 138 139 for.body.unr44: ; preds = %for.body.unr35, %unr.cmp51 140 %35 = phi i64 [ %6, %unr.cmp51 ], [ %34, %for.body.unr35 ] 141 %pvar6.09.unr45 = phi i64* [ %7, %unr.cmp51 ], [ %incdec.ptr4.unr40, %for.body.unr35 ] 142 %var8.0.in8.unr46 = phi i8* [ %4, %unr.cmp51 ], [ %31, %for.body.unr35 ] 143 %i.07.unr47 = phi i32 [ 0, %unr.cmp51 ], [ %inc.unr39, %for.body.unr35 ] 144 %36 = call i8* @llvm.hexagon.circ.ldd(i8* %var8.0.in8.unr46, i8* %3, i32 %or, i32 -8) 145 %37 = load i64, i64* %pvar6.09.unr45, align 8, !tbaa !1 146 %inc.unr48 = add nsw i32 %i.07.unr47, 1 147 %incdec.ptr4.unr49 = getelementptr inbounds i64, i64* %pvar6.09.unr45, i32 1 148 %cmp.unr50 = icmp slt i32 %inc.unr48, %sub 149 %38 = load i64, i64* %var4, align 8, !tbaa !1 150 %39 = call i64 @llvm.hexagon.M2.vdmacs.s1(i64 %35, i64 %37, i64 %38) 151 br label %for.body.unr53 152 153 for.body.unr53: ; preds = %for.body.unr44, %unr.cmp60 154 %40 = phi i64 [ %6, %unr.cmp60 ], [ %39, %for.body.unr44 ] 155 %pvar6.09.unr54 = phi i64* [ %7, %unr.cmp60 ], [ %incdec.ptr4.unr49, %for.body.unr44 ] 156 %var8.0.in8.unr55 = phi i8* [ %4, %unr.cmp60 ], [ %36, %for.body.unr44 ] 157 %i.07.unr56 = phi i32 [ 0, %unr.cmp60 ], [ %inc.unr48, %for.body.unr44 ] 158 %41 = call i8* @llvm.hexagon.circ.ldd(i8* %var8.0.in8.unr55, i8* %3, i32 %or, i32 -8) 159 %42 = load i64, i64* %pvar6.09.unr54, align 8, !tbaa !1 160 %inc.unr57 = add nsw i32 %i.07.unr56, 1 161 %incdec.ptr4.unr58 = getelementptr inbounds i64, i64* %pvar6.09.unr54, i32 1 162 %cmp.unr59 = icmp slt i32 %inc.unr57, %sub 163 %43 = load i64, i64* %var4, align 8, !tbaa !1 164 %44 = call i64 @llvm.hexagon.M2.vdmacs.s1(i64 %40, i64 %42, i64 %43) 165 br label %for.body.lr.ph.split 166 167 for.body.lr.ph.split: ; preds = %for.body.unr53 168 %45 = icmp ult i32 %10, 8 169 br i1 %45, label %for.end.loopexit, label %for.body.lr.ph.split.split 170 171 for.body.lr.ph.split.split: ; preds = %for.body.lr.ph.split, %for.body.lr.ph 172 %.unr = phi i64 [ %44, %for.body.lr.ph.split ], [ %6, %for.body.lr.ph ] 173 %pvar6.09.unr62 = phi i64* [ %incdec.ptr4.unr58, %for.body.lr.ph.split ], [ %7, %for.body.lr.ph ] 174 %var8.0.in8.unr63 = phi i8* [ %41, %for.body.lr.ph.split ], [ %4, %for.body.lr.ph ] 175 %i.07.unr64 = phi i32 [ %inc.unr57, %for.body.lr.ph.split ], [ 0, %for.body.lr.ph ] 176 %.lcssa12.unr = phi i64 [ %44, %for.body.lr.ph.split ], [ 0, %for.body.lr.ph ] 177 br label %for.body 178 179 for.body: ; preds = %for.body, %for.body.lr.ph.split.split 180 %46 = phi i64 [ %.unr, %for.body.lr.ph.split.split ], [ %78, %for.body ] 181 %pvar6.09 = phi i64* [ %pvar6.09.unr62, %for.body.lr.ph.split.split ], [ %scevgep71, %for.body ] 182 %var8.0.in8 = phi i8* [ %var8.0.in8.unr63, %for.body.lr.ph.split.split ], [ %75, %for.body ] 183 %i.07 = phi i32 [ %i.07.unr64, %for.body.lr.ph.split.split ], [ %inc.7, %for.body ] 184 %47 = call i8* @llvm.hexagon.circ.ldd(i8* %var8.0.in8, i8* %3, i32 %or, i32 -8) 185 %48 = load i64, i64* %pvar6.09, align 8, !tbaa !1 186 %inc = add nsw i32 %i.07, 1 187 %49 = load i64, i64* %var4, align 8, !tbaa !1 188 %50 = call i64 @llvm.hexagon.M2.vdmacs.s1(i64 %46, i64 %48, i64 %49) 189 %51 = call i8* @llvm.hexagon.circ.ldd(i8* %47, i8* %3, i32 %or, i32 -8) 190 %scevgep = getelementptr i64, i64* %pvar6.09, i32 1 191 %52 = load i64, i64* %scevgep, align 8, !tbaa !1 192 %inc.1 = add nsw i32 %inc, 1 193 %53 = load i64, i64* %var4, align 8, !tbaa !1 194 %54 = call i64 @llvm.hexagon.M2.vdmacs.s1(i64 %50, i64 %52, i64 %53) 195 %55 = call i8* @llvm.hexagon.circ.ldd(i8* %51, i8* %3, i32 %or, i32 -8) 196 %scevgep65 = getelementptr i64, i64* %scevgep, i32 1 197 %56 = load i64, i64* %scevgep65, align 8, !tbaa !1 198 %inc.2 = add nsw i32 %inc.1, 1 199 %57 = load i64, i64* %var4, align 8, !tbaa !1 200 %58 = call i64 @llvm.hexagon.M2.vdmacs.s1(i64 %54, i64 %56, i64 %57) 201 %59 = call i8* @llvm.hexagon.circ.ldd(i8* %55, i8* %3, i32 %or, i32 -8) 202 %scevgep66 = getelementptr i64, i64* %scevgep65, i32 1 203 %60 = load i64, i64* %scevgep66, align 8, !tbaa !1 204 %inc.3 = add nsw i32 %inc.2, 1 205 %61 = load i64, i64* %var4, align 8, !tbaa !1 206 %62 = call i64 @llvm.hexagon.M2.vdmacs.s1(i64 %58, i64 %60, i64 %61) 207 %63 = call i8* @llvm.hexagon.circ.ldd(i8* %59, i8* %3, i32 %or, i32 -8) 208 %scevgep67 = getelementptr i64, i64* %scevgep66, i32 1 209 %64 = load i64, i64* %scevgep67, align 8, !tbaa !1 210 %inc.4 = add nsw i32 %inc.3, 1 211 %65 = load i64, i64* %var4, align 8, !tbaa !1 212 %66 = call i64 @llvm.hexagon.M2.vdmacs.s1(i64 %62, i64 %64, i64 %65) 213 %67 = call i8* @llvm.hexagon.circ.ldd(i8* %63, i8* %3, i32 %or, i32 -8) 214 %scevgep68 = getelementptr i64, i64* %scevgep67, i32 1 215 %68 = load i64, i64* %scevgep68, align 8, !tbaa !1 216 %inc.5 = add nsw i32 %inc.4, 1 217 %69 = load i64, i64* %var4, align 8, !tbaa !1 218 %70 = call i64 @llvm.hexagon.M2.vdmacs.s1(i64 %66, i64 %68, i64 %69) 219 %71 = call i8* @llvm.hexagon.circ.ldd(i8* %67, i8* %3, i32 %or, i32 -8) 220 %scevgep69 = getelementptr i64, i64* %scevgep68, i32 1 221 %72 = load i64, i64* %scevgep69, align 8, !tbaa !1 222 %inc.6 = add nsw i32 %inc.5, 1 223 %73 = load i64, i64* %var4, align 8, !tbaa !1 224 %74 = call i64 @llvm.hexagon.M2.vdmacs.s1(i64 %70, i64 %72, i64 %73) 225 %75 = call i8* @llvm.hexagon.circ.ldd(i8* %71, i8* %3, i32 %or, i32 -8) 226 %scevgep70 = getelementptr i64, i64* %scevgep69, i32 1 227 %76 = load i64, i64* %scevgep70, align 8, !tbaa !1 228 %inc.7 = add nsw i32 %inc.6, 1 229 %77 = load i64, i64* %var4, align 8, !tbaa !1 230 %78 = call i64 @llvm.hexagon.M2.vdmacs.s1(i64 %74, i64 %76, i64 %77) 231 %cmp.7 = icmp slt i32 %inc.7, %sub 232 %scevgep71 = getelementptr i64, i64* %scevgep70, i32 1 233 br i1 %cmp.7, label %for.body, label %for.end.loopexit.unr-lcssa 234 235 for.end.loopexit.unr-lcssa: ; preds = %for.body 236 %.lcssa12.ph = phi i64 [ %78, %for.body ] 237 br label %for.end.loopexit 238 239 for.end.loopexit: ; preds = %for.end.loopexit.unr-lcssa, %for.body.lr.ph.split 240 %.lcssa12 = phi i64 [ %44, %for.body.lr.ph.split ], [ %.lcssa12.ph, %for.end.loopexit.unr-lcssa ] 241 br label %for.end 242 243 for.end: ; preds = %for.end.loopexit, %entry 244 %.lcssa = phi i64 [ %6, %entry ], [ %.lcssa12, %for.end.loopexit ] 245 %79 = call i32 @llvm.hexagon.S2.vrndpackwhs(i64 %.lcssa) 246 ret i32 %79 247 } 248 249 declare i64 @llvm.hexagon.M2.vdmacs.s1(i64, i64, i64) nounwind readnone 250 251 declare i32 @llvm.hexagon.S2.vrndpackwhs(i64) nounwind readnone 252 253 !0 = !{!"long long", !1} 254 !1 = !{!"omnipotent char", !2} 255 !2 = !{!"Simple C/C++ TBAA"} 256