1 ; RUN: opt < %s -S -instcombine > %t 2 ; RUN: grep "= getelementptr" %t | count 20 3 ; RUN: grep "= phi" %t | count 13 4 5 ; Don't push the geps through these phis, because they would require 6 ; two phis each, which burdens the loop with high register pressure. 7 8 define void @foo(float* %Ar, float* %Ai, i64 %As, float* %Cr, float* %Ci, i64 %Cs, i64 %n) nounwind { 9 entry: 10 %0 = getelementptr inbounds float* %Ar, i64 0 ; <float*> [#uses=1] 11 %1 = getelementptr inbounds float* %Ai, i64 0 ; <float*> [#uses=1] 12 %2 = mul i64 %n, %As ; <i64> [#uses=1] 13 %3 = getelementptr inbounds float* %Ar, i64 %2 ; <float*> [#uses=1] 14 %4 = mul i64 %n, %As ; <i64> [#uses=1] 15 %5 = getelementptr inbounds float* %Ai, i64 %4 ; <float*> [#uses=1] 16 %6 = mul i64 %n, 2 ; <i64> [#uses=1] 17 %7 = mul i64 %6, %As ; <i64> [#uses=1] 18 %8 = getelementptr inbounds float* %Ar, i64 %7 ; <float*> [#uses=1] 19 %9 = mul i64 %n, 2 ; <i64> [#uses=1] 20 %10 = mul i64 %9, %As ; <i64> [#uses=1] 21 %11 = getelementptr inbounds float* %Ai, i64 %10 ; <float*> [#uses=1] 22 %12 = getelementptr inbounds float* %Cr, i64 0 ; <float*> [#uses=1] 23 %13 = getelementptr inbounds float* %Ci, i64 0 ; <float*> [#uses=1] 24 %14 = mul i64 %n, %Cs ; <i64> [#uses=1] 25 %15 = getelementptr inbounds float* %Cr, i64 %14 ; <float*> [#uses=1] 26 %16 = mul i64 %n, %Cs ; <i64> [#uses=1] 27 %17 = getelementptr inbounds float* %Ci, i64 %16 ; <float*> [#uses=1] 28 %18 = mul i64 %n, 2 ; <i64> [#uses=1] 29 %19 = mul i64 %18, %Cs ; <i64> [#uses=1] 30 %20 = getelementptr inbounds float* %Cr, i64 %19 ; <float*> [#uses=1] 31 %21 = mul i64 %n, 2 ; <i64> [#uses=1] 32 %22 = mul i64 %21, %Cs ; <i64> [#uses=1] 33 %23 = getelementptr inbounds float* %Ci, i64 %22 ; <float*> [#uses=1] 34 br label %bb13 35 36 bb: ; preds = %bb13 37 %24 = load float* %A0r.0, align 4 ; <float> [#uses=1] 38 %25 = load float* %A0i.0, align 4 ; <float> [#uses=1] 39 %26 = load float* %A1r.0, align 4 ; <float> [#uses=2] 40 %27 = load float* %A1i.0, align 4 ; <float> [#uses=2] 41 %28 = load float* %A2r.0, align 4 ; <float> [#uses=2] 42 %29 = load float* %A2i.0, align 4 ; <float> [#uses=2] 43 %30 = fadd float %26, %28 ; <float> [#uses=2] 44 %31 = fadd float %27, %29 ; <float> [#uses=2] 45 %32 = fsub float %26, %28 ; <float> [#uses=1] 46 %33 = fsub float %27, %29 ; <float> [#uses=1] 47 %34 = fadd float %24, %30 ; <float> [#uses=2] 48 %35 = fadd float %25, %31 ; <float> [#uses=2] 49 %36 = fmul float %30, -1.500000e+00 ; <float> [#uses=1] 50 %37 = fmul float %31, -1.500000e+00 ; <float> [#uses=1] 51 %38 = fadd float %34, %36 ; <float> [#uses=2] 52 %39 = fadd float %35, %37 ; <float> [#uses=2] 53 %40 = fmul float %32, 0x3FEBB67AE0000000 ; <float> [#uses=2] 54 %41 = fmul float %33, 0x3FEBB67AE0000000 ; <float> [#uses=2] 55 %42 = fadd float %38, %41 ; <float> [#uses=1] 56 %43 = fsub float %39, %40 ; <float> [#uses=1] 57 %44 = fsub float %38, %41 ; <float> [#uses=1] 58 %45 = fadd float %39, %40 ; <float> [#uses=1] 59 store float %34, float* %C0r.0, align 4 60 store float %35, float* %C0i.0, align 4 61 store float %42, float* %C1r.0, align 4 62 store float %43, float* %C1i.0, align 4 63 store float %44, float* %C2r.0, align 4 64 store float %45, float* %C2i.0, align 4 65 %46 = getelementptr inbounds float* %A0r.0, i64 %As ; <float*> [#uses=1] 66 %47 = getelementptr inbounds float* %A0i.0, i64 %As ; <float*> [#uses=1] 67 %48 = getelementptr inbounds float* %A1r.0, i64 %As ; <float*> [#uses=1] 68 %49 = getelementptr inbounds float* %A1i.0, i64 %As ; <float*> [#uses=1] 69 %50 = getelementptr inbounds float* %A2r.0, i64 %As ; <float*> [#uses=1] 70 %51 = getelementptr inbounds float* %A2i.0, i64 %As ; <float*> [#uses=1] 71 %52 = getelementptr inbounds float* %C0r.0, i64 %Cs ; <float*> [#uses=1] 72 %53 = getelementptr inbounds float* %C0i.0, i64 %Cs ; <float*> [#uses=1] 73 %54 = getelementptr inbounds float* %C1r.0, i64 %Cs ; <float*> [#uses=1] 74 %55 = getelementptr inbounds float* %C1i.0, i64 %Cs ; <float*> [#uses=1] 75 %56 = getelementptr inbounds float* %C2r.0, i64 %Cs ; <float*> [#uses=1] 76 %57 = getelementptr inbounds float* %C2i.0, i64 %Cs ; <float*> [#uses=1] 77 %58 = add nsw i64 %i.0, 1 ; <i64> [#uses=1] 78 br label %bb13 79 80 bb13: ; preds = %bb, %entry 81 %i.0 = phi i64 [ 0, %entry ], [ %58, %bb ] ; <i64> [#uses=2] 82 %C2i.0 = phi float* [ %23, %entry ], [ %57, %bb ] ; <float*> [#uses=2] 83 %C2r.0 = phi float* [ %20, %entry ], [ %56, %bb ] ; <float*> [#uses=2] 84 %C1i.0 = phi float* [ %17, %entry ], [ %55, %bb ] ; <float*> [#uses=2] 85 %C1r.0 = phi float* [ %15, %entry ], [ %54, %bb ] ; <float*> [#uses=2] 86 %C0i.0 = phi float* [ %13, %entry ], [ %53, %bb ] ; <float*> [#uses=2] 87 %C0r.0 = phi float* [ %12, %entry ], [ %52, %bb ] ; <float*> [#uses=2] 88 %A2i.0 = phi float* [ %11, %entry ], [ %51, %bb ] ; <float*> [#uses=2] 89 %A2r.0 = phi float* [ %8, %entry ], [ %50, %bb ] ; <float*> [#uses=2] 90 %A1i.0 = phi float* [ %5, %entry ], [ %49, %bb ] ; <float*> [#uses=2] 91 %A1r.0 = phi float* [ %3, %entry ], [ %48, %bb ] ; <float*> [#uses=2] 92 %A0i.0 = phi float* [ %1, %entry ], [ %47, %bb ] ; <float*> [#uses=2] 93 %A0r.0 = phi float* [ %0, %entry ], [ %46, %bb ] ; <float*> [#uses=2] 94 %59 = icmp slt i64 %i.0, %n ; <i1> [#uses=1] 95 br i1 %59, label %bb, label %bb14 96 97 bb14: ; preds = %bb13 98 br label %return 99 100 return: ; preds = %bb14 101 ret void 102 } 103