Home | History | Annotate | Download | only in X86
      1 ; RUN: opt < %s -basicaa -slp-vectorizer -dce -S -mtriple=x86_64-apple-macosx10.8.0 -mcpu=corei7-avx | FileCheck %s
      2 
      3 target datalayout = "e-p:64:64:64-i1:8:8-i8:8:8-i16:16:16-i32:32:32-i64:64:64-f32:32:32-f64:64:64-v64:64:64-v128:128:128-a0:0:64-s0:64:64-f80:128:128-n8:16:32:64-S128"
      4 target triple = "x86_64-apple-macosx10.8.0"
      5 
      6 ;CHECK:rollable
      7 define i32 @rollable(i32* noalias nocapture %in, i32* noalias nocapture %out, i64 %n) {
      8   %1 = icmp eq i64 %n, 0
      9   br i1 %1, label %._crit_edge, label %.lr.ph
     10 
     11 .lr.ph:                                           ; preds = %0, %.lr.ph
     12   %i.019 = phi i64 [ %26, %.lr.ph ], [ 0, %0 ]
     13   %2 = shl i64 %i.019, 2
     14   %3 = getelementptr inbounds i32* %in, i64 %2
     15 ;CHECK:load <4 x i32>
     16   %4 = load i32* %3, align 4
     17   %5 = or i64 %2, 1
     18   %6 = getelementptr inbounds i32* %in, i64 %5
     19   %7 = load i32* %6, align 4
     20   %8 = or i64 %2, 2
     21   %9 = getelementptr inbounds i32* %in, i64 %8
     22   %10 = load i32* %9, align 4
     23   %11 = or i64 %2, 3
     24   %12 = getelementptr inbounds i32* %in, i64 %11
     25   %13 = load i32* %12, align 4
     26 ;CHECK:mul <4 x i32>
     27   %14 = mul i32 %4, 7
     28 ;CHECK:add <4 x i32>
     29   %15 = add i32 %14, 7
     30   %16 = mul i32 %7, 7
     31   %17 = add i32 %16, 14
     32   %18 = mul i32 %10, 7
     33   %19 = add i32 %18, 21
     34   %20 = mul i32 %13, 7
     35   %21 = add i32 %20, 28
     36   %22 = getelementptr inbounds i32* %out, i64 %2
     37 ;CHECK:store <4 x i32>
     38   store i32 %15, i32* %22, align 4
     39   %23 = getelementptr inbounds i32* %out, i64 %5
     40   store i32 %17, i32* %23, align 4
     41   %24 = getelementptr inbounds i32* %out, i64 %8
     42   store i32 %19, i32* %24, align 4
     43   %25 = getelementptr inbounds i32* %out, i64 %11
     44   store i32 %21, i32* %25, align 4
     45   %26 = add i64 %i.019, 1
     46   %exitcond = icmp eq i64 %26, %n
     47   br i1 %exitcond, label %._crit_edge, label %.lr.ph
     48 
     49 ._crit_edge:                                      ; preds = %.lr.ph, %0
     50 ;CHECK: ret
     51   ret i32 undef
     52 }
     53 
     54 ;CHECK:unrollable
     55 ;CHECK-NOT: <4 x i32>
     56 ;CHECK: ret
     57 define i32 @unrollable(i32* %in, i32* %out, i64 %n) nounwind ssp uwtable {
     58   %1 = icmp eq i64 %n, 0
     59   br i1 %1, label %._crit_edge, label %.lr.ph
     60 
     61 .lr.ph:                                           ; preds = %0, %.lr.ph
     62   %i.019 = phi i64 [ %26, %.lr.ph ], [ 0, %0 ]
     63   %2 = shl i64 %i.019, 2
     64   %3 = getelementptr inbounds i32* %in, i64 %2
     65   %4 = load i32* %3, align 4
     66   %5 = or i64 %2, 1
     67   %6 = getelementptr inbounds i32* %in, i64 %5
     68   %7 = load i32* %6, align 4
     69   %8 = or i64 %2, 2
     70   %9 = getelementptr inbounds i32* %in, i64 %8
     71   %10 = load i32* %9, align 4
     72   %11 = or i64 %2, 3
     73   %12 = getelementptr inbounds i32* %in, i64 %11
     74   %13 = load i32* %12, align 4
     75   %14 = mul i32 %4, 7
     76   %15 = add i32 %14, 7
     77   %16 = mul i32 %7, 7
     78   %17 = add i32 %16, 14
     79   %18 = mul i32 %10, 7
     80   %19 = add i32 %18, 21
     81   %20 = mul i32 %13, 7
     82   %21 = add i32 %20, 28
     83   %22 = getelementptr inbounds i32* %out, i64 %2
     84   store i32 %15, i32* %22, align 4
     85   %23 = getelementptr inbounds i32* %out, i64 %5
     86   store i32 %17, i32* %23, align 4
     87   %barrier = call i32 @goo(i32 0)                      ; <---------------- memory barrier.
     88   %24 = getelementptr inbounds i32* %out, i64 %8
     89   store i32 %19, i32* %24, align 4
     90   %25 = getelementptr inbounds i32* %out, i64 %11
     91   store i32 %21, i32* %25, align 4
     92   %26 = add i64 %i.019, 1
     93   %exitcond = icmp eq i64 %26, %n
     94   br i1 %exitcond, label %._crit_edge, label %.lr.ph
     95 
     96 ._crit_edge:                                      ; preds = %.lr.ph, %0
     97   ret i32 undef
     98 }
     99 
    100 declare i32 @goo(i32)
    101