Home | History | Annotate | Download | only in CodeGen
      1 // RUN: %clang_cc1 %s -triple=x86_64-apple-darwin -target-feature +avx -emit-llvm -o - | FileCheck %s
      2 
      3 // Don't include mm_malloc.h, it's system specific.
      4 #define __MM_MALLOC_H
      5 
      6 #include <immintrin.h>
      7 
      8 //
      9 // Test LLVM IR codegen of shuffle instructions
     10 //
     11 
     12 __m256 test__mm256_loadu_ps(void* p) {
     13   // CHECK: load <8 x float>, <8 x float>* %{{.*}}, align 1
     14   return _mm256_loadu_ps(p);
     15 }
     16 
     17 __m256d test__mm256_loadu_pd(void* p) {
     18   // CHECK: load <4 x double>, <4 x double>* %{{.*}}, align 1
     19   return _mm256_loadu_pd(p);
     20 }
     21 
     22 __m256i test__mm256_loadu_si256(void* p) {
     23   // CHECK: load <4 x i64>, <4 x i64>* %{{.+}}, align 1
     24   return _mm256_loadu_si256(p);
     25 }
     26 
     27 __m128i test_mm_cmpestrm(__m128i A, int LA, __m128i B, int LB) {
     28   // CHECK: @llvm.x86.sse42.pcmpestrm128
     29   return _mm_cmpestrm(A, LA, B, LB, 7);
     30 }
     31 
     32 int test_mm_cmpestri(__m128i A, int LA, __m128i B, int LB) {
     33   // CHECK: @llvm.x86.sse42.pcmpestri128
     34   return _mm_cmpestri(A, LA, B, LB, 7);
     35 }
     36 
     37 int test_mm_cmpestra(__m128i A, int LA, __m128i B, int LB) {
     38   // CHECK: @llvm.x86.sse42.pcmpestria128
     39   return _mm_cmpestra(A, LA, B, LB, 7);
     40 }
     41 
     42 int test_mm_cmpestrc(__m128i A, int LA, __m128i B, int LB) {
     43   // CHECK: @llvm.x86.sse42.pcmpestric128
     44   return _mm_cmpestrc(A, LA, B, LB, 7);
     45 }
     46 
     47 int test_mm_cmpestro(__m128i A, int LA, __m128i B, int LB) {
     48   // CHECK: @llvm.x86.sse42.pcmpestrio128
     49   return _mm_cmpestro(A, LA, B, LB, 7);
     50 }
     51 
     52 int test_mm_cmpestrs(__m128i A, int LA, __m128i B, int LB) {
     53   // CHECK: @llvm.x86.sse42.pcmpestris128
     54   return _mm_cmpestrs(A, LA, B, LB, 7);
     55 }
     56 
     57 int test_mm_cmpestrz(__m128i A, int LA, __m128i B, int LB) {
     58   // CHECK: @llvm.x86.sse42.pcmpestriz128
     59   return _mm_cmpestrz(A, LA, B, LB, 7);
     60 }
     61 
     62 __m128i test_mm_cmpistrm(__m128i A, __m128i B) {
     63   // CHECK: @llvm.x86.sse42.pcmpistrm128
     64   return _mm_cmpistrm(A, B, 7);
     65 }
     66 
     67 int test_mm_cmpistri(__m128i A, __m128i B) {
     68   // CHECK: @llvm.x86.sse42.pcmpistri128
     69   return _mm_cmpistri(A, B, 7);
     70 }
     71 
     72 int test_mm_cmpistra(__m128i A, __m128i B) {
     73   // CHECK: @llvm.x86.sse42.pcmpistria128
     74   return _mm_cmpistra(A, B, 7);
     75 }
     76 
     77 int test_mm_cmpistrc(__m128i A, __m128i B) {
     78   // CHECK: @llvm.x86.sse42.pcmpistric128
     79   return _mm_cmpistrc(A, B, 7);
     80 }
     81 
     82 int test_mm_cmpistro(__m128i A, __m128i B) {
     83   // CHECK: @llvm.x86.sse42.pcmpistrio128
     84   return _mm_cmpistro(A, B, 7);
     85 }
     86 
     87 int test_mm_cmpistrs(__m128i A, __m128i B) {
     88   // CHECK: @llvm.x86.sse42.pcmpistris128
     89   return _mm_cmpistrs(A, B, 7);
     90 }
     91 
     92 int test_mm_cmpistrz(__m128i A, __m128i B) {
     93   // CHECK: @llvm.x86.sse42.pcmpistriz128
     94   return _mm_cmpistrz(A, B, 7);
     95 }
     96 
     97 int test_extract_epi32(__m256i __a) {
     98   // CHECK-LABEL: @test_extract_epi32
     99   // CHECK: [[SHIFT1:%[^ ]+]] = and i32 %{{.*}}, 7
    100   // CHECK: extractelement <8 x i32> %{{.*}}, i32 [[SHIFT1]]
    101   return _mm256_extract_epi32(__a, 8);
    102 }
    103 
    104 int test_extract_epi16(__m256i __a) {
    105   // CHECK-LABEL: @test_extract_epi16
    106   // CHECK: [[SHIFT2:%[^ ]+]] = and i32 %{{.*}}, 15
    107   // CHECK: extractelement <16 x i16> %{{.*}}, i32 [[SHIFT2]]
    108   return _mm256_extract_epi16(__a, 16);
    109 }
    110 
    111 int test_extract_epi8(__m256i __a) {
    112   // CHECK-LABEL: @test_extract_epi8
    113   // CHECK: [[SHIFT3:%[^ ]+]] = and i32 %{{.*}}, 31
    114   // CHECK: extractelement <32 x i8> %{{.*}}, i32 [[SHIFT3]]
    115   return _mm256_extract_epi8(__a, 32);
    116 }
    117 
    118 __m256d test_256_blend_pd(__m256d __a, __m256d __b) {
    119   // CHECK-LABEL: @test_256_blend_pd
    120   // CHECK: shufflevector <4 x double> %{{.*}}, <4 x double> %{{.*}}, <4 x i32> <i32 4, i32 1, i32 6, i32 3>
    121   return _mm256_blend_pd(__a, __b, 0x35);
    122 }
    123 
    124 __m256 test_256_blend_ps(__m256 __a, __m256 __b) {
    125   // CHECK-LABEL: @test_256_blend_ps
    126   // CHECK: shufflevector <8 x float> %{{.*}}, <8 x float> %{{.*}}, <8 x i32> <i32 8, i32 1, i32 10, i32 3, i32 12, i32 13, i32 6, i32 7>
    127   return _mm256_blend_ps(__a, __b, 0x35);
    128 }
    129 
    130 __m256i test_256_insert_epi8(__m256i __a) {
    131   // CHECK-LABEL: @test_256_insert_epi8
    132   // CHECK: insertelement <32 x i8> {{.*}}, i8 {{.*}}, i32 {{.*}}
    133   return _mm256_insert_epi8(__a, 42, 3);
    134 }
    135 
    136 __m256i test_256_insert_epi16(__m256i __a) {
    137   // CHECK-LABEL: @test_256_insert_epi16
    138   // CHECK: insertelement <16 x i16> {{.*}}, i16 {{.*}}, i32 {{.*}}
    139   return _mm256_insert_epi16(__a, 42, 3);
    140 }
    141 
    142 __m256i test_256_insert_epi32(__m256i __a) {
    143   // CHECK-LABEL: @test_256_insert_epi32
    144   // CHECK: insertelement <8 x i32> {{.*}}, i32 {{.*}}, i32 {{.*}}
    145   return _mm256_insert_epi32(__a, 42, 3);
    146 }
    147 
    148 __m256i test_256_insert_epi64(__m256i __a) {
    149   // CHECK-LABEL: @test_256_insert_epi64
    150   // CHECK: insertelement <4 x i64> {{.*}}, i64 {{.*}}, i32 {{.*}}
    151   return _mm256_insert_epi64(__a, 42, 3);
    152 }
    153 
    154 __m256 test_mm256_undefined_ps() {
    155   // CHECK-LABEL: @test_mm256_undefined_ps
    156   // CHECK: ret <8 x float> undef
    157   return _mm256_undefined_ps();
    158 }
    159 
    160 __m256d test_mm256_undefined_pd() {
    161   // CHECK-LABEL: @test_mm256_undefined_pd
    162   // CHECK: ret <4 x double> undef
    163   return _mm256_undefined_pd();
    164 }
    165 
    166 __m256i test_mm256_undefined_si256() {
    167   // CHECK-LABEL: @test_mm256_undefined_si256
    168   // CHECK: ret <4 x i64> undef
    169   return _mm256_undefined_si256();
    170 }
    171