/external/llvm/test/CodeGen/X86/ |
vector-shift-lshr-512.ll | 40 ; ALL-NEXT: vpunpckhwd {{.*#+}} ymm2 = ymm3[4],ymm4[4],ymm3[5],ymm4[5],ymm3[6],ymm4[6],ymm3[7],ymm4[7],ymm3[12],ymm4[12],ymm3[13],ymm4[13],ymm3[14],ymm4[14],ymm3[15],ymm4[15] 44 ; ALL-NEXT: vpunpcklwd {{.*#+}} ymm3 = ymm3[0],ymm4[0],ymm3[1],ymm4[1],ymm3[2],ymm4[2],ymm3[3],ymm4[3],ymm3[8],ymm4[8],ymm3[9],ymm4[9],ymm3[10 (…) [all...] |
vector-shift-ashr-512.ll | 40 ; ALL-NEXT: vpunpckhwd {{.*#+}} ymm2 = ymm3[4],ymm4[4],ymm3[5],ymm4[5],ymm3[6],ymm4[6],ymm3[7],ymm4[7],ymm3[12],ymm4[12],ymm3[13],ymm4[13],ymm3[14],ymm4[14],ymm3[15],ymm4[15] 44 ; ALL-NEXT: vpunpcklwd {{.*#+}} ymm3 = ymm3[0],ymm4[0],ymm3[1],ymm4[1],ymm3[2],ymm4[2],ymm3[3],ymm4[3],ymm3[8],ymm4[8],ymm3[9],ymm4[9],ymm3[10 (…) [all...] |
fma_patterns_wide.ll | 15 ; FMA-NEXT: vfmadd213ps %ymm5, %ymm3, %ymm1 21 ; FMA4-NEXT: vfmaddps %ymm5, %ymm3, %ymm1, %ymm1 37 ; FMA-NEXT: vfmadd213pd %ymm5, %ymm3, %ymm1 43 ; FMA4-NEXT: vfmaddpd %ymm5, %ymm3, %ymm1, %ymm1 63 ; FMA-NEXT: vfmsub213ps %ymm5, %ymm3, %ymm1 69 ; FMA4-NEXT: vfmsubps %ymm5, %ymm3, %ymm1, %ymm1 85 ; FMA-NEXT: vfmsub213pd %ymm5, %ymm3, %ymm1 91 ; FMA4-NEXT: vfmsubpd %ymm5, %ymm3, %ymm1, %ymm1 111 ; FMA-NEXT: vfnmadd213ps %ymm5, %ymm3, %ymm1 117 ; FMA4-NEXT: vfnmaddps %ymm5, %ymm3, %ymm1, %ymm [all...] |
vector-shift-shl-512.ll | 40 ; ALL-NEXT: vpunpckhwd {{.*#+}} ymm2 = ymm3[4],ymm4[4],ymm3[5],ymm4[5],ymm3[6],ymm4[6],ymm3[7],ymm4[7],ymm3[12],ymm4[12],ymm3[13],ymm4[13],ymm3[14],ymm4[14],ymm3[15],ymm4[15] 44 ; ALL-NEXT: vpunpcklwd {{.*#+}} ymm3 = ymm3[0],ymm4[0],ymm3[1],ymm4[1],ymm3[2],ymm4[2],ymm3[3],ymm4[3],ymm3[8],ymm4[8],ymm3[9],ymm4[9],ymm3[10 (…) [all...] |
vector-popcnt-512.ll | 112 ; ALL-NEXT: vpand %ymm2, %ymm0, %ymm3 114 ; ALL-NEXT: vpshufb %ymm3, %ymm4, %ymm3 118 ; ALL-NEXT: vpaddb %ymm3, %ymm0, %ymm0 119 ; ALL-NEXT: vpsllw $8, %ymm0, %ymm3 120 ; ALL-NEXT: vpaddb %ymm0, %ymm3, %ymm0 122 ; ALL-NEXT: vpand %ymm2, %ymm1, %ymm3 123 ; ALL-NEXT: vpshufb %ymm3, %ymm4, %ymm3 127 ; ALL-NEXT: vpaddb %ymm3, %ymm1, %ymm [all...] |
avx2-vector-shifts.ll | 289 ; CHECK-NEXT: vpunpckhwd {{.*#+}} ymm3 = ymm1[4],ymm2[4],ymm1[5],ymm2[5],ymm1[6],ymm2[6],ymm1[7],ymm2[7],ymm1[12],ymm2[12],ymm1[13],ymm2[13],ymm1[14],ymm2[14],ymm1[15],ymm2[15] 291 ; CHECK-NEXT: vpsllvd %ymm3, %ymm4, %ymm3 292 ; CHECK-NEXT: vpsrld $16, %ymm3, %ymm3 297 ; CHECK-NEXT: vpackusdw %ymm3, %ymm0, %ymm0 336 ; CHECK-NEXT: vpunpckhwd {{.*#+}} ymm3 = ymm1[4],ymm2[4],ymm1[5],ymm2[5],ymm1[6],ymm2[6],ymm1[7],ymm2[7],ymm1[12],ymm2[12],ymm1[13],ymm2[13],ymm1[14],ymm2[14],ymm1[15],ymm2[15] 338 ; CHECK-NEXT: vpsravd %ymm3, %ymm4, %ymm3 339 ; CHECK-NEXT: vpsrld $16, %ymm3, %ymm [all...] |
vector-rotate-256.ll | 224 ; AVX2-NEXT: vpxor %ymm3, %ymm3, %ymm3 225 ; AVX2-NEXT: vpunpckhwd {{.*#+}} ymm4 = ymm1[4],ymm3[4],ymm1[5],ymm3[5],ymm1[6],ymm3[6],ymm1[7],ymm3[7],ymm1[12],ymm3[12],ymm1[13],ymm3[13],ymm1[14],ymm3[14],ymm1[15],ymm3[15 [all...] |
vector-tzcnt-512.ll | 140 ; ALL-NEXT: vpsubw %ymm0, %ymm2, %ymm3 141 ; ALL-NEXT: vpand %ymm3, %ymm0, %ymm0 142 ; ALL-NEXT: vmovdqa {{.*#+}} ymm3 = [1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1] 143 ; ALL-NEXT: vpsubw %ymm3, %ymm0, %ymm0 157 ; ALL-NEXT: vpsubw %ymm3, %ymm1, %ymm1 176 ; ALL-NEXT: vpsubw %ymm0, %ymm2, %ymm3 177 ; ALL-NEXT: vpand %ymm3, %ymm0, %ymm0 178 ; ALL-NEXT: vmovdqa {{.*#+}} ymm3 = [1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1] 179 ; ALL-NEXT: vpsubw %ymm3, %ymm0, %ymm0 193 ; ALL-NEXT: vpsubw %ymm3, %ymm1, %ymm [all...] |
vector-tzcnt-256.ll | 12 ; AVX1-NEXT: vinsertf128 $1, %xmm1, %ymm3, %ymm1 45 ; AVX2-NEXT: vpand %ymm2, %ymm0, %ymm3 47 ; AVX2-NEXT: vpshufb %ymm3, %ymm4, %ymm3 51 ; AVX2-NEXT: vpaddb %ymm3, %ymm0, %ymm0 65 ; AVX1-NEXT: vinsertf128 $1, %xmm1, %ymm3, %ymm1 98 ; AVX2-NEXT: vpand %ymm2, %ymm0, %ymm3 100 ; AVX2-NEXT: vpshufb %ymm3, %ymm4, %ymm3 104 ; AVX2-NEXT: vpaddb %ymm3, %ymm0, %ymm [all...] |
vector-shift-ashr-256.ll | 41 ; AVX2-NEXT: vpsrlvq %ymm1, %ymm2, %ymm3 44 ; AVX2-NEXT: vpsubq %ymm3, %ymm0, %ymm0 62 ; XOPAVX2-NEXT: vpsrlvq %ymm1, %ymm2, %ymm3 65 ; XOPAVX2-NEXT: vpsubq %ymm3, %ymm0, %ymm0 166 ; AVX2-NEXT: vpunpckhwd {{.*#+}} ymm3 = ymm1[4],ymm2[4],ymm1[5],ymm2[5],ymm1[6],ymm2[6],ymm1[7],ymm2[7],ymm1[12],ymm2[12],ymm1[13],ymm2[13],ymm1[14],ymm2[14],ymm1[15],ymm2[15] 168 ; AVX2-NEXT: vpsravd %ymm3, %ymm4, %ymm3 169 ; AVX2-NEXT: vpsrld $16, %ymm3, %ymm3 174 ; AVX2-NEXT: vpackusdw %ymm3, %ymm0, %ymm [all...] |
avx512-logic.ll | 125 ; KNL-NEXT: vandps %ymm3, %ymm1, %ymm1 140 ; KNL-NEXT: vorps %ymm3, %ymm1, %ymm1 155 ; KNL-NEXT: vxorps %ymm3, %ymm1, %ymm1 170 ; KNL-NEXT: vandps %ymm3, %ymm1, %ymm1 185 ; KNL-NEXT: vorps %ymm3, %ymm1, %ymm1 200 ; KNL-NEXT: vxorps %ymm3, %ymm1, %ymm1
|
machine-combiner-int-vec.ll | 75 ; AVX-NEXT: vpand %ymm3, %ymm2, %ymm1 89 ; AVX-NEXT: vpor %ymm3, %ymm2, %ymm1 103 ; AVX-NEXT: vpxor %ymm3, %ymm2, %ymm1
|
vector-popcnt-256.ll | 33 ; AVX2-NEXT: vmovdqa {{.*#+}} ymm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4,0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4] 34 ; AVX2-NEXT: vpshufb %ymm2, %ymm3, %ymm2 37 ; AVX2-NEXT: vpshufb %ymm0, %ymm3, %ymm0 82 ; AVX2-NEXT: vmovdqa {{.*#+}} ymm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4,0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4] 83 ; AVX2-NEXT: vpshufb %ymm2, %ymm3, %ymm2 86 ; AVX2-NEXT: vpshufb %ymm0, %ymm3, %ymm0 130 ; AVX2-NEXT: vmovdqa {{.*#+}} ymm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4,0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4] 131 ; AVX2-NEXT: vpshufb %ymm2, %ymm3, %ymm2 134 ; AVX2-NEXT: vpshufb %ymm0, %ymm3, %ymm0 169 ; AVX2-NEXT: vmovdqa {{.*#+}} ymm3 = [0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4,0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4 [all...] |
masked_gather_scatter.ll | 335 ; KNL_64-NEXT: vpgatherqd (,%zmm0), %ymm3 {%k3} 338 ; KNL_64-NEXT: vpgatherqd (,%zmm0), %ymm3 {%k1} 360 ; SKX-NEXT: vpgatherqd (,%zmm0), %ymm3 {%k3} 363 ; SKX-NEXT: vpgatherqd (,%zmm0), %ymm3 {%k1} 419 ; KNL_32-NEXT: vpbroadcastd .LCPI8_0, %ymm3 420 ; KNL_32-NEXT: vpmulld %ymm3, %ymm1, %ymm1 422 ; KNL_32-NEXT: vpbroadcastd .LCPI8_1, %ymm3 423 ; KNL_32-NEXT: vpmulld %ymm3, %ymm0, %ymm0 481 ; KNL_32-NEXT: vpbroadcastd .LCPI9_0, %ymm3 482 ; KNL_32-NEXT: vpmulld %ymm3, %ymm1, %ymm [all...] |
musttail-fastcall.ll | 67 ; AVX-DAG: vmovups %ymm3, {{.*}} 90 ; AVX-DAG: vmovups {{.*}}, %ymm3
|
vselect-minmax.ll | [all...] |
vec_minmax_uint.ll | 178 ; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm3, %ymm2 185 ; AVX2-NEXT: vpxor %ymm2, %ymm1, %ymm3 187 ; AVX2-NEXT: vpcmpgtq %ymm3, %ymm2, %ymm2 194 ; AVX512-NEXT: vpxor %ymm2, %ymm1, %ymm3 196 ; AVX512-NEXT: vpcmpgtq %ymm3, %ymm2, %ymm2 618 ; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm3, %ymm2 625 ; AVX2-NEXT: vpxor %ymm2, %ymm0, %ymm3 627 ; AVX2-NEXT: vpcmpgtq %ymm3, %ymm2, %ymm2 628 ; AVX2-NEXT: vpcmpeqd %ymm3, %ymm3, %ymm [all...] |
/external/llvm/test/MC/X86/ |
x86-32-avx.s | [all...] |
/external/libyuv/files/source/ |
row_win.cc | 529 vpcmpeqb ymm3, ymm3, ymm3 // generate mask 0xf800f800 for Red 530 vpsllw ymm3, ymm3, 11 545 vpand ymm1, ymm0, ymm3 // R in upper 5 bits 580 vpcmpeqb ymm3, ymm3, ymm3 // generate mask 0xf800f800 for Red 581 vpsllw ymm3, ymm3, 1 [all...] |
scale_win.cc | 284 vmovdqu ymm3, [eax + esi + 32] local 289 vpmaddubsw ymm3, ymm3, ymm4 local 291 vpaddw ymm1, ymm1, ymm3 454 vmovdqu ymm3, [eax + esi + 32] local 458 vpmaddubsw ymm3, ymm3, ymm4 local 460 vpaddw ymm1, ymm1, ymm3 462 vmovdqu ymm3, [eax + esi * 2 + 32] local 464 vpmaddubsw ymm3, ymm3, ymm local 468 vmovdqu ymm3, [eax + edi + 32] local 471 vpmaddubsw ymm3, ymm3, ymm4 local 844 vmovdqu ymm3, [eax] \/\/ read 32 bytes local 846 vpermq ymm3, ymm3, 0xd8 \/\/ unmutate for vpunpck local 847 vpunpcklbw ymm2, ymm3, ymm5 local 848 vpunpckhbw ymm3, ymm3, ymm5 local 850 vpaddusw ymm1, ymm3, [edx + 32] local [all...] |
scale_gcc.cc | 260 MEMOPREG(vmovdqu,0x20,0,3,1,ymm3) // vmovdqu 0x20(%0,%3,1),%%ymm3 265 "vpmaddubsw %%ymm4,%%ymm3,%%ymm3 \n" 267 "vpaddw %%ymm3,%%ymm1,%%ymm1 \n" 416 MEMOPREG(vmovdqu,0x20,0,3,1,ymm3) // vmovdqu 0x20(%0,%3,1),%%ymm3 420 "vpmaddubsw %%ymm4,%%ymm3,%%ymm3 \n" 422 "vpaddw %%ymm3,%%ymm1,%%ymm1 \n [all...] |
compare_win.cc | 79 vpsubusb ymm3, ymm1, ymm2 // abs difference trick local 81 vpor ymm1, ymm2, ymm3
|
/external/libvpx/libvpx/third_party/libyuv/source/ |
row_win.cc | 534 vpcmpeqb ymm3, ymm3, ymm3 // generate mask 0xf800f800 for Red local 535 vpsllw ymm3, ymm3, 11 local 550 vpand ymm1, ymm0, ymm3 // R in upper 5 bits 585 vpcmpeqb ymm3, ymm3, ymm3 // generate mask 0xf800f800 for Red local 586 vpsllw ymm3, ymm3, 1 local 587 vpsrlw ymm4, ymm3, 6 \/\/ generate mask 0x03e003e0 for Green local 645 vpsrlw ymm3, ymm2, 4 local 928 vpcmpeqb ymm3, ymm3, ymm3 \/\/ generate mask 0x0000001f local 929 vpsrld ymm3, ymm3, 27 local 933 vpslld ymm5, ymm3, 11 \/\/ generate mask 0x0000f800 local 1037 vpcmpeqb ymm3, ymm3, ymm3 \/\/ generate mask 0x0000001f local 1038 vpsrld ymm3, ymm3, 27 local 1042 vpslld ymm5, ymm3, 11 \/\/ generate mask 0x0000f800 local 1083 vpsrld ymm3, ymm0, 9 \/\/ R local 1087 vpand ymm3, ymm3, ymm6 \/\/ R local 1116 vpsrlw ymm3, ymm4, 8 \/\/ generate mask 0x00f000f0 local 1229 vmovdqu ymm3, [eax + 96] local 1233 vpmaddubsw ymm3, ymm3, ymm4 local 1268 vmovdqu ymm3, [eax + 96] local 1272 vpmaddubsw ymm3, ymm3, ymm4 local 1555 vmovdqu ymm3, [eax + 96] local 1559 vpavgb ymm3, ymm3, [eax + esi + 96] local 1564 vshufps ymm4, ymm2, ymm3, 0x88 local 1565 vshufps ymm2, ymm2, ymm3, 0xdd local 1572 vpmaddubsw ymm3, ymm2, ymm7 local 2997 vbroadcastss ymm3, xmm3 local 3250 vpsrlw ymm3, ymm1, 8 local 4301 vpshufb ymm3, ymm1, ymm4 \/\/ high 4 alphas local 4392 vpgatherdd ymm3, [ymm2 * 4 + fixed_invtbl8], ymm5 \/\/ ymm5 cleared. 1, a local 4393 vpunpcklwd ymm2, ymm3, ymm3 \/\/ low 4 inverted alphas. mutated. 1, 1, a, a local 4394 vpunpckhwd ymm3, ymm3, ymm3 \/\/ high 4 inverted alphas. mutated. local 4396 vpshufb ymm3, ymm3, ymm4 \/\/ replicate high 4 alphas local 4448 vinserti128 ymm3, ymm3, xmm0, 1 \/\/ [1,a7,1,a6,1,a5,1,a4,1,a3,1,a2,1,a1,1,a0] local 4454 vpunpcklwd ymm2, ymm3, ymm3 \/\/ low 4 inverted alphas. mutated. 1, 1, a, a local 4455 vpunpckhwd ymm3, ymm3, ymm3 \/\/ high 4 inverted alphas. mutated. local 4457 vpshufb ymm3, ymm3, ymm5 \/\/ replicate high 4 alphas local 4863 vmovdqu ymm3, [esi] \/\/ read 8 pixels from src_argb1 local 4867 vpunpcklbw ymm2, ymm3, ymm5 \/\/ low 4 local 4868 vpunpckhbw ymm3, ymm3, ymm5 \/\/ high 4 local 6143 vmulps ymm3, ymm0, ymm7 \/\/ C3 * X local [all...] |
compare_win.cc | 78 vpsubusb ymm3, ymm1, ymm2 // abs difference trick local 80 vpor ymm1, ymm2, ymm3
|
scale_win.cc | 455 vmovdqu ymm3, [eax + esi * 2 + 32] local 457 vpavgb ymm3, ymm3, [eax + edi + 32] local 460 vpavgb ymm1, ymm1, ymm3 463 vpand ymm3, ymm1, ymm7 local 467 vpavgw ymm1, ymm1, ymm3 841 vmovdqu ymm3, [eax] // read 32 bytes local 843 vpermq ymm3, ymm3, 0xd8 // unmutate for vpunpck local 844 vpunpcklbw ymm2, ymm3, ymm local 845 vpunpckhbw ymm3, ymm3, ymm5 local 847 vpaddusw ymm1, ymm3, [edx + 32] local [all...] |