Lines Matching full:ymm1
90 ; AVX1-NEXT: vmovaps {{.*#+}} ymm1 = [2454267027,2454267027,2454267027,2454267027,2454267027,2454267027,2454267027,2454267027]
91 ; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2
118 ; AVX2-NEXT: vpbroadcastd {{.*}}(%rip), %ymm1
119 ; AVX2-NEXT: vpshufd {{.*#+}} ymm2 = ymm1[1,1,3,3,5,5,7,7]
122 ; AVX2-NEXT: vpmuldq %ymm1, %ymm0, %ymm1
123 ; AVX2-NEXT: vpshufd {{.*#+}} ymm1 = ymm1[1,1,3,3,5,5,7,7]
124 ; AVX2-NEXT: vpblendd {{.*#+}} ymm1 = ymm1[0],ymm2[1],ymm1[2],ymm2[3],ymm1[4],ymm2[5],ymm1[6],ymm2[7]
125 ; AVX2-NEXT: vpaddd %ymm0, %ymm1, %ymm0
126 ; AVX2-NEXT: vpsrld $31, %ymm0, %ymm1
128 ; AVX2-NEXT: vpaddd %ymm1, %ymm0, %ymm0
153 ; AVX2-NEXT: vpsrlw $15, %ymm0, %ymm1
155 ; AVX2-NEXT: vpaddw %ymm1, %ymm0, %ymm0
206 ; AVX2-NEXT: vmovdqa {{.*#+}} ymm1 = [147,147,147,147,147,147,147,147,147,147,147,147,147,147,147,147,147,147,147,147,147,147,147,147,147,147,147,147,147,147,147,147]
207 ; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm2
213 ; AVX2-NEXT: vpmovsxbw %xmm1, %ymm1
215 ; AVX2-NEXT: vpmullw %ymm1, %ymm3, %ymm1
216 ; AVX2-NEXT: vpsrlw $8, %ymm1, %ymm1
217 ; AVX2-NEXT: vperm2i128 {{.*#+}} ymm3 = ymm1[2,3],ymm2[2,3]
218 ; AVX2-NEXT: vinserti128 $1, %xmm2, %ymm1, %ymm1
219 ; AVX2-NEXT: vpackuswb %ymm3, %ymm1, %ymm1
220 ; AVX2-NEXT: vpaddb %ymm0, %ymm1, %ymm0
221 ; AVX2-NEXT: vpsrlw $2, %ymm0, %ymm1
222 ; AVX2-NEXT: vpand {{.*}}(%rip), %ymm1, %ymm1
224 ; AVX2-NEXT: vpxor %ymm2, %ymm1, %ymm1
225 ; AVX2-NEXT: vpsubb %ymm2, %ymm1, %ymm1
228 ; AVX2-NEXT: vpaddb %ymm0, %ymm1, %ymm0
351 ; AVX1-NEXT: vmovaps {{.*#+}} ymm1 = [2454267027,2454267027,2454267027,2454267027,2454267027,2454267027,2454267027,2454267027]
352 ; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm2
384 ; AVX2-NEXT: vpbroadcastd {{.*}}(%rip), %ymm1
385 ; AVX2-NEXT: vpshufd {{.*#+}} ymm2 = ymm1[1,1,3,3,5,5,7,7]
388 ; AVX2-NEXT: vpmuldq %ymm1, %ymm0, %ymm1
389 ; AVX2-NEXT: vpshufd {{.*#+}} ymm1 = ymm1[1,1,3,3,5,5,7,7]
390 ; AVX2-NEXT: vpblendd {{.*#+}} ymm1 = ymm1[0],ymm2[1],ymm1[2],ymm2[3],ymm1[4],ymm2[5],ymm1[6],ymm2[7]
391 ; AVX2-NEXT: vpaddd %ymm0, %ymm1, %ymm1
392 ; AVX2-NEXT: vpsrld $31, %ymm1, %ymm2
393 ; AVX2-NEXT: vpsrad $2, %ymm1, %ymm1
394 ; AVX2-NEXT: vpaddd %ymm2, %ymm1, %ymm1
396 ; AVX2-NEXT: vpmulld %ymm2, %ymm1, %ymm1
397 ; AVX2-NEXT: vpsubd %ymm1, %ymm0, %ymm0
426 ; AVX2-NEXT: vpmulhw {{.*}}(%rip), %ymm0, %ymm1
427 ; AVX2-NEXT: vpsrlw $15, %ymm1, %ymm2
428 ; AVX2-NEXT: vpsraw $1, %ymm1, %ymm1
429 ; AVX2-NEXT: vpaddw %ymm2, %ymm1, %ymm1
430 ; AVX2-NEXT: vpmullw {{.*}}(%rip), %ymm1, %ymm1
431 ; AVX2-NEXT: vpsubw %ymm1, %ymm0, %ymm0
502 ; AVX2-NEXT: vmovdqa {{.*#+}} ymm1 = [147,147,147,147,147,147,147,147,147,147,147,147,147,147,147,147,147,147,147,147,147,147,147,147,147,147,147,147,147,147,147,147]
503 ; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm2
509 ; AVX2-NEXT: vpmovsxbw %xmm1, %ymm1
511 ; AVX2-NEXT: vpmullw %ymm1, %ymm3, %ymm1
512 ; AVX2-NEXT: vpsrlw $8, %ymm1, %ymm1
513 ; AVX2-NEXT: vperm2i128 {{.*#+}} ymm3 = ymm1[2,3],ymm2[2,3]
514 ; AVX2-NEXT: vinserti128 $1, %xmm2, %ymm1, %ymm1
515 ; AVX2-NEXT: vpackuswb %ymm3, %ymm1, %ymm1
516 ; AVX2-NEXT: vpaddb %ymm0, %ymm1, %ymm1
517 ; AVX2-NEXT: vpsrlw $2, %ymm1, %ymm2
522 ; AVX2-NEXT: vpsrlw $7, %ymm1, %ymm1
523 ; AVX2-NEXT: vpand {{.*}}(%rip), %ymm1, %ymm1
524 ; AVX2-NEXT: vpaddb %ymm1, %ymm2, %ymm1
525 ; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm2
534 ; AVX2-NEXT: vpmovsxbw %xmm1, %ymm1
535 ; AVX2-NEXT: vpmullw %ymm3, %ymm1, %ymm1
536 ; AVX2-NEXT: vextracti128 $1, %ymm1, %xmm3
540 ; AVX2-NEXT: vinserti128 $1, %xmm2, %ymm1, %ymm1
541 ; AVX2-NEXT: vpsubb %ymm1, %ymm0, %ymm0