Home | History | Annotate | Download | only in X86

Lines Matching full:ymm0

20 ; AVX1-NEXT:    vextractf128 $1, %ymm0, %xmm6
35 ; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
42 ; AVX2-NEXT: vpxor %ymm2, %ymm0, %ymm0
43 ; AVX2-NEXT: vpsrlvq %ymm1, %ymm0, %ymm0
44 ; AVX2-NEXT: vpsubq %ymm3, %ymm0, %ymm0
52 ; XOPAVX1-NEXT: vextractf128 $1, %ymm0, %xmm4
56 ; XOPAVX1-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
63 ; XOPAVX2-NEXT: vpxor %ymm2, %ymm0, %ymm0
64 ; XOPAVX2-NEXT: vpsrlvq %ymm1, %ymm0, %ymm0
65 ; XOPAVX2-NEXT: vpsubq %ymm3, %ymm0, %ymm0
74 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2
99 ; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
104 ; AVX2-NEXT: vpsravd %ymm1, %ymm0, %ymm0
112 ; XOPAVX1-NEXT: vextractf128 $1, %ymm0, %xmm4
116 ; XOPAVX1-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
121 ; XOPAVX2-NEXT: vpsravd %ymm1, %ymm0, %ymm0
135 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm4
160 ; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
167 ; AVX2-NEXT: vpunpckhwd {{.*#+}} ymm4 = ymm0[4,4,5,5,6,6,7,7,12,12,13,13,14,14,15,15]
171 ; AVX2-NEXT: vpunpcklwd {{.*#+}} ymm0 = ymm0[0,0,1,1,2,2,3,3,8,8,9,9,10,10,11,11]
172 ; AVX2-NEXT: vpsravd %ymm1, %ymm0, %ymm0
173 ; AVX2-NEXT: vpsrld $16, %ymm0, %ymm0
174 ; AVX2-NEXT: vpackusdw %ymm3, %ymm0, %ymm0
182 ; XOPAVX1-NEXT: vextractf128 $1, %ymm0, %xmm4
186 ; XOPAVX1-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
194 ; XOPAVX2-NEXT: vextracti128 $1, %ymm0, %xmm4
198 ; XOPAVX2-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm0
210 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm4
257 ; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
263 ; AVX2-NEXT: vpunpckhbw {{.*#+}} ymm2 = ymm0[8],ymm1[8],ymm0[9],ymm1[9],ymm0[10],ymm1[10],ymm0[11],ymm1[11],ymm0[12],ymm1[12],ymm0[13],ymm1[13],ymm0[14],ymm1[14],ymm0[15],ymm1[15],ymm0[24],ymm1[24],ymm0[25],ymm1[25],ymm0[26],ymm1[26],ymm0[27],ymm1[27],ymm0[28],ymm1[28],ymm0[29],ymm1[29],ymm0[30],ymm1[30],ymm0[31],ymm1[31]
264 ; AVX2-NEXT: vpunpckhbw {{.*#+}} ymm3 = ymm0[8,8,9,9,10,10,11,11,12,12,13,13,14,14,15,15,24,24,25,25,26,26,27,27,28,28,29,29,30,30,31,31]
274 ; AVX2-NEXT: vpunpcklbw {{.*#+}} ymm1 = ymm0[0],ymm1[0],ymm0[1],ymm1[1],ymm0[2],ymm1[2],ymm0[3],ymm1[3],ymm0[4],ymm1[4],ymm0[5],ymm1[5],ymm0[6],ymm1[6],ymm0[7],ymm1[7],ymm0[16],ymm1[16],ymm0[17],ymm1[17],ymm0[18],ymm1[18],ymm0[19],ymm1[19],ymm0[20],ymm1[20],ymm0[21],ymm1[21],ymm0[22],ymm1[22],ymm0[23],ymm1[23]
275 ; AVX2-NEXT: vpunpcklbw {{.*#+}} ymm0 = ymm0[0,0,1,1,2,2,3,3,4,4,5,5,6,6,7,7,16,16,17,17,18,18,19,19,20,20,21,21,22,22,23,23]
276 ; AVX2-NEXT: vpsraw $4, %ymm0, %ymm3
277 ; AVX2-NEXT: vpblendvb %ymm1, %ymm3, %ymm0, %ymm0
278 ; AVX2-NEXT: vpsraw $2, %ymm0, %ymm3
280 ; AVX2-NEXT: vpblendvb %ymm1, %ymm3, %ymm0, %ymm0
281 ; AVX2-NEXT: vpsraw $1, %ymm0, %ymm3
283 ; AVX2-NEXT: vpblendvb %ymm1, %ymm3, %ymm0, %ymm0
284 ; AVX2-NEXT: vpsrlw $8, %ymm0, %ymm0
285 ; AVX2-NEXT: vpackuswb %ymm2, %ymm0, %ymm0
293 ; XOPAVX1-NEXT: vextractf128 $1, %ymm0, %xmm4
297 ; XOPAVX1-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
305 ; XOPAVX2-NEXT: vextracti128 $1, %ymm0, %xmm4
309 ; XOPAVX2-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm0
324 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
331 ; AVX1-NEXT: vinsertf128 $1, %xmm3, %ymm0, %ymm0
338 ; AVX2-NEXT: vpsrlq %xmm1, %ymm0, %ymm0
339 ; AVX2-NEXT: vpxor %ymm2, %ymm0, %ymm0
340 ; AVX2-NEXT: vpsubq %ymm2, %ymm0, %ymm0
348 ymm0, %xmm2
351 ; XOPAVX1-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
358 ; XOPAVX2-NEXT: vpsrlq %xmm1, %ymm0, %ymm0
359 ; XOPAVX2-NEXT: vpxor %ymm2, %ymm0, %ymm0
360 ; XOPAVX2-NEXT: vpsubq %ymm2, %ymm0, %ymm0
372 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2
375 ; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
382 ; AVX2-NEXT: vpsrad %xmm1, %ymm0, %ymm0
389 ; XOPAVX1-NEXT: vextractf128 $1, %ymm0, %xmm2
392 ; XOPAVX1-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
399 ; XOPAVX2-NEXT: vpsrad %xmm1, %ymm0, %ymm0
409 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm2
415 ; AVX1-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
423 ; AVX2-NEXT: vpsraw %xmm1, %ymm0, %ymm0
428 ; XOPAVX1-NEXT: vextractf128 $1, %ymm0, %xmm2
434 ; XOPAVX1-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
442 ; XOPAVX2-NEXT: vpsraw %xmm1, %ymm0, %ymm0
456 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
496 ; AVX1-NEXT: vinsertf128 $1, %xmm8, %ymm0, %ymm0
503 ; AVX2-NEXT: vpunpckhbw {{.*#+}} ymm2 = ymm0[8],ymm1[8],ymm0[9],ymm1[9],ymm0[10],ymm1[10],ymm0[11],ymm1[11],ymm0[12],ymm1[12],ymm0[13],ymm1[13],ymm0[14],ymm1[14],ymm0[15],ymm1[15],ymm0[24],ymm1[24],ymm0[25],ymm1[25],ymm0[26],ymm1[26],ymm0[27],ymm1[27],ymm0[28],ymm1[28],ymm0[29],ymm1[29],ymm0[30],ymm1[30],ymm0[31],ymm1[31]
504 ; AVX2-NEXT: vpunpckhbw {{.*#+}} ymm3 = ymm0[8,8,9,9,10,10,11,11,12,12,13,13,14,14,15,15,24,24,25,25,26,26,27,27,28,28,29,29,30,30,31,31]
514 ; AVX2-NEXT: vpunpcklbw {{.*#+}} ymm1 = ymm0[0],ymm1[0],ymm0[1],ymm1[1],ymm0[2],ymm1[2],ymm0[3],ymm1[3],ymm0[4],ymm1[4],ymm0[5],ymm1[5],ymm0[6],ymm1[6],ymm0[7],ymm1[7],ymm0[16],ymm1[16],ymm0[17],ymm1[17],ymm0[18],ymm1[18],ymm0[19],ymm1[19],ymm0[20],ymm1[20],ymm0[21],ymm1[21],ymm0[22],ymm1[22],ymm0[23],ymm1[23]
515 ; AVX2-NEXT: vpunpcklbw {{.*#+}} ymm0 = ymm0[0,0,1,1,2,2,3,3,4,4,5,5,6,6,7,7,16,16,17,17,18,18,19,19,20,20,21,21,22,22,23,23]
516 ; AVX2-NEXT: vpsraw $4, %ymm0, %ymm3
517 ; AVX2-NEXT: vpblendvb %ymm1, %ymm3, %ymm0, %ymm0
518 ; AVX2-NEXT: vpsraw $2, %ymm0, %ymm3
520 ; AVX2-NEXT: vpblendvb %ymm1, %ymm3, %ymm0, %ymm0
521 ; AVX2-NEXT: vpsraw $1, %ymm0, %ymm3
523 ; AVX2-NEXT: vpblendvb %ymm1, %ymm3, %ymm0, %ymm0
524 ; AVX2-NEXT: vpsrlw $8, %ymm0, %ymm0
525 ; AVX2-NEXT: vpackuswb %ymm2, %ymm0, %ymm0
533 ; XOPAVX1-NEXT: vextractf128 $1, %ymm0, %xmm2
536 ; XOPAVX1-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
545 ; XOPAVX2-NEXT: vextracti128 $1, %ymm0, %xmm4
549 ; XOPAVX2-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm0
563 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1
576 ; AVX1-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm0
581 ; AVX2-NEXT: vpsrlvq {{.*}}(%rip), %ymm0, %ymm0
583 ; AVX2-NEXT: vpxor %ymm1, %ymm0, %ymm0
584 ; AVX2-NEXT: vpsubq %ymm1, %ymm0, %ymm0
591 ; XOPAVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
595 ; XOPAVX1-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
600 ; XOPAVX2-NEXT: vpsrlvq {{.*}}(%rip), %ymm0, %ymm0
602 ; XOPAVX2-NEXT: vpxor %ymm1, %ymm0, %ymm0
603 ; XOPAVX2-NEXT: vpsubq %ymm1, %ymm0, %ymm0
619 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm0
625 ; AVX1-NEXT: vinsertf128 $1, %xmm0, %ymm1, %ymm0
630 ; AVX2-NEXT: vpsravd {{.*}}(%rip), %ymm0, %ymm0
636 ; XOPAVX1-NEXT: vextractf128 $1, %ymm0, %xmm0
638 ; XOPAVX1-NEXT: vinsertf128 $1, %xmm0, %ymm1, %ymm0
643 ; XOPAVX2-NEXT: vpsravd {{.*}}(%rip), %ymm0, %ymm0
652 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1
677 ; AVX1-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm0
685 ; AVX2-NEXT: vpunpckhwd {{.*#+}} ymm4 = ymm0[4,4,5,5,6,6,7,7,12,12,13,13,14,14,15,15]
689 ; AVX2-NEXT: vpunpcklwd {{.*#+}} ymm0 = ymm0[0,0,1,1,2,2,3,3,8,8,9,9,10,10,11,11]
690 ; AVX2-NEXT: vpsravd %ymm1, %ymm0, %ymm0
691 ; AVX2-NEXT: vpsrld $16, %ymm0, %ymm0
692 ; AVX2-NEXT: vpackusdw %ymm3, %ymm0, %ymm0
699 ; XOPAVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
703 ; XOPAVX1-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
710 ; XOPAVX2-NEXT: vextracti128 $1, %ymm0, %xmm3
714 ; XOPAVX2-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm0
726 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
766 ; AVX1-NEXT: vinsertf128 $1, %xmm8, %ymm0, %ymm0
773 ; AVX2-NEXT: vpunpckhbw {{.*#+}} ymm2 = ymm0[8],ymm1[8],ymm0[9],ymm1[9],ymm0[10],ymm1[10],ymm0[11],ymm1[11],ymm0[12],ymm1[12],ymm0[13],ymm1[13],ymm0[14],ymm1[14],ymm0[15],ymm1[15],ymm0[24],ymm1[24],ymm0[25],ymm1[25],ymm0[26],ymm1[26],ymm0[27],ymm1[27],ymm0[28],ymm1[28],ymm0[29],ymm1[29],ymm0[30],ymm1[30],ymm0[31],ymm1[31]
774 ; AVX2-NEXT: vpunpckhbw {{.*#+}} ymm3 = ymm0[8,8,9,9,10,10,11,11,12,12,13,13,14,14,15,15,24,24,25,25,26,26,27,27,28,28,29,29,30,30,31,31]
784 ; AVX2-NEXT: vpunpcklbw {{.*#+}} ymm1 = ymm0[0],ymm1[0],ymm0[1],ymm1[1],ymm0[2],ymm1[2],ymm0[3],ymm1[3],ymm0[4],ymm1[4],ymm0[5],ymm1[5],ymm0[6],ymm1[6],ymm0[7],ymm1[7],ymm0[16],ymm1[16],ymm0[17],ymm1[17],ymm0[18],ymm1[18],ymm0[19],ymm1[19],ymm0[20],ymm1[20],ymm0[21],ymm1[21],ymm0[22],ymm1[22],ymm0[23],ymm1[23]
785 ; AVX2-NEXT: vpunpcklbw {{.*#+}} ymm0 = ymm0[0,0,1,1,2,2,3,3,4,4,5,5,6,6,7,7,16,16,17,17,18,18,19,19,20,20,21,21,22,22,23,23]
786 ; AVX2-NEXT: vpsraw $4, %ymm0, %ymm3
787 ; AVX2-NEXT: vpblendvb %ymm1, %ymm3, %ymm0, %ymm0
788 ; AVX2-NEXT: vpsraw $2, %ymm0, %ymm3
790 ; AVX2-NEXT: vpblendvb %ymm1, %ymm3, %ymm0, %ymm0
791 ; AVX2-NEXT: vpsraw $1, %ymm0, %ymm3
793 ; AVX2-NEXT: vpblendvb %ymm1, %ymm3, %ymm0, %ymm0
794 ; AVX2-NEXT: vpsrlw $8, %ymm0, %ymm0
795 ; AVX2-NEXT: vpackuswb %ymm2, %ymm0, %ymm0
802 ; XOPAVX1-NEXT: vextractf128 $1, %ymm0, %xmm2
805 ; XOPAVX1-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
812 ; XOPAVX2-NEXT: vextracti128 $1, %ymm0, %xmm2
815 ; XOPAVX2-NEXT: vinserti128 $1, %xmm2, %ymm0, %ymm0
828 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1
835 ; AVX1-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm0
840 ; AVX2-NEXT: vpsrad $7, %ymm0, %ymm1
841 ; AVX2-NEXT: vpsrlq $7, %ymm0, %ymm0
842 ; AVX2-NEXT: vpblendd {{.*#+}} ymm0 = ymm0[0],ymm1[1],ymm0[2],ymm1[3],ymm0[4],ymm1[5],ymm0[6],ymm1[7]
849 ; XOPAVX1-NEXT: vextractf128 $1, %ymm0, %xmm2
852 ; XOPAVX1-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
857 ; XOPAVX2-NEXT: vpsrlq $7, %ymm0, %ymm0
859 ; XOPAVX2-NEXT: vpxor %ymm1, %ymm0, %ymm0
860 ; XOPAVX2-NEXT: vpsubq %ymm1, %ymm0, %ymm0
870 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm0
872 ; AVX1-NEXT: vinsertf128 $1, %xmm0, %ymm1, %ymm0
877 ; AVX2-NEXT: vpsrad $5, %ymm0, %ymm0
883 ; XOPAVX1-NEXT: vextractf128 $1, %ymm0, %xmm0
885 ; XOPAVX1-NEXT: vinsertf128 $1, %xmm0, %ymm1, %ymm0
890 ; XOPAVX2-NEXT: vpsrad $5, %ymm0, %ymm0
900 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm0
902 ; AVX1-NEXT: vinsertf128 $1, %xmm0, %ymm1, %ymm0
907 ; AVX2-NEXT: vpsraw $3, %ymm0, %ymm0
913 ; XOPAVX1-NEXT: vextractf128 $1, %ymm0, %xmm0
915 ; XOPAVX1-NEXT: vinsertf128 $1, %xmm0, %ymm1, %ymm0
920 ; XOPAVX2-NEXT: vpsraw $3, %ymm0, %ymm0
929 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm1
940 ; AVX1-NEXT: vinsertf128 $1, %xmm1, %ymm0, %ymm0
945 ; AVX2-NEXT: vpsrlw $3, %ymm0, %ymm0
946 ; AVX2-NEXT: vpand {{.*}}(%rip), %ymm0, %ymm0
948 ; AVX2-NEXT: vpxor %ymm1, %ymm0, %ymm0
949 ; AVX2-NEXT: vpsubb %ymm1, %ymm0, %ymm0
956 ; XOPAVX1-NEXT: vextractf128 $1, %ymm0, %xmm2
959 ; XOPAVX1-NEXT: vinsertf128 $1, %xmm2, %ymm0, %ymm0
964 ; XOPAVX2-NEXT: vpsrlw $3, %ymm0, %ymm0
965 ; XOPAVX2-NEXT: vpand {{.*}}(%rip), %ymm0, %ymm0
967 ; XOPAVX2-NEXT: vpxor %ymm1, %ymm0, %ymm0
968 ; XOPAVX2-NEXT: vpsubb %ymm1, %ymm0, %ymm0