Lines Matching full:xmm2
11 ; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm1[1,1,3,3]
13 ; SSE41-NEXT: pmuludq %xmm2, %xmm3
26 ; SSE-NEXT: movdqa %xmm0, %xmm2
27 ; SSE-NEXT: pmuludq %xmm1, %xmm2
28 ; SSE-NEXT: pshufd {{.*#+}} xmm2 = xmm2[1,3,2,3]
33 ; SSE-NEXT: punpckldq {{.*#+}} xmm2 = xmm2[0],xmm1[0],xmm2[1],xmm1[1]
34 ; SSE-NEXT: psubd %xmm2, %xmm0
36 ; SSE-NEXT: paddd %xmm2, %xmm0
43 ; AVX-NEXT: vpshufd {{.*#+}} xmm2 = xmm1[1,1,3,3]
45 ; AVX-NEXT: vpmuludq %xmm2, %xmm3, %xmm2
48 ; AVX-NEXT: vpblendd {{.*#+}} xmm1 = xmm1[0],xmm2[1],xmm1[2],xmm2[3]
61 ; SSE41-NEXT: movdqa {{.*#+}} xmm2 = [613566757,613566757,613566757,613566757]
62 ; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[1,1,3,3]
66 ; SSE41-NEXT: pmuludq %xmm2, %xmm5
75 ; SSE41-NEXT: pmuludq %xmm1, %xmm2
76 ; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm2[1,1,3,3]
77 ; SSE41-NEXT: pblendw {{.*#+}} xmm2 = xmm2[0,1],xmm4[2,3],xmm2[4,5],xmm4[6,7]
78 ; SSE41-NEXT: psubd %xmm2, %xmm1
80 ; SSE41-NEXT: paddd %xmm2, %xmm1
86 ; SSE-NEXT: movdqa {{.*#+}} xmm2 = [613566757,613566757,613566757,613566757]
88 ; SSE-NEXT: pmuludq %xmm2, %xmm3
90 ; SSE-NEXT: pshufd {{.*#+}} xmm4 = xmm2[1,1,3,3]
99 ; SSE-NEXT: pmuludq %xmm1, %xmm2
100 ; SSE-NEXT: pshufd {{.*#+}} xmm2 = xmm2[1,3,2,3]
104 ; SSE-NEXT: punpckldq {{.*#+}} xmm2 = xmm2[0],xmm3[0],xmm2[1],xmm3[1]
105 ; SSE-NEXT: psubd %xmm2, %xmm1
107 ; SSE-NEXT: paddd %xmm2, %xmm1
165 ; SSE41-NEXT: movdqa {{.*#+}} xmm2 = [9363,9363,9363,9363,9363,9363,9363,9363]
167 ; SSE41-NEXT: pmulhuw %xmm2, %xmm3
172 ; SSE41-NEXT: pmulhuw %xmm1, %xmm2
173 ; SSE41-NEXT: psubw %xmm2, %xmm1
175 ; SSE41-NEXT: paddw %xmm2, %xmm1
181 ; SSE-NEXT: movdqa {{.*#+}} xmm2 = [9363,9363,9363,9363,9363,9363,9363,9363]
183 ; SSE-NEXT: pmulhuw %xmm2, %xmm3
188 ; SSE-NEXT: pmulhuw %xmm1, %xmm2
189 ; SSE-NEXT: psubw %xmm2, %xmm1
191 ; SSE-NEXT: paddw %xmm2, %xmm1
240 ; SSE41-NEXT: movdqa {{.*#+}} xmm2 = [18725,18725,18725,18725,18725,18725,18725,18725]
241 ; SSE41-NEXT: pmulhw %xmm2, %xmm0
246 ; SSE41-NEXT: pmulhw %xmm2, %xmm1
247 ; SSE41-NEXT: movdqa %xmm1, %xmm2
248 ; SSE41-NEXT: psrlw $15, %xmm2
250 ; SSE41-NEXT: paddw %xmm2, %xmm1
255 ; SSE-NEXT: movdqa {{.*#+}} xmm2 = [18725,18725,18725,18725,18725,18725,18725,18725]
256 ; SSE-NEXT: pmulhw %xmm2, %xmm0
261 ; SSE-NEXT: pmulhw %xmm2, %xmm1
262 ; SSE-NEXT: movdqa %xmm1, %xmm2
263 ; SSE-NEXT: psrlw $15, %xmm2
265 ; SSE-NEXT: paddw %xmm2, %xmm1
503 ; SSE-NEXT: movd %eax, %xmm2
517 ; SSE-NEXT: punpcklbw {{.*#+}} xmm0 = xmm0[0],xmm2[0],xmm0[1],xmm2[1],xmm0[2],xmm2[2],xmm0[3],xmm2[3],xmm0[4],xmm2[4],xmm0[5],xmm2[5],xmm0[6],xmm2[6],xmm0[7],xmm2[7]
536 ; SSE-NEXT: movd %eax, %xmm2
537 ; SSE-NEXT: punpcklbw {{.*#+}} xmm2 = xmm2[0],xmm1[0],xmm2[1],xmm1[1],xmm2[2],xmm1[2],xmm2[3],xmm1[3],xmm2[4],xmm1[4],xmm2[5],xmm1[5],xmm2[6],xmm1[6],xmm2[7],xmm1[7]
559 ; SSE-NEXT: punpcklbw {{.*#+}} xmm1 = xmm1[0],xmm2[0],xmm1[1],xmm2[1],xmm1[2],xmm2[2],xmm1[3],xmm2[3],xmm1[4],xmm2[4],xmm1[5],xmm2[5],xmm1[6],xmm2[6],xmm1[7],xmm2[7]
569 ; SSE-NEXT: movd %eax, %xmm2
579 ; SSE-NEXT: punpcklbw {{.*#+}} xmm0 = xmm0[0],xmm2[0],xmm0[1],xmm2[1],xmm0[2],xmm2[2],xmm0[3],xmm2[3],xmm0[4],xmm2[4],xmm0[5],xmm2[5],xmm0[6],xmm2[6],xmm0[7],xmm2[7]
597 ; SSE-NEXT: movd %eax, %xmm2
598 ; SSE-NEXT: punpcklbw {{.*#+}} xmm2 = xmm2[0],xmm3[0],xmm2[1],xmm3[1],xmm2[2],xmm3[2],xmm2[3],xmm3[3],xmm2[4],xmm3[4],xmm2[5],xmm3[5],xmm2[6],xmm3[6],xmm2[7],xmm3[7]
599 ; SSE-NEXT: punpcklbw {{.*#+}} xmm2 = xmm2[0],xmm0[0],xmm2[1],xmm0[1],xmm2[2],xmm0[2],xmm2[3],xmm0[3],xmm2[4],xmm0[4],xmm2[5],xmm0[5],xmm2[6],xmm0[6],xmm2[7],xmm0[7]
640 ; SSE-NEXT: punpcklbw {{.*#+}} xmm0 = xmm0[0],xmm2[0],xmm0[1],xmm2[1],xmm0[2],xmm2[2],xmm0[3],xmm2[3],xmm0[4],xmm2[4],xmm0[5],xmm2[5],xmm0[6],xmm2[6],xmm0[7],xmm2[7]
834 ; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm1[1,1,3,3]
836 ; SSE41-NEXT: pmuldq %xmm2, %xmm3
851 ; SSE-NEXT: movdqa %xmm0, %xmm2
852 ; SSE-NEXT: psrad $31, %xmm2
853 ; SSE-NEXT: pand %xmm1, %xmm2
859 ; SSE-NEXT: paddd %xmm1, %xmm2
865 ; SSE-NEXT: psubd %xmm2, %xmm1
877 ; AVX-NEXT: vpshufd {{.*#+}} xmm2 = xmm1[1,1,3,3]
879 ; AVX-NEXT: vpmuldq %xmm2, %xmm3, %xmm2
882 ; AVX-NEXT: vpblendd {{.*#+}} xmm1 = xmm1[0],xmm2[1],xmm1[2],xmm2[3]
899 ; SSE41-NEXT: movdqa %xmm0, %xmm2
900 ; SSE41-NEXT: pmuldq %xmm3, %xmm2
901 ; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm2[1,1,3,3]
902 ; SSE41-NEXT: pblendw {{.*#+}} xmm2 = xmm2[0,1],xmm5[2,3],xmm2[4,5],xmm5[6,7]
903 ; SSE41-NEXT: paddd %xmm0, %xmm2
904 ; SSE41-NEXT: movdqa %xmm2, %xmm0
906 ; SSE41-NEXT: psrad $2, %xmm2
907 ; SSE41-NEXT: paddd %xmm0, %xmm2
918 ; SSE41-NEXT: movdqa %xmm2, %xmm0
924 ; SSE-NEXT: movdqa %xmm0, %xmm2
929 ; SSE-NEXT: pand %xmm2, %xmm0
930 ; SSE-NEXT: movdqa %xmm2, %xmm5
934 ; SSE-NEXT: movdqa %xmm2, %xmm0
938 ; SSE-NEXT: pshufd {{.*#+}} xmm7 = xmm2[1,1,3,3]
943 ; SSE-NEXT: paddd %xmm2, %xmm0
944 ; SSE-NEXT: movdqa %xmm0, %xmm2
945 ; SSE-NEXT: psrld $31, %xmm2
947 ; SSE-NEXT: paddd %xmm2, %xmm0
954 ; SSE-NEXT: pshufd {{.*#+}} xmm2 = xmm3[1,3,2,3]
958 ; SSE-NEXT: punpckldq {{.*#+}} xmm2 = xmm2[0],xmm3[0],xmm2[1],xmm3[1]
959 ; SSE-NEXT: psubd %xmm5, %xmm2
960 ; SSE-NEXT: paddd %xmm1, %xmm2
961 ; SSE-NEXT: movdqa %xmm2, %xmm1
963 ; SSE-NEXT: psrad $2, %xmm2
964 ; SSE-NEXT: paddd %xmm1, %xmm2
965 ; SSE-NEXT: movdqa %xmm2, %xmm1
989 ; SSE41-NEXT: movdqa {{.*#+}} xmm2 = [613566757,613566757,613566757,613566757]
990 ; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[1,1,3,3]
994 ; SSE41-NEXT: pmuludq %xmm2, %xmm5
1007 ; SSE41-NEXT: pmuludq %xmm1, %xmm2
1008 ; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm2[1,1,3,3]
1009 ; SSE41-NEXT: pblendw {{.*#+}} xmm2 = xmm2[0,1],xmm4[2,3],xmm2[4,5],xmm4[6,7]
1011 ; SSE41-NEXT: psubd %xmm2, %xmm3
1013 ; SSE41-NEXT: paddd %xmm2, %xmm3
1022 ; SSE-NEXT: movdqa %xmm0, %xmm2
1023 ; SSE-NEXT: pmuludq %xmm3, %xmm2
1024 ; SSE-NEXT: pshufd {{.*#+}} xmm2 = xmm2[1,3,2,3]
1029 ; SSE-NEXT: punpckldq {{.*#+}} xmm2 = xmm2[0],xmm5[0],xmm2[1],xmm5[1]
1031 ; SSE-NEXT: psubd %xmm2, %xmm5
1033 ; SSE-NEXT: paddd %xmm2, %xmm5
1035 ; SSE-NEXT: movdqa {{.*#+}} xmm2 = [7,7,7,7]
1037 ; SSE-NEXT: pmuludq %xmm2, %xmm5
1039 ; SSE-NEXT: pmuludq %xmm2, %xmm6
1055 ; SSE-NEXT: pmuludq %xmm2, %xmm4
1057 ; SSE-NEXT: pmuludq %xmm2, %xmm3
1058 ; SSE-NEXT: pshufd {{.*#+}} xmm2 = xmm3[0,2,2,3]
1059 ; SSE-NEXT: punpckldq {{.*#+}} xmm4 = xmm4[0],xmm2[0],xmm4[1],xmm2[1]
1087 ; SSE41-NEXT: movdqa {{.*#+}} xmm2 = [2454267027,2454267027,2454267027,2454267027]
1088 ; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[1,1,3,3]
1092 ; SSE41-NEXT: pmuldq %xmm2, %xmm5
1105 ; SSE41-NEXT: pmuldq %xmm1, %xmm2
1106 ; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm2[1,1,3,3]
1107 ; SSE41-NEXT: pblendw {{.*#+}} xmm2 = xmm2[0,1],xmm5[2,3],xmm2[4,5],xmm5[6,7]
1108 ; SSE41-NEXT: paddd %xmm1, %xmm2
1109 ; SSE41-NEXT: movdqa %xmm2, %xmm3
1111 ; SSE41-NEXT: psrad $2, %xmm2
1112 ; SSE41-NEXT: paddd %xmm3, %xmm2
1113 ; SSE41-NEXT: pmulld %xmm4, %xmm2
1114 ; SSE41-NEXT: psubd %xmm2, %xmm1
1119 ; SSE-NEXT: movdqa {{.*#+}} xmm2 = [2454267027,2454267027,2454267027,2454267027]
1120 ; SSE-NEXT: movdqa %xmm2, %xmm3
1126 ; SSE-NEXT: pand %xmm2, %xmm6
1129 ; SSE-NEXT: pmuludq %xmm2, %xmm4
1131 ; SSE-NEXT: pshufd {{.*#+}} xmm5 = xmm2[1,1,3,3]
1153 ; SSE-NEXT: pand %xmm2, %xmm6
1155 ; SSE-NEXT: pmuludq %xmm1, %xmm2
1156 ; SSE-NEXT: pshufd {{.*#+}} xmm2 = xmm2[1,3,2,3]
1160 ; SSE-NEXT: punpckldq {{.*#+}} xmm2 = xmm2[0],xmm3[0],xmm2[1],xmm3[1]
1161 ; SSE-NEXT: psubd %xmm6, %xmm2
1162 ; SSE-NEXT: paddd %xmm1, %xmm2
1163 ; SSE-NEXT: movdqa %xmm2, %xmm3
1165 ; SSE-NEXT: psrad $2, %xmm2
1166 ; SSE-NEXT: paddd %xmm3, %xmm2
1167 ; SSE-NEXT: pshufd {{.*#+}} xmm3 = xmm2[1,1,3,3]
1168 ; SSE-NEXT: pmuludq %xmm4, %xmm2
1169 ; SSE-NEXT: pshufd {{.*#+}} xmm2 = xmm2[0,2,2,3]
1172 ; SSE-NEXT: punpckldq {{.*#+}} xmm2 = xmm2[0],xmm3[0],xmm2[1],xmm3[1]
1173 ; SSE-NEXT: psubd %xmm2, %xmm1
1222 ; SSE41-NEXT: pshufd {{.*#+}} xmm2 = xmm1[1,1,3,3]
1224 ; SSE41-NEXT: pmuldq %xmm2, %xmm3
1236 ; SSE-NEXT: movdqa %xmm1, %xmm2
1237 ; SSE-NEXT: psrad $31, %xmm2
1238 ; SSE-NEXT: pand %xmm0, %xmm2
1242 ; SSE-NEXT: paddd %xmm2, %xmm3
1243 ; SSE-NEXT: pshufd {{.*#+}} xmm2 = xmm0[1,1,3,3]
1247 ; SSE-NEXT: pmuludq %xmm2, %xmm0
1259 ; AVX-NEXT: vpshufd {{.*#+}} xmm2 = xmm1[1,1,3,3]
1261 ; AVX-NEXT: vpmuldq %xmm2, %xmm3, %xmm2
1264 ; AVX-NEXT: vpblendd {{.*#+}} xmm0 = xmm0[0],xmm2[1],xmm0[2],xmm2[3]