Home | History | Annotate | Download | only in X86

Lines Matching full:xmm3

12 ; SSE41-NEXT:    pshufd {{.*#+}} xmm3 = xmm0[1,1,3,3]
13 ; SSE41-NEXT: pmuludq %xmm2, %xmm3
16 ; SSE41-NEXT: pblendw {{.*#+}} xmm1 = xmm1[0,1],xmm3[2,3],xmm1[4,5],xmm3[6,7]
30 ; SSE-NEXT: pshufd {{.*#+}} xmm3 = xmm0[1,1,3,3]
31 ; SSE-NEXT: pmuludq %xmm1, %xmm3
32 ; SSE-NEXT: pshufd {{.*#+}} xmm1 = xmm3[1,3,2,3]
44 ; AVX-NEXT: vpshufd {{.*#+}} xmm3 = xmm0[1,1,3,3]
45 ; AVX-NEXT: vpmuludq %xmm2, %xmm3, %xmm2
62 ; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[1,1,3,3]
64 ; SSE41-NEXT: pmuludq %xmm3, %xmm4
74 ; SSE41-NEXT: pmuludq %xmm3, %xmm4
87 ; SSE-NEXT: movdqa %xmm0, %xmm3
88 ; SSE-NEXT: pmuludq %xmm2, %xmm3
89 ; SSE-NEXT: pshufd {{.*#+}} xmm3 = xmm3[1,3,2,3]
94 ; SSE-NEXT: punpckldq {{.*#+}} xmm3 = xmm3[0],xmm5[0],xmm3[1],xmm5[1]
95 ; SSE-NEXT: psubd %xmm3, %xmm0
97 ; SSE-NEXT: paddd %xmm3, %xmm0
101 ; SSE-NEXT: pshufd {{.*#+}} xmm3 = xmm1[1,1,3,3]
102 ; SSE-NEXT: pmuludq %xmm4, %xmm3
103 ; SSE-NEXT: pshufd {{.*#+}} xmm3 = xmm3[1,3,2,3]
104 ; SSE-NEXT: punpckldq {{.*#+}} xmm2 = xmm2[0],xmm3[0],xmm2[1],xmm3[1]
166 ; SSE41-NEXT: movdqa %xmm0, %xmm3
167 ; SSE41-NEXT: pmulhuw %xmm2, %xmm3
168 ; SSE41-NEXT: psubw %xmm3, %xmm0
170 ; SSE41-NEXT: paddw %xmm3, %xmm0
182 ; SSE-NEXT: movdqa %xmm0, %xmm3
183 ; SSE-NEXT: pmulhuw %xmm2, %xmm3
184 ; SSE-NEXT: psubw %xmm3, %xmm0
186 ; SSE-NEXT: paddw %xmm3, %xmm0
242 ; SSE41-NEXT: movdqa %xmm0, %xmm3
243 ; SSE41-NEXT: psrlw $15, %xmm3
245 ; SSE41-NEXT: paddw %xmm3, %xmm0
257 ; SSE-NEXT: movdqa %xmm0, %xmm3
258 ; SSE-NEXT: psrlw $15, %xmm3
260 ; SSE-NEXT: paddw %xmm3, %xmm0
546 ; SSE-NEXT: movd %eax, %xmm3
558 ; SSE-NEXT: punpcklbw {{.*#+}} xmm1 = xmm1[0],xmm3[0],xmm1[1],xmm3[1],xmm1[2],xmm3[2],xmm1[3],xmm3[3],xmm1[4],xmm3[4],xmm1[5],xmm3[5],xmm1[6],xmm3[6],xmm1[7],xmm3[7]
588 ; SSE-NEXT: movd %eax, %xmm3
598 ; SSE-NEXT: punpcklbw {{.*#+}} xmm2 = xmm2[0],xmm3[0],xmm2[1],xmm3[1],xmm2[2],xmm3[2],xmm2[3],xmm3[3],xmm2[4],xmm3[4],xmm2[5],xmm3[5],xmm2[6],xmm3[6],xmm2[7],xmm3[7]
617 ; SSE-NEXT: movd %eax, %xmm3
618 ; SSE-NEXT: punpcklbw {{.*#+}} xmm3 = xmm3[0],xmm0[0],xmm3[1],xmm0[1],xmm3[2],xmm0[2],xmm3[3],xmm0[3],xmm3[4],xmm0[4],xmm3[5],xmm0[5],xmm3[6],xmm0[6],xmm3[7],xmm0[7]
639 ; SSE-NEXT: punpcklbw {{.*#+}} xmm0 = xmm0[0],xmm3[0],xmm0[1],xmm3[1],xmm0[2],xmm3[2],xmm0[3],xmm3[3],xmm0[4],xmm3[4],xmm0[5],xmm3[5],xmm0[6],xmm3[6],xmm0[7],xmm3[7]
835 ; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm0[1,1,3,3]
836 ; SSE41-NEXT: pmuldq %xmm2, %xmm3
839 ; SSE41-NEXT: pblendw {{.*#+}} xmm1 = xmm1[0,1],xmm3[2,3],xmm1[4,5],xmm3[6,7]
854 ; SSE-NEXT: movdqa %xmm0, %xmm3
855 ; SSE-NEXT: pmuludq %xmm1, %xmm3
860 ; SSE-NEXT: pshufd {{.*#+}} xmm1 = xmm3[1,3,2,3]
861 ; SSE-NEXT: pshufd {{.*#+}} xmm3 = xmm0[1,1,3,3]
862 ; SSE-NEXT: pmuludq %xmm4, %xmm3
863 ; SSE-NEXT: pshufd {{.*#+}} xmm3 = xmm3[1,3,2,3]
864 ; SSE-NEXT: punpckldq {{.*#+}} xmm1 = xmm1[0],xmm3[0],xmm1[1],xmm3[1]
878 ; AVX-NEXT: vpshufd {{.*#+}} xmm3 = xmm0[1,1,3,3]
879 ; AVX-NEXT: vpmuldq %xmm2, %xmm3, %xmm2
895 ; SSE41-NEXT: movdqa {{.*#+}} xmm3 = [2454267027,2454267027,2454267027,2454267027]
896 ; SSE41-NEXT: pshufd {{.*#+}} xmm4 = xmm3
900 ; SSE41-NEXT: pmuldq %xmm3, %xmm2
910 ; SSE41-NEXT: pmuldq %xmm1, %xmm3
911 ; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm3[1,1,3,3]
912 ; SSE41-NEXT: pblendw {{.*#+}} xmm3 = xmm3[0,1],xmm0[2,3],xmm3[4,5],xmm0[6,7]
913 ; SSE41-NEXT: paddd %xmm1, %xmm3
914 ; SSE41-NEXT: movdqa %xmm3, %xmm0
916 ; SSE41-NEXT: psrad $2, %xmm3
917 ; SSE41-NEXT: paddd %xmm0, %xmm3
919 ; SSE41-NEXT: movdqa %xmm3, %xmm1
925 ; SSE-NEXT: movdqa {{.*#+}} xmm3 = [2454267027,2454267027,2454267027,2454267027]
926 ; SSE-NEXT: movdqa %xmm3, %xmm4
932 ; SSE-NEXT: pand %xmm3, %xmm5
935 ; SSE-NEXT: pmuludq %xmm3, %xmm0
937 ; SSE-NEXT: pshufd {{.*#+}} xmm6 = xmm3[1,1,3,3]
951 ; SSE-NEXT: pand %xmm3, %xmm5
953 ; SSE-NEXT: pmuludq %xmm1, %xmm3
954 ; SSE-NEXT: pshufd {{.*#+}} xmm2 = xmm3[1,3,2,3]
955 ; SSE-NEXT: pshufd {{.*#+}} xmm3 = xmm1[1,1,3,3]
956 ; SSE-NEXT: pmuludq %xmm6, %xmm3
957 ; SSE-NEXT: pshufd {{.*#+}} xmm3 = xmm3[1,3,2,3]
958 ; SSE-NEXT: punpckldq {{.*#+}} xmm2 = xmm2[0],xmm3[0],xmm2[1],xmm3[1]
990 ; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[1,1,3,3]
992 ; SSE41-NEXT: pmuludq %xmm3, %xmm4
1006 ; SSE41-NEXT: pmuludq %xmm3, %xmm4
1010 ; SSE41-NEXT: movdqa %xmm1, %xmm3
1011 ; SSE41-NEXT: psubd %xmm2, %xmm3
1012 ; SSE41-NEXT: psrld $1, %xmm3
1013 ; SSE41-NEXT: paddd %xmm2, %xmm3
1014 ; SSE41-NEXT: psrld $2, %xmm3
1015 ; SSE41-NEXT: pmulld %xmm5, %xmm3
1016 ; SSE41-NEXT: psubd %xmm3, %xmm1
1021 ; SSE-NEXT: movdqa {{.*#+}} xmm3 = [613566757,613566757,613566757,613566757]
1023 ; SSE-NEXT: pmuludq %xmm3, %xmm2
1025 ; SSE-NEXT: pshufd {{.*#+}} xmm4 = xmm3[1,1,3,3]
1043 ; SSE-NEXT: pmuludq %xmm1, %xmm3
1044 ; SSE-NEXT: pshufd {{.*#+}} xmm3 = xmm3[1,3,2,3]
1048 ; SSE-NEXT: punpckldq {{.*#+}} xmm3 = xmm3[0],xmm4[0],xmm3[1],xmm4[1]
1050 ; SSE-NEXT: psubd %xmm3, %xmm4
1052 ; SSE-NEXT: paddd %xmm3, %xmm4
1054 ; SSE-NEXT: pshufd {{.*#+}} xmm3 = xmm4[1,1,3,3]
1057 ; SSE-NEXT: pmuludq %xmm2, %xmm3
1058 ; SSE-NEXT: pshufd {{.*#+}} xmm2 = xmm3[0,2,2,3]
1088 ; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm2[1,1,3,3]
1090 ; SSE41-NEXT: pmuldq %xmm3, %xmm4
1104 ; SSE41-NEXT: pmuldq %xmm3, %xmm5
1109 ; SSE41-NEXT: movdqa %xmm2, %xmm3
1110 ; SSE41-NEXT: psrld $31, %xmm3
1112 ; SSE41-NEXT: paddd %xmm3, %xmm2
1120 ; SSE-NEXT: movdqa %xmm2, %xmm3
1121 ; SSE-NEXT: psrad $31, %xmm3
1122 ; SSE-NEXT: movdqa %xmm3, %xmm4
1150 ; SSE-NEXT: pand %xmm1, %xmm3
1154 ; SSE-NEXT: paddd %xmm3, %xmm6
1157 ; SSE-NEXT: pshufd {{.*#+}} xmm3 = xmm1[1,1,3,3]
1158 ; SSE-NEXT: pmuludq %xmm5, %xmm3
1159 ; SSE-NEXT: pshufd {{.*#+}} xmm3 = xmm3[1,3,2,3]
1160 ; SSE-NEXT: punpckldq {{.*#+}} xmm2 = xmm2[0],xmm3[0],xmm2[1],xmm3[1]
1163 ; SSE-NEXT: movdqa %xmm2, %xmm3
1164 ; SSE-NEXT: psrld $31, %xmm3
1166 ; SSE-NEXT: paddd %xmm3, %xmm2
1167 ; SSE-NEXT: pshufd {{.*#+}} xmm3 = xmm2[1,1,3,3]
1170 ; SSE-NEXT: pmuludq %xmm4, %xmm3
1171 ; SSE-NEXT: pshufd {{.*#+}} xmm3 = xmm3[0,2,2,3]
1172 ; SSE-NEXT: punpckldq {{.*#+}} xmm2 = xmm2[0],xmm3[0],xmm2[1],xmm3[1]
1223 ; SSE41-NEXT: pshufd {{.*#+}} xmm3 = xmm0[1,1,3,3]
1224 ; SSE41-NEXT: pmuldq %xmm2, %xmm3
1227 ; SSE41-NEXT: pblendw {{.*#+}} xmm1 = xmm1[0,1],xmm3[2,3],xmm1[4,5],xmm3[6,7]
1239 ; SSE-NEXT: movdqa %xmm0, %xmm3
1240 ; SSE-NEXT: psrad $31, %xmm3
1241 ; SSE-NEXT: pand %xmm1, %xmm3
1242 ; SSE-NEXT: paddd %xmm2, %xmm3
1250 ; SSE-NEXT: psubd %xmm3, %xmm4
1260 ; AVX-NEXT: vpshufd {{.*#+}} xmm3 = xmm0[1,1,3,3]
1261 ; AVX-NEXT: vpmuldq %xmm2, %xmm3, %xmm2