Lines Matching full:next
10 ; X32-NEXT: paddb %xmm1, %xmm0
11 ; X32-NEXT: retl
15 ; X64-NEXT: paddb %xmm1, %xmm0
16 ; X64-NEXT: retq
27 ; X32-NEXT: paddw %xmm1, %xmm0
28 ; X32-NEXT: retl
32 ; X64-NEXT: paddw %xmm1, %xmm0
33 ; X64-NEXT: retq
44 ; X32-NEXT: paddd %xmm1, %xmm0
45 ; X32-NEXT: retl
49 ; X64-NEXT: paddd %xmm1, %xmm0
50 ; X64-NEXT: retq
61 ; X32-NEXT: paddq %xmm1, %xmm0
62 ; X32-NEXT: retl
66 ; X64-NEXT: paddq %xmm1, %xmm0
67 ; X64-NEXT: retq
75 ; X32-NEXT: addpd %xmm1, %xmm0
76 ; X32-NEXT: retl
80 ; X64-NEXT: addpd %xmm1, %xmm0
81 ; X64-NEXT: retq
89 ; X32-NEXT: addsd %xmm1, %xmm0
90 ; X32-NEXT: retl
94 ; X64-NEXT: addsd %xmm1, %xmm0
95 ; X64-NEXT: retq
106 ; X32-NEXT: paddsb %xmm1, %xmm0
107 ; X32-NEXT: retl
111 ; X64-NEXT: paddsb %xmm1, %xmm0
112 ; X64-NEXT: retq
124 ; X32-NEXT: paddsw %xmm1, %xmm0
125 ; X32-NEXT: retl
129 ; X64-NEXT: paddsw %xmm1, %xmm0
130 ; X64-NEXT: retq
142 ; X32-NEXT: paddusb %xmm1, %xmm0
143 ; X32-NEXT: retl
147 ; X64-NEXT: paddusb %xmm1, %xmm0
148 ; X64-NEXT: retq
160 ; X32-NEXT: paddusw %xmm1, %xmm0
161 ; X32-NEXT: retl
165 ; X64-NEXT: paddusw %xmm1, %xmm0
166 ; X64-NEXT: retq
178 ; X32-NEXT: andps %xmm1, %xmm0
179 ; X32-NEXT: retl
183 ; X64-NEXT: andps %xmm1, %xmm0
184 ; X64-NEXT: retq
195 ; X32-NEXT: andps %xmm1, %xmm0
196 ; X32-NEXT: retl
200 ; X64-NEXT: andps %xmm1, %xmm0
201 ; X64-NEXT: retq
209 ; X32-NEXT: andnps %xmm1, %xmm0
210 ; X32-NEXT: retl
214 ; X64-NEXT: andnps %xmm1, %xmm0
215 ; X64-NEXT: retq
227 ; X32-NEXT: pcmpeqd %xmm2, %xmm2
228 ; X32-NEXT: pxor %xmm2, %xmm0
229 ; X32-NEXT: pand %xmm1, %xmm0
230 ; X32-NEXT: retl
234 ; X64-NEXT: pcmpeqd %xmm2, %xmm2
235 ; X64-NEXT: pxor %xmm2, %xmm0
236 ; X64-NEXT: pand %xmm1, %xmm0
237 ; X64-NEXT: retq
246 ; X32-NEXT: pavgb %xmm1, %xmm0
247 ; X32-NEXT: retl
251 ; X64-NEXT: pavgb %xmm1, %xmm0
252 ; X64-NEXT: retq
264 ; X32-NEXT: pavgw %xmm1, %xmm0
265 ; X32-NEXT: retl
269 ; X64-NEXT: pavgw %xmm1, %xmm0
270 ; X64-NEXT: retq
282 ; X32-NEXT: pslldq {{.*#+}} xmm0 = zero,zero,zero,zero,zero,xmm0[0,1,2,3,4,5,6,7,8,9,10]
283 ; X32-NEXT: retl
287 ; X64-NEXT: pslldq {{.*#+}} xmm0 = zero,zero,zero,zero,zero,xmm0[0,1,2,3,4,5,6,7,8,9,10]
288 ; X64-NEXT: retq
298 ; X32-NEXT: psrldq {{.*#+}} xmm0 = xmm0[5,6,7,8,9,10,11,12,13,14,15],zero,zero,zero,zero,zero
299 ; X32-NEXT: retl
303 ; X64-NEXT: psrldq {{.*#+}} xmm0 = xmm0[5,6,7,8,9,10,11,12,13,14,15],zero,zero,zero,zero,zero
304 ; X64-NEXT: retq
314 ; X32-NEXT: retl
318 ; X64-NEXT: retq
326 ; X32-NEXT: retl
330 ; X64-NEXT: retq
338 ; X32-NEXT: retl
342 ; X64-NEXT: retq
350 ; X32-NEXT: retl
354 ; X64-NEXT: retq
362 ; X32-NEXT: retl
366 ; X64-NEXT: retq
374 ; X32-NEXT: retl
378 ; X64-NEXT: retq
386 ; X32-NEXT: movl {{[0-9]+}}(%esp), %eax
387 ; X32-NEXT: clflush (%eax)
388 ; X32-NEXT: retl
392 ; X64-NEXT: clflush (%rdi)
393 ; X64-NEXT: retq
402 ; X32-NEXT: pcmpeqb %xmm1, %xmm0
403 ; X32-NEXT: retl
407 ; X64-NEXT: pcmpeqb %xmm1, %xmm0
408 ; X64-NEXT: retq
420 ; X32-NEXT: pcmpeqw %xmm1, %xmm0
421 ; X32-NEXT: retl
425 ; X64-NEXT: pcmpeqw %xmm1, %xmm0
426 ; X64-NEXT: retq
438 ; X32-NEXT: pcmpeqd %xmm1, %xmm0
439 ; X32-NEXT: retl
443 ; X64-NEXT: pcmpeqd %xmm1, %xmm0
444 ; X64-NEXT: retq
456 ; X32-NEXT: cmpeqpd %xmm1, %xmm0
457 ; X32-NEXT: retl
461 ; X64-NEXT: cmpeqpd %xmm1, %xmm0
462 ; X64-NEXT: retq
472 ; X32-NEXT: cmpeqsd %xmm1, %xmm0
473 ; X32-NEXT: retl
477 ; X64-NEXT: cmpeqsd %xmm1, %xmm0
478 ; X64-NEXT: retq
487 ; X32-NEXT: cmplepd %xmm0, %xmm1
488 ; X32-NEXT: movapd %xmm1, %xmm0
489 ; X32-NEXT: retl
493 ; X64-NEXT: cmplepd %xmm0, %xmm1
494 ; X64-NEXT: movapd %xmm1, %xmm0
495 ; X64-NEXT: retq
505 ; X32-NEXT: cmplesd %xmm0, %xmm1
506 ; X32-NEXT: movsd {{.*#+}} xmm0 = xmm1[0],xmm0[1]
507 ; X32-NEXT: retl
511 ; X64-NEXT: cmplesd %xmm0, %xmm1
512 ; X64-NEXT: movsd {{.*#+}} xmm0 = xmm1[0],xmm0[1]
513 ; X64-NEXT: retq
525 NEXT: pcmpgtb %xmm1, %xmm0
526 ; X32-NEXT: retl
530 ; X64-NEXT: pcmpgtb %xmm1, %xmm0
531 ; X64-NEXT: retq
543 ; X32-NEXT: pcmpgtw %xmm1, %xmm0
544 ; X32-NEXT: retl
548 ; X64-NEXT: pcmpgtw %xmm1, %xmm0
549 ; X64-NEXT: retq
561 ; X32-NEXT: pcmpgtd %xmm1, %xmm0
562 ; X32-NEXT: retl
566 ; X64-NEXT: pcmpgtd %xmm1, %xmm0
567 ; X64-NEXT: retq
579 ; X32-NEXT: cmpltpd %xmm0, %xmm1
580 ; X32-NEXT: movapd %xmm1, %xmm0
581 ; X32-NEXT: retl
585 ; X64-NEXT: cmpltpd %xmm0, %xmm1
586 ; X64-NEXT: movapd %xmm1, %xmm0
587 ; X64-NEXT: retq
597 ; X32-NEXT: cmpltsd %xmm0, %xmm1
598 ; X32-NEXT: movsd {{.*#+}} xmm0 = xmm1[0],xmm0[1]
599 ; X32-NEXT: retl
603 ; X64-NEXT: cmpltsd %xmm0, %xmm1
604 ; X64-NEXT: movsd {{.*#+}} xmm0 = xmm1[0],xmm0[1]
605 ; X64-NEXT: retq
617 ; X32-NEXT: cmplepd %xmm1, %xmm0
618 ; X32-NEXT: retl
622 ; X64-NEXT: cmplepd %xmm1, %xmm0
623 ; X64-NEXT: retq
633 ; X32-NEXT: cmplesd %xmm1, %xmm0
634 ; X32-NEXT: retl
638 ; X64-NEXT: cmplesd %xmm1, %xmm0
639 ; X64-NEXT: retq
647 ; X32-NEXT: pcmpgtb %xmm0, %xmm1
648 ; X32-NEXT: movdqa %xmm1, %xmm0
649 ; X32-NEXT: retl
653 ; X64-NEXT: pcmpgtb %xmm0, %xmm1
654 ; X64-NEXT: movdqa %xmm1, %xmm0
655 ; X64-NEXT: retq
667 ; X32-NEXT: pcmpgtw %xmm0, %xmm1
668 ; X32-NEXT: movdqa %xmm1, %xmm0
669 ; X32-NEXT: retl
673 ; X64-NEXT: pcmpgtw %xmm0, %xmm1
674 ; X64-NEXT: movdqa %xmm1, %xmm0
675 ; X64-NEXT: retq
687 ; X32-NEXT: pcmpgtd %xmm0, %xmm1
688 ; X32-NEXT: movdqa %xmm1, %xmm0
689 ; X32-NEXT: retl
693 ; X64-NEXT: pcmpgtd %xmm0, %xmm1
694 ; X64-NEXT: movdqa %xmm1, %xmm0
695 ; X64-NEXT: retq
707 ; X32-NEXT: cmpltpd %xmm1, %xmm0
708 ; X32-NEXT: retl
712 ; X64-NEXT: cmpltpd %xmm1, %xmm0
713 ; X64-NEXT: retq
723 ; X32-NEXT: cmpltsd %xmm1, %xmm0
724 ; X32-NEXT: retl
728 ; X64-NEXT: cmpltsd %xmm1, %xmm0
729 ; X64-NEXT: retq
737 ; X32-NEXT: cmpneqpd %xmm1, %xmm0
738 ; X32-NEXT: retl
742 ; X64-NEXT: cmpneqpd %xmm1, %xmm0
743 ; X64-NEXT: retq
753 ; X32-NEXT: cmpneqsd %xmm1, %xmm0
754 ; X32-NEXT: retl
758 ; X64-NEXT: cmpneqsd %xmm1, %xmm0
759 ; X64-NEXT: retq
767 ; X32-NEXT: cmpnlepd %xmm0, %xmm1
768 ; X32-NEXT: movapd %xmm1, %xmm0
769 ; X32-NEXT: retl
773 ; X64-NEXT: cmpnlepd %xmm0, %xmm1
774 ; X64-NEXT: movapd %xmm1, %xmm0
775 ; X64-NEXT: retq
785 ; X32-NEXT: cmpnlesd %xmm0, %xmm1
786 ; X32-NEXT: movsd {{.*#+}} xmm0 = xmm1[0],xmm0[1]
787 ; X32-NEXT: retl
791 ; X64-NEXT: cmpnlesd %xmm0, %xmm1
792 ; X64-NEXT: movsd {{.*#+}} xmm0 = xmm1[0],xmm0[1]
793 ; X64-NEXT: retq
805 ; X32-NEXT: cmpnltpd %xmm0, %xmm1
806 ; X32-NEXT: movapd %xmm1, %xmm0
807 ; X32-NEXT: retl
811 ; X64-NEXT: cmpnltpd %xmm0, %xmm1
812 ; X64-NEXT: movapd %xmm1, %xmm0
813 ; X64-NEXT: retq
823 ; X32-NEXT: cmpnltsd %xmm0, %xmm1
824 ; X32-NEXT: movsd {{.*#+}} xmm0 = xmm1[0],xmm0[1]
825 ; X32-NEXT: retl
829 ; X64-NEXT: cmpnltsd %xmm0, %xmm1
830 ; X64-NEXT: movsd {{.*#+}} xmm0 = xmm1[0],xmm0[1]
831 ; X64-NEXT: retq
843 ; X32-NEXT: cmpnlepd %xmm1, %xmm0
844 ; X32-NEXT: retl
848 ; X64-NEXT: cmpnlepd %xmm1, %xmm0
849 ; X64-NEXT: retq
859 ; X32-NEXT: cmpnlesd %xmm1, %xmm0
860 ; X32-NEXT: retl
864 ; X64-NEXT: cmpnlesd %xmm1, %xmm0
865 ; X64-NEXT: retq
873 ; X32-NEXT: cmpnltpd %xmm1, %xmm0
874 ; X32-NEXT: retl
878 ; X64-NEXT: cmpnltpd %xmm1, %xmm0
879 ; X64-NEXT: retq
889 ; X32-NEXT: cmpnltsd %xmm1, %xmm0
890 ; X32-NEXT: retl
894 ; X64-NEXT: cmpnltsd %xmm1, %xmm0
895 ; X64-NEXT: retq
903 ; X32-NEXT: cmpordpd %xmm1, %xmm0
904 ; X32-NEXT: retl
908 ; X64-NEXT: cmpordpd %xmm1, %xmm0
909 ; X64-NEXT: retq
919 ; X32-NEXT: cmpordsd %xmm1, %xmm0
920 ; X32-NEXT: retl
924 ; X64-NEXT: cmpordsd %xmm1, %xmm0
925 ; X64-NEXT: retq
933 ; X32-NEXT: cmpunordpd %xmm1, %xmm0
934 ; X32-NEXT: retl
938 ; X64-NEXT: cmpunordpd %xmm1, %xmm0
939 ; X64-NEXT: retq
949 ; X32-NEXT: cmpunordsd %xmm1, %xmm0
950 ; X32-NEXT: retl
954 ; X64-NEXT: cmpunordsd %xmm1, %xmm0
955 ; X64-NEXT: retq
963 ; X32-NEXT: comisd %xmm1, %xmm0
964 ; X32-NEXT: setnp %al
965 ; X32-NEXT: sete %cl
966 ; X32-NEXT: andb %al, %cl
967 ; X32-NEXT: movzbl %cl, %eax
968 ; X32-NEXT: retl
972 ; X64-NEXT: comisd %xmm1, %xmm0
973 ; X64-NEXT: setnp %al
974 ; X64-NEXT: sete %cl
975 ; X64-NEXT: andb %al, %cl
976 ; X64-NEXT: movzbl %cl, %eax
977 ; X64-NEXT: retq
986 ; X32-NEXT: xorl %eax, %eax
987 ; X32-NEXT: comisd %xmm1, %xmm0
988 ; X32-NEXT: setae %al
989 ; X32-NEXT: retl
993 ; X64-NEXT: xorl %eax, %eax
994 ; X64-NEXT: comisd %xmm1, %xmm0
995 ; X64-NEXT: setae %al
996 ; X64-NEXT: retq
1005 ; X32-NEXT: xorl %eax, %eax
1006 ; X32-NEXT: comisd %xmm1, %xmm0
1007 ; X32-NEXT: seta %al
1008 ; X32-NEXT: retl
1012 ; X64-NEXT: xorl %eax, %eax
1013 ; X64-NEXT: comisd %xmm1, %xmm0
1014 ; X64-NEXT: seta %al
1015 ; X64-NEXT: retq
1024 ; X32-NEXT: xorl %eax, %eax
1025 ; X32-NEXT: comisd %xmm0, %xmm1
1026 ; X32-NEXT: setae %al
1027 ; X32-NEXT: retl
1031 ; X64-NEXT: xorl %eax, %eax
1032 ; X64-NEXT: comisd %xmm0, %xmm1
1033 ; X64-NEXT: setae %al
1034 ; X64-NEXT: retq
1043 ; X32-NEXT: xorl %eax, %eax
1044 ; X32-NEXT: comisd %xmm0, %xmm1
1045 ; X32-NEXT: seta %al
1046 ; X32-NEXT: retl
1050 ; X64-NEXT: xorl %eax, %eax
1051 ; X64-NEXT: comisd %xmm0, %xmm1
1052 ; X64-NEXT: seta %al
1053 ; X64-NEXT: retq
1062 ; X32-NEXT: comisd %xmm1, %xmm0
1063 ; X32-NEXT: setp %al
1064 ; X32-NEXT: setne %cl
1065 ; X32-NEXT: orb %al, %cl
1066 ; X32-NEXT: movzbl %cl, %eax
1067 ; X32-NEXT: retl
1071 ; X64-NEXT: comisd %xmm1, %xmm0
1072 ; X64-NEXT: setp %al
1073 ; X64-NEXT: setne %cl
1074 ; X64-NEXT: orb %al, %cl
1075 ; X64-NEXT: movzbl %cl, %eax
1076 ; X64-NEXT: retq
1085 ; X32-NEXT: cvtdq2pd %xmm0, %xmm0
1086 ; X32-NEXT: retl
1090 ; X64-NEXT: cvtdq2pd %xmm0, %xmm0
1091 ; X64-NEXT: retq
1101 ; X32-NEXT: cvtdq2ps %xmm0, %xmm0
1102 ; X32-NEXT: retl
1106 ; X64-NEXT: cvtdq2ps %xmm0, %xmm0
1107 ; X64-NEXT: retq
1117 ; X32-NEXT: cvtpd2dq %xmm0, %xmm0
1118 ; X32-NEXT: retl
1122 ; X64-NEXT: cvtpd2dq %xmm0, %xmm0
1123 ; X64-NEXT: retq
1133 ; X32-NEXT: cvtpd2ps %xmm0, %xmm0
1134 ; X32-NEXT: retl
1138 ; X64-NEXT: cvtpd2ps %xmm0, %xmm0
1139 ; X64-NEXT: retq
1148 ; X32-NEXT: cvtps2dq %xmm0, %xmm0
1149 ; X32-NEXT: retl
1153 ; X64-NEXT: cvtps2dq %xmm0, %xmm0
1154 ; X64-NEXT: retq
1164 ; X32-NEXT: cvtps2pd %xmm0, %xmm0
1165 ; X32-NEXT: retl
1169 ; X64-NEXT: cvtps2pd %xmm0, %xmm0
1170 ; X64-NEXT: retq
1179 ; X32-NEXT: pushl %ebp
1180 ; X32-NEXT: movl %esp, %ebp
1181 ; X32-NEXT: andl $-8, %esp
1182 ; X32-NEXT: subl $8, %esp
1183 ; X32-NEXT: movlps %xmm0, (%esp)
1184 ; X32-NEXT: fldl (%esp)
1185 ; X32-NEXT: movl %ebp, %esp
1186 ; X32-NEXT: popl %ebp
1187 ; X32-NEXT: retl
1191 ; X64-NEXT: retq
1199 ; X32-NEXT: cvtsd2si %xmm0, %eax
1200 ; X32-NEXT: retl
1204 ; X64-NEXT: cvtsd2si %xmm0, %eax
1205 ; X64-NEXT: retq
1214 ; X32-NEXT: movd %xmm0, %eax
1215 ; X32-NEXT: retl
1219 ; X64-NEXT: movd %xmm0, %eax
1220 ; X64-NEXT: retq
1229 ; X32-NEXT: movl {{[0-9]+}}(%esp), %eax
1230 ; X32-NEXT: cvtsi2sdl %eax, %xmm1
1231 ; X32-NEXT: movsd {{.*#+}} xmm0 = xmm1[0],xmm0[1]
1232 ; X32-NEXT: retl
1236 ; X64-NEXT: cvtsi2sdl %edi, %xmm1
1237 ; X64-NEXT: movsd {{.*#+}} xmm0 = xmm1[0],xmm0[1]
1238 ; X64-NEXT: retq
1247 ; X32-NEXT: movd {{.*#+}} xmm0 = mem[0],zero,zero,zero
1248 ; X32-NEXT: retl
1252 ; X64-NEXT: movd %edi, %xmm0
1253 ; X64-NEXT: retq
1265 ; X32-NEXT: cvtss2sd %xmm1, %xmm1
1266 ; X32-NEXT: movsd {{.*#+}} xmm0 = xmm1[0],xmm0[1]
1267 ; X32-NEXT: retl
1271 ; X64-NEXT: cvtss2sd %xmm1, %xmm1
1272 ; X64-NEXT: movsd {{.*#+}} xmm0 = xmm1[0],xmm0[1]
1273 ; X64-NEXT: retq
1283 ; X32-NEXT: cvttpd2dq %xmm0, %xmm0
1284 ; X32-NEXT: retl
1288 ; X64-NEXT: cvttpd2dq %xmm0, %xmm0
1289 ; X64-NEXT: retq
1299 ; X32-NEXT: cvttps2dq %xmm0, %xmm0
1300 ; X32-NEXT: retl
1304 ; X64-NEXT: cvttps2dq %xmm0, %xmm0
1305 ; X64-NEXT: retq
1314 ; X32-NEXT: cvttsd2si %xmm0, %eax
1315 ; X32-NEXT: retl
1319 ; X64-NEXT: cvttsd2si %xmm0, %eax
1320 ; X64-NEXT: retq
1329 ; X32-NEXT: divpd %xmm1, %xmm0
1330 ; X32-NEXT: retl
1334 ; X64-NEXT: divpd %xmm1, %xmm0
1335 ; X64-NEXT: retq
1343 ; X32-NEXT: divsd %xmm1, %xmm0
1344 ; X32-NEXT: retl
1348 ; X64-NEXT: divsd %xmm1, %xmm0
1349 ; X64-NEXT: retq
1360 ; X32-NEXT: pextrw $1, %xmm0, %eax
1361 ; X32-NEXT: movzwl %ax, %eax
1362 ; X32-NEXT: retl
1366 ; X64-NEXT: pextrw $1, %xmm0, %eax
1367 ; X64-NEXT: movzwl %ax, %eax
1368 ; X64-NEXT: retq
1378 ; X32-NEXT: movw {{[0-9]+}}(%esp), %ax
1379 ; X32-NEXT: pinsrw $1, %eax, %xmm0
1380 ; X32-NEXT: retl
1384 ; X64-NEXT: pinsrw $1, %edi, %xmm0
1385 ; X64-NEXT: retq
1395 ; X32-NEXT: lfence
1396 ; X32-NEXT: retl
1400 ; X64-NEXT: lfence
1401 ; X64-NEXT: retq
1410 ; X32-NEXT: movl {{[0-9]+}}(%esp), %eax
1411 ; X32-NEXT: movaps (%eax), %xmm0
1412 ; X32-NEXT: retl
1416 ; X64-NEXT: movaps (%rdi), %xmm0
1417 ; X64-NEXT: retq
1426 ; X32-NEXT: movl {{[0-9]+}}(%esp), %eax
1427 ; X32-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero
1428 ; X32-NEXT: retl
1432 ; X64-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero
1433 ; X64-NEXT: retq
1443 ; X32-NEXT: movl {{[0-9]+}}(%esp), %eax
1444 ; X32-NEXT: movaps (%eax), %xmm0
1445 ; X32-NEXT: retl
1449 ; X64-NEXT: movaps (%rdi), %xmm0
1450 ; X64-NEXT: retq
1458 ; X32-NEXT: movl {{[0-9]+}}(%esp), %eax
1459 ; X32-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero
1460 ; X32-NEXT: movlhps {{.*#+}} xmm0 = xmm0[0,0]
1461 ; X32-NEXT: retl
1465 ; X64-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero
1466 ; X64-NEXT: movlhps {{.*#+}} xmm0 = xmm0[0,0]
1467 ; X64-NEXT: retq
1477 ; X32-NEXT: movl {{[0-9]+}}(%esp), %eax
1478 ; X32-NEXT: movhpd {{.*#+}} xmm0 = xmm0[0],mem[0]
1479 ; X32-NEXT: retl
1483 ; X64-NEXT: movhpd {{.*#+}} xmm0 = xmm0[0],mem[0]
1484 ; X64-NEXT: retq
1493 ; X32-NEXT: movl {{[0-9]+}}(%esp), %eax
1494 ; X32-NEXT: movq {{.*#+}} xmm0 = mem[0],zero
1495 ; X32-NEXT: retl
1499 ; X64-NEXT: movq {{.*#+}} xmm0 = mem[0],zero
1500 ; X64-NEXT: retq
1511 ; X32-NEXT: movl {{[0-9]+}}(%esp), %eax
1512 ; X32-NEXT: movlpd {{.*#+}} xmm0 = mem[0],xmm0[1]
1513 ; X32-NEXT: retl
1517 ; X64-NEXT: movlpd {{.*#+}} xmm0 = mem[0],xmm0[1]
1518 ; X64-NEXT: retq
1527 ; X32-NEXT: movl {{[0-9]+}}(%esp), %eax
1528 ; X32-NEXT: movapd (%eax), %xmm0
1529 ; X32-NEXT: shufpd {{.*#+}} xmm0 = xmm0[1,0]
1530 ; X32-NEXT: retl
1534 ; X64-NEXT: movapd (%rdi), %xmm0
1535 ; X64-NEXT: shufpd {{.*#+}} xmm0 = xmm0[1,0]
1536 ; X64-NEXT: retq
1546 ; X32-NEXT: movl {{[0-9]+}}(%esp), %eax
1547 ; X32-NEXT: movups (%eax), %xmm0
1548 ; X32-NEXT: retl
1552 ; X64-NEXT: movups (%rdi), %xmm0
1553 ; X64-NEXT: retq
1562 ; X32-NEXT: movl {{[0-9]+}}(%esp), %eax
1563 ; X32-NEXT: movups (%eax), %xmm0
1564 ; X32-NEXT: retl
1568 ; X64-NEXT: movups (%rdi), %xmm0
1569 ; X64-NEXT: retq
1577 ; X32-NEXT: pmaddwd %xmm1, %xmm0
1578 ; X32-NEXT: retl
1582 ; X64-NEXT: pmaddwd %xmm1, %xmm0
1583 ; X64-NEXT: retq
1595 ; X32-NEXT: pushl %edi
1596 ; X32-NEXT: movl {{[0-9]+}}(%esp), %edi
1597 ; X32-NEXT: maskmovdqu %xmm1, %xmm0
1598 ; X32-NEXT: popl %edi
1599 ; X32-NEXT: retl
1603 ; X64-NEXT: maskmovdqu %xmm1, %xmm0
1604 ; X64-NEXT: retq
1615 ; X32-NEXT: pmaxsw %xmm1, %xmm0
1616 ; X32-NEXT: retl
1620 ; X64-NEXT: pmaxsw %xmm1, %xmm0
1621 ; X64-NEXT: retq
1633 ; X32-NEXT: pmaxub %xmm1, %xmm0
1634 ; X32-NEXT: retl
1638 ; X64-NEXT: pmaxub %xmm1, %xmm0
1639 ; X64-NEXT: retq
1651 ; X32-NEXT: maxpd %xmm1, %xmm0
1652 ; X32-NEXT: retl
1656 ; X64-NEXT: maxpd %xmm1, %xmm0
1657 ; X64-NEXT: retq
1666 ; X32-NEXT: maxsd %xmm1, %xmm0
1667 ; X32-NEXT: retl
1671 ; X64-NEXT: maxsd %xmm1, %xmm0
1672 ; X64-NEXT: retq
1681 ; X32-NEXT: mfence
1682 ; X32-NEXT: retl
1686 ; X64-NEXT: mfence
1687 ; X64-NEXT: retq
1696 ; X32-NEXT: pminsw %xmm1, %xmm0
1697 ; X32-NEXT: retl
1701 ; X64-NEXT: pminsw %xmm1, %xmm0
1702 ; X64-NEXT: retq
1714 ; X32-NEXT: pminub %xmm1, %xmm0
1715 ; X32-NEXT: retl
1719 ; X64-NEXT: pminub %xmm1, %xmm0
1720 ; X64-NEXT: retq
1732 ; X32-NEXT: minpd %xmm1, %xmm0
1733 ; X32-NEXT: retl
1737 ; X64-NEXT: minpd %xmm1, %xmm0
1738 ; X64-NEXT: retq
1747 ; X32-NEXT: minsd %xmm1, %xmm0
1748 ; X32-NEXT: retl
1752 ; X64-NEXT: minsd %xmm1, %xmm0
1753 ; X64-NEXT: retq
1762 ; X32-NEXT: movq {{.*#+}} xmm0 = xmm0[0],zero
1763 ; X32-NEXT: retl
1767 ; X64-NEXT: movq {{.*#+}} xmm0 = xmm0[0],zero
1768 ; X64-NEXT: retq
1776 ; X32-NEXT: movsd {{.*#+}} xmm0 = xmm1[0],xmm0[1]
1777 ; X32-NEXT: retl
1781 ; X64-NEXT: movsd {{.*#+}} xmm0 = xmm1[0],xmm0[1]
1782 ; X64-NEXT: retq
1793 ; X32-NEXT: pmovmskb %xmm0, %eax
1794 ; X32-NEXT: retl
1798 ; X64-NEXT: pmovmskb %xmm0, %eax
1799 ; X64-NEXT: retq
1809 ; X32-NEXT: movmskpd %xmm0, %eax
1810 ; X32-NEXT: retl
1814 ; X64-NEXT: movmskpd %xmm0, %eax
1815 ; X64-NEXT: retq
1824 ; X32-NEXT: pmuludq %xmm1, %xmm0
1825 ; X32-NEXT: retl
1829 ; X64-NEXT: pmuludq %xmm1, %xmm0
1830 ; X64-NEXT: retq
1841 ; X32-NEXT: mulpd %xmm1, %xmm0
1842 ; X32-NEXT: retl
1846 ; X64-NEXT: mulpd %xmm1, %xmm0
1847 ; X64-NEXT: retq
1855 ; X32-NEXT: mulsd %xmm1, %xmm0
1856 ; X32-NEXT: retl
1860 ; X64-NEXT: mulsd %xmm1, %xmm0
1861 ; X64-NEXT: retq
1872 ; X32-NEXT: pmulhw %xmm1, %xmm0
1873 ; X32-NEXT: retl
1877 ; X64-NEXT: pmulhw %xmm1, %xmm0
1878 ; X64-NEXT: retq
1890 ; X32-NEXT: pmulhuw %xmm1, %xmm0
1891 ; X32-NEXT: retl
1895 ; X64-NEXT: pmulhuw %xmm1, %xmm0
1896 ; X64-NEXT: retq
1908 ; X32-NEXT: pmullw %xmm1, %xmm0
1909 ; X32-NEXT: retl
1913 ; X64-NEXT: pmullw %xmm1, %xmm0
1914 ; X64-NEXT: retq
1925 ; X32-NEXT: orps %xmm1, %xmm0
1926 ; X32-NEXT: retl
1930 ; X64-NEXT: orps %xmm1, %xmm0
1931 ; X64-NEXT: retq
1942 ; X32-NEXT: orps %xmm1, %xmm0
1943 ; X32-NEXT: retl
1947 ; X64-NEXT: orps %xmm1, %xmm0
1948 ; X64-NEXT: retq
1956 ; X32-NEXT: packsswb %xmm1, %xmm0
1957 ; X32-NEXT: retl
1961 ; X64-NEXT: packsswb %xmm1, %xmm0
1962 ; X64-NEXT: retq
1974 ; X32-NEXT: packssdw %xmm1, %xmm0
1975 ; X32-NEXT: retl
1979 ; X64-NEXT: packssdw %xmm1, %xmm0
1980 ; X64-NEXT: retq
1992 ; X32-NEXT: packuswb %xmm1, %xmm0
1993 ; X32-NEXT: retl
1997 ; X64-NEXT: packuswb %xmm1, %xmm0
1998 ; X64-NEXT: retq
2010 ; X32-NEXT: pause
2011 ; X32-NEXT: retl
2015 ; X64-NEXT: pause
2016 ; X64-NEXT: retq
2025 ; X32-NEXT: psadbw %xmm1, %xmm0
2026 ; X32-NEXT: retl
2030 ; X64-NEXT: psadbw %xmm1, %xmm0
2031 ; X64-NEXT: retq
2042 ; X32-NEXT: movzbl {{[0-9]+}}(%esp), %eax
2043 ; X32-NEXT: movd %eax, %xmm0
2044 ; X32-NEXT: movzbl {{[0-9]+}}(%esp), %eax
2045 ; X32-NEXT: movd %eax, %xmm1
2046 ; X32-NEXT: punpcklbw {{.*#+}} xmm1 = xmm1[0],xmm0[0],xmm1[1],xmm0[1],xmm1[2],xmm0[2],xmm1[3],xmm0[3],xmm1[4],xmm0[4],xmm1[5],xmm0[5],xmm1[6],xmm0[6],xmm1[7],xmm0[7]
2047 ; X32-NEXT: movzbl {{[0-9]+}}(%esp), %eax
2048 ; X32-NEXT: movd %eax, %xmm0
2049 ; X32-NEXT: movzbl {{[0-9]+}}(%esp), %eax
2050 ; X32-NEXT: movd %eax, %xmm2
2051 ; X32-NEXT: punpcklbw {{.*#+}} xmm2 = xmm2[0],xmm0[0],xmm2[1],xmm0[1],xmm2[2],xmm0[2],xmm2[3],xmm0[3],xmm2[4],xmm0[4],xmm2[5],xmm0[5],xmm2[6],xmm0[6],xmm2[7],xmm0[7]
2052 ; X32-NEXT: punpcklbw {{.*#+}} xmm2 = xmm2[0],xmm1[0],xmm2[1],xmm1[1],xmm2[2],xmm1[2],xmm2[3],xmm1[3],xmm2[4],xmm1[4],xmm2[5],xmm1[5],xmm2[6],xmm1[6],xmm2[7],xmm1[7]
2053 ; X32-NEXT: movzbl {{[0-9]+}}(%esp), %eax
2054 ; X32-NEXT: movd %eax, %xmm0
2055 ; X32-NEXT: movzbl {{[0-9]+}}(%esp), %eax
2056 ; X32-NEXT: movd %eax, %xmm3
2057 ; X32-NEXT: punpcklbw {{.*#+}} xmm3 = xmm3[0],xmm0[0],xmm3[1],xmm0[1],xmm3[2],xmm0[2],xmm3[3],xmm0[3],xmm3[4],xmm0[4],xmm3[5],xmm0[5],xmm3[6],xmm0[6],xmm3[7],xmm0[7]
2058 ; X32-NEXT: movzbl {{[0-9]+}}(%esp), %eax
2059 ; X32-NEXT: movd %eax, %xmm0
2060 ; X32-NEXT: movzbl {{[0-9]+}}(%esp), %eax
2061 ; X32-NEXT: movd %eax, %xmm1
2062 ; X32-NEXT: punpcklbw {{.*#+}} xmm1 = xmm1[0],xmm0[0],xmm1[1],xmm0[1],xmm1[2],xmm0[2],xmm1[3],xmm0[3],xmm1[4],xmm0[4],xmm1[5],xmm0[5],xmm1[6],xmm0[6],xmm1[7],xmm0[7]
2063 ; X32-NEXT: punpcklbw {{.*#+}} xmm1 = xmm1[0],xmm3[0],xmm1[1],xmm3[1],xmm1[2],xmm3[2],xmm1[3],xmm3[3],xmm1[4],xmm3[4],xmm1[5],xmm3[5],xmm1[6],xmm3[6],xmm1[7],xmm3[7]
2064 ; X32-NEXT: punpcklbw {{.*#+}} xmm1 = xmm1[0],xmm2[0],xmm1[1],xmm2[1],xmm1[2],xmm2[2],xmm1[3],xmm2[3],xmm1[4],xmm2[4],xmm1[5],xmm2[5],xmm1[6],xmm2[6],xmm1[7],xmm2[7]
2065 ; X32-NEXT: movzbl {{[0-9]+}}(%esp), %eax
2066 ; X32-NEXT: movd %eax, %xmm0
2067 ; X32-NEXT: movzbl {{[0-9]+}}(%esp), %eax
2068 ; X32-NEXT: movd %eax, %xmm2
2069 ; X32-NEXT: punpcklbw {{.*#+}} xmm2 = xmm2[0],xmm0[0],xmm2[1],xmm0[1],xmm2[2],xmm0[2],xmm2[3],xmm0[3],xmm2[4],xmm0[4],xmm2[5],xmm0[5],xmm2[6],xmm0[6],xmm2[7],xmm0[7]
2070 ; X32-NEXT: movzbl {{[0-9]+}}(%esp), %eax
2071 ; X32-NEXT: movd %eax, %xmm0
2072 ; X32-NEXT: movzbl {{[0-9]+}}(%esp), %eax
2073 ; X32-NEXT: movd %eax, %xmm3
2074 ; X32-NEXT: punpcklbw {{.*#+}} xmm3 = xmm3[0],xmm0[0],xmm3[1],xmm0[1],xmm3[2],xmm0[2],xmm3[3],xmm0[3],xmm3[4],xmm0[4],xmm3[5],xmm0[5],xmm3[6],xmm0[6],xmm3[7],xmm0[7]
2075 ; X32-NEXT
2076 ; X32-NEXT: movzbl {{[0-9]+}}(%esp), %eax
2077 ; X32-NEXT: movd %eax, %xmm0
2078 ; X32-NEXT: movzbl {{[0-9]+}}(%esp), %eax
2079 ; X32-NEXT: movd %eax, %xmm2
2080 ; X32-NEXT: punpcklbw {{.*#+}} xmm2 = xmm2[0],xmm0[0],xmm2[1],xmm0[1],xmm2[2],xmm0[2],xmm2[3],xmm0[3],xmm2[4],xmm0[4],xmm2[5],xmm0[5],xmm2[6],xmm0[6],xmm2[7],xmm0[7]
2081 ; X32-NEXT: movzbl {{[0-9]+}}(%esp), %eax
2082 ; X32-NEXT: movd %eax, %xmm4
2083 ; X32-NEXT: movzbl {{[0-9]+}}(%esp), %eax
2084 ; X32-NEXT: movd %eax, %xmm0
2085 ; X32-NEXT: punpcklbw {{.*#+}} xmm0 = xmm0[0],xmm4[0],xmm0[1],xmm4[1],xmm0[2],xmm4[2],xmm0[3],xmm4[3],xmm0[4],xmm4[4],xmm0[5],xmm4[5],xmm0[6],xmm4[6],xmm0[7],xmm4[7]
2086 ; X32-NEXT: punpcklbw {{.*#+}} xmm0 = xmm0[0],xmm2[0],xmm0[1],xmm2[1],xmm0[2],xmm2[2],xmm0[3],xmm2[3],xmm0[4],xmm2[4],xmm0[5],xmm2[5],xmm0[6],xmm2[6],xmm0[7],xmm2[7]
2087 ; X32-NEXT: punpcklbw {{.*#+}} xmm0 = xmm0[0],xmm3[0],xmm0[1],xmm3[1],xmm0[2],xmm3[2],xmm0[3],xmm3[3],xmm0[4],xmm3[4],xmm0[5],xmm3[5],xmm0[6],xmm3[6],xmm0[7],xmm3[7]
2088 ; X32-NEXT: punpcklbw {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1],xmm0[2],xmm1[2],xmm0[3],xmm1[3],xmm0[4],xmm1[4],xmm0[5],xmm1[5],xmm0[6],xmm1[6],xmm0[7],xmm1[7]
2089 ; X32-NEXT: retl
2093 ; X64-NEXT: movzbl %dil, %eax
2094 ; X64-NEXT: movd %eax, %xmm0
2095 ; X64-NEXT: movzbl {{[0-9]+}}(%rsp), %eax
2096 ; X64-NEXT: movd %eax, %xmm1
2097 ; X64-NEXT: punpcklbw {{.*#+}} xmm1 = xmm1[0],xmm0[0],xmm1[1],xmm0[1],xmm1[2],xmm0[2],xmm1[3],xmm0[3],xmm1[4],xmm0[4],xmm1[5],xmm0[5],xmm1[6],xmm0[6],xmm1[7],xmm0[7]
2098 ; X64-NEXT: movzbl %r8b, %eax
2099 ; X64-NEXT: movd %eax, %xmm0
2100 ; X64-NEXT: movzbl {{[0-9]+}}(%rsp), %eax
2101 ; X64-NEXT: movd %eax, %xmm2
2102 ; X64-NEXT: punpcklbw {{.*#+}} xmm2 = xmm2[0],xmm0[0],xmm2[1],xmm0[1],xmm2[2],xmm0[2],xmm2[3],xmm0[3],xmm2[4],xmm0[4],xmm2[5],xmm0[5],xmm2[6],xmm0[6],xmm2[7],xmm0[7]
2103 ; X64-NEXT: punpcklbw {{.*#+}} xmm2 = xmm2[0],xmm1[0],xmm2[1],xmm1[1],xmm2[2],xmm1[2],xmm2[3],xmm1[3],xmm2[4],xmm1[4],xmm2[5],xmm1[5],xmm2[6],xmm1[6],xmm2[7],xmm1[7]
2104 ; X64-NEXT: movzbl %dl, %eax
2105 ; X64-NEXT: movd %eax, %xmm0
2106 ; X64-NEXT: movzbl {{[0-9]+}}(%rsp), %eax
2107 ; X64-NEXT: movd %eax, %xmm3
2108 ; X64-NEXT: punpcklbw {{.*#+}} xmm3 = xmm3[0],xmm0[0],xmm3[1],xmm0[1],xmm3[2],xmm0[2],xmm3[3],xmm0[3],xmm3[4],xmm0[4],xmm3[5],xmm0[5],xmm3[6],xmm0[6],xmm3[7],xmm0[7]
2109 ; X64-NEXT: movzbl {{[0-9]+}}(%rsp), %eax
2110 ; X64-NEXT: movd %eax, %xmm0
2111 ; X64-NEXT: movzbl {{[0-9]+}}(%rsp), %eax
2112 ; X64-NEXT: movd %eax, %xmm1
2113 ; X64-NEXT: punpcklbw {{.*#+}} xmm1 = xmm1[0],xmm0[0],xmm1[1],xmm0[1],xmm1[2],xmm0[2],xmm1[3],xmm0[3],xmm1[4],xmm0[4],xmm1[5],xmm0[5],xmm1[6],xmm0[6],xmm1[7],xmm0[7]
2114 ; X64-NEXT: punpcklbw {{.*#+}} xmm1 = xmm1[0],xmm3[0],xmm1[1],xmm3[1],xmm1[2],xmm3[2],xmm1[3],xmm3[3],xmm1[4],xmm3[4],xmm1[5],xmm3[5],xmm1[6],xmm3[6],xmm1[7],xmm3[7]
2115 ; X64-NEXT: punpcklbw {{.*#+}} xmm1 = xmm1[0],xmm2[0],xmm1[1],xmm2[1],xmm1[2],xmm2[2],xmm1[3],xmm2[3],xmm1[4],xmm2[4],xmm1[5],xmm2[5],xmm1[6],xmm2[6],xmm1[7],xmm2[7]
2116 ; X64-NEXT: movzbl %sil, %eax
2117 ; X64-NEXT: movd %eax, %xmm0
2118 ; X64-NEXT: movzbl {{[0-9]+}}(%rsp), %eax
2119 ; X64-NEXT: movd %eax, %xmm2
2120 ; X64-NEXT: punpcklbw {{.*#+}} xmm2 = xmm2[0],xmm0[0],xmm2[1],xmm0[1],xmm2[2],xmm0[2],xmm2[3],xmm0[3],xmm2[4],xmm0[4],xmm2[5],xmm0[5],xmm2[6],xmm0[6],xmm2[7],xmm0[7]
2121 ; X64-NEXT: movzbl %r9b, %eax
2122 ; X64-NEXT: movd %eax, %xmm0
2123 ; X64-NEXT: movzbl {{[0-9]+}}(%rsp), %eax
2124 ; X64-NEXT: movd %eax, %xmm3
2125 ; X64-NEXT: punpcklbw {{.*#+}} xmm3 = xmm3[0],xmm0[0],xmm3[1],xmm0[1],xmm3[2],xmm0[2],xmm3[3],xmm0[3],xmm3[4],xmm0[4],xmm3[5],xmm0[5],xmm3[6],xmm0[6],xmm3[7],xmm0[7]
2126 ; X64-NEXT: punpcklbw {{.*#+}} xmm3 = xmm3[0],xmm2[0],xmm3[1],xmm2[1],xmm3[2],xmm2[2],xmm3[3],xmm2[3],xmm3[4],xmm2[4],xmm3[5],xmm2[5],xmm3[6],xmm2[6],xmm3[7],xmm2[7]
2127 ; X64-NEXT: movzbl %cl, %eax
2128 ; X64-NEXT: movd %eax, %xmm0
2129 ; X64-NEXT: movzbl {{[0-9]+}}(%rsp), %eax
2130 ; X64-NEXT: movd %eax, %xmm2
2131 ; X64-NEXT: punpcklbw {{.*#+}} xmm2 = xmm2[0],xmm0[0],xmm2[1],xmm0[1],xmm2[2],xmm0[2],xmm2[3],xmm0[3],xmm2[4],xmm0[4],xmm2[5],xmm0[5],xmm2[6],xmm0[6],xmm2[7],xmm0[7]
2132 ; X64-NEXT: movzbl {{[0-9]+}}(%rsp), %eax
2133 ; X64-NEXT: movd %eax, %xmm4
2134 ; X64-NEXT: movzbl {{[0-9]+}}(%rsp), %eax
2135 ; X64-NEXT: movd %eax, %xmm0
2136 ; X64-NEXT: punpcklbw {{.*#+}} xmm0 = xmm0[0],xmm4[0],xmm0[1],xmm4[1],xmm0[2],xmm4[2],xmm0[3],xmm4[3],xmm0[4],xmm4[4],xmm0[5],xmm4[5],xmm0[6],xmm4[6],xmm0[7],xmm4[7]
2137 ; X64-NEXT: punpcklbw {{.*#+}} xmm0 = xmm0[0],xmm2[0],xmm0[1],xmm2[1],xmm0[2],xmm2[2],xmm0[3],xmm2[3],xmm0[4],xmm2[4],xmm0[5],xmm2[5],xmm0[6],xmm2[6],xmm0[7],xmm2[7]
2138 ; X64-NEXT: punpcklbw {{.*#+}} xmm0 = xmm0[0],xmm3[0],xmm0[1],xmm3[1],xmm0[2],xmm3[2],xmm0[3],xmm3[3],xmm0[4],xmm3[4],xmm0[5],xmm3[5],xmm0[6],xmm3[6],xmm0[7],xmm3[7]
2139 ; X64-NEXT: punpcklbw {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1],xmm0[2],xmm1[2],xmm0[3],xmm1[3],xmm0[4],xmm1[4],xmm0[5],xmm1[5],xmm0[6],xmm1[6],xmm0[7],xmm1[7]
2140 ; X64-NEXT: retq
2164 ; X32-NEXT: movw {{[0-9]+}}(%esp), %ax
2165 ; X32-NEXT: movd %eax, %xmm1
2166 ; X32-NEXT: movw {{[0-9]+}}(%esp), %ax
2167 ; X32-NEXT: movd %eax, %xmm2
2168 ; X32-NEXT: movw {{[0-9]+}}(%esp), %ax
2169 ; X32-NEXT: movd %eax, %xmm3
2170 ; X32-NEXT: movw {{[0-9]+}}(%esp), %ax
2171 ; X32-NEXT: movd %eax, %xmm4
2172 ; X32-NEXT: movw {{[0-9]+}}(%esp), %ax
2173 ; X32-NEXT: movd %eax, %xmm5
2174 ; X32-NEXT: movw {{[0-9]+}}(%esp), %ax
2175 ; X32-NEXT: movd %eax, %xmm6
2176 ; X32-NEXT: movw {{[0-9]+}}(%esp), %ax
2177 ; X32-NEXT: movd %eax, %xmm7
2178 ; X32-NEXT: movw {{[0-9]+}}(%esp), %ax
2179 ; X32-NEXT: movd %eax, %xmm0
2180 ; X32-NEXT: punpcklwd {{.*#+}} xmm2 = xmm2[0],xmm1[0],xmm2[1],xmm1[1],xmm2[2],xmm1[2],xmm2[3],xmm1[3]
2181 ; X32-NEXT: punpcklwd {{.*#+}} xmm4 = xmm4[0],xmm3[0],xmm4[1],xmm3[1],xmm4[2],xmm3[2],xmm4[3],xmm3[3]
2182 ; X32-NEXT: punpcklwd {{.*#+}} xmm4 = xmm4[0],xmm2[0],xmm4[1],xmm2[1],xmm4[2],xmm2[2],xmm4[3],xmm2[3]
2183 ; X32-NEXT: punpcklwd {{.*#+}} xmm6 = xmm6[0],xmm5[0],xmm6[1],xmm5[1],xmm6[2],xmm5[2],xmm6[3],xmm5[3]
2184 ; X32-NEXT: punpcklwd {{.*#+}} xmm0 = xmm0[0],xmm7[0],xmm0[1],xmm7[1],xmm0[2],xmm7[2],xmm0[3],xmm7[3]
2185 ; X32-NEXT: punpcklwd {{.*#+}} xmm0 = xmm0[0],xmm6[0],xmm0[1],xmm6[1],xmm0[2],xmm6[2],xmm0[3],xmm6[3]
2186 ; X32-NEXT: punpcklwd {{.*#+}} xmm0 = xmm0[0],xmm4[0],xmm0[1],xmm4[1],xmm0[2],xmm4[2],xmm0[3],xmm4[3]
2187 ; X32-NEXT: retl
2191 ; X64-NEXT: movw {{[0-9]+}}(%rsp), %r10w
2192 ; X64-NEXT: movw {{[0-9]+}}(%rsp), %ax
2193 ; X64-NEXT: movd %edi, %xmm0
2194 ; X64-NEXT: movd %r8d, %xmm1
2195 ; X64-NEXT: punpcklwd {{.*#+}} xmm1 = xmm1[0],xmm0[0],xmm1[1],xmm0[1],xmm1[2],xmm0[2],xmm1[3],xmm0[3]
2196 ; X64-NEXT: movd %edx, %xmm0
2197 ; X64-NEXT: movd %eax, %xmm2
2198 ; X64-NEXT: punpcklwd {{.*#+}} xmm2 = xmm2[0],xmm0[0],xmm2[1],xmm0[1],xmm2[2],xmm0[2],xmm2[3],xmm0[3]
2199 ; X64-NEXT: punpcklwd {{.*#+}} xmm2 = xmm2[0],xmm1[0],xmm2[1],xmm1[1],xmm2[2],xmm1[2],xmm2[3],xmm1[3]
2200 ; X64-NEXT: movd %esi, %xmm0
2201 ; X64-NEXT: movd %r9d, %xmm1
2202 ; X64-NEXT: punpcklwd {{.*#+}} xmm1 = xmm1[0],xmm0[0],xmm1[1],xmm0[1],xmm1[2],xmm0[2],xmm1[3],xmm0[3]
2203 ; X64-NEXT: movd %ecx, %xmm3
2204 ; X64-NEXT: movd %r10d, %xmm0
2205 ; X64-NEXT: punpcklwd {{.*#+}} xmm0 = xmm0[0],xmm3[0],xmm0[1],xmm3[1],xmm0[2],xmm3[2],xmm0[3],xmm3[3]
2206 ; X64-NEXT: punpcklwd {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1],xmm0[2],xmm1[2],xmm0[3],xmm1[3]
2207 ; X64-NEXT: punpcklwd {{.*#+}} xmm0 = xmm0[0],xmm2[0],xmm0[1],xmm2[1],xmm0[2],xmm2[2],xmm0[3],xmm2[3]
2208 ; X64-NEXT: retq
2224 ; X32-NEXT: movd {{.*#+}} xmm0 = mem[0],zero,zero,zero
2225 ; X32-NEXT: movd {{.*#+}} xmm1 = mem[0],zero,zero,zero
2226 ; X32-NEXT: punpckldq {{.*#+}} xmm1 = xmm1[0],xmm0[0],xmm1[1],xmm0[1]
2227 ; X32-NEXT: movd {{.*#+}} xmm2 = mem[0],zero,zero,zero
2228 ; X32-NEXT: movd {{.*#+}} xmm0 = mem[0],zero,zero,zero
2229 ; X32-NEXT: punpckldq {{.*#+}} xmm0 = xmm0[0],xmm2[0],xmm0[1],xmm2[1]
2230 ; X32-NEXT: punpckldq {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1]
2231 ; X32-NEXT: retl
2235 ; X64-NEXT: movd %edi, %xmm0
2236 ; X64-NEXT: movd %edx, %xmm1
2237 ; X64-NEXT: punpckldq {{.*#+}} xmm1 = xmm1[0],xmm0[0],xmm1[1],xmm0[1]
2238 ; X64-NEXT: movd %esi, %xmm2
2239 ; X64-NEXT: movd %ecx, %xmm0
2240 ; X64-NEXT: punpckldq {{.*#+}} xmm0 = xmm0[0],xmm2[0],xmm0[1],xmm2[1]
2241 ; X64-NEXT: punpckldq {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1]
2242 ; X64-NEXT: retq
2256 ; X32-NEXT: movd {{.*#+}} xmm1 = mem[0],zero,zero,zero
2257 ; X32-NEXT: movd {{.*#+}} xmm0 = mem[0],zero,zero,zero
2258 ; X32-NEXT: punpckldq {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1]
2259 ; X32-NEXT: movd {{.*#+}} xmm1 = mem[0],zero,zero,zero
2260 ; X32-NEXT: movd {{.*#+}} xmm2 = mem[0],zero,zero,zero
2261 ; X32-NEXT: punpckldq {{.*#+}} xmm2 = xmm2[0],xmm1[0],xmm2[1],xmm1[1]
2262 ; X32-NEXT: punpckldq {{.*#+}} xmm0 = xmm0[0],xmm2[0],xmm0[1],xmm2[1]
2263 ; X32-NEXT: retl
2267 ; X64-NEXT: movd %rdi, %xmm1
2268 ; X64-NEXT: movd %rsi, %xmm0
2269 ; X64-NEXT: punpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm1[0]
2270 ; X64-NEXT: retq
2279 ; X32-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero
2280 ; X32-NEXT: movsd {{.*#+}} xmm1 = mem[0],zero
2281 ; X32-NEXT: unpcklpd {{.*#+}} xmm0 = xmm0[0],xmm1[0]
2282 ; X32-NEXT: retl
2286 ; X64-NEXT: unpcklpd {{.*#+}} xmm1 = xmm1[0],xmm0[0]
2287 ; X64-NEXT: movapd %xmm1, %xmm0
2288 ; X64-NEXT: retq
2297 ; X32-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero
2298 ; X32-NEXT: movq {{.*#+}} xmm0 = xmm0[0],zero
2299 ; X32-NEXT: retl
2303 ; X64-NEXT: movq {{.*#+}} xmm0 = xmm0[0],zero
2304 ; X64-NEXT: retq
2313 ; X32-NEXT: movzbl {{[0-9]+}}(%esp), %eax
2314 ; X32-NEXT: movd %eax, %xmm0
2315 ; X32-NEXT: punpcklbw {{.*#+}} xmm0 = xmm0[0,0,1,1,2,2,3,3,4,4,5,5,6,6,7,7]
2316 ; X32-NEXT: pshuflw {{.*#+}} xmm0 = xmm0[0,0,0,0,4,5,6,7]
2317 ; X32-NEXT: pshufd {{.*#+}} xmm0 = xmm0[0,0,1,1]
2318 ; X32-NEXT: retl
2322 ; X64-NEXT: movzbl %dil, %eax
2323 ; X64-NEXT: movd %eax, %xmm0
2324 ; X64-NEXT: punpcklbw {{.*#+}} xmm0 = xmm0[0,0,1,1,2,2,3,3,4,4,5,5,6,6,7,7]
2325 ; X64-NEXT: pshuflw {{.*#+}} xmm0 = xmm0[0,0,0,0,4,5,6,7]
2326 ; X64-NEXT: pshufd {{.*#+}} xmm0 = xmm0[0,0,1,1]
2327 ; X64-NEXT: retq
2351 ; X32-NEXT: movw {{[0-9]+}}(%esp), %ax
2352 ; X32-NEXT: movd %eax, %xmm0
2353 ; X32-NEXT: pshuflw {{.*#+}} xmm0 = xmm0[0,0,0,0,4,5,6,7]
2354 ; X32-NEXT: pshufd {{.*#+}} xmm0 = xmm0[0,0,1,1]
2355 ; X32-NEXT: retl
2359 ; X64-NEXT: movd %edi, %xmm0
2360 ; X64-NEXT: pshuflw {{.*#+}} xmm0 = xmm0[0,0,0,0,4,5,6,7]
2361 ; X64-NEXT: pshufd {{.*#+}} xmm0 = xmm0[0,0,1,1]
2362 ; X64-NEXT: retq
2378 ; X32-NEXT: movd {{.*#+}} xmm0 = mem[0],zero,zero,zero
2379 ; X32-NEXT: pshufd {{.*#+}} xmm0 = xmm0[0,0,0,0]
2380 ; X32-NEXT: retl
2384 ; X64-NEXT: movd %edi, %xmm0
2385 ; X64-NEXT: pshufd {{.*#+}} xmm0 = xmm0[0,0,0,0]
2386 ; X64-NEXT: retq
2400 ; X32-NEXT: movd {{.*#+}} xmm0 = mem[0],zero,zero,zero
2401 ; X32-NEXT: pshufd {{.*#+}} xmm0 = xmm0[0,0,1,1]
2402 ; X32-NEXT: movd {{.*#+}} xmm1 = mem[0],zero,zero,zero
2403 ; X32-NEXT
2404 ; X32-NEXT: punpckldq {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1]
2405 ; X32-NEXT: retl
2409 ; X64-NEXT: movd %rdi, %xmm0
2410 ; X64-NEXT: pshufd {{.*#+}} xmm0 = xmm0[0,1,0,1]
2411 ; X64-NEXT: retq
2420 ; X32-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero
2421 ; X32-NEXT: movlhps {{.*#+}} xmm0 = xmm0[0,0]
2422 ; X32-NEXT: retl
2426 ; X64-NEXT: movlhps {{.*#+}} xmm0 = xmm0[0,0]
2427 ; X64-NEXT: retq
2436 ; X32-NEXT: movzbl {{[0-9]+}}(%esp), %eax
2437 ; X32-NEXT: movd %eax, %xmm0
2438 ; X32-NEXT: movzbl {{[0-9]+}}(%esp), %eax
2439 ; X32-NEXT: movd %eax, %xmm1
2440 ; X32-NEXT: punpcklbw {{.*#+}} xmm1 = xmm1[0],xmm0[0],xmm1[1],xmm0[1],xmm1[2],xmm0[2],xmm1[3],xmm0[3],xmm1[4],xmm0[4],xmm1[5],xmm0[5],xmm1[6],xmm0[6],xmm1[7],xmm0[7]
2441 ; X32-NEXT: movzbl {{[0-9]+}}(%esp), %eax
2442 ; X32-NEXT: movd %eax, %xmm0
2443 ; X32-NEXT: movzbl {{[0-9]+}}(%esp), %eax
2444 ; X32-NEXT: movd %eax, %xmm2
2445 ; X32-NEXT: punpcklbw {{.*#+}} xmm2 = xmm2[0],xmm0[0],xmm2[1],xmm0[1],xmm2[2],xmm0[2],xmm2[3],xmm0[3],xmm2[4],xmm0[4],xmm2[5],xmm0[5],xmm2[6],xmm0[6],xmm2[7],xmm0[7]
2446 ; X32-NEXT: punpcklbw {{.*#+}} xmm2 = xmm2[0],xmm1[0],xmm2[1],xmm1[1],xmm2[2],xmm1[2],xmm2[3],xmm1[3],xmm2[4],xmm1[4],xmm2[5],xmm1[5],xmm2[6],xmm1[6],xmm2[7],xmm1[7]
2447 ; X32-NEXT: movzbl {{[0-9]+}}(%esp), %eax
2448 ; X32-NEXT: movd %eax, %xmm0
2449 ; X32-NEXT: movzbl {{[0-9]+}}(%esp), %eax
2450 ; X32-NEXT: movd %eax, %xmm3
2451 ; X32-NEXT: punpcklbw {{.*#+}} xmm3 = xmm3[0],xmm0[0],xmm3[1],xmm0[1],xmm3[2],xmm0[2],xmm3[3],xmm0[3],xmm3[4],xmm0[4],xmm3[5],xmm0[5],xmm3[6],xmm0[6],xmm3[7],xmm0[7]
2452 ; X32-NEXT: movzbl {{[0-9]+}}(%esp), %eax
2453 ; X32-NEXT: movd %eax, %xmm0
2454 ; X32-NEXT: movzbl {{[0-9]+}}(%esp), %eax
2455 ; X32-NEXT: movd %eax, %xmm1
2456 ; X32-NEXT: punpcklbw {{.*#+}} xmm1 = xmm1[0],xmm0[0],xmm1[1],xmm0[1],xmm1[2],xmm0[2],xmm1[3],xmm0[3],xmm1[4],xmm0[4],xmm1[5],xmm0[5],xmm1[6],xmm0[6],xmm1[7],xmm0[7]
2457 ; X32-NEXT: punpcklbw {{.*#+}} xmm1 = xmm1[0],xmm3[0],xmm1[1],xmm3[1],xmm1[2],xmm3[2],xmm1[3],xmm3[3],xmm1[4],xmm3[4],xmm1[5],xmm3[5],xmm1[6],xmm3[6],xmm1[7],xmm3[7]
2458 ; X32-NEXT: punpcklbw {{.*#+}} xmm1 = xmm1[0],xmm2[0],xmm1[1],xmm2[1],xmm1[2],xmm2[2],xmm1[3],xmm2[3],xmm1[4],xmm2[4],xmm1[5],xmm2[5],xmm1[6],xmm2[6],xmm1[7],xmm2[7]
2459 ; X32-NEXT: movzbl {{[0-9]+}}(%esp), %eax
2460 ; X32-NEXT: movd %eax, %xmm0
2461 ; X32-NEXT: movzbl {{[0-9]+}}(%esp), %eax
2462 ; X32-NEXT: movd %eax, %xmm2
2463 ; X32-NEXT: punpcklbw {{.*#+}} xmm2 = xmm2[0],xmm0[0],xmm2[1],xmm0[1],xmm2[2],xmm0[2],xmm2[3],xmm0[3],xmm2[4],xmm0[4],xmm2[5],xmm0[5],xmm2[6],xmm0[6],xmm2[7],xmm0[7]
2464 ; X32-NEXT: movzbl {{[0-9]+}}(%esp), %eax
2465 ; X32-NEXT: movd %eax, %xmm0
2466 ; X32-NEXT: movzbl {{[0-9]+}}(%esp), %eax
2467 ; X32-NEXT: movd %eax, %xmm3
2468 ; X32-NEXT: punpcklbw {{.*#+}} xmm3 = xmm3[0],xmm0[0],xmm3[1],xmm0[1],xmm3[2],xmm0[2],xmm3[3],xmm0[3],xmm3[4],xmm0[4],xmm3[5],xmm0[5],xmm3[6],xmm0[6],xmm3[7],xmm0[7]
2469 ; X32-NEXT: punpcklbw {{.*#+}} xmm3 = xmm3[0],xmm2[0],xmm3[1],xmm2[1],xmm3[2],xmm2[2],xmm3[3],xmm2[3],xmm3[4],xmm2[4],xmm3[5],xmm2[5],xmm3[6],xmm2[6],xmm3[7],xmm2[7]
2470 ; X32-NEXT: movzbl {{[0-9]+}}(%esp), %eax
2471 ; X32-NEXT: movd %eax, %xmm0
2472 ; X32-NEXT: movzbl {{[0-9]+}}(%esp), %eax
2473 ; X32-NEXT: movd %eax, %xmm2
2474 ; X32-NEXT: punpcklbw {{.*#+}} xmm2 = xmm2[0],xmm0[0],xmm2[1],xmm0[1],xmm2[2],xmm0[2],xmm2[3],xmm0[3],xmm2[4],xmm0[4],xmm2[5],xmm0[5],xmm2[6],xmm0[6],xmm2[7],xmm0[7]
2475 ; X32-NEXT: movzbl {{[0-9]+}}(%esp), %eax
2476 ; X32-NEXT: movd %eax, %xmm4
2477 ; X32-NEXT: movzbl {{[0-9]+}}(%esp), %eax
2478 ; X32-NEXT: movd %eax, %xmm0
2479 ; X32-NEXT: punpcklbw {{.*#+}} xmm0 = xmm0[0],xmm4[0],xmm0[1],xmm4[1],xmm0[2],xmm4[2],xmm0[3],xmm4[3],xmm0[4],xmm4[4],xmm0[5],xmm4[5],xmm0[6],xmm4[6],xmm0[7],xmm4[7]
2480 ; X32-NEXT: punpcklbw {{.*#+}} xmm0 = xmm0[0],xmm2[0],xmm0[1],xmm2[1],xmm0[2],xmm2[2],xmm0[3],xmm2[3],xmm0[4],xmm2[4],xmm0[5],xmm2[5],xmm0[6],xmm2[6],xmm0[7],xmm2[7]
2481 ; X32-NEXT: punpcklbw {{.*#+}} xmm0 = xmm0[0],xmm3[0],xmm0[1],xmm3[1],xmm0[2],xmm3[2],xmm0[3],xmm3[3],xmm0[4],xmm3[4],xmm0[5],xmm3[5],xmm0[6],xmm3[6],xmm0[7],xmm3[7]
2482 ; X32-NEXT: punpcklbw {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1],xmm0[2],xmm1[2],xmm0[3],xmm1[3],xmm0[4],xmm1[4],xmm0[5],xmm1[5],xmm0[6],xmm1[6],xmm0[7],xmm1[7]
2483 ; X32-NEXT: retl
2487 ; X64-NEXT: movzbl {{[0-9]+}}(%rsp), %eax
2488 ; X64-NEXT: movd %eax, %xmm0
2489 ; X64-NEXT: movzbl {{[0-9]+}}(%rsp), %eax
2490 ; X64-NEXT: movd %eax, %xmm1
2491 ; X64-NEXT: punpcklbw {{.*#+}} xmm1 = xmm1[0],xmm0[0],xmm1[1],xmm0[1],xmm1[2],xmm0[2],xmm1[3],xmm0[3],xmm1[4],xmm0[4],xmm1[5],xmm0[5],xmm1[6],xmm0[6],xmm1[7],xmm0[7]
2492 ; X64-NEXT: movzbl {{[0-9]+}}(%rsp), %eax
2493 ; X64-NEXT: movd %eax, %xmm0
2494 ; X64-NEXT: movzbl %cl, %eax
2495 ; X64-NEXT: movd %eax, %xmm2
2496 ; X64-NEXT: punpcklbw {{.*#+}} xmm2 = xmm2[0],xmm0[0],xmm2[1],xmm0[1],xmm2[2],xmm0[2],xmm2[3],xmm0[3],xmm2[4],xmm0[4],xmm2[5],xmm0[5],xmm2[6],xmm0[6],xmm2[7],xmm0[7]
2497 ; X64-NEXT: punpcklbw {{.*#+}} xmm2 = xmm2[0],xmm1[0],xmm2[1],xmm1[1],xmm2[2],xmm1[2],xmm2[3],xmm1[3],xmm2[4],xmm1[4],xmm2[5],xmm1[5],xmm2[6],xmm1[6],xmm2[7],xmm1[7]
2498 ; X64-NEXT: movzbl {{[0-9]+}}(%rsp), %eax
2499 ; X64-NEXT: movd %eax, %xmm0
2500 ; X64-NEXT: movzbl %r9b, %eax
2501 ; X64-NEXT: movd %eax, %xmm3
2502 ; X64-NEXT: punpcklbw {{.*#+}} xmm3 = xmm3[0],xmm0[0],xmm3[1],xmm0[1],xmm3[2],xmm0[2],xmm3[3],xmm0[3],xmm3[4],xmm0[4],xmm3[5],xmm0[5],xmm3[6],xmm0[6],xmm3[7],xmm0[7]
2503 ; X64-NEXT: movzbl {{[0-9]+}}(%rsp), %eax
2504 ; X64-NEXT: movd %eax, %xmm0
2505 ; X64-NEXT: movzbl %sil, %eax
2506 ; X64-NEXT: movd %eax, %xmm1
2507 ; X64-NEXT: punpcklbw {{.*#+}} xmm1 = xmm1[0],xmm0[0],xmm1[1],xmm0[1],xmm1[2],xmm0[2],xmm1[3],xmm0[3],xmm1[4],xmm0[4],xmm1[5],xmm0[5],xmm1[6],xmm0[6],xmm1[7],xmm0[7]
2508 ; X64-NEXT: punpcklbw {{.*#+}} xmm1 = xmm1[0],xmm3[0],xmm1[1],xmm3[1],xmm1[2],xmm3[2],xmm1[3],xmm3[3],xmm1[4],xmm3[4],xmm1[5],xmm3[5],xmm1[6],xmm3[6],xmm1[7],xmm3[7]
2509 ; X64-NEXT: punpcklbw {{.*#+}} xmm1 = xmm1[0],xmm2[0],xmm1[1],xmm2[1],xmm1[2],xmm2[2],xmm1[3],xmm2[3],xmm1[4],xmm2[4],xmm1[5],xmm2[5],xmm1[6],xmm2[6],xmm1[7],xmm2[7]
2510 ; X64-NEXT: movzbl {{[0-9]+}}(%rsp), %eax
2511 ; X64-NEXT: movd %eax, %xmm0
2512 ; X64-NEXT: movzbl {{[0-9]+}}(%rsp), %eax
2513 ; X64-NEXT: movd %eax, %xmm2
2514 ; X64-NEXT: punpcklbw {{.*#+}} xmm2 = xmm2[0],xmm0[0],xmm2[1],xmm0[1],xmm2[2],xmm0[2],xmm2[3],xmm0[3],xmm2[4],xmm0[4],xmm2[5],xmm0[5],xmm2[6],xmm0[6],xmm2[7],xmm0[7]
2515 ; X64-NEXT: movzbl {{[0-9]+}}(%rsp), %eax
2516 ; X64-NEXT: movd %eax, %xmm0
2517 ; X64-NEXT: movzbl %dl, %eax
2518 ; X64-NEXT: movd %eax, %xmm3
2519 ; X64-NEXT: punpcklbw {{.*#+}} xmm3 = xmm3[0],xmm0[0],xmm3[1],xmm0[1],xmm3[2],xmm0[2],xmm3[3],xmm0[3],xmm3[4],xmm0[4],xmm3[5],xmm0[5],xmm3[6],xmm0[6],xmm3[7],xmm0[7]
2520 ; X64-NEXT: punpcklbw {{.*#+}} xmm3 = xmm3[0],xmm2[0],xmm3[1],xmm2[1],xmm3[2],xmm2[2],xmm3[3],xmm2[3],xmm3[4],xmm2[4],xmm3[5],xmm2[5],xmm3[6],xmm2[6],xmm3[7],xmm2[7]
2521 ; X64-NEXT: movzbl {{[0-9]+}}(%rsp), %eax
2522 ; X64-NEXT: movd %eax, %xmm0
2523 ; X64-NEXT: movzbl %r8b, %eax
2524 ; X64-NEXT: movd %eax, %xmm2
2525 ; X64-NEXT: punpcklbw {{.*#+}} xmm2 = xmm2[0],xmm0[0],xmm2[1],xmm0[1],xmm2[2],xmm0[2],xmm2[3],xmm0[3],xmm2[4],xmm0[4],xmm2[5],xmm0[5],xmm2[6],xmm0[6],xmm2[7],xmm0[7]
2526 ; X64-NEXT: movzbl {{[0-9]+}}(%rsp), %eax
2527 ; X64-NEXT: movd %eax, %xmm4
2528 ; X64-NEXT: movzbl %dil, %eax
2529 ; X64-NEXT: movd %eax, %xmm0
2530 ; X64-NEXT: punpcklbw {{.*#+}} xmm0 = xmm0[0],xmm4[0],xmm0[1],xmm4[1],xmm0[2],xmm4[2],xmm0[3],xmm4[3],xmm0[4],xmm4[4],xmm0[5],xmm4[5],xmm0[6],xmm4[6],xmm0[7],xmm4[7]
2531 ; X64-NEXT: punpcklbw {{.*#+}} xmm0 = xmm0[0],xmm2[0],xmm0[1],xmm2[1],xmm0[2],xmm2[2],xmm0[3],xmm2[3],xmm0[4],xmm2[4],xmm0[5],xmm2[5],xmm0[6],xmm2[6],xmm0[7],xmm2[7]
2532 ; X64-NEXT: punpcklbw {{.*#+}} xmm0 = xmm0[0],xmm3[0],xmm0[1],xmm3[1],xmm0[2],xmm3[2],xmm0[3],xmm3[3],xmm0[4],xmm3[4],xmm0[5],xmm3[5],xmm0[6],xmm3[6],xmm0[7],xmm3[7]
2533 ; X64-NEXT: punpcklbw {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1],xmm0[2],xmm1[2],xmm0[3],xmm1[3],xmm0[4],xmm1[4],xmm0[5],xmm1[5],xmm0[6],xmm1[6],xmm0[7],xmm1[7]
2534 ; X64-NEXT: retq
2558 ; X32-NEXT: movw {{[0-9]+}}(%esp), %ax
2559 ; X32-NEXT: movd %eax, %xmm1
2560 ; X32-NEXT: movw {{[0-9]+}}(%esp), %ax
2561 ; X32-NEXT: movd %eax, %xmm2
2562 ; X32-NEXT: movw {{[0-9]+}}(%esp), %ax
2563 ; X32-NEXT: movd %eax, %xmm3
2564 ; X32-NEXT: movw {{[0-9]+}}(%esp), %ax
2565 ; X32-NEXT: movd %eax, %xmm4
2566 ; X32-NEXT: movw {{[0-9]+}}(%esp), %ax
2567 ; X32-NEXT: movd %eax, %xmm5
2568 ; X32-NEXT: movw {{[0-9]+}}(%esp), %ax
2569 ; X32-NEXT: movd %eax, %xmm6
2570 ; X32-NEXT: movw {{[0-9]+}}(%esp), %ax
2571 ; X32-NEXT: movd %eax, %xmm7
2572 ; X32-NEXT: movw {{[0-9]+}}(%esp), %ax
2573 ; X32-NEXT: movd %eax, %xmm0
2574 ; X32-NEXT: punpcklwd {{.*#+}} xmm2 = xmm2[0],xmm1[0],xmm2[1],xmm1[1],xmm2[2],xmm1[2],xmm2[3],xmm1[3]
2575 ; X32-NEXT: punpcklwd {{.*#+}} xmm4 = xmm4[0],xmm3[0],xmm4[1],xmm3[1],xmm4[2],xmm3[2],xmm4[3],xmm3[3]
2576 ; X32-NEXT: punpcklwd {{.*#+}} xmm4 = xmm4[0],xmm2[0],xmm4[1],xmm2[1],xmm4[2],xmm2[2],xmm4[3],xmm2[3]
2577 ; X32-NEXT: punpcklwd {{.*#+}} xmm6 = xmm6[0],xmm5[0],xmm6[1],xmm5[1],xmm6[2],xmm5[2],xmm6[3],xmm5[3]
2578 ; X32-NEXT: punpcklwd {{.*#+}} xmm0 = xmm0[0],xmm7[0],xmm0[1],xmm7[1],xmm0[2],xmm7[2],xmm0[3],xmm7[3]
2579 ; X32-NEXT: punpcklwd {{.*#+}} xmm0 = xmm0[0],xmm6[0],xmm0[1],xmm6[1],xmm0[2],xmm6[2],xmm0[3],xmm6[3]
2580 ; X32-NEXT: punpcklwd {{.*#+}} xmm0 = xmm0[0],xmm4[0],xmm0[1],xmm4[1],xmm0[2],xmm4[2],xmm0[3],xmm4[3]
2581 ; X32-NEXT: retl
2585 ; X64-NEXT: movw {{[0-9]+}}(%rsp), %ax
2586 ; X64-NEXT: movw {{[0-9]+}}(%rsp), %r10w
2587 ; X64-NEXT: movd %eax, %xmm0
2588 ; X64-NEXT: movd %ecx, %xmm1
2589 ; X64-NEXT: punpcklwd {{.*#+}} xmm1 = xmm1[0],xmm0[0],xmm1[1],xmm0[1],xmm1[2],xmm0[2],xmm1[3],xmm0[3]
2590 ; X64-NEXT: movd %r9d, %xmm0
2591 ; X64-NEXT: movd %esi, %xmm2
2592 ; X64-NEXT: punpcklwd {{.*#+}} xmm2 = xmm2[0],xmm0[0],xmm2[1],xmm0[1],xmm2[2],xmm0[2],xmm2[3],xmm0[3]
2593 ; X64-NEXT: punpcklwd {{.*#+}} xmm2 = xmm2[0],xmm1[0],xmm2[1],xmm1[1],xmm2[2],xmm1[2],xmm2[3],xmm1[3]
2594 ; X64-NEXT: movd %r10d, %xmm0
2595 ; X64-NEXT: movd %edx, %xmm1
2596 ; X64-NEXT: punpcklwd {{.*#+}} xmm1 = xmm1[0],xmm0[0],xmm1[1],xmm0[1],xmm1[2],xmm0[2],xmm1[3],xmm0[3]
2597 ; X64-NEXT: movd %r8d, %xmm3
2598 ; X64-NEXT: movd %edi, %xmm0
2599 ; X64-NEXT: punpcklwd {{.*#+}} xmm0 = xmm0[0],xmm3[0],xmm0[1],xmm3[1],xmm0[2],xmm3[2],xmm0[3],xmm3[3]
2600 ; X64-NEXT: punpcklwd {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1],xmm0[2],xmm1[2],xmm0[3],xmm1[3]
2601 ; X64-NEXT: punpcklwd {{.*#+}} xmm0 = xmm0[0],xmm2[0],xmm0[1],xmm2[1],xmm0[2],xmm2[2],xmm0[3],xmm2[3]
2602 ; X64-NEXT: retq
2618 ; X32-NEXT: movd {{.*#+}} xmm0 = mem[0],zero,zero,zero
2619 ; X32-NEXT: movd {{.*#+}} xmm1 = mem[0],zero,zero,zero
2620 ; X32-NEXT: punpckldq {{.*#+}} xmm1 = xmm1[0],xmm0[0],xmm1[1],xmm0[1]
2621 ; X32-NEXT: movd {{.*#+}} xmm2 = mem[0],zero,zero,zero
2622 ; X32-NEXT: movd {{.*#+}} xmm0 = mem[0],zero,zero,zero
2623 ; X32-NEXT: punpckldq {{.*#+}} xmm0 = xmm0[0],xmm2[0],xmm0[1],xmm2[1]
2624 ; X32-NEXT: punpckldq {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1]
2625 ; X32-NEXT: retl
2629 ; X64-NEXT: movd %ecx, %xmm0
2630 ; X64-NEXT: movd %esi, %xmm1
2631 ; X64-NEXT: punpckldq {{.*#+}} xmm1 = xmm1[0],xmm0[0],xmm1[1],xmm0[1]
2632 ; X64-NEXT: movd %edx, %xmm2
2633 ; X64-NEXT: movd %edi, %xmm0
2634 ; X64-NEXT: punpckldq {{.*#+}} xmm0 = xmm0[0],xmm2[0],xmm0[1],xmm2[1]
2635 ; X64-NEXT: punpckldq {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1]
2636 ; X64-NEXT: retq
2650 ; X32-NEXT: movd {{.*#+}} xmm1 = mem[0],zero,zero,zero
2651 ; X32-NEXT: movd {{.*#+}} xmm0 = mem[0],zero,zero,zero
2652 ; X32-NEXT: punpckldq {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1]
2653 ; X32-NEXT: movd {{.*#+}} xmm1 = mem[0],zero,zero,zero
2654 ; X32-NEXT: movd {{.*#+}} xmm2 = mem[0],zero,zero,zero
2655 ; X32-NEXT: punpckldq {{.*#+}} xmm2 = xmm2[0],xmm1[0],xmm2[1],xmm1[1]
2656 ; X32-NEXT: punpckldq {{.*#+}} xmm0 = xmm0[0],xmm2[0],xmm0[1],xmm2[1]
2657 ; X32-NEXT: retl
2661 ; X64-NEXT: movd %rsi, %xmm1
2662 ; X64-NEXT: movd %rdi, %xmm0
2663 ; X64-NEXT: punpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm1[0]
2664 ; X64-NEXT: retq
2673 ; X32-NEXT: movsd {{.*#+}} xmm1 = mem[0],zero
2674 ; X32-NEXT: movsd {{.*#+}} xmm0 = mem[0],zero
2675 ; X32-NEXT: unpcklpd {{.*#+}} xmm0 = xmm0[0],xmm1[0]
2676 ; X32-NEXT: retl
2680 ; X64-NEXT: unpcklpd {{.*#+}} xmm0 = xmm0[0],xmm1[0]
2681 ; X64-NEXT: retq
2690 ; X32-NEXT: xorps %xmm0, %xmm0
2691 ; X32-NEXT: retl
2695 ; X64-NEXT: xorps %xmm0, %xmm0
2696 ; X64-NEXT: retq
2703 ; X32-NEXT: xorps %xmm0, %xmm0
2704 ; X32-NEXT: retl
2708 ; X64-NEXT: xorps %xmm0, %xmm0
2709 ; X64-NEXT: retq
2716 ; X32-NEXT: pshufd {{.*#+}} xmm0 = xmm0[0,0,0,0]
2717 ; X32-NEXT: retl
2721 ; X64-NEXT: pshufd {{.*#+}} xmm0 = xmm0[0,0,0,0]
2722 ; X64-NEXT: retq
2732 ; X32-NEXT: shufpd {{.*#+}} xmm0 = xmm0[1],xmm1[0]
2733 ; X32-NEXT: retl
2737 ; X64-NEXT: shufpd {{.*#+}} xmm0 = xmm0[1],xmm1[0]
2738 ; X64-NEXT: retq
2746 ; X32-NEXT: pshufhw {{.*#+}} xmm0 = xmm0[0,1,2,3,4,4,4,4]
2747 ; X32-NEXT: retl
2751 ; X64-NEXT: pshufhw {{.*#+}} xmm0 = xmm0[0,1,2,3,4,4,4,4]
2752 ; X64-NEXT: retq
2762 ; X32-NEXT: pshuflw {{.*#+}} xmm0 = xmm0[0,0,0,0,4,5,6,7]
2763 ; X32-NEXT: retl
2767 ; X64-NEXT: pshuflw {{.*#+}} xmm0 = xmm0[0,0,0,0,4,5,6,7]
2768 ; X64-NEXT: retq
2778 ; X32-NEXT: psllw %xmm1, %xmm0
2779 ; X32-NEXT: retl
2783 ; X64-NEXT: psllw %xmm1, %xmm0
2784 ; X64-NEXT: retq
2796 ; X32-NEXT: pslld %xmm1, %xmm0
2797 ; X32-NEXT: retl
2801 ; X64-NEXT: pslld %xmm1, %xmm0
2802 ; X64-NEXT: retq
2814 ; X32-NEXT: psllq %xmm1, %xmm0
2815 ; X32-NEXT: retl
2819 ; X64-NEXT: psllq %xmm1, %xmm0
2820 ; X64-NEXT: retq
2829 ; X32-NEXT: psllw $1, %xmm0
2830 ; X32-NEXT: retl
2834 ; X64-NEXT: psllw $1, %xmm0
2835 ; X64-NEXT: retq
2846 ; X32-NEXT: pslld $1, %xmm0
2847 ; X32-NEXT: retl
2851 ; X64-NEXT: pslld $1, %xmm0
2852 ; X64-NEXT: retq
2863 ; X32-NEXT: psllq $1, %xmm0
2864 ; X32-NEXT: retl
2868 ; X64-NEXT: psllq $1, %xmm0
2869 ; X64-NEXT: retq
2878 ; X32-NEXT: pslldq {{.*#+}} xmm0 = zero,zero,zero,zero,zero,xmm0[0,1,2,3,4,5,6,7,8,9,10]
2879 ; X32-NEXT: retl
2883 ; X64-NEXT: pslldq {{.*#+}} xmm0 = zero,zero,zero,zero,zero,xmm0[0,1,2,3,4,5,6,7,8,9,10]
2884 ; X64-NEXT: retq
2894 ; X32-NEXT: sqrtpd %xmm0, %xmm0
2895 ; X32-NEXT: retl
2899 ; X64-NEXT: sqrtpd %xmm0, %xmm0
2900 ; X64-NEXT: retq
2909 ; X32-NEXT: sqrtsd %xmm0, %xmm1
2910 ; X32-NEXT: movaps %xmm1, %xmm0
2911 ; X32-NEXT: retl
2915 ; X64-NEXT: sqrtsd %xmm0, %xmm1
2916 ; X64-NEXT: movaps %xmm1, %xmm0
2917 ; X64-NEXT: retq
2930 ; X32-NEXT: psraw %xmm1, %xmm0
2931 ; X32-NEXT: retl
2935 ; X64-NEXT: psraw %xmm1, %xmm0
2936 ; X64-NEXT: retq
2948 ; X32-NEXT: psrad %xmm1, %xmm0
2949 ; X32-NEXT: retl
2953 ; X64-NEXT: psrad %xmm1, %xmm0
2954 ; X64-NEXT: retq
2966 ; X32-NEXT: psraw $1, %xmm0
2967 ; X32-NEXT: retl
2971 ; X64-NEXT: psraw $1, %xmm0
2972 ; X64-NEXT: retq
2983 ; X32-NEXT: psrad $1, %xmm0
2984 ; X32-NEXT: retl
2988 ; X64-NEXT: psrad $1, %xmm0
2989 ; X64-NEXT: retq
3000 ; X32-NEXT: psrlw %xmm1, %xmm0
3001 ; X32-NEXT: retl
3005 ; X64-NEXT: psrlw %xmm1, %xmm0
3006 ; X64-NEXT: retq
3018 ; X32-NEXT: psrld %xmm1, %xmm0
3019 ; X32-NEXT: retl
3023 ; X64-NEXT: psrld %xmm1, %xmm0
3024 ; X64-NEXT: retq
3036 ; X32-NEXT: psrlq %xmm1, %xmm0
3037 ; X32-NEXT: retl
3041 ; X64-NEXT: psrlq %xmm1, %xmm0
3042 ; X64-NEXT: retq
3051 ; X32-NEXT: psrlw $1, %xmm0
3052 ; X32-NEXT: retl
3056 ; X64-NEXT: psrlw $1, %xmm0
3057 ; X64-NEXT: retq
3068 ; X32-NEXT: psrld $1, %xmm0
3069 ; X32-NEXT: retl
3073 ; X64-NEXT: psrld $1, %xmm0
3074 ; X64-NEXT: retq
3085 ; X32-NEXT: psrlq $1, %xmm0
3086 ; X32-NEXT: retl
3090 ; X64-NEXT: psrlq $1, %xmm0
3091 ; X64-NEXT: retq
3100 ; X32-NEXT: psrldq {{.*#+}} xmm0 = xmm0[5,6,7,8,9,10,11,12,13,14,15],zero,zero,zero,zero,zero
3101 ; X32-NEXT: retl
3105 ; X64-NEXT: psrldq {{.*#+}} xmm0 = xmm0[5,6,7,8,9,10,11,12,13,14,15],zero,zero,zero,zero,zero
3106 ; X64-NEXT: retq
3116 ; X32-NEXT: movl {{[0-9]+}}(%esp), %eax
3117 ; X32-NEXT: movaps %xmm0, (%eax)
3118 ; X32-NEXT: retl
3122 ; X64-NEXT: movaps %xmm0, (%rdi)
3123 ; X64-NEXT: retq
3132 ; X32-NEXT: movl {{[0-9]+}}(%esp), %eax
3133 ; X32-NEXT: movlhps {{.*#+}} xmm0 = xmm0[0,0]
3134 ; X32-NEXT: movaps %xmm0, (%eax)
3135 ; X32-NEXT: retl
3139 ; X64-NEXT: movlhps {{.*#+}} xmm0 = xmm0[0,0]
3140 ; X64-NEXT: movaps %xmm0, (%rdi)
3141 ; X64-NEXT: retq
3151 ; X32-NEXT: movl {{[0-9]+}}(%esp), %eax
3152 ; X32-NEXT: movsd %xmm0, (%eax)
3153 ; X32-NEXT: retl
3157 ; X64-NEXT: movsd %xmm0, (%rdi)
3158 ; X64-NEXT: retq
3167 ; X32-NEXT: movl {{[0-9]+}}(%esp), %eax
3168 ; X32-NEXT: movaps %xmm0, (%eax)
3169 ; X32-NEXT: retl
3173 ; X64-NEXT: movaps %xmm0, (%rdi)
3174 ; X64-NEXT: retq
3182 ; X32-NEXT: movl {{[0-9]+}}(%esp), %eax
3183 ; X32-NEXT: movlhps {{.*#+}} xmm0 = xmm0[0,0]
3184 ; X32-NEXT: movaps %xmm0, (%eax)
3185 ; X32-NEXT: retl
3189 ; X64-NEXT: movlhps {{.*#+}} xmm0 = xmm0[0,0]
3190 ; X64-NEXT: movaps %xmm0, (%rdi)
3191 ; X64-NEXT: retq
3201 ; X32-NEXT: movl {{[0-9]+}}(%esp), %eax
3202 ; X32-NEXT: shufpd {{.*#+}} xmm0 = xmm0[1,0]
3203 ; X32-NEXT: movsd %xmm0, (%eax)
3204 ; X32-NEXT: retl
3208 ; X64-NEXT: shufpd {{.*#+}} xmm0 = xmm0[1,0]
3209 ; X64-NEXT: movsd %xmm0, (%rdi)
3210 ; X64-NEXT: retq
3219 ; X32-NEXT: movl {{[0-9]+}}(%esp), %eax
3220 ; X32-NEXT: movlps %xmm0, (%eax)
3221 ; X32-NEXT: retl
3225 ; X64-NEXT: movd %xmm0, %rax
3226 ; X64-NEXT: movq %rax, (%rdi)
3227 ; X64-NEXT: retq
3237 ; X32-NEXT: movl {{[0-9]+}}(%esp), %eax
3238 ; X32-NEXT: movsd %xmm0, (%eax)
3239 ; X32-NEXT: retl
3243 ; X64-NEXT: movsd %xmm0, (%rdi)
3244 ; X64-NEXT: retq
3253 ; X32-NEXT: movl {{[0-9]+}}(%esp), %eax
3254 ; X32-NEXT: shufpd {{.*#+}} xmm0 = xmm0[1,0]
3255 ; X32-NEXT: movapd %xmm0, (%eax)
3256 ; X32-NEXT: retl
3260 ; X64-NEXT: shufpd {{.*#+}} xmm0 = xmm0[1,0]
3261 ; X64-NEXT: movapd %xmm0, (%rdi)
3262 ; X64-NEXT: retq
3272 ; X32-NEXT: movl {{[0-9]+}}(%esp), %eax
3273 ; X32-NEXT: movups %xmm0, (%eax)
3274 ; X32-NEXT: retl
3278 ; X64-NEXT: movups %xmm0, (%rdi)
3279 ; X64-NEXT: retq
3288 ; X32-NEXT: movl {{[0-9]+}}(%esp), %eax
3289 ; X32-NEXT: movups %xmm0, (%eax)
3290 ; X32-NEXT: retl
3294 ; X64-NEXT: movups %xmm0, (%rdi)
3295 ; X64-NEXT: retq
3303 ; X32-NEXT: movl {{[0-9]+}}(%esp), %eax
3304 ; X32-NEXT: movntps %xmm0, (%eax)
3305 ; X32-NEXT: retl
3309 ; X64-NEXT: movntps %xmm0, (%rdi)
3310 ; X64-NEXT: retq
3319 ; X32-NEXT: movl {{[0-9]+}}(%esp), %eax
3320 ; X32-NEXT: movl {{[0-9]+}}(%esp), %ecx
3321 ; X32-NEXT: movntil %eax, (%ecx)
3322 ; X32-NEXT: retl
3326 ; X64-NEXT: movntil %esi, (%rdi)
3327 ; X64-NEXT: retq
3335 ; X32-NEXT: movl {{[0-9]+}}(%esp), %eax
3336 ; X32-NEXT: movntps %xmm0, (%eax)
3337 ; X32-NEXT: retl
3341 ; X64-NEXT: movntps %xmm0, (%rdi)
3342 ; X64-NEXT: retq
3350 ; X32-NEXT: psubb %xmm1, %xmm0
3351 ; X32-NEXT: retl
3355 ; X64-NEXT: psubb %xmm1, %xmm0
3356 ; X64-NEXT: retq
3367 ; X32-NEXT: psubw %xmm1, %xmm0
3368 ; X32-NEXT: retl
3372 ; X64-NEXT: psubw %xmm1, %xmm0
3373 ; X64-NEXT: retq
3384 ; X32-NEXT: psubd %xmm1, %xmm0
3385 ; X32-NEXT: retl
3389 ; X64-NEXT: psubd %xmm1, %xmm0
3390 ; X64-NEXT: retq
3401 ; X32-NEXT: psubq %xmm1, %xmm0
3402 ; X32-NEXT: retl
3406 ; X64-NEXT: psubq %xmm1, %xmm0
3407 ; X64-NEXT: retq
3415 ; X32-NEXT: subpd %xmm1, %xmm0
3416 ; X32-NEXT: retl
3420 ; X64-NEXT: subpd %xmm1, %xmm0
3421 ; X64-NEXT: retq
3429 ; X32-NEXT: subsd %xmm1, %xmm0
3430 ; X32-NEXT: retl
3434 ; X64-NEXT: subsd %xmm1, %xmm0
3435 ; X64-NEXT: retq
3446 ; X32-NEXT: psubsb %xmm1, %xmm0
3447 ; X32-NEXT: retl
3451 ; X64-NEXT: psubsb %xmm1, %xmm0
3452 ; X64-NEXT: retq
3464 ; X32-NEXT: psubsw %xmm1, %xmm0
3465 ; X32-NEXT: retl
3469 ; X64-NEXT: psubsw %xmm1, %xmm0
3470 ; X64-NEXT: retq
3482 ; X32-NEXT: psubusb %xmm1, %xmm0
3483 ; X32-NEXT: retl
3487 ; X64-NEXT: psubusb %xmm1, %xmm0
3488 ; X64-NEXT: retq
3500 ; X32-NEXT: psubusw %xmm1, %xmm0
3501 ; X32-NEXT: retl
3505 ; X64-NEXT: psubusw %xmm1, %xmm0
3506 ; X64-NEXT: retq
3518 ; X32-NEXT: ucomisd %xmm1, %xmm0
3519 ; X32-NEXT: setnp %al
3520 ; X32-NEXT: sete %cl
3521 ; X32-NEXT: andb %al, %cl
3522 ; X32-NEXT: movzbl %cl, %eax
3523 ; X32-NEXT: retl
3527 ; X64-NEXT: ucomisd %xmm1, %xmm0
3528 ; X64-NEXT: setnp %al
3529 ; X64-NEXT: sete %cl
3530 ; X64-NEXT: andb %al, %cl
3531 ; X64-NEXT: movzbl %cl, %eax
3532 ; X64-NEXT: retq
3541 ; X32-NEXT: xorl %eax, %eax
3542 ; X32-NEXT: ucomisd %xmm1, %xmm0
3543 ; X32-NEXT: setae %al
3544 ; X32-NEXT: retl
3548 ; X64-NEXT: xorl %eax, %eax
3549 ; X64-NEXT: ucomisd %xmm1, %xmm0
3550 ; X64-NEXT: setae %al
3551 ; X64-NEXT: retq
3560 ; X32-NEXT: xorl %eax, %eax
3561 ; X32-NEXT: ucomisd %xmm1, %xmm0
3562 ; X32-NEXT: seta %al
3563 ; X32-NEXT: retl
3567 ; X64-NEXT: xorl %eax, %eax
3568 ; X64-NEXT: ucomisd %xmm1, %xmm0
3569 ; X64-NEXT: seta %al
3570 ; X64-NEXT: retq
3579 ; X32-NEXT: xorl %eax, %eax
3580 ; X32-NEXT: ucomisd %xmm0, %xmm1
3581 ; X32-NEXT: setae %al
3582 ; X32-NEXT: retl
3586 ; X64-NEXT: xorl %eax, %eax
3587 ; X64-NEXT: ucomisd %xmm0, %xmm1
3588 ; X64-NEXT: setae %al
3589 ; X64-NEXT: retq
3598 ; X32-NEXT: xorl %eax, %eax
3599 ; X32-NEXT: ucomisd %xmm0, %xmm1
3600 ; X32-NEXT: seta %al
3601 ; X32-NEXT: retl
3605 ; X64-NEXT: xorl %eax, %eax
3606 ; X64-NEXT: ucomisd %xmm0, %xmm1
3607 ; X64-NEXT: seta %al
3608 ; X64-NEXT: retq
3617 ; X32-NEXT: ucomisd %xmm1, %xmm0
3618 ; X32-NEXT: setp %al
3619 ; X32-NEXT: setne %cl
3620 ; X32-NEXT: orb %al, %cl
3621 ; X32-NEXT: movzbl %cl, %eax
3622 ; X32-NEXT: retl
3626 ; X64-NEXT: ucomisd %xmm1, %xmm0
3627 ; X64-NEXT: setp %al
3628 ; X64-NEXT: setne %cl
3629 ; X64-NEXT: orb %al, %cl
3630 ; X64-NEXT: movzbl %cl, %eax
3631 ; X64-NEXT: retq
3640 ; X32-NEXT: retl
3644 ; X64-NEXT: retq
3651 ; X32-NEXT: retl
3655 ; X64-NEXT: retq
3662 ; X32-NEXT: punpckhbw {{.*#+}} xmm0 = xmm0[8],xmm1[8],xmm0[9],xmm1[9],xmm0[10],xmm1[10],xmm0[11],xmm1[11],xmm0[12],xmm1[12],xmm0[13],xmm1[13],xmm0[14],xmm1[14],xmm0[15],xmm1[15]
3663 ; X32-NEXT: retl
3667 ; X64-NEXT: punpckhbw {{.*#+}} xmm0 = xmm0[8],xmm1[8],xmm0[9],xmm1[9],xmm0[10],xmm1[10],xmm0[11],xmm1[11],xmm0[12],xmm1[12],xmm0[13],xmm1[13],xmm0[14],xmm1[14],xmm0[15],xmm1[15]
3668 ; X64-NEXT: retq
3679 ; X32-NEXT: punpckhwd {{.*#+}} xmm0 = xmm0[4],xmm1[4],xmm0[5],xmm1[5],xmm0[6],xmm1[6],xmm0[7],xmm1[7]
3680 ; X32-NEXT: retl
3684 ; X64-NEXT: punpckhwd {{.*#+}} xmm0 = xmm0[4],xmm1[4],xmm0[5],xmm1[5],xmm0[6],xmm1[6],xmm0[7],xmm1[7]
3685 ; X64-NEXT: retq
3696 ; X32-NEXT: punpckhdq {{.*#+}} xmm0 = xmm0[2],xmm1[2],xmm0[3],xmm1[3]
3697 ; X32-NEXT: retl
3701 ; X64-NEXT: punpckhdq {{.*#+}} xmm0 = xmm0[2],xmm1[2],xmm0[3],xmm1[3]
3702 ; X64-NEXT: retq
3713 ; X32-NEXT: punpckhqdq {{.*#+}} xmm0 = xmm0[1],xmm1[1]
3714 ; X32-NEXT: retl
3718 ; X64-NEXT: punpckhqdq {{.*#+}} xmm0 = xmm0[1],xmm1[1]
3719 ; X64-NEXT: retq
3727 ; X32-NEXT: unpckhpd {{.*#+}} xmm0 = xmm0[1],xmm1[1]
3728 ; X32-NEXT: retl
3732 ; X64-NEXT: unpckhpd {{.*#+}} xmm0 = xmm0[1],xmm1[1]
3733 ; X64-NEXT: retq
3741 ; X32-NEXT: punpcklbw {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1],xmm0[2],xmm1[2],xmm0[3],xmm1[3],xmm0[4],xmm1[4],xmm0[5],xmm1[5],xmm0[6],xmm1[6],xmm0[7],xmm1[7]
3742 ; X32-NEXT: retl
3746 ; X64-NEXT: punpcklbw {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1],xmm0[2],xmm1[2],xmm0[3],xmm1[3],xmm0[4],xmm1[4],xmm0[5],xmm1[5],xmm0[6],xmm1[6],xmm0[7],xmm1[7]
3747 ; X64-NEXT: retq
3758 ; X32-NEXT: punpcklwd {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1],xmm0[2],xmm1[2],xmm0[3],xmm1[3]
3759 ; X32-NEXT: retl
3763 ; X64-NEXT: punpcklwd {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1],xmm0[2],xmm1[2],xmm0[3],xmm1[3]
3764 ; X64-NEXT: retq
3775 ; X32-NEXT: punpckldq {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1]
3776 ; X32-NEXT: retl
3780 ; X64-NEXT: punpckldq {{.*#+}} xmm0 = xmm0[0],xmm1[0],xmm0[1],xmm1[1]
3781 ; X64-NEXT: retq
3792 ; X32-NEXT: punpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm1[0]
3793 ; X32-NEXT: retl
3797 ; X64-NEXT: punpcklqdq {{.*#+}} xmm0 = xmm0[0],xmm1[0]
3798 ; X64-NEXT: retq
3806 ; X32-NEXT: unpcklpd {{.*#+}} xmm0 = xmm0[0],xmm1[0]
3807 ; X32-NEXT: retl
3811 ; X64-NEXT: unpcklpd {{.*#+}} xmm0 = xmm0[0],xmm1[0]
3812 ; X64-NEXT: retq
3820 ; X32-NEXT: xorps %xmm1, %xmm0
3821 ; X32-NEXT: retl
3825 ; X64-NEXT: xorps %xmm1, %xmm0
3826 ; X64-NEXT: retq
3837 ; X32-NEXT: xorps %xmm1, %xmm0
3838 ; X32-NEXT: retl
3842 ; X64-NEXT: xorps %xmm1, %xmm0
3843 ; X64-NEXT: retq