Lines Matching full:xmm3
38 ; SSE2-NEXT: pcmpeqd %xmm3, %xmm3
39 ; SSE2-NEXT: pxor %xmm2, %xmm3
41 ; SSE2-NEXT: pandn %xmm1, %xmm3
42 ; SSE2-NEXT: por %xmm3, %xmm2
90 ; SSE2-NEXT: movdqa %xmm1, %xmm3
91 ; SSE2-NEXT: pcmpgtb %xmm0, %xmm3
93 ; SSE2-NEXT: pxor %xmm3, %xmm2
94 ; SSE2-NEXT: pandn %xmm0, %xmm3
96 ; SSE2-NEXT: por %xmm3, %xmm2
247 ; SSE2-NEXT: movdqa %xmm0, %xmm3
248 ; SSE2-NEXT: pxor %xmm2, %xmm3
250 ; SSE2-NEXT: pcmpgtw %xmm3, %xmm2
276 ; SSE2-NEXT: pxor %xmm3, %xmm3
277 ; SSE2-NEXT: pcmpeqw %xmm2, %xmm3
278 ; SSE2-NEXT: pand %xmm3, %xmm0
279 ; SSE2-NEXT: pandn %xmm1, %xmm3
280 ; SSE2-NEXT: por %xmm3, %xmm0
302 ; SSE2-NEXT: movdqa %xmm1, %xmm3
303 ; SSE2-NEXT: pxor %xmm2, %xmm3
305 ; SSE2-NEXT: pcmpgtw %xmm3, %xmm2
331 ; SSE2-NEXT: pxor %xmm3, %xmm3
332 ; SSE2-NEXT: pcmpeqw %xmm2, %xmm3
333 ; SSE2-NEXT: pand %xmm3, %xmm0
334 ; SSE2-NEXT: pandn %xmm1, %xmm3
335 ; SSE2-NEXT: por %xmm3, %xmm0
383 ; SSE2-NEXT: pcmpeqd %xmm3, %xmm3
384 ; SSE2-NEXT: pxor %xmm2, %xmm3
386 ; SSE2-NEXT: pandn %xmm1, %xmm3
387 ; SSE2-NEXT: por %xmm3, %xmm2
435 ; SSE2-NEXT: movdqa %xmm1, %xmm3
436 ; SSE2-NEXT: pcmpgtd %xmm0, %xmm3
438 ; SSE2-NEXT: pxor %xmm3, %xmm2
439 ; SSE2-NEXT: pandn %xmm0, %xmm3
441 ; SSE2-NEXT: por %xmm3, %xmm2
464 ; SSE2-NEXT: movdqa %xmm0, %xmm3
465 ; SSE2-NEXT: pxor %xmm2, %xmm3
467 ; SSE2-NEXT: pcmpgtd %xmm3, %xmm2
491 ; SSE2-NEXT: movdqa {{.*#+}} xmm3 = [2147483648,2147483648,2147483648,2147483648]
493 ; SSE2-NEXT: pxor %xmm3, %xmm2
494 ; SSE2-NEXT: pxor %xmm0, %xmm3
495 ; SSE2-NEXT: pcmpgtd %xmm2, %xmm3
497 ; SSE2-NEXT: pxor %xmm3, %xmm2
498 ; SSE2-NEXT: pandn %xmm0, %xmm3
500 ; SSE2-NEXT: por %xmm3, %xmm2
523 ; SSE2-NEXT: movdqa %xmm1, %xmm3
524 ; SSE2-NEXT: pxor %xmm2, %xmm3
526 ; SSE2-NEXT: pcmpgtd %xmm3, %xmm2
550 ; SSE2-NEXT: movdqa {{.*#+}} xmm3 = [2147483648,2147483648,2147483648,2147483648]
552 ; SSE2-NEXT: pxor %xmm3, %xmm2
553 ; SSE2-NEXT: pxor %xmm1, %xmm3
554 ; SSE2-NEXT: pcmpgtd %xmm2, %xmm3
556 ; SSE2-NEXT: pxor %xmm3, %xmm2
557 ; SSE2-NEXT: pandn %xmm0, %xmm3
559 ; SSE2-NEXT: por %xmm3, %xmm2
581 ; SSE2-NEXT: movdqa %xmm3, %xmm4
589 ; SSE2-NEXT: pandn %xmm3, %xmm4
596 ; SSE4-NEXT: pminsb %xmm3, %xmm1
602 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
603 ; AVX1-NEXT: vpminsb %xmm2, %xmm3, %xmm2
627 ; SSE2-NEXT: pcmpgtb %xmm3, %xmm6
638 ; SSE2-NEXT: pandn %xmm3, %xmm4
647 ; SSE4-NEXT: pminsb %xmm3, %xmm1
653 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
654 ; AVX1-NEXT: vpminsb %xmm2, %xmm3, %xmm2
678 ; SSE2-NEXT: pcmpgtb %xmm3, %xmm4
685 ; SSE2-NEXT: pandn %xmm3, %xmm4
694 ; SSE4-NEXT: pmaxsb %xmm3, %xmm1
700 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
701 ; AVX1-NEXT: vpmaxsb %xmm2, %xmm3, %xmm2
724 ; SSE2-NEXT: movdqa %xmm3, %xmm6
736 ; SSE2-NEXT: pandn %xmm3, %xmm5
745 ; SSE4-NEXT: pmaxsb %xmm3, %xmm1
751 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
752 ; AVX1-NEXT: vpmaxsb %xmm2, %xmm3, %xmm2
776 ; SSE-NEXT: pminub %xmm3, %xmm1
782 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
783 ; AVX1-NEXT: vpminub %xmm2, %xmm3, %xmm2
807 ; SSE-NEXT: pminub %xmm3, %xmm1
813 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
814 ; AVX1-NEXT: vpminub %xmm2, %xmm3, %xmm2
838 ; SSE-NEXT: pmaxub %xmm3, %xmm1
844 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
845 ; AVX1-NEXT: vpmaxub %xmm2, %xmm3, %xmm2
869 ; SSE-NEXT: pmaxub %xmm3, %xmm1
875 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
876 ; AVX1-NEXT: vpmaxub %xmm2, %xmm3, %xmm2
900 ; SSE-NEXT: pminsw %xmm3, %xmm1
906 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
907 ; AVX1-NEXT: vpminsw %xmm2, %xmm3, %xmm2
931 ; SSE-NEXT: pminsw %xmm3, %xmm1
937 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
938 ; AVX1-NEXT: vpminsw %xmm2, %xmm3, %xmm2
962 ; SSE-NEXT: pmaxsw %xmm3, %xmm1
968 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
969 ; AVX1-NEXT: vpmaxsw %xmm2, %xmm3, %xmm2
993 ; SSE-NEXT: pmaxsw %xmm3, %xmm1
999 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
1000 ; AVX1-NEXT: vpmaxsw %xmm2, %xmm3, %xmm2
1026 ; SSE2-NEXT: movdqa %xmm3, %xmm6
1037 ; SSE2-NEXT: pandn %xmm3, %xmm6
1044 ; SSE4-NEXT: pminuw %xmm3, %xmm1
1050 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
1051 ; AVX1-NEXT: vpminuw %xmm2, %xmm3, %xmm2
1075 ; SSE2-NEXT: psubusw %xmm3, %xmm4
1085 ; SSE2-NEXT: pandn %xmm3, %xmm4
1094 ; SSE4-NEXT: pminuw %xmm3, %xmm1
1100 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
1101 ; AVX1-NEXT: vpminuw %xmm2, %xmm3, %xmm2
1125 ; SSE2-NEXT: movdqa %xmm3, %xmm6
1138 ; SSE2-NEXT: pandn %xmm3, %xmm4
1146 ; SSE4-NEXT: pmaxuw %xmm3, %xmm1
1152 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
1153 ; AVX1-NEXT: vpmaxuw %xmm2, %xmm3, %xmm2
1176 ; SSE2-NEXT: movdqa %xmm3, %xmm4
1187 ; SSE2-NEXT: pandn %xmm3, %xmm4
1194 ; SSE4-NEXT: pmaxuw %xmm3, %xmm1
1200 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
1201 ; AVX1-NEXT: vpmaxuw %xmm2, %xmm3, %xmm2
1224 ; SSE2-NEXT: movdqa %xmm3, %xmm4
1232 ; SSE2-NEXT: pandn %xmm3, %xmm4
1239 ; SSE4-NEXT: pminsd %xmm3, %xmm1
1245 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
1246 ; AVX1-NEXT: vpminsd %xmm2, %xmm3, %xmm2
1270 ; SSE2-NEXT: pcmpgtd %xmm3, %xmm6
1281 ; SSE2-NEXT: pandn %xmm3, %xmm4
1290 ; SSE4-NEXT: pminsd %xmm3, %xmm1
1296 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
1297 ; AVX1-NEXT: vpminsd %xmm2, %xmm3, %xmm2
1321 ; SSE2-NEXT: pcmpgtd %xmm3, %xmm4
1328 ; SSE2-NEXT: pandn %xmm3, %xmm4
1337 ; SSE4-NEXT: pmaxsd %xmm3, %xmm1
1343 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
1344 ; AVX1-NEXT: vpmaxsd %xmm2, %xmm3, %xmm2
1367 ; SSE2-NEXT: movdqa %xmm3, %xmm6
1379 ; SSE2-NEXT: pandn %xmm3, %xmm5
1388 ; SSE4-NEXT: pmaxsd %xmm3, %xmm1
1394 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
1395 ; AVX1-NEXT: vpmaxsd %xmm2, %xmm3, %xmm2
1421 ; SSE2-NEXT: movdqa %xmm3, %xmm6
1432 ; SSE2-NEXT: pandn %xmm3, %xmm6
1439 ; SSE4-NEXT: pminud %xmm3, %xmm1
1445 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
1446 ; AVX1-NEXT: vpminud %xmm2, %xmm3, %xmm2
1470 ; SSE2-NEXT: movdqa %xmm3, %xmm4
1487 ; SSE2-NEXT: pandn %xmm3, %xmm5
1496 ; SSE4-NEXT: pminud %xmm3, %xmm1
1502 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
1503 ; AVX1-NEXT: vpminud %xmm2, %xmm3, %xmm2
1527 ; SSE2-NEXT: movdqa %xmm3, %xmm6
1540 ; SSE2-NEXT: pandn %xmm3, %xmm4
1548 ; SSE4-NEXT: pmaxud %xmm3, %xmm1
1554 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
1555 ; AVX1-NEXT: vpmaxud %xmm2, %xmm3, %xmm2
1581 ; SSE2-NEXT: movdqa %xmm3, %xmm7
1596 ; SSE2-NEXT: pandn %xmm3, %xmm5
1605 ; SSE4-NEXT: pmaxud %xmm3, %xmm1
1611 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
1612 ; AVX1-NEXT: vpmaxud %xmm2, %xmm3, %xmm2
1663 ; SSE2-NEXT: pcmpeqd %xmm3, %xmm3
1664 ; SSE2-NEXT: pxor %xmm2, %xmm3
1666 ; SSE2-NEXT: pandn %xmm0, %xmm3
1667 ; SSE2-NEXT: por %xmm3, %xmm2
1715 ; SSE2-NEXT: movdqa %xmm1, %xmm3
1716 ; SSE2-NEXT: pcmpgtb %xmm0, %xmm3
1718 ; SSE2-NEXT: pxor %xmm3, %xmm2
1719 ; SSE2-NEXT: pandn %xmm1, %xmm3
1721 ; SSE2-NEXT: por %xmm3, %xmm2
1872 ; SSE2-NEXT: movdqa %xmm0, %xmm3
1873 ; SSE2-NEXT: pxor %xmm2, %xmm3
1875 ; SSE2-NEXT: pcmpgtw %xmm3, %xmm2
1900 ; SSE2-NEXT: movdqa %xmm0, %xmm3
1901 ; SSE2-NEXT: psubusw %xmm1, %xmm3
1903 ; SSE2-NEXT: pcmpeqw %xmm3, %xmm2
1929 ; SSE2-NEXT: movdqa %xmm1, %xmm3
1930 ; SSE2-NEXT: pxor %xmm2, %xmm3
1932 ; SSE2-NEXT: pcmpgtw %xmm3, %xmm2
1957 ; SSE2-NEXT: movdqa %xmm1, %xmm3
1958 ; SSE2-NEXT: psubusw %xmm0, %xmm3
1960 ; SSE2-NEXT: pcmpeqw %xmm3, %xmm2
2013 ; SSE2-NEXT: pcmpeqd %xmm3, %xmm3
2014 ; SSE2-NEXT: pxor %xmm2, %xmm3
2016 ; SSE2-NEXT: pandn %xmm0, %xmm3
2017 ; SSE2-NEXT: por %xmm3, %xmm2
2065 ; SSE2-NEXT: movdqa %xmm1, %xmm3
2066 ; SSE2-NEXT: pcmpgtd %xmm0, %xmm3
2068 ; SSE2-NEXT: pxor %xmm3, %xmm2
2069 ; SSE2-NEXT: pandn %xmm1, %xmm3
2071 ; SSE2-NEXT: por %xmm3, %xmm2
2094 ; SSE2-NEXT: movdqa %xmm0, %xmm3
2095 ; SSE2-NEXT: pxor %xmm2, %xmm3
2097 ; SSE2-NEXT: pcmpgtd %xmm3, %xmm2
2122 ; SSE2-NEXT: movdqa {{.*#+}} xmm3 = [2147483648,2147483648,2147483648,2147483648]
2124 ; SSE2-NEXT: pxor %xmm3, %xmm2
2125 ; SSE2-NEXT: pxor %xmm0, %xmm3
2126 ; SSE2-NEXT: pcmpgtd %xmm2, %xmm3
2128 ; SSE2-NEXT: pxor %xmm3, %xmm2
2129 ; SSE2-NEXT: pandn %xmm1, %xmm3
2131 ; SSE2-NEXT: por %xmm3, %xmm2
2154 ; SSE2-NEXT: movdqa %xmm1, %xmm3
2155 ; SSE2-NEXT: pxor %xmm2, %xmm3
2157 ; SSE2-NEXT: pcmpgtd %xmm3, %xmm2
2182 ; SSE2-NEXT: movdqa {{.*#+}} xmm3 = [2147483648,2147483648,2147483648,2147483648]
2184 ; SSE2-NEXT: pxor %xmm3, %xmm2
2185 ; SSE2-NEXT: pxor %xmm1, %xmm3
2186 ; SSE2-NEXT: pcmpgtd %xmm2, %xmm3
2188 ; SSE2-NEXT: pxor %xmm3, %xmm2
2189 ; SSE2-NEXT: pandn %xmm1, %xmm3
2191 ; SSE2-NEXT: por %xmm3, %xmm2
2213 ; SSE2-NEXT: movdqa %xmm3, %xmm4
2220 ; SSE2-NEXT: pand %xmm4, %xmm3
2222 ; SSE2-NEXT: por %xmm3, %xmm4
2230 ; SSE4-NEXT: pmaxsb %xmm3, %xmm1
2236 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
2237 ; AVX1-NEXT: vpmaxsb %xmm2, %xmm3, %xmm2
2261 ; SSE2-NEXT: pcmpgtb %xmm3, %xmm6
2271 ; SSE2-NEXT: pandn %xmm3, %xmm6
2281 ; SSE4-NEXT: pmaxsb %xmm3, %xmm1
2287 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
2288 ; AVX1-NEXT: vpmaxsb %xmm2, %xmm3, %xmm2
2312 ; SSE2-NEXT: pcmpgtb %xmm3, %xmm4
2318 ; SSE2-NEXT: pand %xmm4, %xmm3
2320 ; SSE2-NEXT: por %xmm3, %xmm4
2328 ; SSE4-NEXT: pminsb %xmm3, %xmm1
2334 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
2335 ; AVX1-NEXT: vpminsb %xmm2, %xmm3, %xmm2
2358 ; SSE2-NEXT: movdqa %xmm3, %xmm6
2369 ; SSE2-NEXT: pandn %xmm3, %xmm6
2379 ; SSE4-NEXT: pminsb %xmm3, %xmm1
2385 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
2386 ; AVX1-NEXT: vpminsb %xmm2, %xmm3, %xmm2
2410 ; SSE-NEXT: pmaxub %xmm3, %xmm1
2416 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
2417 ; AVX1-NEXT: vpmaxub %xmm2, %xmm3, %xmm2
2441 ; SSE-NEXT: pmaxub %xmm3, %xmm1
2447 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
2448 ; AVX1-NEXT: vpmaxub %xmm2, %xmm3, %xmm2
2472 ; SSE-NEXT: pminub %xmm3, %xmm1
2478 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
2479 ; AVX1-NEXT: vpminub %xmm2, %xmm3, %xmm2
2503 ; SSE-NEXT: pminub %xmm3, %xmm1
2509 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
2510 ; AVX1-NEXT: vpminub %xmm2, %xmm3, %xmm2
2534 ; SSE-NEXT: pmaxsw %xmm3, %xmm1
2540 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
2541 ; AVX1-NEXT: vpmaxsw %xmm2, %xmm3, %xmm2
2565 ; SSE-NEXT: pmaxsw %xmm3, %xmm1
2571 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
2572 ; AVX1-NEXT: vpmaxsw %xmm2, %xmm3, %xmm2
2596 ; SSE-NEXT: pminsw %xmm3, %xmm1
2602 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
2603 ; AVX1-NEXT: vpminsw %xmm2, %xmm3, %xmm2
2627 ; SSE-NEXT: pminsw %xmm3, %xmm1
2633 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
2634 ; AVX1-NEXT: vpminsw %xmm2, %xmm3, %xmm2
2660 ; SSE2-NEXT: movdqa %xmm3, %xmm5
2670 ; SSE2-NEXT: pand %xmm5, %xmm3
2672 ; SSE2-NEXT: por %xmm3, %xmm5
2680 ; SSE4-NEXT: pmaxuw %xmm3, %xmm1
2686 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
2687 ; AVX1-NEXT: vpmaxuw %xmm2, %xmm3, %xmm2
2711 ; SSE2-NEXT: psubusw %xmm3, %xmm4
2720 ; SSE2-NEXT: pand %xmm4, %xmm3
2722 ; SSE2-NEXT: por %xmm3, %xmm4
2730 ; SSE4-NEXT: pmaxuw %xmm3, %xmm1
2736 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
2737 ; AVX1-NEXT: vpmaxuw %xmm2, %xmm3, %xmm2
2761 ; SSE2-NEXT: movdqa %xmm3, %xmm6
2773 ; SSE2-NEXT: pand %xmm5, %xmm3
2775 ; SSE2-NEXT: por %xmm3, %xmm5
2783 ; SSE4-NEXT: pminuw %xmm3, %xmm1
2789 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
2790 ; AVX1-NEXT: vpminuw %xmm2, %xmm3, %xmm2
2813 ; SSE2-NEXT: movdqa %xmm3, %xmm4
2823 ; SSE2-NEXT: pand %xmm4, %xmm3
2825 ; SSE2-NEXT: por %xmm3, %xmm4
2833 xmm3, %xmm1
2839 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
2840 ; AVX1-NEXT: vpminuw %xmm2, %xmm3, %xmm2
2863 ; SSE2-NEXT: movdqa %xmm3, %xmm4
2870 ; SSE2-NEXT: pand %xmm4, %xmm3
2872 ; SSE2-NEXT: por %xmm3, %xmm4
2880 ; SSE4-NEXT: pmaxsd %xmm3, %xmm1
2886 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
2887 ; AVX1-NEXT: vpmaxsd %xmm2, %xmm3, %xmm2
2911 ; SSE2-NEXT: pcmpgtd %xmm3, %xmm6
2921 ; SSE2-NEXT: pandn %xmm3, %xmm6
2931 ; SSE4-NEXT: pmaxsd %xmm3, %xmm1
2937 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
2938 ; AVX1-NEXT: vpmaxsd %xmm2, %xmm3, %xmm2
2962 ; SSE2-NEXT: pcmpgtd %xmm3, %xmm4
2968 ; SSE2-NEXT: pand %xmm4, %xmm3
2970 ; SSE2-NEXT: por %xmm3, %xmm4
2978 ; SSE4-NEXT: pminsd %xmm3, %xmm1
2984 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
2985 ; AVX1-NEXT: vpminsd %xmm2, %xmm3, %xmm2
3008 ; SSE2-NEXT: movdqa %xmm3, %xmm6
3019 ; SSE2-NEXT: pandn %xmm3, %xmm6
3029 ; SSE4-NEXT: pminsd %xmm3, %xmm1
3035 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
3036 ; AVX1-NEXT: vpminsd %xmm2, %xmm3, %xmm2
3062 ; SSE2-NEXT: movdqa %xmm3, %xmm5
3072 ; SSE2-NEXT: pand %xmm5, %xmm3
3074 ; SSE2-NEXT: por %xmm3, %xmm5
3082 ; SSE4-NEXT: pmaxud %xmm3, %xmm1
3088 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
3089 ; AVX1-NEXT: vpmaxud %xmm2, %xmm3, %xmm2
3113 ; SSE2-NEXT: movdqa %xmm3, %xmm4
3129 ; SSE2-NEXT: pandn %xmm3, %xmm7
3139 ; SSE4-NEXT: pmaxud %xmm3, %xmm1
3145 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
3146 ; AVX1-NEXT: vpmaxud %xmm2, %xmm3, %xmm2
3170 ; SSE2-NEXT: movdqa %xmm3, %xmm6
3182 ; SSE2-NEXT: pand %xmm5, %xmm3
3184 ; SSE2-NEXT: por %xmm3, %xmm5
3192 ; SSE4-NEXT: pminud %xmm3, %xmm1
3198 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
3199 ; AVX1-NEXT: vpminud %xmm2, %xmm3, %xmm2
3225 ; SSE2-NEXT: movdqa %xmm3, %xmm7
3239 ; SSE2-NEXT: pandn %xmm3, %xmm7
3249 ; SSE4-NEXT: pminud %xmm3, %xmm1
3255 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
3256 ; AVX1-NEXT: vpminud %xmm2, %xmm3, %xmm2
3282 ; SSE2-NEXT: pcmpgtb %xmm3, %xmm8
3298 ; SSE2-NEXT: pand %xmm8, %xmm3
3300 ; SSE2-NEXT: por %xmm8, %xmm3
3308 ; SSE4-NEXT: pminsb %xmm7, %xmm3
3321 ; AVX1-NEXT: vpminsb %xmm3, %xmm1, %xmm1
3344 ; SSE2-NEXT: movdqa %xmm3, %xmm8
3349 ; SSE2-NEXT: movdqa %xmm12, %xmm3
3350 ; SSE2-NEXT: pxor %xmm13, %xmm3
3372 ; SSE2-NEXT: pandn %xmm7, %xmm3
3373 ; SSE2-NEXT: por %xmm12, %xmm3
3383 ; SSE4-NEXT: pminsb %xmm7, %xmm3
3396 ; AVX1-NEXT: vpminsb %xmm3, %xmm1, %xmm1
3419 ; SSE2-NEXT: movdqa %xmm3, %xmm8
3420 ; SSE2-NEXT: pcmpgtb %xmm7, %xmm3
3436 ; SSE2-NEXT: pand %xmm3, %xmm8
3437 ; SSE2-NEXT: pandn %xmm7, %xmm3
3438 ; SSE2-NEXT: por %xmm8, %xmm3
3449 ; SSE4-NEXT: pmaxsb %xmm7, %xmm3
3462 ; AVX1-NEXT: vpmaxsb %xmm3, %xmm1, %xmm1
3485 ; SSE2-NEXT: movdqa %xmm3, %xmm8
3491 ; SSE2-NEXT: movdqa %xmm12, %xmm3
3492 ; SSE2-NEXT: pxor %xmm0, %xmm3
3514 ; SSE2-NEXT: pandn %xmm7, %xmm3
3515 ; SSE2-NEXT: por %xmm12, %xmm3
3524 ; SSE4-NEXT: pmaxsb %xmm7, %xmm3
3537 ; AVX1-NEXT: vpmaxsb %xmm3, %xmm1, %xmm1
3563 ; SSE-NEXT: pminub %xmm7, %xmm3
3576 ; AVX1-NEXT: vpminub %xmm3, %xmm1, %xmm1
3602 ; SSE-NEXT: pminub %xmm7, %xmm3
3615 ; AVX1-NEXT: vpminub %xmm3, %xmm1, %xmm1
3641 ; SSE-NEXT: pmaxub %xmm7, %xmm3
3654 ; AVX1-NEXT: vpmaxub %xmm3, %xmm1, %xmm1
3680 ; SSE-NEXT: pmaxub %xmm7, %xmm3
3693 ; AVX1-NEXT: vpmaxub %xmm3, %xmm1, %xmm1
3719 ; SSE-NEXT: pminsw %xmm7, %xmm3
3732 ; AVX1-NEXT: vpminsw %xmm3, %xmm1, %xmm1
3758 ; SSE-NEXT: pminsw %xmm7, %xmm3
3771 ; AVX1-NEXT: vpminsw %xmm3, %xmm1, %xmm1
3797 ; SSE-NEXT: pmaxsw %xmm7, %xmm3
3810 ; AVX1-NEXT: vpmaxsw %xmm3, %xmm1, %xmm1
3836 ; SSE-NEXT: pmaxsw %xmm7, %xmm3
3849 ; AVX1-NEXT: vpmaxsw %xmm3, %xmm1, %xmm1
3873 ; SSE2-NEXT: movdqa %xmm3, %xmm9
3901 ; SSE2-NEXT: pand %xmm8, %xmm3
3903 ; SSE2-NEXT: por %xmm8, %xmm3
3911 ; SSE4-NEXT: pminuw %xmm7, %xmm3
3924 ; AVX1-NEXT: vpminuw %xmm3, %xmm1, %xmm1
3947 ; SSE2-NEXT: movdqa %xmm3, %xmm8
3950 ; SSE2-NEXT: psubusw %xmm7, %xmm3
3952 ; SSE2-NEXT: pcmpeqw %xmm12, %xmm3
3969 ; SSE2-NEXT: pand %xmm3, %xmm8
3970 ; SSE2-NEXT: pandn %xmm7, %xmm3
3971 ; SSE2-NEXT: por %xmm8, %xmm3
3980 ; SSE4-NEXT: pminuw %xmm7, %xmm3
3993 ; AVX1-NEXT: vpminuw %xmm3, %xmm1, %xmm1
4019 ; SSE2-NEXT: movdqa %xmm3, %xmm8
4045 ; SSE2-NEXT: pand %xmm8, %xmm3
4047 ; SSE2-NEXT: por %xmm3, %xmm8
4050 ; SSE2-NEXT: movdqa %xmm8, %xmm3
4058 ; SSE4-NEXT: pmaxuw %xmm7, %xmm3
4071 ; AVX1-NEXT: vpmaxuw %xmm3, %xmm1, %xmm1
4095 ; SSE2-NEXT: psubusw %xmm3, %xmm8
4116 ; SSE2-NEXT: pand %xmm8, %xmm3
4118 ; SSE2-NEXT: por %xmm8, %xmm3
4126 ; SSE4-NEXT: pmaxuw %xmm7, %xmm3
4139 ; AVX1-NEXT: vpmaxuw %xmm3, %xmm1, %xmm1
4163 ; SSE2-NEXT: pcmpgtd %xmm3, %xmm8
4179 ; SSE2-NEXT: pand %xmm8, %xmm3
4181 ; SSE2-NEXT: por %xmm8, %xmm3
4189 ; SSE4-NEXT: pminsd %xmm7, %xmm3
4202 ; AVX1-NEXT: vpminsd %xmm3, %xmm1, %xmm1
4225 ; SSE2-NEXT: movdqa %xmm3, %xmm8
4230 ; SSE2-NEXT: movdqa %xmm12, %xmm3
4231 ; SSE2-NEXT: pxor %xmm13, %xmm3
4253 ; SSE2-NEXT: pandn %xmm7, %xmm3
4254 ; SSE2-NEXT: por %xmm12, %xmm3
4264 ; SSE4-NEXT: pminsd %xmm7, %xmm3
4277 ; AVX1-NEXT: vpminsd %xmm3, %xmm1, %xmm1
4300 ; SSE2-NEXT: movdqa %xmm3, %xmm8
4301 ; SSE2-NEXT: pcmpgtd %xmm7, %xmm3
4317 ; SSE2-NEXT: pand %xmm3, %xmm8
4318 ; SSE2-NEXT: pandn %xmm7, %xmm3
4319 ; SSE2-NEXT: por %xmm8, %xmm3
4330 ; SSE4-NEXT: pmaxsd %xmm7, %xmm3
4343 ; AVX1-NEXT: vpmaxsd %xmm3, %xmm1, %xmm1
4366 ; SSE2-NEXT: movdqa %xmm3, %xmm8
4372 ; SSE2-NEXT: movdqa %xmm12, %xmm3
4373 xmm3
4395 ; SSE2-NEXT: pandn %xmm7, %xmm3
4396 ; SSE2-NEXT: por %xmm12, %xmm3
4405 ; SSE4-NEXT: pmaxsd %xmm7, %xmm3
4418 ; AVX1-NEXT: vpmaxsd %xmm3, %xmm1, %xmm1
4442 ; SSE2-NEXT: movdqa %xmm3, %xmm9
4470 ; SSE2-NEXT: pand %xmm8, %xmm3
4472 ; SSE2-NEXT: por %xmm8, %xmm3
4480 ; SSE4-NEXT: pminud %xmm7, %xmm3
4493 ; AVX1-NEXT: vpminud %xmm3, %xmm1, %xmm1
4520 ; SSE2-NEXT: movdqa %xmm3, %xmm12
4554 ; SSE2-NEXT: pandn %xmm3, %xmm12
4559 ; SSE2-NEXT: movdqa %xmm8, %xmm3
4567 ; SSE4-NEXT: pminud %xmm7, %xmm3
4580 ; AVX1-NEXT: vpminud %xmm3, %xmm1, %xmm1
4606 ; SSE2-NEXT: movdqa %xmm3, %xmm8
4632 ; SSE2-NEXT: pand %xmm8, %xmm3
4634 ; SSE2-NEXT: por %xmm3, %xmm8
4637 ; SSE2-NEXT: movdqa %xmm8, %xmm3
4645 ; SSE4-NEXT: pmaxud %xmm7, %xmm3
4658 ; AVX1-NEXT: vpmaxud %xmm3, %xmm1, %xmm1
4683 ; SSE2-NEXT: movdqa %xmm3, %xmm0
4719 ; SSE2-NEXT: pandn %xmm3, %xmm12
4724 ; SSE2-NEXT: movdqa %xmm8, %xmm3
4732 ; SSE4-NEXT: pmaxud %xmm7, %xmm3
4745 ; AVX1-NEXT: vpmaxud %xmm3, %xmm1, %xmm1
4769 ; SSE2-NEXT: movdqa %xmm3, %xmm8
4825 ; SSE2-NEXT: pand %xmm8, %xmm3
4827 ; SSE2-NEXT: por %xmm8, %xmm3
4834 ; SSE4-NEXT: pcmpgtq %xmm3, %xmm9
4847 ; SSE4-NEXT: blendvpd %xmm3, %xmm7
4851 ; SSE4-NEXT: movapd %xmm7, %xmm3
4859 ; AVX1-NEXT: vpcmpgtq %xmm1, %xmm3, %xmm5
4893 ; SSE2-NEXT: movdqa %xmm3, %xmm7
4894 ; SSE2-NEXT: movdqa %xmm2, %xmm3
4914 ; SSE2-NEXT: movdqa %xmm3, %xmm13
4958 ; SSE2-NEXT: pandn %xmm3, %xmm13
4967 ; SSE2-NEXT: movdqa %xmm8, %xmm3
4973 ; SSE4-NEXT: movdqa %xmm3, %xmm9
4991 ; SSE4-NEXT: blendvpd %xmm3, %xmm7
4995 ; SSE4-NEXT: movapd %xmm7, %xmm3
5005 ; AVX1-NEXT: vpcmpgtq %xmm3, %xmm1, %xmm6
5046 ; SSE2-NEXT: movdqa %xmm3, %xmm10
5100 ; SSE2-NEXT: pand %xmm8, %xmm3
5102 ; SSE2-NEXT: por %xmm8, %xmm3
5108 ; SSE4-NEXT: movdqa %xmm3, %xmm9
5121 ; SSE4-NEXT: blendvpd %xmm3, %xmm7
5125 ; SSE4-NEXT: movapd %xmm7, %xmm3
5133 ; AVX1-NEXT: vpcmpgtq %xmm3, %xmm1, %xmm5
5167 ; SSE2-NEXT: movdqa %xmm3, %xmm7
5168 ; SSE2-NEXT: movdqa %xmm2, %xmm3
5187 ; SSE2-NEXT: movdqa %xmm3, %xmm11
5233 ; SSE2-NEXT: pandn %xmm3, %xmm13
5242 ; SSE2-NEXT: movdqa %xmm8, %xmm3
5249 ; SSE4-NEXT: pcmpgtq %xmm3, %xmm9
5267 ; SSE4-NEXT: blendvpd %xmm3, %xmm7
5271 ; SSE4-NEXT: movapd %xmm7, %xmm3
5281 ; AVX1-NEXT: vpcmpgtq %xmm1, %xmm3, %xmm6
5320 ; SSE2-NEXT: movdqa %xmm3, %xmm8
5376 ; SSE2-NEXT: pand %xmm8, %xmm3
5378 ; SSE2-NEXT: por %xmm8, %xmm3
5385 ; SSE4-NEXT: movdqa %xmm3, %xmm10
5410 ; SSE4-NEXT: blendvpd %xmm3, %xmm7
5414 ; SSE4-NEXT: movapd %xmm7, %xmm3
5426 ; AVX1-NEXT: vxorps %xmm5, %xmm3, %xmm7
5470 ; SSE2-NEXT: movdqa %xmm3, %xmm7
5471 ; SSE2-NEXT: movdqa %xmm2, %xmm3
5491 ; SSE2-NEXT: movdqa %xmm3, %xmm13
5535 ; SSE2-NEXT: pandn %xmm3, %xmm13
5544 ; SSE2-NEXT: movdqa %xmm8, %xmm3
5553 ; SSE4-NEXT: movdqa %xmm3, %xmm8
5581 ; SSE4-NEXT: blendvpd %xmm3, %xmm7
5585 ; SSE4-NEXT: movapd %xmm7, %xmm3
5598 ; AVX1-NEXT: vxorps %xmm5, %xmm3, %xmm7
5650 ; SSE2-NEXT: movdqa %xmm3, %xmm10
5704 ; SSE2-NEXT: pand %xmm8, %xmm3
5706 ; SSE2-NEXT: por %xmm8, %xmm3
5715 xmm3, %xmm9
5738 ; SSE4-NEXT: blendvpd %xmm3, %xmm7
5742 ; SSE4-NEXT: movapd %xmm7, %xmm3
5753 ; AVX1-NEXT: vxorps %xmm5, %xmm3, %xmm6
5798 ; SSE2-NEXT: movdqa %xmm3, %xmm7
5799 ; SSE2-NEXT: movdqa %xmm2, %xmm3
5818 ; SSE2-NEXT: movdqa %xmm3, %xmm11
5864 ; SSE2-NEXT: pandn %xmm3, %xmm13
5873 ; SSE2-NEXT: movdqa %xmm8, %xmm3
5880 ; SSE4-NEXT: movdqa %xmm3, %xmm10
5910 ; SSE4-NEXT: blendvpd %xmm3, %xmm7
5914 ; SSE4-NEXT: movapd %xmm7, %xmm3
5928 ; AVX1-NEXT: vxorps %xmm5, %xmm3, %xmm6
5976 ; SSE2-NEXT: movdqa %xmm3, %xmm8
5977 ; SSE2-NEXT: movdqa %xmm7, %xmm3
5978 ; SSE2-NEXT: pcmpgtb %xmm8, %xmm3
5994 ; SSE2-NEXT: pand %xmm3, %xmm7
5995 ; SSE2-NEXT: pandn %xmm8, %xmm3
5996 ; SSE2-NEXT: por %xmm7, %xmm3
6007 ; SSE4-NEXT: pmaxsb %xmm7, %xmm3
6020 ; AVX1-NEXT: vpmaxsb %xmm3, %xmm1, %xmm1
6044 ; SSE2-NEXT: movdqa %xmm3, %xmm12
6070 ; SSE2-NEXT: pandn %xmm3, %xmm9
6074 ; SSE2-NEXT: movdqa %xmm9, %xmm3
6082 ; SSE4-NEXT: pmaxsb %xmm7, %xmm3
6095 ; AVX1-NEXT: vpmaxsb %xmm3, %xmm1, %xmm1
6118 ; SSE2-NEXT: movdqa %xmm3, %xmm8
6119 ; SSE2-NEXT: pcmpgtb %xmm7, %xmm3
6135 ; SSE2-NEXT: pand %xmm3, %xmm7
6136 ; SSE2-NEXT: pandn %xmm8, %xmm3
6137 ; SSE2-NEXT: por %xmm7, %xmm3
6148 ; SSE4-NEXT: pminsb %xmm7, %xmm3
6161 ; AVX1-NEXT: vpminsb %xmm3, %xmm1, %xmm1
6187 ; SSE2-NEXT: pcmpgtb %xmm3, %xmm12
6212 ; SSE2-NEXT: pandn %xmm3, %xmm9
6215 ; SSE2-NEXT: movdqa %xmm9, %xmm3
6223 ; SSE4-NEXT: pminsb %xmm7, %xmm3
6236 ; AVX1-NEXT: vpminsb %xmm3, %xmm1, %xmm1
6262 ; SSE-NEXT: pmaxub %xmm7, %xmm3
6275 ; AVX1-NEXT: vpmaxub %xmm3, %xmm1, %xmm1
6301 ; SSE-NEXT: pmaxub %xmm7, %xmm3
6314 ; AVX1-NEXT: vpmaxub %xmm3, %xmm1, %xmm1
6340 ; SSE-NEXT: pminub %xmm7, %xmm3
6353 ; AVX1-NEXT: vpminub %xmm3, %xmm1, %xmm1
6379 ; SSE-NEXT: pminub %xmm7, %xmm3
6392 ; AVX1-NEXT: vpminub %xmm3, %xmm1, %xmm1
6418 ; SSE-NEXT: pmaxsw %xmm7, %xmm3
6431 ; AVX1-NEXT: vpmaxsw %xmm3, %xmm1, %xmm1
6457 ; SSE-NEXT: pmaxsw %xmm7, %xmm3
6470 ; AVX1-NEXT: vpmaxsw %xmm3, %xmm1, %xmm1
6496 ; SSE-NEXT: pminsw %xmm7, %xmm3
6509 ; AVX1-NEXT: vpminsw %xmm3, %xmm1, %xmm1
6535 ; SSE-NEXT: pminsw %xmm7, %xmm3
6548 ; AVX1-NEXT: vpminsw %xmm3, %xmm1, %xmm1
6573 ; SSE2-NEXT: movdqa %xmm3, %xmm9
6602 ; SSE2-NEXT: pandn %xmm3, %xmm8
6606 ; SSE2-NEXT: movdqa %xmm8, %xmm3
6614 ; SSE4-NEXT: pmaxuw %xmm7, %xmm3
6627 ; AVX1-NEXT: vpmaxuw %xmm3, %xmm1, %xmm1
6650 ; SSE2-NEXT: movdqa %xmm3, %xmm8
6653 ; SSE2-NEXT: psubusw %xmm7, %xmm3
6655 ; SSE2-NEXT: pcmpeqw %xmm12, %xmm3
6672 ; SSE2-NEXT: pand %xmm3, %xmm7
6673 ; SSE2-NEXT: pandn %xmm8, %xmm3
6674 ; SSE2-NEXT: por %xmm7, %xmm3
6683 ; SSE4-NEXT: pmaxuw %xmm7, %xmm3
6696 ; AVX1-NEXT: vpmaxuw %xmm3, %xmm1, %xmm1
6723 ; SSE2-NEXT: movdqa %xmm3, %xmm8
6750 ; SSE2-NEXT: pandn %xmm3, %xmm8
6754 ; SSE2-NEXT: movdqa %xmm8, %xmm3
6762 ; SSE4-NEXT: pminuw %xmm7, %xmm3
6775 ; AVX1-NEXT: vpminuw %xmm3, %xmm1, %xmm1
6798 ; SSE2-NEXT: movdqa %xmm3, %xmm8
6801 ; SSE2-NEXT: movdqa %xmm7, %xmm3
6802 ; SSE2-NEXT: psubusw %xmm8, %xmm3
6804 ; SSE2-NEXT: pcmpeqw %xmm12, %xmm3
6823 ; SSE2-NEXT: pand %xmm3, %xmm7
6824 ; SSE2-NEXT: pandn %xmm8, %xmm3
6825 ; SSE2-NEXT: por %xmm7, %xmm3
6834 ; SSE4-NEXT: pminuw %xmm7, %xmm3
6847 ; AVX1-NEXT: vpminuw %xmm3, %xmm1, %xmm1
6870 ; SSE2-NEXT: movdqa %xmm3, %xmm8
6871 ; SSE2-NEXT: movdqa %xmm7, %xmm3
6872 ; SSE2-NEXT: pcmpgtd %xmm8, %xmm3
6888 ; SSE2-NEXT: pand %xmm3, %xmm7
6889 ; SSE2-NEXT: pandn %xmm8, %xmm3
6890 ; SSE2-NEXT: por %xmm7, %xmm3
6901 ; SSE4-NEXT: pmaxsd %xmm7, %xmm3
6914 ; AVX1-NEXT: vpmaxsd %xmm3, %xmm1, %xmm1
6938 ; SSE2-NEXT: movdqa %xmm3, %xmm12
6964 ; SSE2-NEXT: pandn %xmm3, %xmm9
6968 ; SSE2-NEXT: movdqa %xmm9, %xmm3
6976 ; SSE4-NEXT: pmaxsd %xmm7, %xmm3
6989 ; AVX1-NEXT: vpmaxsd %xmm3, %xmm1, %xmm1
7012 ; SSE2-NEXT: movdqa %xmm3, %xmm8
7013 ; SSE2-NEXT: pcmpgtd %xmm7, %xmm3
7029 ; SSE2-NEXT: pand %xmm3, %xmm7
7030 ; SSE2-NEXT: pandn %xmm8, %xmm3
7031 ; SSE2-NEXT: por %xmm7, %xmm3
7042 ; SSE4-NEXT: pminsd %xmm7, %xmm3
7055 ; AVX1-NEXT: vpminsd %xmm3, %xmm1, %xmm1
7081 ; SSE2-NEXT: pcmpgtd %xmm3, %xmm12
7106 ; SSE2-NEXT: pandn %xmm3, %xmm9
7109 ; SSE2-NEXT: movdqa %xmm9, %xmm3
7117 ; SSE4-NEXT: pminsd %xmm7, %xmm3
7130 ; AVX1-NEXT: vpminsd %xmm3, %xmm1, %xmm1
7155 ; SSE2-NEXT: movdqa %xmm3, %xmm9
7184 ; SSE2-NEXT: pandn %xmm3, %xmm8
7188 ; SSE2-NEXT: movdqa %xmm8, %xmm3
7196 ; SSE4-NEXT: pmaxud %xmm7, %xmm3
7209 ; AVX1-NEXT: vpmaxud %xmm3, %xmm1, %xmm1
7236 ; SSE2-NEXT: movdqa %xmm3, %xmm12
7271 ; SSE2-NEXT: pandn %xmm3, %xmm8
7275 ; SSE2-NEXT: movdqa %xmm8, %xmm3
7283 ; SSE4-NEXT: pmaxud %xmm7, %xmm3
7296 ; AVX1-NEXT: vpmaxud %xmm3, %xmm1, %xmm1
7323 ; SSE2-NEXT: movdqa %xmm3, %xmm8
7350 ; SSE2-NEXT: pandn %xmm3, %xmm8
7354 ; SSE2-NEXT: movdqa %xmm8, %xmm3
7362 ; SSE4-NEXT: pminud %xmm7, %xmm3
7375 ; AVX1-NEXT: vpminud %xmm3, %xmm1, %xmm1
7400 ; SSE2-NEXT: movdqa %xmm3, %xmm0
7437 ; SSE2-NEXT: pandn %xmm3, %xmm8
7441 ; SSE2-NEXT: movdqa %xmm8, %xmm3
7449 ; SSE4-NEXT: pminud %xmm7, %xmm3
7462 ; AVX1-NEXT: vpminud %xmm3, %xmm1, %xmm1
7488 ; SSE2-NEXT: movdqa %xmm3, %xmm8
7545 ; SSE2-NEXT: pandn %xmm3, %xmm8
7550 ; SSE2-NEXT: movdqa %xmm8, %xmm3
7557 ; SSE4-NEXT: pcmpgtq %xmm3, %xmm9
7570 ; SSE4-NEXT: blendvpd %xmm7, %xmm3
7579 ; AVX1-NEXT: vpcmpgtq %xmm1, %xmm3, %xmm5
7613 ; SSE2-NEXT: movdqa %xmm3, %xmm7
7614 ; SSE2-NEXT: movdqa %xmm2, %xmm3
7634 ; SSE2-NEXT: movdqa %xmm3, %xmm13
7679 ; SSE2-NEXT: pandn %xmm3, %xmm10
7687 ; SSE2-NEXT: movdqa %xmm8, %xmm3
7693 ; SSE4-NEXT: movdqa %xmm3, %xmm9
7711 ; SSE4-NEXT: blendvpd %xmm7, %xmm3
7722 ; AVX1-NEXT: vpcmpgtq %xmm3, %xmm1, %xmm6
7763 ; SSE2-NEXT: movdqa %xmm3, %xmm9
7818 ; SSE2-NEXT: pandn %xmm3, %xmm8
7823 ; SSE2-NEXT: movdqa %xmm8, %xmm3
7829 ; SSE4-NEXT: movdqa %xmm3, %xmm9
7842 ; SSE4-NEXT: blendvpd %xmm7, %xmm3
7851 ; AVX1-NEXT: vpcmpgtq %xmm3, %xmm1, %xmm5
7885 ; SSE2-NEXT: movdqa %xmm3, %xmm7
7886 ; SSE2-NEXT: movdqa %xmm2, %xmm3
7905 ; SSE2-NEXT: movdqa %xmm3, %xmm11
7952 ; SSE2-NEXT: pandn %xmm3, %xmm10
7960 ; SSE2-NEXT: movdqa %xmm8, %xmm3
7967 ; SSE4-NEXT: pcmpgtq %xmm3, %xmm9
7985 ; SSE4-NEXT: blendvpd %xmm7, %xmm3
7996 ; AVX1-NEXT: vpcmpgtq %xmm1, %xmm3, %xmm6
8035 ; SSE2-NEXT: movdqa %xmm3, %xmm8
8092 ; SSE2-NEXT: pandn %xmm3, %xmm8
8097 ; SSE2-NEXT: movdqa %xmm8, %xmm3
8104 ; SSE4-NEXT: movdqa %xmm3, %xmm10
8129 ; SSE4-NEXT: blendvpd %xmm7, %xmm3
8142 ; AVX1-NEXT: vxorps %xmm5, %xmm3, %xmm7
8186 ; SSE2-NEXT: movdqa %xmm3, %xmm7
8187 ; SSE2-NEXT: movdqa %xmm2, %xmm3
8207 ; SSE2-NEXT: movdqa %xmm3, %xmm13
8252 ; SSE2-NEXT: pandn %xmm3, %xmm10
8260 ; SSE2-NEXT: movdqa %xmm8, %xmm3
8269 ; SSE4-NEXT: movdqa %xmm3, %xmm9
8297 ; SSE4-NEXT: blendvpd %xmm7, %xmm3
8311 ; AVX1-NEXT: vxorps %xmm5, %xmm3, %xmm7
8363 ; SSE2-NEXT: movdqa %xmm3, %xmm9
8418 ; SSE2-NEXT: pandn %xmm3, %xmm8
8423 ; SSE2-NEXT: movdqa %xmm8, %xmm3
8432 ; SSE4-NEXT: movdqa %xmm3, %xmm9
8455 ; SSE4-NEXT: blendvpd %xmm7, %xmm3
8467 ; AVX1-NEXT: vxorps %xmm5, %xmm3, %xmm6
8512 ; SSE2-NEXT: movdqa %xmm3, %xmm7
8513 ; SSE2-NEXT: movdqa %xmm2, %xmm3
8532 ; SSE2-NEXT: movdqa %xmm3, %xmm11
8579 ; SSE2-NEXT: pandn %xmm3, %xmm10
8587 ; SSE2-NEXT: movdqa %xmm8, %xmm3
8594 ; SSE4-NEXT: movdqa %xmm3, %xmm10
8624 ; SSE4-NEXT: blendvpd %xmm7, %xmm3
8639 ; AVX1-NEXT: vxorps %xmm5, %xmm3, %xmm6
8690 ; SSE2-NEXT: movdqa %xmm3, %xmm6
8715 ; SSE2-NEXT: pandn %xmm3, %xmm6
8722 ; SSE4-NEXT: movdqa %xmm3, %xmm5
8728 ; SSE4-NEXT: blendvpd %xmm1, %xmm3
8730 ; SSE4-NEXT: movapd %xmm3, %xmm1
8736 ; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3
8737 ; AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2
8738 ; AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm3
8763 ; SSE2-NEXT: movdqa %xmm3, %xmm4
8794 ; SSE2-NEXT: pandn %xmm3, %xmm9
8804 ; SSE4-NEXT: pcmpgtq %xmm3, %xmm5
8811 ; SSE4-NEXT: blendvpd %xmm1, %xmm3
8813 ; SSE4-NEXT: movapd %xmm3, %xmm1
8819 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
8820 ; AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2
8821 ; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3
8822 ; AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm2
8824 ; AVX1-NEXT: vpxor %xmm3, %xmm4, %xmm3
8851 ; SSE2-NEXT: movdqa %xmm3, %xmm5
8878 ; SSE2-NEXT: pandn %xmm3, %xmm6
8886 ; SSE4-NEXT: pcmpgtq %xmm3, %xmm5
8890 ; SSE4-NEXT: blendvpd %xmm1, %xmm3
8892 ; SSE4-NEXT: movapd %xmm3, %xmm1
8898 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
8899 ; AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2
8900 ; AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm3
8927 ; SSE2-NEXT: movdqa %xmm3, %xmm5
8956 ; SSE2-NEXT: pandn %xmm3, %xmm9
8965 ; SSE4-NEXT: movdqa %xmm3, %xmm5
8974 ; SSE4-NEXT: blendvpd %xmm1, %xmm3
8976 ; SSE4-NEXT: movapd %xmm3, %xmm1
8982 ; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3
8983 ; AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2
8984 ; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3
8985 ; AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm2
8987 ; AVX1-NEXT: vpxor %xmm3, %xmm4, %xmm3
9016 ; SSE2-NEXT: movdqa %xmm3, %xmm6
9041 ; SSE2-NEXT: pandn %xmm3, %xmm6
9051 ; SSE4-NEXT: movdqa %xmm3, %xmm5
9060 ; SSE4-NEXT: blendvpd %xmm1, %xmm3
9062 ; SSE4-NEXT: movapd %xmm3, %xmm1
9068 ; AVX1-NEXT: vmovaps {{.*#+}} xmm3 = [9223372036854775808,9223372036854775808]
9069 ; AVX1-NEXT: vxorps %xmm3, %xmm2, %xmm2
9071 ; AVX1-NEXT: vxorps %xmm3, %xmm4, %xmm4
9073 ; AVX1-NEXT: vxorps %xmm3, %xmm0, %xmm4
9074 ; AVX1-NEXT: vxorps %xmm3, %xmm1, %xmm3
9075 ; AVX1-NEXT: vpcmpgtq %xmm4, %xmm3, %xmm3
9103 ; SSE2-NEXT: movdqa %xmm3, %xmm4
9134 ; SSE2-NEXT: pandn %xmm3, %xmm9
9144 ; SSE4-NEXT: movdqa %xmm3, %xmm6
9158 ; SSE4-NEXT: blendvpd %xmm1, %xmm3
9160 ; SSE4-NEXT: movapd %xmm3, %xmm1
9166 ; AVX1-NEXT: vmovaps {{.*#+}} xmm3 = [9223372036854775808,9223372036854775808]
9167 ; AVX1-NEXT: vxorps %xmm3, %xmm2, %xmm2
9169 ; AVX1-NEXT: vxorps %xmm3, %xmm4, %xmm4
9173 ; AVX1-NEXT: vxorps %xmm3, %xmm1, %xmm5
9174 ; AVX1-NEXT: vxorps %xmm3, %xmm0, %xmm3
9175 ; AVX1-NEXT: vpcmpgtq %xmm5, %xmm3, %xmm3
9176 ; AVX1-NEXT: vpxor %xmm4, %xmm3, %xmm3
9206 ; SSE2-NEXT: movdqa %xmm3, %xmm5
9233 ; SSE2-NEXT: pandn %xmm3, %xmm6
9241 ; SSE4-NEXT: movdqa %xmm3, %xmm6
9252 ; SSE4-NEXT: blendvpd %xmm1, %xmm3
9254 ; SSE4-NEXT: movapd %xmm3, %xmm1
9260 ; AVX1-NEXT: vmovaps {{.*#+}} xmm3 = [9223372036854775808,9223372036854775808]
9261 ; AVX1-NEXT: vxorps %xmm3, %xmm2, %xmm2
9263 ; AVX1-NEXT: vxorps %xmm3, %xmm4, %xmm4
9265 ; AVX1-NEXT: vxorps %xmm3, %xmm1, %xmm4
9266 ; AVX1-NEXT: vxorps %xmm3, %xmm0, %xmm3
9267 ; AVX1-NEXT: vpcmpgtq %xmm4, %xmm3, %xmm3
9297 ; SSE2-NEXT: movdqa %xmm3, %xmm5
9326 ; SSE2-NEXT: pandn %xmm3, %xmm9
9338 ; SSE4-NEXT: movdqa %xmm3, %xmm5
9350 ; SSE4-NEXT: blendvpd %xmm1, %xmm3
9352 ; SSE4-NEXT: movapd %xmm3, %xmm1
9358 ; AVX1-NEXT: vmovaps {{.*#+}} xmm3 = [9223372036854775808,9223372036854775808]
9359 ; AVX1-NEXT: vxorps %xmm3, %xmm2, %xmm2
9361 ; AVX1-NEXT: vxorps %xmm3, %xmm4, %xmm4
9365 ; AVX1-NEXT: vxorps %xmm3, %xmm0, %xmm5
9366 ; AVX1-NEXT: vxorps %xmm3, %xmm1, %xmm3
9367 ; AVX1-NEXT: vpcmpgtq %xmm5, %xmm3, %xmm3
9368 ; AVX1-NEXT: vpxor %xmm4, %xmm3, %xmm3
9400 ; SSE2-NEXT: movdqa %xmm3, %xmm6
9424 ; SSE2-NEXT: pand %xmm4, %xmm3
9426 ; SSE2-NEXT: por %xmm3, %xmm4
9434 ; SSE4-NEXT: movdqa %xmm3, %xmm5
9440 ; SSE4-NEXT: blendvpd %xmm3, %xmm1
9447 ; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3
9448 ; AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2
9449 ; AVX1-NEXT: vpcmpgtq %xmm0, %xmm1, %xmm3
9474 ; SSE2-NEXT: movdqa %xmm3, %xmm4
9504 ; SSE2-NEXT: pandn %xmm3, %xmm8
9515 ; SSE4-NEXT: pcmpgtq %xmm3, %xmm5
9522 ; SSE4-NEXT: blendvpd %xmm3, %xmm1
9529 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
9530 ; AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2
9531 ; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3
9532 ; AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm2
9534 ; AVX1-NEXT: vpxor %xmm3, %xmm4, %xmm3
9561 ; SSE2-NEXT: movdqa %xmm3, %xmm4
9587 ; SSE2-NEXT: pand %xmm4, %xmm3
9589 ; SSE2-NEXT: por %xmm3, %xmm4
9598 ; SSE4-NEXT: pcmpgtq %xmm3, %xmm5
9602 ; SSE4-NEXT: blendvpd %xmm3, %xmm1
9609 ; AVX1-NEXT: vextractf128 $1, %ymm0, %xmm3
9610 ; AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2
9611 ; AVX1-NEXT: vpcmpgtq %xmm1, %xmm0, %xmm3
9638 ; SSE2-NEXT: movdqa %xmm3, %xmm5
9666 ; SSE2-NEXT: pandn %xmm3, %xmm8
9676 ; SSE4-NEXT: movdqa %xmm3, %xmm5
9685 ; SSE4-NEXT: blendvpd %xmm3, %xmm1
9692 ; AVX1-NEXT: vextractf128 $1, %ymm1, %xmm3
9693 ; AVX1-NEXT: vpcmpgtq %xmm2, %xmm3, %xmm2
9694 ; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3
9695 ; AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm2
9697 ; AVX1-NEXT: vpxor %xmm3, %xmm4, %xmm3
9726 ; SSE2-NEXT: movdqa %xmm3, %xmm6
9750 ; SSE2-NEXT: pand %xmm4, %xmm3
9752 ; SSE2-NEXT: por %xmm3, %xmm4
9763 ; SSE4-NEXT: movdqa %xmm3, %xmm5
9772 ; SSE4-NEXT: blendvpd %xmm3, %xmm1
9779 ; AVX1-NEXT: vmovaps {{.*#+}} xmm3 = [9223372036854775808,9223372036854775808]
9780 ; AVX1-NEXT: vxorps %xmm3, %xmm2, %xmm2
9782 ; AVX1-NEXT: vxorps %xmm3, %xmm4, %xmm4
9784 ; AVX1-NEXT: vxorps %xmm3, %xmm0, %xmm4
9785 ; AVX1-NEXT: vxorps %xmm3, %xmm1, %xmm3
9786 ; AVX1-NEXT: vpcmpgtq %xmm4, %xmm3, %xmm3
9814 ; SSE2-NEXT: movdqa %xmm3, %xmm4
9844 ; SSE2-NEXT: pandn %xmm3, %xmm8
9855 ; SSE4-NEXT: movdqa %xmm3, %xmm6
9869 ; SSE4-NEXT: blendvpd %xmm3, %xmm1
9876 ; AVX1-NEXT: vmovaps {{.*#+}} xmm3 = [9223372036854775808,9223372036854775808]
9877 ; AVX1-NEXT: vxorps %xmm3, %xmm2, %xmm2
9879 ; AVX1-NEXT: vxorps %xmm3, %xmm4, %xmm4
9883 ; AVX1-NEXT: vxorps %xmm3
9884 ; AVX1-NEXT: vxorps %xmm3, %xmm0, %xmm3
9885 ; AVX1-NEXT: vpcmpgtq %xmm5, %xmm3, %xmm3
9886 ; AVX1-NEXT: vpxor %xmm4, %xmm3, %xmm3
9916 ; SSE2-NEXT: movdqa %xmm3, %xmm4
9942 ; SSE2-NEXT: pand %xmm4, %xmm3
9944 ; SSE2-NEXT: por %xmm3, %xmm4
9953 ; SSE4-NEXT: movdqa %xmm3, %xmm6
9964 ; SSE4-NEXT: blendvpd %xmm3, %xmm1
9971 ; AVX1-NEXT: vmovaps {{.*#+}} xmm3 = [9223372036854775808,9223372036854775808]
9972 ; AVX1-NEXT: vxorps %xmm3, %xmm2, %xmm2
9974 ; AVX1-NEXT: vxorps %xmm3, %xmm4, %xmm4
9976 ; AVX1-NEXT: vxorps %xmm3, %xmm1, %xmm4
9977 ; AVX1-NEXT: vxorps %xmm3, %xmm0, %xmm3
9978 ; AVX1-NEXT: vpcmpgtq %xmm4, %xmm3, %xmm3
10008 ; SSE2-NEXT: movdqa %xmm3, %xmm5
10036 ; SSE2-NEXT: pandn %xmm3, %xmm8
10049 ; SSE4-NEXT: movdqa %xmm3, %xmm5
10061 ; SSE4-NEXT: blendvpd %xmm3, %xmm1
10068 ; AVX1-NEXT: vmovaps {{.*#+}} xmm3 = [9223372036854775808,9223372036854775808]
10069 ; AVX1-NEXT: vxorps %xmm3, %xmm2, %xmm2
10071 ; AVX1-NEXT: vxorps %xmm3, %xmm4, %xmm4
10075 ; AVX1-NEXT: vxorps %xmm3, %xmm0, %xmm5
10076 ; AVX1-NEXT: vxorps %xmm3, %xmm1, %xmm3
10077 ; AVX1-NEXT: vpcmpgtq %xmm5, %xmm3, %xmm3
10078 ; AVX1-NEXT: vpxor %xmm4, %xmm3, %xmm3
10108 ; SSE2-NEXT: movdqa %xmm0, %xmm3
10109 ; SSE2-NEXT: pxor %xmm2, %xmm3
10112 ; SSE2-NEXT: pcmpgtd %xmm3, %xmm4
10114 ; SSE2-NEXT: pcmpeqd %xmm3, %xmm2
10117 ; SSE2-NEXT: pshufd {{.*#+}} xmm3 = xmm4[1,1,3,3]
10118 ; SSE2-NEXT: por %xmm2, %xmm3
10119 ; SSE2-NEXT: pand %xmm3, %xmm0
10120 ; SSE2-NEXT: pandn %xmm1, %xmm3
10121 ; SSE2-NEXT: por %xmm3, %xmm0
10159 ; SSE2-NEXT: movdqa %xmm1, %xmm3
10160 ; SSE2-NEXT: pxor %xmm2, %xmm3
10163 ; SSE2-NEXT: pcmpgtd %xmm3, %xmm4
10165 ; SSE2-NEXT: pcmpeqd %xmm3, %xmm2
10168 ; SSE2-NEXT: pshufd {{.*#+}} xmm3 = xmm4[1,1,3,3]
10169 ; SSE2-NEXT: por %xmm2, %xmm3
10171 ; SSE2-NEXT: pxor %xmm3, %xmm2
10172 ; SSE2-NEXT: pandn %xmm0, %xmm3
10174 ; SSE2-NEXT: por %xmm3, %xmm2
10182 ; SSE4-NEXT: pcmpeqd %xmm3, %xmm3
10183 ; SSE4-NEXT: pxor %xmm3, %xmm0
10191 ; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3
10192 ; AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm2
10199 ; AVX2-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3
10200 ; AVX2-NEXT: vpxor %xmm3, %xmm2, %xmm2
10218 ; SSE2-NEXT: movdqa %xmm1, %xmm3
10219 ; SSE2-NEXT: pxor %xmm2, %xmm3
10222 ; SSE2-NEXT: pcmpgtd %xmm3, %xmm4
10224 ; SSE2-NEXT: pcmpeqd %xmm3, %xmm2
10227 ; SSE2-NEXT: pshufd {{.*#+}} xmm3 = xmm4[1,1,3,3]
10228 ; SSE2-NEXT: por %xmm2, %xmm3
10229 ; SSE2-NEXT: pand %xmm3, %xmm0
10230 ; SSE2-NEXT: pandn %xmm1, %xmm3
10231 ; SSE2-NEXT: por %xmm3, %xmm0
10268 ; SSE2-NEXT: movdqa %xmm0, %xmm3
10269 ; SSE2-NEXT: pxor %xmm2, %xmm3
10272 ; SSE2-NEXT: pcmpgtd %xmm3, %xmm4
10274 ; SSE2-NEXT: pcmpeqd %xmm3, %xmm2
10277 ; SSE2-NEXT: pshufd {{.*#+}} xmm3 = xmm4[1,1,3,3]
10278 ; SSE2-NEXT: por %xmm2, %xmm3
10280 ; SSE2-NEXT: pxor %xmm3, %xmm2
10281 ; SSE2-NEXT: pandn %xmm0, %xmm3
10283 ; SSE2-NEXT: por %xmm3, %xmm2
10290 ; SSE4-NEXT: movdqa %xmm1, %xmm3
10291 ; SSE4-NEXT: pcmpgtq %xmm2, %xmm3
10293 ; SSE4-NEXT: pxor %xmm3, %xmm0
10301 ; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3
10302 ; AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm2
10309 ; AVX2-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3
10310 ; AVX2-NEXT: vpxor %xmm3, %xmm2, %xmm2
10328 ; SSE2-NEXT: movdqa %xmm0, %xmm3
10329 ; SSE2-NEXT: pxor %xmm2, %xmm3
10332 ; SSE2-NEXT: pcmpgtd %xmm3, %xmm4
10334 ; SSE2-NEXT: pcmpeqd %xmm3, %xmm2
10337 ; SSE2-NEXT: pshufd {{.*#+}} xmm3 = xmm4[1,1,3,3]
10338 ; SSE2-NEXT: por %xmm2, %xmm3
10339 ; SSE2-NEXT: pand %xmm3, %xmm0
10340 ; SSE2-NEXT: pandn %xmm1, %xmm3
10341 ; SSE2-NEXT: por %xmm3, %xmm0
10348 ; SSE4-NEXT: movdqa %xmm2, %xmm3
10349 ; SSE4-NEXT: pxor %xmm0, %xmm3
10351 ; SSE4-NEXT: pcmpgtq %xmm3, %xmm0
10359 ; AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm3
10361 xmm3, %xmm2, %xmm2
10368 ; AVX2-NEXT: vpxor %xmm2, %xmm0, %xmm3
10370 ; AVX2-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2
10388 ; SSE2-NEXT: movdqa %xmm1, %xmm3
10389 ; SSE2-NEXT: pxor %xmm2, %xmm3
10392 ; SSE2-NEXT: pcmpgtd %xmm3, %xmm4
10394 ; SSE2-NEXT: pcmpeqd %xmm3, %xmm2
10397 ; SSE2-NEXT: pshufd {{.*#+}} xmm3 = xmm4[1,1,3,3]
10398 ; SSE2-NEXT: por %xmm2, %xmm3
10400 ; SSE2-NEXT: pxor %xmm3, %xmm2
10401 ; SSE2-NEXT: pandn %xmm0, %xmm3
10403 ; SSE2-NEXT: por %xmm3, %xmm2
10410 ; SSE4-NEXT: movdqa {{.*#+}} xmm3 = [9223372036854775808,9223372036854775808]
10412 ; SSE4-NEXT: pxor %xmm3, %xmm0
10413 ; SSE4-NEXT: pxor %xmm2, %xmm3
10414 ; SSE4-NEXT: pcmpgtq %xmm0, %xmm3
10416 ; SSE4-NEXT: pxor %xmm3, %xmm0
10424 ; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm3
10426 ; AVX1-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2
10427 ; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3
10428 ; AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm2
10435 ; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm3
10437 ; AVX2-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2
10438 ; AVX2-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3
10439 ; AVX2-NEXT: vpxor %xmm3, %xmm2, %xmm2
10457 ; SSE2-NEXT: movdqa %xmm1, %xmm3
10458 ; SSE2-NEXT: pxor %xmm2, %xmm3
10461 ; SSE2-NEXT: pcmpgtd %xmm3, %xmm4
10463 ; SSE2-NEXT: pcmpeqd %xmm3, %xmm2
10466 ; SSE2-NEXT: pshufd {{.*#+}} xmm3 = xmm4[1,1,3,3]
10467 ; SSE2-NEXT: por %xmm2, %xmm3
10468 ; SSE2-NEXT: pand %xmm3, %xmm0
10469 ; SSE2-NEXT: pandn %xmm1, %xmm3
10470 ; SSE2-NEXT: por %xmm3, %xmm0
10477 ; SSE4-NEXT: movdqa %xmm1, %xmm3
10478 ; SSE4-NEXT: pxor %xmm0, %xmm3
10480 ; SSE4-NEXT: pcmpgtq %xmm3, %xmm0
10488 ; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm3
10490 ; AVX1-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2
10497 ; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm3
10499 ; AVX2-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2
10517 ; SSE2-NEXT: movdqa %xmm0, %xmm3
10518 ; SSE2-NEXT: pxor %xmm2, %xmm3
10521 ; SSE2-NEXT: pcmpgtd %xmm3, %xmm4
10523 ; SSE2-NEXT: pcmpeqd %xmm3, %xmm2
10526 ; SSE2-NEXT: pshufd {{.*#+}} xmm3 = xmm4[1,1,3,3]
10527 ; SSE2-NEXT: por %xmm2, %xmm3
10529 ; SSE2-NEXT: pxor %xmm3, %xmm2
10530 ; SSE2-NEXT: pandn %xmm0, %xmm3
10532 ; SSE2-NEXT: por %xmm3, %xmm2
10539 ; SSE4-NEXT: movdqa {{.*#+}} xmm3 = [9223372036854775808,9223372036854775808]
10540 ; SSE4-NEXT: pxor %xmm3, %xmm0
10541 ; SSE4-NEXT: pxor %xmm1, %xmm3
10542 ; SSE4-NEXT: pcmpgtq %xmm0, %xmm3
10544 ; SSE4-NEXT: pxor %xmm3, %xmm0
10552 ; AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm3
10554 ; AVX1-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2
10555 ; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3
10556 ; AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm2
10563 ; AVX2-NEXT: vpxor %xmm2, %xmm0, %xmm3
10565 ; AVX2-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2
10566 ; AVX2-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3
10567 ; AVX2-NEXT: vpxor %xmm3, %xmm2, %xmm2
10585 ; SSE2-NEXT: movdqa %xmm0, %xmm3
10586 ; SSE2-NEXT: pxor %xmm2, %xmm3
10589 ; SSE2-NEXT: pcmpgtd %xmm3, %xmm4
10591 ; SSE2-NEXT: pcmpeqd %xmm3, %xmm2
10592 ; SSE2-NEXT: pshufd {{.*#+}} xmm3 = xmm2[1,1,3,3]
10593 ; SSE2-NEXT: pand %xmm5, %xmm3
10595 ; SSE2-NEXT: por %xmm3, %xmm2
10637 ; SSE2-NEXT: movdqa %xmm1, %xmm3
10638 ; SSE2-NEXT: pxor %xmm2, %xmm3
10641 ; SSE2-NEXT: pcmpgtd %xmm3, %xmm4
10643 ; SSE2-NEXT: pcmpeqd %xmm3, %xmm2
10646 ; SSE2-NEXT: pshufd {{.*#+}} xmm3 = xmm4[1,1,3,3]
10647 ; SSE2-NEXT: por %xmm2, %xmm3
10649 ; SSE2-NEXT: pxor %xmm3, %xmm2
10650 ; SSE2-NEXT: pandn %xmm1, %xmm3
10652 ; SSE2-NEXT: por %xmm3, %xmm2
10660 ; SSE4-NEXT: pcmpeqd %xmm3, %xmm3
10661 ; SSE4-NEXT: pxor %xmm3, %xmm0
10669 ; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3
10670 ; AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm2
10677 ; AVX2-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3
10678 ; AVX2-NEXT: vpxor %xmm3, %xmm2, %xmm2
10696 ; SSE2-NEXT: movdqa %xmm1, %xmm3
10697 ; SSE2-NEXT: pxor %xmm2, %xmm3
10700 ; SSE2-NEXT: pcmpgtd %xmm3, %xmm4
10702 ; SSE2-NEXT: pcmpeqd %xmm3, %xmm2
10703 ; SSE2-NEXT: pshufd {{.*#+}} xmm3 = xmm2[1,1,3,3]
10704 ; SSE2-NEXT: pand %xmm5, %xmm3
10706 ; SSE2-NEXT: por %xmm3, %xmm2
10747 ; SSE2-NEXT: movdqa %xmm0, %xmm3
10748 ; SSE2-NEXT: pxor %xmm2, %xmm3
10751 ; SSE2-NEXT: pcmpgtd %xmm3, %xmm4
10753 ; SSE2-NEXT: pcmpeqd %xmm3, %xmm2
10756 ; SSE2-NEXT: pshufd {{.*#+}} xmm3 = xmm4[1,1,3,3]
10757 ; SSE2-NEXT: por %xmm2, %xmm3
10759 ; SSE2-NEXT: pxor %xmm3, %xmm2
10760 ; SSE2-NEXT: pandn %xmm1, %xmm3
10762 ; SSE2-NEXT: por %xmm3, %xmm2
10769 ; SSE4-NEXT: movdqa %xmm1, %xmm3
10770 ; SSE4-NEXT: pcmpgtq %xmm2, %xmm3
10772 ; SSE4-NEXT: pxor %xmm3, %xmm0
10780 ; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3
10781 ; AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm2
10788 ; AVX2-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3
10789 ; AVX2-NEXT: vpxor %xmm3, %xmm2, %xmm2
10807 ; SSE2-NEXT: movdqa %xmm0, %xmm3
10808 ; SSE2-NEXT: pxor %xmm2, %xmm3
10811 ; SSE2-NEXT: pcmpgtd %xmm3, %xmm4
10813 ; SSE2-NEXT: pcmpeqd %xmm3, %xmm2
10814 ; SSE2-NEXT: pshufd {{.*#+}} xmm3 = xmm2[1,1,3,3]
10815 ; SSE2-NEXT: pand %xmm5, %xmm3
10817 ; SSE2-NEXT: por %xmm3, %xmm2
10828 ; SSE4-NEXT: movdqa %xmm2, %xmm3
10829 ; SSE4-NEXT: pxor %xmm0, %xmm3
10831 ; SSE4-NEXT: pcmpgtq %xmm3, %xmm0
10839 ; AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm3
10841 ; AVX1-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2
10848 ; AVX2-NEXT: vpxor %xmm2, %xmm0, %xmm3
10850 ; AVX2-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2
10868 ; SSE2-NEXT: movdqa %xmm1, %xmm3
10869 ; SSE2-NEXT: pxor %xmm2, %xmm3
10872 ; SSE2-NEXT: pcmpgtd %xmm3, %xmm4
10874 ; SSE2-NEXT: pcmpeqd %xmm3, %xmm2
10877 ; SSE2-NEXT: pshufd {{.*#+}} xmm3 = xmm4[1,1,3,3]
10878 ; SSE2-NEXT: por %xmm2, %xmm3
10880 ; SSE2-NEXT: pxor %xmm3, %xmm2
10881 ; SSE2-NEXT: pandn %xmm1, %xmm3
10883 ; SSE2-NEXT: por %xmm3, %xmm2
10890 ; SSE4-NEXT: movdqa {{.*#+}} xmm3 = [9223372036854775808,9223372036854775808]
10892 ; SSE4-NEXT: pxor %xmm3, %xmm0
10893 ; SSE4-NEXT: pxor %xmm2, %xmm3
10894 ; SSE4-NEXT: pcmpgtq %xmm0, %xmm3
10896 ; SSE4-NEXT: pxor %xmm3, %xmm0
10904 ; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm3
10906 ; AVX1-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2
10907 ; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3
10908 ; AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm2
10915 ; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm3
10917 ; AVX2-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2
10918 ; AVX2-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3
10919 ; AVX2-NEXT: vpxor %xmm3, %xmm2, %xmm2
10937 ; SSE2-NEXT: movdqa %xmm1, %xmm3
10938 ; SSE2-NEXT: pxor %xmm2, %xmm3
10941 ; SSE2-NEXT: pcmpgtd %xmm3, %xmm4
10943 ; SSE2-NEXT: pcmpeqd %xmm3, %xmm2
10944 ; SSE2-NEXT: pshufd {{.*#+}} xmm3 = xmm2[1,1,3,3]
10945 ; SSE2-NEXT: pand %xmm5, %xmm3
10947 ; SSE2-NEXT: por %xmm3, %xmm2
10958 ; SSE4-NEXT: movdqa %xmm1, %xmm3
10959 ; SSE4-NEXT: pxor %xmm0, %xmm3
10961 ; SSE4-NEXT: pcmpgtq %xmm3, %xmm0
10969 ; AVX1-NEXT: vpxor %xmm2, %xmm1, %xmm3
10971 ; AVX1-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2
10978 ; AVX2-NEXT: vpxor %xmm2, %xmm1, %xmm3
10980 ; AVX2-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2
10998 ; SSE2-NEXT: movdqa %xmm0, %xmm3
10999 ; SSE2-NEXT: pxor %xmm2, %xmm3
11002 ; SSE2-NEXT: pcmpgtd %xmm3, %xmm4
11004 ; SSE2-NEXT: pcmpeqd %xmm3, %xmm2
11007 ; SSE2-NEXT: pshufd {{.*#+}} xmm3 = xmm4[1,1,3,3]
11008 ; SSE2-NEXT: por %xmm2, %xmm3
11010 ; SSE2-NEXT: pxor %xmm3, %xmm2
11011 ; SSE2-NEXT: pandn %xmm1, %xmm3
11013 ; SSE2-NEXT: por %xmm3, %xmm2
11020 ; SSE4-NEXT: movdqa {{.*#+}} xmm3 = [9223372036854775808,9223372036854775808]
11021 ; SSE4-NEXT: pxor %xmm3, %xmm0
11022 ; SSE4-NEXT: pxor %xmm1, %xmm3
11023 ; SSE4-NEXT: pcmpgtq %xmm0, %xmm3
11025 ; SSE4-NEXT: pxor %xmm3, %xmm0
11033 ; AVX1-NEXT: vpxor %xmm2, %xmm0, %xmm3
11035 ; AVX1-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2
11036 ; AVX1-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3
11037 ; AVX1-NEXT: vpxor %xmm3, %xmm2, %xmm2
11044 ; AVX2-NEXT: vpxor %xmm2, %xmm0, %xmm3
11046 ; AVX2-NEXT: vpcmpgtq %xmm3, %xmm2, %xmm2
11047 ; AVX2-NEXT: vpcmpeqd %xmm3, %xmm3, %xmm3
11048 ; AVX2-NEXT: vpxor %xmm3, %xmm2, %xmm2