Lines Matching full:xmm12
3346 ; SSE2-NEXT: movdqa %xmm8, %xmm12
3347 ; SSE2-NEXT: pcmpgtb %xmm7, %xmm12
3349 ; SSE2-NEXT: movdqa %xmm12, %xmm3
3371 ; SSE2-NEXT: pandn %xmm8, %xmm12
3373 ; SSE2-NEXT: por %xmm12, %xmm3
3488 ; SSE2-NEXT: movdqa %xmm7, %xmm12
3489 ; SSE2-NEXT: pcmpgtb %xmm8, %xmm12
3491 ; SSE2-NEXT: movdqa %xmm12, %xmm3
3513 ; SSE2-NEXT: pandn %xmm8, %xmm12
3515 ; SSE2-NEXT: por %xmm12, %xmm3
3885 ; SSE2-NEXT: movdqa %xmm5, %xmm12
3886 ; SSE2-NEXT: pxor %xmm10, %xmm12
3887 ; SSE2-NEXT: pcmpgtw %xmm11, %xmm12
3895 ; SSE2-NEXT: pand %xmm12, %xmm1
3896 ; SSE2-NEXT: pandn %xmm5, %xmm12
3897 ; SSE2-NEXT: por %xmm12, %xmm1
3951 ; SSE2-NEXT: pxor %xmm12, %xmm12
3952 ; SSE2-NEXT: pcmpeqw %xmm12, %xmm3
3954 ; SSE2-NEXT: pcmpeqw %xmm12, %xmm2
3956 ; SSE2-NEXT: pcmpeqw %xmm12, %xmm1
3959 ; SSE2-NEXT: pcmpeqw %xmm12, %xmm11
4027 ; SSE2-NEXT: movdqa %xmm5, %xmm12
4028 ; SSE2-NEXT: pxor %xmm11, %xmm12
4031 ; SSE2-NEXT: pcmpgtw %xmm12, %xmm10
4032 ; SSE2-NEXT: movdqa %xmm4, %xmm12
4033 ; SSE2-NEXT: pxor %xmm11, %xmm12
4035 ; SSE2-NEXT: pcmpgtw %xmm12, %xmm11
4104 ; SSE2-NEXT: movdqa %xmm4, %xmm12
4105 ; SSE2-NEXT: psubusw %xmm0, %xmm12
4106 ; SSE2-NEXT: pcmpeqw %xmm9, %xmm12
4107 ; SSE2-NEXT: pand %xmm12, %xmm0
4108 ; SSE2-NEXT: pandn %xmm4, %xmm12
4109 ; SSE2-NEXT: por %xmm12, %xmm0
4227 ; SSE2-NEXT: movdqa %xmm8, %xmm12
4228 ; SSE2-NEXT: pcmpgtd %xmm7, %xmm12
4230 ; SSE2-NEXT: movdqa %xmm12, %xmm3
4252 ; SSE2-NEXT: pandn %xmm8, %xmm12
4254 ; SSE2-NEXT: por %xmm12, %xmm3
4369 ; SSE2-NEXT: movdqa %xmm7, %xmm12
4370 ; SSE2-NEXT: pcmpgtd %xmm8, %xmm12
4372 ; SSE2-NEXT: movdqa %xmm12, %xmm3
4394 ; SSE2-NEXT: pandn %xmm8, %xmm12
4396 ; SSE2-NEXT: por %xmm12, %xmm3
4454 ; SSE2-NEXT: movdqa %xmm5, %xmm12
4455 ; SSE2-NEXT: pxor %xmm10, %xmm12
4456 ; SSE2-NEXT: pcmpgtd %xmm11, %xmm12
4464 ; SSE2-NEXT: pand %xmm12, %xmm1
4465 ; SSE2-NEXT: pandn %xmm5, %xmm12
4466 ; SSE2-NEXT: por %xmm12, %xmm1
4520 ; SSE2-NEXT: movdqa %xmm3, %xmm12
4521 ; SSE2-NEXT: pxor %xmm14, %xmm12
4522 ; SSE2-NEXT: pcmpgtd %xmm0, %xmm12
4524 ; SSE2-NEXT: movdqa %xmm12, %xmm8
4554 ; SSE2-NEXT: pandn %xmm3, %xmm12
4556 ; SSE2-NEXT: por %xmm12, %xmm8
4614 ; SSE2-NEXT: movdqa %xmm5, %xmm12
4615 ; SSE2-NEXT: pxor %xmm11, %xmm12
4618 ; SSE2-NEXT: pcmpgtd %xmm12, %xmm10
4619 ; SSE2-NEXT: movdqa %xmm4, %xmm12
4620 ; SSE2-NEXT: pxor %xmm11, %xmm12
4622 ; SSE2-NEXT: pcmpgtd %xmm12, %xmm11
4685 ; SSE2-NEXT: movdqa %xmm7, %xmm12
4686 ; SSE2-NEXT: pxor %xmm14, %xmm12
4687 ; SSE2-NEXT: pcmpgtd %xmm0, %xmm12
4689 ; SSE2-NEXT: movdqa %xmm12, %xmm8
4719 ; SSE2-NEXT: pandn %xmm3, %xmm12
4721 ; SSE2-NEXT: por %xmm12, %xmm8
4775 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm11[0,0,2,2]
4778 ; SSE2-NEXT: pand %xmm12, %xmm10
4785 ; SSE2-NEXT: movdqa %xmm11, %xmm12
4786 ; SSE2-NEXT: pcmpgtd %xmm10, %xmm12
4787 ; SSE2-NEXT: pshufd {{.*#+}} xmm13 = xmm12[0,0,2,2]
4791 ; SSE2-NEXT: pshufd {{.*#+}} xmm10 = xmm12[1,1,3,3]
4795 ; SSE2-NEXT: movdqa %xmm5, %xmm12
4796 ; SSE2-NEXT: pxor %xmm9, %xmm12
4797 ; SSE2-NEXT: movdqa %xmm12, %xmm13
4800 ; SSE2-NEXT: pcmpeqd %xmm11, %xmm12
4801 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm12[1,1,3,3]
4803 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm13[1,1,3,3]
4804 ; SSE2-NEXT: por %xmm11, %xmm12
4819 ; SSE2-NEXT: pand %xmm12, %xmm1
4820 ; SSE2-NEXT: pandn %xmm5, %xmm12
4821 ; SSE2-NEXT: por %xmm12, %xmm1
4903 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm11[0,0,2,2]
4906 ; SSE2-NEXT: pand %xmm12, %xmm0
4907 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm11[1,1,3,3]
4908 ; SSE2-NEXT: por %xmm0, %xmm12
4910 ; SSE2-NEXT: movdqa %xmm12, %xmm8
4961 ; SSE2-NEXT: pandn %xmm7, %xmm12
4963 ; SSE2-NEXT: por %xmm12, %xmm8
4975 ; SSE4-NEXT: pcmpeqd %xmm12, %xmm12
4976 ; SSE4-NEXT: pxor %xmm12, %xmm9
4979 ; SSE4-NEXT: pxor %xmm12, %xmm10
4982 ; SSE4-NEXT: pxor %xmm12, %xmm11
4984 ; SSE4-NEXT: pxor %xmm12, %xmm0
5050 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm11[0,0,2,2]
5053 ; SSE2-NEXT: pand %xmm12, %xmm10
5060 ; SSE2-NEXT: movdqa %xmm11, %xmm12
5061 ; SSE2-NEXT: pcmpgtd %xmm10, %xmm12
5062 ; SSE2-NEXT: pshufd {{.*#+}} xmm13 = xmm12[0,0,2,2]
5066 ; SSE2-NEXT: pshufd {{.*#+}} xmm10 = xmm12[1,1,3,3]
5070 ; SSE2-NEXT: movdqa %xmm1, %xmm12
5071 ; SSE2-NEXT: pxor %xmm9, %xmm12
5072 ; SSE2-NEXT: movdqa %xmm12, %xmm13
5075 ; SSE2-NEXT: pcmpeqd %xmm11, %xmm12
5076 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm12[1,1,3,3]
5078 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm13[1,1,3,3]
5079 ; SSE2-NEXT: por %xmm11, %xmm12
5094 ; SSE2-NEXT: pand %xmm12, %xmm1
5095 ; SSE2-NEXT: pandn %xmm5, %xmm12
5096 ; SSE2-NEXT: por %xmm12, %xmm1
5178 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm11[0,0,2,2]
5181 ; SSE2-NEXT: pand %xmm12, %xmm0
5182 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm11[1,1,3,3]
5183 ; SSE2-NEXT: por %xmm0, %xmm12
5185 ; SSE2-NEXT: movdqa %xmm12, %xmm8
5236 ; SSE2-NEXT: pandn %xmm7, %xmm12
5238 ; SSE2-NEXT: por %xmm12, %xmm8
5258 ; SSE4-NEXT: movdqa %xmm4, %xmm12
5259 ; SSE4-NEXT: pcmpgtq %xmm8, %xmm12
5260 ; SSE4-NEXT: pxor %xmm12, %xmm0
5326 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm11[0,0,2,2]
5329 ; SSE2-NEXT: pand %xmm12, %xmm10
5336 ; SSE2-NEXT: movdqa %xmm11, %xmm12
5337 ; SSE2-NEXT: pcmpgtd %xmm10, %xmm12
5338 ; SSE2-NEXT: pshufd {{.*#+}} xmm13 = xmm12[0,0,2,2]
5342 ; SSE2-NEXT: pshufd {{.*#+}} xmm10 = xmm12[1,1,3,3]
5346 ; SSE2-NEXT: movdqa %xmm5, %xmm12
5347 ; SSE2-NEXT: pxor %xmm9, %xmm12
5348 ; SSE2-NEXT: movdqa %xmm12, %xmm13
5351 ; SSE2-NEXT: pcmpeqd %xmm11, %xmm12
5352 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm12[1,1,3,3]
5354 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm13[1,1,3,3]
5355 ; SSE2-NEXT: por %xmm11, %xmm12
5370 ; SSE2-NEXT: pand %xmm12, %xmm1
5371 ; SSE2-NEXT: pandn %xmm5, %xmm12
5372 ; SSE2-NEXT: por %xmm12, %xmm1
5395 ; SSE4-NEXT: movdqa %xmm1, %xmm12
5396 ; SSE4-NEXT: pxor %xmm0, %xmm12
5399 ; SSE4-NEXT: pcmpgtq %xmm12, %xmm11
5400 ; SSE4-NEXT: movdqa %xmm8, %xmm12
5401 ; SSE4-NEXT: pxor %xmm0, %xmm12
5403 ; SSE4-NEXT: pcmpgtq %xmm12, %xmm0
5480 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm11[0,0,2,2]
5483 ; SSE2-NEXT: pand %xmm12, %xmm0
5484 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm11[1,1,3,3]
5485 ; SSE2-NEXT: por %xmm0, %xmm12
5487 ; SSE2-NEXT: movdqa %xmm12, %xmm8
5538 ; SSE2-NEXT: pandn %xmm7, %xmm12
5540 ; SSE2-NEXT: por %xmm12, %xmm8
5556 ; SSE4-NEXT: pcmpeqd %xmm12, %xmm12
5557 ; SSE4-NEXT: pxor %xmm12, %xmm8
5563 ; SSE4-NEXT: pxor %xmm12, %xmm10
5569 ; SSE4-NEXT: pxor %xmm12, %xmm11
5574 ; SSE4-NEXT: pxor %xmm12, %xmm0
5654 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm11[0,0,2,2]
5657 ; SSE2-NEXT: pand %xmm12, %xmm10
5664 ; SSE2-NEXT: movdqa %xmm11, %xmm12
5665 ; SSE2-NEXT: pcmpgtd %xmm10, %xmm12
5666 ; SSE2-NEXT: pshufd {{.*#+}} xmm13 = xmm12[0,0,2,2]
5670 ; SSE2-NEXT: pshufd {{.*#+}} xmm10 = xmm12[1,1,3,3]
5674 ; SSE2-NEXT: movdqa %xmm1, %xmm12
5675 ; SSE2-NEXT: pxor %xmm9, %xmm12
5676 ; SSE2-NEXT: movdqa %xmm12, %xmm13
5679 ; SSE2-NEXT: pcmpeqd %xmm11, %xmm12
5680 ; SSE2-NEXT: pshufd {{.*#+}} xmm11 = xmm12[1,1,3,3]
5682 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm13[1,1,3,3]
5683 ; SSE2-NEXT: por %xmm11, %xmm12
5698 ; SSE2-NEXT: pand %xmm12, %xmm1
5699 ; SSE2-NEXT: pandn %xmm5, %xmm12
5700 ; SSE2-NEXT: por %xmm12, %xmm1
5723 ; SSE4-NEXT: movdqa %xmm5, %xmm12
5724 ; SSE4-NEXT: pxor %xmm0, %xmm12
5727 ; SSE4-NEXT: pcmpgtq %xmm12, %xmm11
5728 ; SSE4-NEXT: movdqa %xmm4, %xmm12
5729 ; SSE4-NEXT: pxor %xmm0, %xmm12
5731 ; SSE4-NEXT: pcmpgtq %xmm12, %xmm0
5809 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm11[0,0,2,2]
5812 ; SSE2-NEXT: pand %xmm12, %xmm0
5813 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm11[1,1,3,3]
5814 ; SSE2-NEXT: por %xmm0, %xmm12
5816 ; SSE2-NEXT: movdqa %xmm12, %xmm8
5867 ; SSE2-NEXT: pandn %xmm7, %xmm12
5869 ; SSE2-NEXT: por %xmm12, %xmm8
5885 ; SSE4-NEXT: pcmpeqd %xmm12, %xmm12
5886 ; SSE4-NEXT: pxor %xmm12, %xmm8
5892 ; SSE4-NEXT: pxor %xmm12, %xmm10
5898 ; SSE4-NEXT: pxor %xmm12, %xmm11
5903 ; SSE4-NEXT: pxor %xmm12, %xmm0
6044 ; SSE2-NEXT: movdqa %xmm3, %xmm12
6045 ; SSE2-NEXT: pcmpgtb %xmm7, %xmm12
6047 ; SSE2-NEXT: movdqa %xmm12, %xmm9
6069 ; SSE2-NEXT: pandn %xmm7, %xmm12
6071 ; SSE2-NEXT: por %xmm12, %xmm9
6186 ; SSE2-NEXT: movdqa %xmm7, %xmm12
6187 ; SSE2-NEXT: pcmpgtb %xmm3, %xmm12
6189 ; SSE2-NEXT: movdqa %xmm12, %xmm9
6211 ; SSE2-NEXT: pandn %xmm7, %xmm12
6213 ; SSE2-NEXT: por %xmm12, %xmm9
6583 ; SSE2-NEXT: movdqa %xmm1, %xmm12
6584 ; SSE2-NEXT: pxor %xmm0, %xmm12
6587 ; SSE2-NEXT: pcmpgtw %xmm12, %xmm10
6588 ; SSE2-NEXT: movdqa %xmm11, %xmm12
6589 ; SSE2-NEXT: pxor %xmm0, %xmm12
6591 ; SSE2-NEXT: pcmpgtw %xmm12, %xmm0
6654 ; SSE2-NEXT: pxor %xmm12, %xmm12
6655 ; SSE2-NEXT: pcmpeqw %xmm12, %xmm3
6657 ; SSE2-NEXT: pcmpeqw %xmm12, %xmm2
6659 ; SSE2-NEXT: pcmpeqw %xmm12, %xmm1
6662 ; SSE2-NEXT: pcmpeqw %xmm12, %xmm11
6731 ; SSE2-NEXT: movdqa %xmm5, %xmm12
6732 ; SSE2-NEXT: pxor %xmm0, %xmm12
6735 ; SSE2-NEXT: pcmpgtw %xmm12, %xmm10
6736 ; SSE2-NEXT: movdqa %xmm4, %xmm12
6737 ; SSE2-NEXT: pxor %xmm0, %xmm12
6739 ; SSE2-NEXT: pcmpgtw %xmm12, %xmm0
6803 ; SSE2-NEXT: pxor %xmm12, %xmm12
6804 ; SSE2-NEXT: pcmpeqw %xmm12, %xmm3
6807 ; SSE2-NEXT: pcmpeqw %xmm12, %xmm2
6810 ; SSE2-NEXT: pcmpeqw %xmm12, %xmm1
6813 ; SSE2-NEXT: pcmpeqw %xmm12, %xmm11
6938 ; SSE2-NEXT: movdqa %xmm3, %xmm12
6939 ; SSE2-NEXT: pcmpgtd %xmm7, %xmm12
6941 ; SSE2-NEXT: movdqa %xmm12, %xmm9
6963 ; SSE2-NEXT: pandn %xmm7, %xmm12
6965 ; SSE2-NEXT: por %xmm12, %xmm9
7080 ; SSE2-NEXT: movdqa %xmm7, %xmm12
7081 ; SSE2-NEXT: pcmpgtd %xmm3, %xmm12
7083 ; SSE2-NEXT: movdqa %xmm12, %xmm9
7105 ; SSE2-NEXT: pandn %xmm7, %xmm12
7107 ; SSE2-NEXT: por %xmm12, %xmm9
7165 ; SSE2-NEXT: movdqa %xmm1, %xmm12
7166 ; SSE2-NEXT: pxor %xmm0, %xmm12
7169 ; SSE2-NEXT: pcmpgtd %xmm12, %xmm10
7170 ; SSE2-NEXT: movdqa %xmm11, %xmm12
7171 ; SSE2-NEXT: pxor %xmm0, %xmm12
7173 ; SSE2-NEXT: pcmpgtd %xmm12, %xmm0
7236 ; SSE2-NEXT: movdqa %xmm3, %xmm12
7237 ; SSE2-NEXT: pxor %xmm14, %xmm12
7238 ; SSE2-NEXT: pcmpgtd %xmm0, %xmm12
7240 ; SSE2-NEXT: movdqa %xmm12, %xmm8
7270 ; SSE2-NEXT: pandn %xmm7, %xmm12
7272 ; SSE2-NEXT: por %xmm12, %xmm8
7331 ; SSE2-NEXT: movdqa %xmm5, %xmm12
7332 ; SSE2-NEXT: pxor %xmm0, %xmm12
7335 ; SSE2-NEXT: pcmpgtd %xmm12, %xmm10
7336 ; SSE2-NEXT: movdqa %xmm4, %xmm12
7337 ; SSE2-NEXT: pxor %xmm0, %xmm12
7339 ; SSE2-NEXT: pcmpgtd %xmm12, %xmm0
7402 ; SSE2-NEXT: movdqa %xmm7, %xmm12
7403 ; SSE2-NEXT: pxor %xmm14, %xmm12
7404 ; SSE2-NEXT: pcmpgtd %xmm0, %xmm12
7406 ; SSE2-NEXT: movdqa %xmm12, %xmm8
7436 ; SSE2-NEXT: pandn %xmm7, %xmm12
7438 ; SSE2-NEXT: por %xmm12, %xmm8
7494 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm10[0,0,2,2]
7497 ; SSE2-NEXT: pand %xmm12, %xmm9
7504 ; SSE2-NEXT: movdqa %xmm10, %xmm12
7505 ; SSE2-NEXT: pcmpgtd %xmm9, %xmm12
7506 ; SSE2-NEXT: pshufd {{.*#+}} xmm13 = xmm12[0,0,2,2]
7510 ; SSE2-NEXT: pshufd {{.*#+}} xmm9 = xmm12[1,1,3,3]
7514 ; SSE2-NEXT: movdqa %xmm5, %xmm12
7515 ; SSE2-NEXT: pxor %xmm11, %xmm12
7516 ; SSE2-NEXT: movdqa %xmm12, %xmm13
7519 ; SSE2-NEXT: pcmpeqd %xmm10, %xmm12
7520 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm12[1,1,3,3]
7521 ; SSE2-NEXT: pand %xmm14, %xmm12
7523 ; SSE2-NEXT: por %xmm12, %xmm10
7524 ; SSE2-NEXT: movdqa %xmm0, %xmm12
7525 ; SSE2-NEXT: pxor %xmm11, %xmm12
7528 ; SSE2-NEXT: pcmpgtd %xmm12, %xmm13
7530 ; SSE2-NEXT: pcmpeqd %xmm12, %xmm11
7531 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm11[1,1,3,3]
7532 ; SSE2-NEXT: pand %xmm14, %xmm12
7534 ; SSE2-NEXT: por %xmm12, %xmm11
7623 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm11[0,0,2,2]
7626 ; SSE2-NEXT: pand %xmm12, %xmm0
7627 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm11[1,1,3,3]
7628 ; SSE2-NEXT: por %xmm0, %xmm12
7630 ; SSE2-NEXT: movdqa %xmm12, %xmm8
7681 ; SSE2-NEXT: pandn -{{[0-9]+}}(%rsp), %xmm12 # 16-byte Folded Reload
7683 ; SSE2-NEXT: por %xmm12, %xmm8
7695 ; SSE4-NEXT: pcmpeqd %xmm12, %xmm12
7696 ; SSE4-NEXT: pxor %xmm12, %xmm9
7699 ; SSE4-NEXT: pxor %xmm12, %xmm10
7702 ; SSE4-NEXT: pxor %xmm12, %xmm11
7704 ; SSE4-NEXT: pxor %xmm12, %xmm0
7767 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm10[0,0,2,2]
7770 ; SSE2-NEXT: pand %xmm12, %xmm9
7777 ; SSE2-NEXT: movdqa %xmm10, %xmm12
7778 ; SSE2-NEXT: pcmpgtd %xmm9, %xmm12
7779 ; SSE2-NEXT: pshufd {{.*#+}} xmm13 = xmm12[0,0,2,2]
7783 ; SSE2-NEXT: pshufd {{.*#+}} xmm9 = xmm12[1,1,3,3]
7787 ; SSE2-NEXT: movdqa %xmm1, %xmm12
7788 ; SSE2-NEXT: pxor %xmm11, %xmm12
7789 ; SSE2-NEXT: movdqa %xmm12, %xmm13
7792 ; SSE2-NEXT: pcmpeqd %xmm10, %xmm12
7793 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm12[1,1,3,3]
7794 ; SSE2-NEXT: pand %xmm14, %xmm12
7796 ; SSE2-NEXT: por %xmm12, %xmm10
7797 ; SSE2-NEXT: movdqa %xmm4, %xmm12
7798 ; SSE2-NEXT: pxor %xmm11, %xmm12
7801 ; SSE2-NEXT: pcmpgtd %xmm12, %xmm13
7803 ; SSE2-NEXT: pcmpeqd %xmm12, %xmm11
7804 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm11[1,1,3,3]
7805 ; SSE2-NEXT: pand %xmm14, %xmm12
7807 ; SSE2-NEXT: por %xmm12, %xmm11
7896 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm11[0,0,2,2]
7899 ; SSE2-NEXT: pand %xmm12, %xmm0
7900 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm11[1,1,3,3]
7901 ; SSE2-NEXT: por %xmm0, %xmm12
7903 ; SSE2-NEXT: movdqa %xmm12, %xmm8
7954 ; SSE2-NEXT: pandn -{{[0-9]+}}(%rsp), %xmm12 # 16-byte Folded Reload
7956 ; SSE2-NEXT: por %xmm12, %xmm8
7976 ; SSE4-NEXT: movdqa %xmm4, %xmm12
7977 ; SSE4-NEXT: pcmpgtq %xmm8, %xmm12
7978 ; SSE4-NEXT: pxor %xmm12, %xmm0
8041 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm10[0,0,2,2]
8044 ; SSE2-NEXT: pand %xmm12, %xmm9
8051 ; SSE2-NEXT: movdqa %xmm10, %xmm12
8052 ; SSE2-NEXT: pcmpgtd %xmm9, %xmm12
8053 ; SSE2-NEXT: pshufd {{.*#+}} xmm13 = xmm12[0,0,2,2]
8057 ; SSE2-NEXT: pshufd {{.*#+}} xmm9 = xmm12[1,1,3,3]
8061 ; SSE2-NEXT: movdqa %xmm5, %xmm12
8062 ; SSE2-NEXT: pxor %xmm11, %xmm12
8063 ; SSE2-NEXT: movdqa %xmm12, %xmm13
8066 ; SSE2-NEXT: pcmpeqd %xmm10, %xmm12
8067 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm12[1,1,3,3]
8068 ; SSE2-NEXT: pand %xmm14, %xmm12
8070 ; SSE2-NEXT: por %xmm12, %xmm10
8071 ; SSE2-NEXT: movdqa %xmm0, %xmm12
8072 ; SSE2-NEXT: pxor %xmm11, %xmm12
8075 ; SSE2-NEXT: pcmpgtd %xmm12, %xmm13
8077 ; SSE2-NEXT: pcmpeqd %xmm12, %xmm11
8078 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm11[1,1,3,3]
8079 xmm12
8081 ; SSE2-NEXT: por %xmm12, %xmm11
8114 ; SSE4-NEXT: movdqa %xmm1, %xmm12
8115 ; SSE4-NEXT: pxor %xmm0, %xmm12
8118 ; SSE4-NEXT: pcmpgtq %xmm12, %xmm11
8119 ; SSE4-NEXT: movdqa %xmm8, %xmm12
8120 ; SSE4-NEXT: pxor %xmm0, %xmm12
8122 ; SSE4-NEXT: pcmpgtq %xmm12, %xmm0
8196 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm11[0,0,2,2]
8199 ; SSE2-NEXT: pand %xmm12, %xmm0
8200 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm11[1,1,3,3]
8201 ; SSE2-NEXT: por %xmm0, %xmm12
8203 ; SSE2-NEXT: movdqa %xmm12, %xmm8
8254 ; SSE2-NEXT: pandn -{{[0-9]+}}(%rsp), %xmm12 # 16-byte Folded Reload
8256 ; SSE2-NEXT: por %xmm12, %xmm8
8272 ; SSE4-NEXT: pcmpeqd %xmm12, %xmm12
8273 ; SSE4-NEXT: pxor %xmm12, %xmm9
8279 ; SSE4-NEXT: pxor %xmm12, %xmm10
8285 ; SSE4-NEXT: pxor %xmm12, %xmm11
8290 ; SSE4-NEXT: pxor %xmm12, %xmm0
8367 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm10[0,0,2,2]
8370 ; SSE2-NEXT: pand %xmm12, %xmm9
8377 ; SSE2-NEXT: movdqa %xmm10, %xmm12
8378 ; SSE2-NEXT: pcmpgtd %xmm9, %xmm12
8379 ; SSE2-NEXT: pshufd {{.*#+}} xmm13 = xmm12[0,0,2,2]
8383 ; SSE2-NEXT: pshufd {{.*#+}} xmm9 = xmm12[1,1,3,3]
8387 ; SSE2-NEXT: movdqa %xmm1, %xmm12
8388 ; SSE2-NEXT: pxor %xmm11, %xmm12
8389 ; SSE2-NEXT: movdqa %xmm12, %xmm13
8392 ; SSE2-NEXT: pcmpeqd %xmm10, %xmm12
8393 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm12[1,1,3,3]
8394 ; SSE2-NEXT: pand %xmm14, %xmm12
8396 ; SSE2-NEXT: por %xmm12, %xmm10
8397 ; SSE2-NEXT: movdqa %xmm4, %xmm12
8398 ; SSE2-NEXT: pxor %xmm11, %xmm12
8401 ; SSE2-NEXT: pcmpgtd %xmm12, %xmm13
8403 ; SSE2-NEXT: pcmpeqd %xmm12, %xmm11
8404 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm11[1,1,3,3]
8405 ; SSE2-NEXT: pand %xmm14, %xmm12
8407 ; SSE2-NEXT: por %xmm12, %xmm11
8440 ; SSE4-NEXT: movdqa %xmm5, %xmm12
8441 ; SSE4-NEXT: pxor %xmm0, %xmm12
8444 ; SSE4-NEXT: pcmpgtq %xmm12, %xmm11
8445 ; SSE4-NEXT: movdqa %xmm4, %xmm12
8446 ; SSE4-NEXT: pxor %xmm0, %xmm12
8448 ; SSE4-NEXT: pcmpgtq %xmm12, %xmm0
8523 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm11[0,0,2,2]
8526 ; SSE2-NEXT: pand %xmm12, %xmm0
8527 ; SSE2-NEXT: pshufd {{.*#+}} xmm12 = xmm11[1,1,3,3]
8528 ; SSE2-NEXT: por %xmm0, %xmm12
8530 ; SSE2-NEXT: movdqa %xmm12, %xmm8
8581 ; SSE2-NEXT: pandn -{{[0-9]+}}(%rsp), %xmm12 # 16-byte Folded Reload
8583 ; SSE2-NEXT: por %xmm12, %xmm8
8599 ; SSE4-NEXT: pcmpeqd %xmm12, %xmm12
8600 ; SSE4-NEXT: pxor %xmm12, %xmm9
8606 ; SSE4-NEXT: pxor %xmm12, %xmm10
8612 ; SSE4-NEXT: pxor %xmm12, %xmm11
8617 ; SSE4-NEXT: pxor %xmm12, %xmm0