Home | History | Annotate | Download | only in source

Lines Matching full:ymm0

333     vpermq      ymm0, ymm0, 0xd8
334 vpunpcklbw ymm0, ymm0, ymm0
335 vpermq ymm0, ymm0, 0xd8
336 vpunpckhwd ymm1, ymm0, ymm0
337 vpunpcklwd ymm0, ymm0, ymm0
338 vpor ymm0, ymm0, ymm5
340 vmovdqu [edx], ymm0
544 vmovdqu ymm0, [eax] // fetch 16 pixels of bgr565
545 vpand ymm1, ymm0, ymm3 // R in upper 5 bits
546 vpsllw ymm2, ymm0, 11 // B in upper 5 bits
551 vpand ymm0, ymm0, ymm4 // G in middle 6 bits
552 vpmulhuw ymm0, ymm0, ymm6 // << 5 * (256 + 4)
553 vpor ymm0, ymm0, ymm7 // AG
554 vpermq ymm0, ymm0, 0xd8 // mutate for unpack
556 vpunpckhbw ymm2, ymm1, ymm0
557 vpunpcklbw ymm1, ymm1, ymm0
593 vmovdqu ymm0, [eax] // fetch 16 pixels of 1555
594 vpsllw ymm1, ymm0, 1 // R in upper 5 bits
595 vpsllw ymm2, ymm0, 11 // B in upper 5 bits
601 vpsraw ymm2, ymm0, 8 // A
602 vpand ymm0, ymm0, ymm4 // G in middle 5 bits
603 vpmulhuw ymm0, ymm0, ymm6 // << 6 * (256 + 8)
605 vpor ymm0, ymm0, ymm2 // AG
606 vpermq ymm0, ymm0, 0xd8 // mutate for unpack
608 vpunpckhbw ymm2, ymm1, ymm0
609 vpunpcklbw ymm1, ymm1, ymm0
637 vmovdqu ymm0, [eax] // fetch 16 pixels of bgra4444
638 vpand ymm2, ymm0, ymm5 // mask high nibbles
639 vpand ymm0, ymm0, ymm4 // mask low nibbles
641 vpsllw ymm1, ymm0, 4
643 vpor ymm0, ymm0, ymm1
644 vpermq ymm0, ymm0, 0xd8 // mutate for unpack
646 vpunpckhbw ymm1, ymm0, ymm2
647 vpunpcklbw ymm0, ymm0, ymm2
648 vmovdqu [eax * 2 + edx], ymm0 // store 8 pixels of ARGB
929 vmovdqu ymm0, [eax] // fetch 8 pixels of argb
930 vpaddusb ymm0, ymm0, ymm6 // add dither
931 vpsrld ymm2, ymm0, 5 // G
932 vpsrld ymm1, ymm0, 3 // B
933 vpsrld ymm0, ymm0, 8 // R
936 vpand ymm0, ymm0, ymm5 // R
938 vpor ymm0, ymm0, ymm1 // BGR
939 vpackusdw ymm0, ymm0, ymm0
940 vpermq ymm0, ymm0, 0xd8
1038 vmovdqu ymm0, [eax] // fetch 8 pixels of argb
1039 vpsrld ymm2, ymm0, 5 // G
1040 vpsrld ymm1, ymm0, 3 // B
1041 vpsrld ymm0, ymm0, 8 // R
1044 vpand ymm0, ymm0, ymm5 // R
1046 vpor ymm0, ymm0, ymm1 // BGR
1047 vpackusdw ymm0, ymm0, ymm0
1048 vpermq ymm0, ymm0, 0xd8
1075 vmovdqu ymm0, [eax] // fetch 8 pixels of argb
1076 vpsrld ymm3, ymm0, 9 // R
1077 vpsrld ymm2, ymm0, 6 // G
1078 vpsrld ymm1, ymm0, 3 // B
1079 vpsrad ymm0, ymm0, 16 // A
1083 vpand ymm0, ymm0, ymm7 // A
1084 vpor ymm0, ymm0, ymm1 // BA
1086 vpor ymm0, ymm0, ymm2 // BGRA
1087 vpackssdw ymm0, ymm0, ymm0
1088 vpermq ymm0, ymm0, 0xd8
1112 vmovdqu ymm0, [eax] // fetch 8 pixels of argb
1113 vpand ymm1, ymm0, ymm4 // high nibble
1114 vpand ymm0, ymm0, ymm3 // low nibble
1116 vpsrld ymm0, ymm0, 4
1117 vpor ymm0, ymm0, ymm1
1118 vpackuswb ymm0, ymm0, ymm0
1119 vpermq ymm0, ymm0, 0xd8
1219 vmovdqu ymm0, [eax]
1223 vpmaddubsw ymm0, ymm0, ymm4
1228 vphaddw ymm0, ymm0, ymm1 // mutates.
1230 vpsrlw ymm0, ymm0, 7
1232 vpackuswb ymm0, ymm0, ymm2 // mutates.
1233 vpermd ymm0, ymm6, ymm0 // For vphaddw + vpackuswb mutation.
1234 vpaddb ymm0, ymm0, ymm5 // add 16 for Y
1235 vmovdqu [edx], ymm0
1258 vmovdqu ymm0, [eax]
1262 vpmaddubsw ymm0, ymm0, ymm4
1267 vphaddw ymm0, ymm0, ymm1 // mutates.
1269 vpaddw ymm0, ymm0, ymm5 // Add .5 for rounding.
1271 vpsrlw ymm0, ymm0, 7
1273 vpackuswb ymm0, ymm0, ymm2 // mutates.
1274 vpermd ymm0, ymm6, ymm0 // For vphaddw + vpackuswb mutation.
1275 vmovdqu [edx], ymm0
1545 vmovdqu ymm0, [eax]
1549 vpavgb ymm0, ymm0, [eax + esi]
1554 vshufps ymm4, ymm0, ymm1, 0x88
1555 vshufps ymm0, ymm0, ymm1, 0xdd
1556 vpavgb ymm0, ymm0, ymm4 // mutated by vshufps
1564 vpmaddubsw ymm1, ymm0, ymm7 // U
1566 vpmaddubsw ymm0, ymm0, ymm6 // V
1569 vphaddw ymm0, ymm0, ymm2
1571 vpsraw ymm0, ymm0, 8
1572 vpacksswb ymm0, ymm1, ymm0 // mutates
1573 vpermq ymm0, ymm0, 0xd8 // For vpacksswb
1574 vpshufb ymm0, ymm0, ymmword ptr kShufARGBToUV_AVX // for vshufps/vphaddw
1575 vpaddb ymm0, ymm0, ymm5 // -> unsigned
1578 vextractf128 [edx], ymm0, 0 // U
1579 vextractf128 [edx + edi], ymm0, 1 // V
1611 vmovdqu ymm0, [eax]
1615 vpavgb ymm0, ymm0, [eax + esi]
1620 vshufps ymm4, ymm0, ymm1, 0x88
1621 vshufps ymm0, ymm0, ymm1, 0xdd
1622 vpavgb ymm0, ymm0, ymm4 // mutated by vshufps
1630 vpmaddubsw ymm1, ymm0, ymm7 // U
1632 vpmaddubsw ymm0, ymm0, ymm6 // V
1635 vphaddw ymm0, ymm0, ymm2
1637 vpaddw ymm0, ymm0, ymm5
1639 vpsraw ymm0, ymm0, 8
1640 vpacksswb ymm0, ymm1, ymm0 // mutates
1641 vpermq ymm0, ymm0, 0xd8 // For vpacksswb
1642 vpshufb ymm0, ymm0, ymmword ptr kShufARGBToUV_AVX // for vshufps/vphaddw
1645 vextractf128 [edx], ymm0, 0 // U
1646 vextractf128 [edx + edi], ymm0, 1 // V
1932 __asm vpermq ymm0, ymm0, 0xd8 \
1934 __asm vpunpcklbw ymm0, ymm0, ymm1 /* UV */ \
1946 __asm vpunpcklbw ymm0, ymm0, ymm1 /* UV */ \
1947 __asm vpermq ymm0, ymm0, 0xd8 \
1948 __asm vpunpcklwd ymm0, ymm0, ymm0 /* UVUV (upsample) */ \
1960 __asm vpunpcklbw ymm0, ymm0, ymm1 /* UV */ \
1961 __asm vpermq ymm0, ymm0, 0xd8 \
1962 __asm vpunpcklwd ymm0, ymm0, ymm0 /* UVUV (upsample) */ \
1977 __asm vpunpcklbw ymm0, ymm0
1978 __asm vpunpcklwd ymm0, ymm0, ymm0 /* UVUV (upsample) */ \
1979 __asm vpermq ymm0, ymm0, 0xd8 \
1980 __asm vpunpckldq ymm0, ymm0, ymm0 /* UVUVUVUV (upsample) */ \
1991 __asm vpermq ymm0, ymm0, 0xd8 \
1992 __asm vpunpcklwd ymm0, ymm0, ymm0 /* UVUV (upsample) */ \
2003 __asm vpermq ymm0, ymm0, 0xd8 \
2004 __asm vpshufb ymm0, ymm0, ymmword ptr kShuffleNV21 \
2015 __asm vmovdqu ymm0, [eax] /* UV */ \
2016 __asm vpshufb ymm0, ymm0, ymmword ptr kShuffleYUY2UV \
2024 __asm vmovdqu ymm0, [eax] /* UV */ \
2025 __asm vpshufb ymm0, ymm0, ymmword ptr kShuffleUYVYUV \
2031 __asm vpmaddubsw ymm2, ymm0, ymmword ptr [YuvConstants + KUVTOR] /* R UV */\
2032 __asm vpmaddubsw ymm1, ymm0, ymmword ptr [YuvConstants + KUVTOG] /* G UV */\
2033 __asm vpmaddubsw ymm0, ymm0, ymmword ptr [YuvConstants + KUVTOB] /* B UV */\
2039 __asm vpsubw ymm0, ymm3, ymm0 \
2042 __asm vpaddsw ymm0, ymm0, ymm4 /* B += Y */ \
2045 __asm vpsraw ymm0, ymm0, 6 \
2048 __asm vpackuswb ymm0, ymm0, ymm0 /* B */ \
2055 __asm vpunpcklbw ymm0, ymm0, ymm1 /* BG */ \
2056 __asm vpermq ymm0, ymm0, 0xd8 \
2059 __asm vpunpcklwd ymm1, ymm0, ymm2 /* BGRA first 8 pixels */ \
2060 __asm vpunpckhwd ymm0, ymm0, ymm2 /* BGRA next 8 pixels */ \
2062 __asm vmovdqu 32[edx], ymm0 \
2070 __asm vpunpcklbw ymm2, ymm5, ymm0 /* AB */ \
2072 __asm vpunpcklwd ymm0, ymm2, ymm1 /* ABGR first 8 pixels */ \
2074 __asm vmovdqu [edx], ymm0 \
3089 vpermq ymm0, ymm0, 0xd8 // vpunpcklbw mutates
3090 vpunpcklbw ymm0, ymm0, ymm0 // Y.Y
3091 vpmulhuw ymm0, ymm0, ymm2
3092 vpsubusw ymm0, ymm0, ymm3
3093 vpsrlw ymm0, ymm0, 6
3094 vpackuswb ymm0, ymm0, ymm0 // G. still mutated: 3120
3098 vpunpcklbw ymm1, ymm0, ymm0 // GG - mutates
3100 vpunpcklwd ymm0, ymm1, ymm1 // GGGG first 8 pixels
3102 vpor ymm0, ymm0, ymm4
3104 vmovdqu [edx], ymm0
3152 vmovdqu ymm0, [eax - 32 + ecx]
3153 vpshufb ymm0, ymm0, ymm5
3154 vpermq ymm0, ymm0, 0x4e // swap high and low halfs
3155 vmovdqu [edx], ymm0
3237 vpermd ymm0, ymm5, [eax - 32 + ecx * 4] // permute dword order
3238 vmovdqu [edx], ymm0
3302 vmovdqu ymm0, [eax]
3305 vpsrlw ymm2, ymm0, 8 // odd bytes
3307 vpand ymm0, ymm0, ymm5 // even bytes
3309 vpackuswb ymm0, ymm0, ymm1
3311 vpermq ymm0, ymm0, 0xd8
3313 vmovdqu [edx], ymm0
3370 vmovdqu ymm0, [eax] // read 32 U's
3373 vpunpcklbw ymm2, ymm0, ymm1 // low 16 UV pairs. mutated qqword 0,2
3374 vpunpckhbw ymm0, ymm0, ymm1 // high 16 UV pairs. mutated qqword 1,3
3376 vextractf128 [edi + 16], ymm0, 0 // bytes 16..31
3378 vextractf128 [edi + 48], ymm0, 1 // bytes 47..63
3438 vmovdqu ymm0, [eax]
3441 vmovdqu [edx], ymm0
3513 vpcmpeqb ymm0, ymm0, ymm0
3514 vpsrld ymm0, ymm0, 8 // generate mask 0x00ffffff
3520 vpblendvb ymm1, ymm1, [edx], ymm0
3521 vpblendvb ymm2, ymm2, [edx + 32], ymm0
3607 vpcmpeqb ymm0, ymm0, ymm0
3608 vpsrld ymm0, ymm0, 8 // generate mask 0x00ffffff
3616 vpblendvb ymm1, ymm1, [edx], ymm0
3617 vpblendvb ymm2, ymm2, [edx + 32], ymm0
3689 vmovdqu ymm0, [eax]
3692 vpand ymm0, ymm0, ymm5 // even bytes are Y
3694 vpackuswb ymm0, ymm0, ymm1 // mutates.
3695 vpermq ymm0, ymm0, 0xd8
3696 vmovdqu [edx], ymm0
3721 vmovdqu ymm0, [eax]
3723 vpavgb ymm0, ymm0, [eax + esi]
3726 vpsrlw ymm0, ymm0, 8 // YUYV -> UVUV
3728 vpackuswb ymm0, ymm0, ymm1 // mutates.
3729 vpermq ymm0, ymm0, 0xd8
3730 vpand ymm1, ymm0, ymm5 // U
3731 vpsrlw ymm0, ymm0, 8 // V
3733 vpackuswb ymm0, ymm0, ymm0 // mutates.
3735 vpermq ymm0, ymm0, 0xd8
3737 vextractf128 [edx + edi], ymm0, 0 // V
3763 vmovdqu ymm0, [eax]
3766 vpsrlw ymm0, ymm0, 8 // YUYV -> UVUV
3768 vpackuswb ymm0, ymm0, ymm1 // mutates.
3769 vpermq ymm0, ymm0, 0xd8
3770 vpand ymm1, ymm0, ymm5 // U
3771 vpsrlw ymm0, ymm0, 8 // V
3773 vpackuswb ymm0, ymm0, ymm0 // mutates.
3775 vpermq ymm0, ymm0, 0xd8
3777 vextractf128 [edx + edi], ymm0, 0 // V
3797 vmovdqu ymm0, [eax]
3800 vpsrlw ymm0, ymm0, 8 // odd bytes are Y
3802 vpackuswb ymm0, ymm0, ymm1 // mutates.
3803 vpermq ymm0, ymm0, 0xd8
3804 vmovdqu [edx], ymm0
3829 vmovdqu ymm0, [eax]
3831 vpavgb ymm0, ymm0, [eax + esi]
3834 vpand ymm0, ymm0, ymm5 // UYVY -> UVUV
3836 vpackuswb ymm0, ymm0, ymm1 // mutates.
3837 vpermq ymm0, ymm0, 0xd8
3838 vpand ymm1, ymm0, ymm5 // U
3839 vpsrlw ymm0, ymm0, 8 // V
3841 vpackuswb ymm0, ymm0, ymm0 // mutates.
3843 vpermq ymm0, ymm0, 0xd8
3845 vextractf128 [edx + edi], ymm0, 0 // V
3871 vmovdqu ymm0, [eax]
3874 vpand ymm0, ymm0, ymm5 // UYVY -> UVUV
3876 vpackuswb ymm0, ymm0, ymm1 // mutates.
3877 vpermq ymm0, ymm0, 0xd8
3878 vpand ymm1, ymm0, ymm5 // U
3879 vpsrlw ymm0, ymm0, 8 // V
3881 vpackuswb ymm0, ymm0, ymm0 // mutates.
3883 vpermq ymm0, ymm0, 0xd8
3885 vextractf128 [edx + edi], ymm0, 0 // V
4191 vmovdqu ymm0, [esi] // alpha
4192 vpunpckhbw ymm3, ymm0, ymm0 // 8..15, 24..31
4193 vpunpcklbw ymm0, ymm0, ymm0 // 0..7, 16..23
4195 vpxor ymm0, ymm0, ymm5 // a, 255-a
4203 vpmaddubsw ymm0, ymm0, ymm1
4205 vpaddw ymm0, ymm0, ymm7 // unbias result - 32768 and round.
4207 vpsrlw ymm0, ymm0, 8
4208 vpackuswb ymm0, ymm0, ymm3
4209 vmovdqu [edi + esi], ymm0
4377 vpunpcklbw ymm0, ymm6, ymm6 // low 4 pixels. mutated.
4379 vpshufb ymm2, ymm0, ymm4 // low 4 alphas
4381 vpmulhuw ymm0, ymm0, ymm2 // rgb * a
4384 vpsrlw ymm0, ymm0, 8
4386 vpackuswb ymm0, ymm0, ymm1 // unmutated.
4387 vpor ymm0, ymm0, ymm6 // copy original alpha
4388 vmovdqu [eax + edx], ymm0
4472 vpunpcklbw ymm0, ymm6, ymm6 // low 4 pixels. mutated.
4479 vpmulhuw ymm0, ymm0, ymm2 // rgb * ia
4481 vpackuswb ymm0, ymm0, ymm1 // unmutated.
4482 vmovdqu [eax + edx], ymm0
4535 vpunpcklbw ymm0, ymm6, ymm6 // low 4 pixels. mutated.
4541 vpmulhuw ymm0, ymm0, ymm2 // rgb * ia
4543 vpackuswb ymm0, ymm0, ymm1 // unmutated.
4544 vmovdqu [eax + edx], ymm0
4949 vpunpcklbw ymm0, ymm1, ymm1 // low 4
4953 vpmulhuw ymm0, ymm0, ymm2 // src_argb0 * src_argb1 low 4
4955 vpackuswb ymm0, ymm0, ymm1
4956 vmovdqu [edx], ymm0
4981 vmovdqu ymm0, [eax] // read 8 pixels from src_argb0
4983 vpaddusb ymm0, ymm0, [esi] // add 8 pixels from src_argb1
4985 vmovdqu [edx], ymm0
5010 vmovdqu ymm0, [eax] // read 8 pixels from src_argb0
5012 vpsubusb ymm0, ymm0, [esi] // src_argb0 - src_argb1
5014 vmovdqu [edx], ymm0
5625 vmovdqu ymm0, [esi]
5627 vpunpckhbw ymm1, ymm0, ymm2 // mutates
5628 vpunpcklbw ymm0, ymm0, ymm2
5630 vpsubb ymm0, ymm0, ymm4
5632 vpmaddubsw ymm0, ymm5, ymm0
5634 vpaddw ymm0, ymm0, ymm4
5636 vpsrlw ymm0, ymm0, 8
5637 vpackuswb ymm0, ymm0, ymm1 // unmutates
5638 vmovdqu [esi + edi], ymm0
5646 vmovdqu ymm0, [esi]
5647 vpavgb ymm0, ymm0, [esi + edx]
5648 vmovdqu [esi + edi], ymm0
5787 vmovdqu ymm0, [eax]
5790 vpshufb ymm0, ymm0, ymm5
5792 vmovdqu [edx], ymm0
6076 vpmovzxbd ymm0, qword ptr [eax] // 2 BGRA pixels
6078 vcvtdq2ps ymm0, ymm0 // X 8 floats
6079 vmulps ymm2, ymm0, ymm0 // X * X
6080 vmulps ymm3, ymm0, ymm7 // C3 * X
6081 vfmadd132ps ymm0, ymm4, ymm5 // result = C0 + C1 * X
6082 vfmadd231ps ymm0, ymm2, ymm6 // result += C2 * X * X
6083 vfmadd231ps ymm0, ymm2, ymm3 // result += C3 * X * X * X
6084 vcvttps2dq ymm0, ymm0
6085 vpackusdw ymm0, ymm0, ymm0 // b0g0r0a0_00000000_b0g0r0a0_00000000
6086 vpermq ymm0, ymm0, 0xd8 // b0g0r0a0_b0g0r0a0_00000000_00000000