Home | History | Annotate | Download | only in source

Lines Matching refs:ymm1

304     vpunpckhwd  ymm1, ymm0, ymm0
307 vpor ymm1, ymm1, ymm5
309 vmovdqu [edx + 32], ymm1
515 vpand ymm1, ymm0, ymm3 // R in upper 5 bits
517 vpmulhuw ymm1, ymm1, ymm5 // * (256 + 8)
519 vpsllw ymm1, ymm1, 8
520 vpor ymm1, ymm1, ymm2 // RB
525 vpermq ymm1, ymm1, 0xd8
526 vpunpckhbw ymm2, ymm1, ymm0
527 vpunpcklbw ymm1, ymm1, ymm0
528 vmovdqu [eax * 2 + edx], ymm1 // store 4 pixels of ARGB
564 vpsllw ymm1, ymm0, 1 // R in upper 5 bits
566 vpand ymm1, ymm1, ymm3
568 vpmulhuw ymm1, ymm1, ymm5 // * (256 + 8)
569 vpsllw ymm1, ymm1, 8
570 vpor ymm1, ymm1, ymm2 // RB
577 vpermq ymm1, ymm1, 0xd8
578 vpunpckhbw ymm2, ymm1, ymm0
579 vpunpcklbw ymm1, ymm1, ymm0
580 vmovdqu [eax * 2 + edx], ymm1 // store 8 pixels of ARGB
611 vpsllw ymm1, ymm0, 4
613 vpor ymm0, ymm0, ymm1
616 vpunpckhbw ymm1, ymm0, ymm2
619 vmovdqu [eax * 2 + edx + 32], ymm1 // store next 8 pixels of ARGB
907 vpsrld ymm1, ymm0, 3 // B
910 vpand ymm1, ymm1, ymm3 // B
912 vpor ymm1, ymm1, ymm2 // BG
913 ymm1 // BGR
1018 vpsrld ymm1, ymm0, 3 // B
1021 vpand ymm1, ymm1, ymm3 // B
1023 vpor ymm1, ymm1, ymm2 // BG
1024 vpor ymm0, ymm0, ymm1 // BGR
1057 vpsrld ymm1, ymm0, 3 // B
1061 vpand ymm1, ymm1, ymm4 // B
1063 vpor ymm0, ymm0, ymm1 // BA
1093 vpand ymm1, ymm0, ymm4 // high nibble
1095 vpsrld ymm1, ymm1, 8
1097 vpor ymm0, ymm0, ymm1
1201 vmovdqu ymm1, [eax + 32]
1205 vpmaddubsw ymm1, ymm1, ymm4
1209 vphaddw ymm0, ymm0, ymm1 // mutates.
1241 vmovdqu ymm1, [eax + 32]
1245 vpmaddubsw ymm1, ymm1, ymm4
1249 vphaddw ymm0, ymm0, ymm1 // mutates.
1537 vmovdqu ymm1, [eax + 32]
1541 vpavgb ymm1, ymm1, [eax + esi + 32]
1545 vshufps ymm4, ymm0, ymm1, 0x88
1546 vshufps ymm0, ymm0, ymm1, 0xdd
1555 vpmaddubsw ymm1, ymm0, ymm7 // U
1559 vphaddw ymm1, ymm1, ymm3 // mutates
1561 vpsraw ymm1, ymm1, 8
1563 vpacksswb ymm0, ymm1, ymm0 // mutates
1605 vmovdqu ymm1, [eax + 32]
1609 vpavgb ymm1, ymm1, [eax + esi + 32]
1613 vshufps ymm4, ymm0, ymm1, 0x88
1614 vshufps ymm0, ymm0, ymm1, 0xdd
1623 vpmaddubsw ymm1, ymm0, ymm7 // U
1627 vphaddw ymm1, ymm1, ymm3 // mutates
1629 vpaddw ymm1, ymm1, ymm5 // +.5 rounding -> unsigned
1631 vpsraw ymm1, ymm1, 8
1633 vpacksswb ymm0, ymm1, ymm0 // mutates
1934 __asm vpermq ymm1, ymm1, 0xd8 \
1935 __asm vpunpcklbw ymm0, ymm0, ymm1 /* UV */ \
1947 __asm vpunpcklbw ymm0, ymm0, ymm1 /* UV */ \
1961 __asm vpunpcklbw ymm0, ymm0, ymm1 /* UV */ \
2018 __asm vpmaddubsw ymm1, ymm0, ymmword ptr [YuvConstants + KUVTOG] /* G UV */\
2023 __asm vpsubw ymm1, ymm3, ymm1 \
2028 __asm vpaddsw ymm1, ymm1, ymm4 /* G += Y */ \
2031 __asm vpsraw ymm1, ymm1, 6 \
2034 __asm vpackuswb ymm1, ymm1, ymm1 /* G */ \
2041 __asm vpunpcklbw ymm0, ymm0, ymm1 /* BG */ \
2045 __asm vpunpcklwd ymm1, ymm0, ymm2 /* BGRA first 8 pixels */ \
2047 __asm vmovdqu 0[edx], ymm1 \
2054 __asm vpunpcklbw ymm1, ymm1, ymm2 /* GR */ \
2055 __asm vpermq ymm1, ymm1, 0xd8 \
2058 __asm vpunpcklwd ymm0, ymm2, ymm1 /* ABGR first 8 pixels */ \
2059 __asm vpunpckhwd ymm1, ymm2, ymm1 /* ABGR next 8 pixels */ \
2061 __asm vmovdqu [edx + 32], ymm1 \
2980 vpunpcklbw ymm1, ymm0, ymm0 // GG - mutates
2981 vpermq ymm1, ymm1, 0xd8
2982 vpunpcklwd ymm0, ymm1, ymm1 // GGGG first 8 pixels
2983 vpunpckhwd ymm1, ymm1, ymm1 // GGGG next 8 pixels
2985 vpor ymm1, ymm1, ymm4
2987 vmovdqu [edx + 32], ymm1
3186 vmovdqu ymm1, [eax + 32]
3189 vpsrlw ymm3, ymm1, 8
3191 vpand ymm1, ymm1, ymm5
3192 vpackuswb ymm0, ymm0, ymm1
3256 vmovdqu ymm1, [eax + edx] // and 32 V's
3258 vpunpcklbw ymm2, ymm0, ymm1 // low 16 UV pairs. mutated qqword 0,2
3259 vpunpckhbw ymm0, ymm0, ymm1 // high 16 UV pairs. mutated qqword 1,3
3322 vmovdqu ymm1, [eax + 32]
3325 vmovdqu [edx + 32], ymm1
3401 vmovdqu ymm1, [eax]
3404 vpblendvb ymm1, ymm1, [edx], ymm0
3406 vmovdqu [edx], ymm1
3459 vmovdqu ymm1, [eax + 32]
3461 vpsrld ymm1, ymm1, 24
3465 vpackssdw ymm0, ymm0, ymm1 // mutates
3534 vpmovzxbd ymm1, qword ptr [eax]
3537 vpslld ymm1, ymm1, 24
3539 vpblendvb ymm1, ymm1, [edx], ymm0
3541 vmovdqu [edx], ymm1
3611 vmovdqu ymm1, [eax + 32]
3614 vpand ymm1, ymm1, ymm5
3615 vpackuswb ymm0, ymm0, ymm1 // mutates.
3645 vmovdqu ymm1, [eax + 32]
3647 vpavgb ymm1, ymm1, [eax + esi + 32]
3650 vpsrlw ymm1, ymm1, 8
3651 vpackuswb ymm0, ymm0, ymm1 // mutates.
3653 vpand ymm1, ymm0, ymm5 // U
3655 vpackuswb ymm1, ymm1, ymm1 // mutates.
3657 vpermq ymm1, ymm1, 0xd8
3659 vextractf128 [edx], ymm1, 0 // U
3688 vmovdqu ymm1, [eax + 32]
3691 vpsrlw ymm1, ymm1, 8
3692 vpackuswb ymm0, ymm0, ymm1 // mutates.
3694 vpand ymm1, ymm0, ymm5 // U
3696 vpackuswb ymm1, ymm1, ymm1 // mutates.
3698 vpermq ymm1, ymm1, 0xd8
3700 vextractf128 [edx], ymm1, 0 // U
3722 vmovdqu ymm1, [eax + 32]
3725 vpsrlw ymm1, ymm1, 8
3726 vpackuswb ymm0, ymm0, ymm1 // mutates.
3756 vmovdqu ymm1, [eax + 32]
3758 vpavgb ymm1, ymm1, [eax + esi + 32]
3761 vpand ymm1, ymm1, ymm5
3762 vpackuswb ymm0, ymm0, ymm1 // mutates.
3764 vpand ymm1, ymm0, ymm5 // U
3766 vpackuswb ymm1, ymm1, ymm1 // mutates.
3768 vpermq ymm1, ymm1, 0xd8
3770 vextractf128 [edx], ymm1, 0 // U
3799 vmovdqu ymm1, [eax + 32]
3802 vpand ymm1, ymm1, ymm5
3803 vpackuswb ymm0, ymm0, ymm1 // mutates.
3805 vpand ymm1, ymm0, ymm5 // U
3807 vpackuswb ymm1, ymm1, ymm1 // mutates.
3809 vpermq ymm1, ymm1, 0xd8
3811 vextractf128 [edx], ymm1, 0 // U
4133 vmovdqu ymm1, [eax + esi] // src0
4135 vpunpckhbw ymm4, ymm1, ymm2
4136 vpunpcklbw ymm1, ymm1, ymm2
4138 vpsubb ymm1, ymm1, ymm6 // bias src0/1 - 128
4140 vpmaddubsw ymm0, ymm0, ymm1
4316 vpunpckhbw ymm1, ymm6, ymm6 // high 4 pixels. mutated.
4318 vpshufb ymm3, ymm1, ymm4 // high 4 alphas
4320 vpmulhuw ymm1, ymm1, ymm3 // rgb * a
4323 vpsrlw ymm1, ymm1, 8
4324 vpackuswb ymm0, ymm0, ymm1 // unmutated.
4410 vpunpckhbw ymm1, ymm6, ymm6 // high 4 pixels. mutated.
4417 vpmulhuw ymm1, ymm1, ymm3 // rgb * ia
4418 vpackuswb ymm0, ymm0, ymm1 // unmutated.
4473 vpunpckhbw ymm1, ymm6, ymm6 // high 4 pixels. mutated.
4479 vpmulhuw ymm1, ymm1, ymm3 // rgb * ia
4480 vpackuswb ymm0, ymm0, ymm1 // unmutated.
4887 vmovdqu ymm1, [eax] // read 8 pixels from src_argb0
4891 vpunpcklbw ymm0, ymm1ymm1 // low 4
4892 vpunpckhbw ymm1, ymm1, ymm1 // high 4
4896 vpmulhuw ymm1, ymm1, ymm3 // src_argb0 * src_argb1 high 4
4897 vpackuswb ymm0, ymm0, ymm1
5584 vpunpckhbw ymm1, ymm0, ymm2 // mutates
5586 vpsubb ymm1, ymm1, ymm4 // bias to signed image
5588 vpmaddubsw ymm1, ymm5, ymm1
5590 vpaddw ymm1, ymm1, ymm4 // unbias and round
5592 vpsrlw ymm1, ymm1, 8
5594 vpackuswb ymm0, ymm0, ymm1 // unmutates
5748 vmovdqu ymm1, [eax + 32]
5751 vpshufb ymm1, ymm1, ymm5
5753 vmovdqu [edx + 32], ymm1