Home | History | Annotate | Download | only in source

Lines Matching defs:ymm0

872     vmovdqu    ymm0, [eax]
876 vpmaddubsw ymm0, ymm0, ymm4
881 vphaddw ymm0, ymm0, ymm1 // mutates.
883 vpsrlw ymm0, ymm0, 7
885 vpackuswb ymm0, ymm0, ymm2 // mutates.
886 vpermd ymm0, ymm6, ymm0 // For vphaddw + vpackuswb mutation.
887 vpaddb ymm0, ymm0, ymm5
889 vmovdqu [edx], ymm0
912 vmovdqu ymm0, [eax]
916 vpmaddubsw ymm0, ymm0, ymm4
921 vphaddw ymm0, ymm0, ymm1 // mutates.
923 vpaddw ymm0, ymm0, ymm5 // Add .5 for rounding.
925 vpsrlw ymm0, ymm0, 7
927 vpackuswb ymm0, ymm0, ymm2 // mutates.
928 vpermd ymm0, ymm6, ymm0 // For vphaddw + vpackuswb mutation.
930 vmovdqu [edx], ymm0
1366 vmovdqu ymm0, [eax]
1370 vpavgb ymm0, ymm0, [eax + esi]
1375 vshufps ymm4, ymm0, ymm1, 0x88
1376 vshufps ymm0, ymm0, ymm1, 0xdd
1377 vpavgb ymm0, ymm0, ymm4 // mutated by vshufps
1385 vpmaddubsw ymm1, ymm0, ymm7 // U
1387 vpmaddubsw ymm0, ymm0, ymm6 // V
1390 vphaddw ymm0, ymm0, ymm2
1392 vpsraw ymm0, ymm0, 8
1393 vpacksswb ymm0, ymm1, ymm0 // mutates
1394 vpermq ymm0, ymm0, 0xd8 // For vpacksswb
1395 vpshufb ymm0, ymm0, kShufARGBToUV_AVX // For vshufps + vphaddw
1396 vpaddb ymm0, ymm0, ymm5 // -> unsigned
1400 vextractf128 [edx], ymm0, 0 // U
1401 vextractf128 [edx + edi], ymm0, 1 // V
2252 vpunpcklbw ymm0, ymm0, ymm1 // UV
2253 vpermq ymm0, ymm0, 0xd8
2254 vpunpcklwd ymm0, ymm0, ymm0 // UVUV
2255 vpmaddubsw ymm2, ymm0, kUVToB_AVX // scale B UV
2256 vpmaddubsw ymm1, ymm0, kUVToG_AVX // scale G UV
2257 vpmaddubsw ymm0, ymm0, kUVToR_AVX // scale R UV
2260 vpsubw ymm0, ymm0, kUVBiasR_AVX
2271 vpaddsw ymm0, ymm0, ymm3 // R += Y
2274 vpsraw ymm0, ymm0, 6
2277 vpackuswb ymm0, ymm0, ymm0 // R
2282 vpunpcklbw ymm0, ymm0, ymm5 // RA
2283 vpermq ymm0, ymm0, 0xd8
2284 vpunpcklwd ymm1, ymm2, ymm0 // BGRA first 8 pixels
2285 vpunpckhwd ymm2, ymm2, ymm0 // BGRA next 8 pixels
3321 vmovdqu ymm0, [eax + ecx]
3322 vpshufb ymm0, ymm0, ymm5
3323 vpermq ymm0, ymm0, 0x4e // swap high and low halfs
3325 vmovdqu [edx], ymm0
3446 vpermd ymm0, ymm5, [eax + ecx * 4] // permute dword order
3448 vmovdqu [edx], ymm0
3547 vmovdqu ymm0, [eax]
3550 vpsrlw ymm2, ymm0, 8 // odd bytes
3552 vpand ymm0, ymm0, ymm5 // even bytes
3554 vpackuswb ymm0, ymm0, ymm1
3556 vpermq ymm0, ymm0, 0xd8
3558 vmovdqu [edx], ymm0
3647 vmovdqu ymm0, [eax] // read 32 U's
3650 vpunpcklbw ymm2, ymm0, ymm1 // low 16 UV pairs. mutated qqword 0,2
3651 vpunpckhbw ymm0, ymm0, ymm1 // high 16 UV pairs. mutated qqword 1,3
3652 vperm2i128 ymm1, ymm2, ymm0, 0x20 // low 128 of ymm2 and low 128 of ymm0
3653 vperm2i128 ymm2, ymm2, ymm0, 0x31 // high 128 of ymm2 and high 128 of ymm0
3770 vpcmpeqb ymm0, ymm0, ymm0
3771 vpsrld ymm0, ymm0, 8 // generate mask 0x00ffffff
3778 vpblendvb ymm1, ymm1, [edx], ymm0
3779 vpblendvb ymm2, ymm2, [edx + 32], ymm0
3839 vpcmpeqb ymm0, ymm0, ymm0
3840 vpsrld ymm0, ymm0, 8 // generate mask 0x00ffffff
3849 vpblendvb ymm1, ymm1, [edx], ymm0
3850 vpblendvb ymm2, ymm2, [edx + 32], ymm0
3924 vmovdqu ymm0, [eax]
3927 vpand ymm0, ymm0, ymm5 // even bytes are Y
3929 vpackuswb ymm0, ymm0, ymm1 // mutates.
3930 vpermq ymm0, ymm0, 0xd8
3932 vmovdqu [edx], ymm0
3957 vmovdqu ymm0, [eax]
3959 vpavgb ymm0, ymm0, [eax + esi]
3962 vpsrlw ymm0, ymm0, 8 // YUYV -> UVUV
3964 vpackuswb ymm0, ymm0, ymm1 // mutates.
3965 vpermq ymm0, ymm0, 0xd8
3966 vpand ymm1, ymm0, ymm5 // U
3967 vpsrlw ymm0, ymm0, 8 // V
3969 vpackuswb ymm0, ymm0, ymm0 // mutates.
3971 vpermq ymm0, ymm0, 0xd8
3973 vextractf128 [edx + edi], ymm0, 0 // V
4000 vmovdqu ymm0, [eax]
4003 vpsrlw ymm0, ymm0, 8 // YUYV -> UVUV
4005 vpackuswb ymm0, ymm0, ymm1 // mutates.
4006 vpermq ymm0, ymm0, 0xd8
4007 vpand ymm1, ymm0, ymm5 // U
4008 vpsrlw ymm0, ymm0, 8 // V
4010 vpackuswb ymm0, ymm0, ymm0 // mutates.
4012 vpermq ymm0, ymm0, 0xd8
4014 vextractf128 [edx + edi], ymm0, 0 // V
4035 vmovdqu ymm0, [eax]
4038 vpsrlw ymm0, ymm0, 8 // odd bytes are Y
4040 vpackuswb ymm0, ymm0, ymm1 // mutates.
4041 vpermq ymm0, ymm0, 0xd8
4043 vmovdqu [edx], ymm0
4068 vmovdqu ymm0, [eax]
4070 vpavgb ymm0, ymm0, [eax + esi]
4073 vpand ymm0, ymm0, ymm5 // UYVY -> UVUV
4075 vpackuswb ymm0, ymm0, ymm1 // mutates.
4076 vpermq ymm0, ymm0, 0xd8
4077 vpand ymm1, ymm0, ymm5 // U
4078 vpsrlw ymm0, ymm0, 8 // V
4080 vpackuswb ymm0, ymm0, ymm0 // mutates.
4082 vpermq ymm0, ymm0, 0xd8
4084 vextractf128 [edx + edi], ymm0, 0 // V
4111 vmovdqu ymm0, [eax]
4114 vpand ymm0, ymm0, ymm5 // UYVY -> UVUV
4116 vpackuswb ymm0, ymm0, ymm1 // mutates.
4117 vpermq ymm0, ymm0, 0xd8
4118 vpand ymm1, ymm0, ymm5 // U
4119 vpsrlw ymm0, ymm0, 8 // V
4121 vpackuswb ymm0, ymm0, ymm0 // mutates.
4123 vpermq ymm0, ymm0, 0xd8
4125 vextractf128 [edx + edi], ymm0, 0 // V
4959 vpunpcklbw ymm0, ymm6, ymm6 // low 4 pixels. mutated.
4961 vpshufb ymm2, ymm0, ymm4 // low 4 alphas
4963 vpmulhuw ymm0, ymm0, ymm2 // rgb * a
4966 vpsrlw ymm0, ymm0, 8
4968 vpackuswb ymm0, ymm0, ymm1 // unmutated.
4969 vpor ymm0, ymm0, ymm6 // copy original alpha
4971 vmovdqu [eax + edx], ymm0
5055 vpunpcklbw ymm0, ymm6, ymm6 // low 4 pixels. mutated.
5062 vpmulhuw ymm0, ymm0, ymm2 // rgb * ia
5064 vpackuswb ymm0, ymm0, ymm1 // unmutated.
5066 vmovdqu [eax + edx], ymm0
5118 vpunpcklbw ymm0, ymm6, ymm6 // low 4 pixels. mutated.
5124 vpmulhuw ymm0, ymm0, ymm2 // rgb * ia
5126 vpackuswb ymm0, ymm0, ymm1 // unmutated.
5128 vmovdqu [eax + edx], ymm0
5542 vpunpcklbw ymm0, ymm1, ymm1 // low 4
5546 vpmulhuw ymm0, ymm0, ymm2 // src_argb0 * src_argb1 low 4
5548 vpackuswb ymm0, ymm0, ymm1
5549 vmovdqu [edx], ymm0
5575 vmovdqu ymm0, [eax] // read 8 pixels from src_argb0
5577 vpaddusb ymm0, ymm0, [esi] // add 8 pixels from src_argb1
5579 vmovdqu [edx], ymm0
5605 vmovdqu ymm0, [eax] // read 8 pixels from src_argb0
5607 vpsubusb ymm0, ymm0, [esi] // src_argb0 - src_argb1
5609 vmovdqu [edx], ymm0
6230 vpxor ymm0, ymm0, ymm0
6231 vpermd ymm5, ymm0, ymm5
6235 vmovdqu ymm0, [esi]
6237 vpunpckhbw ymm1, ymm0, ymm2 // mutates
6238 vpunpcklbw ymm0, ymm0, ymm2 // mutates
6239 vpmaddubsw ymm0, ymm0, ymm5
6241 vpsrlw ymm0, ymm0, 7
6243 vpackuswb ymm0, ymm0, ymm1 // unmutates
6245 vmovdqu [esi + edi], ymm0
6253 vmovdqu ymm0, [esi]
6254 vpavgb ymm0, ymm0, [esi + edx]
6255 vpavgb ymm0, ymm0, [esi + edx]
6257 vmovdqu [esi + edi], ymm0
6265 vmovdqu ymm0, [esi]
6266 vpavgb ymm0, ymm0, [esi + edx]
6268 vmovdqu [esi + edi], ymm0
6276 vmovdqu ymm0, [esi + edx]
6277 vpavgb ymm0, ymm0, [esi]
6278 vpavgb ymm0, ymm0, [esi]
6280 vmovdqu [esi + edi], ymm0
6775 vmovdqu ymm0, [eax]
6776 vpavgb ymm0, ymm0, [eax + edx]
6778 vmovdqu [eax + edi], ymm0
6912 vmovdqu ymm0, [eax]
6915 vpshufb ymm0, ymm0, ymm5
6918 vmovdqu [edx], ymm0
7209 vpmovzxbd ymm0, qword ptr [eax] // 2 BGRA pixels
7211 vcvtdq2ps ymm0, ymm0 // X 8 floats
7212 vmulps ymm2, ymm0, ymm0 // X * X
7213 vmulps ymm3, ymm0, ymm7 // C3 * X
7214 vfmadd132ps ymm0, ymm4, ymm5 // result = C0 + C1 * X
7215 vfmadd231ps ymm0, ymm2, ymm6 // result += C2 * X * X
7216 vfmadd231ps ymm0, ymm2, ymm3 // result += C3 * X * X * X
7217 vcvttps2dq ymm0, ymm0
7218 vpackusdw ymm0, ymm0, ymm0 // b0g0r0a0_00000000_b0g0r0a0_00000000
7219 vpermq ymm0, ymm0, 0xd8 // b0g0r0a0_b0g0r0a0_00000000_00000000