fwd_dct32x32_msa.c | 18 v8i16 in0_1, in1_1, in2_1, in3_1, in4_1, in5_1, in6_1, in7_1; local 24 LD_SH4(input + (4 * src_stride), src_stride, in0_1, in1_1, in2_1, in3_1); 28 SLLI_4V(in0_1, in1_1, in2_1, in3_1, 2); 32 BUTTERFLY_8(in0_1, in1_1, in2_1, in3_1, in4_1, in5_1, in6_1, in7_1, step0_1, 42 LD_SH4(input + (12 * src_stride), src_stride, in0_1, in1_1, in2_1, in3_1); 46 SLLI_4V(in0_1, in1_1, in2_1, in3_1, 2); 50 BUTTERFLY_8(in0_1, in1_1, in2_1, in3_1, in4_1, in5_1, in6_1, in7_1, step0_1, 597 v8i16 in0_1, in1_1, in2_1, in3_1, in4_1, in5_1, in6_1, in7_1; local 613 in0_1 = LD_SH(temp + 16); 623 TRANSPOSE8x8_SH_SH(in0_1, in1_1, in2_1, in3_1, in4_1, in5_1, in6_1, in7_1 [all...] |