/external/libvpx/libvpx/vp9/common/arm/neon/ |
vp9_iht4x4_add_neon.c | 27 int16x8_t *q8s16, 33 d0x2s16 = vtrn_s16(vget_low_s16(*q8s16), vget_high_s16(*q8s16)); 40 *q8s16 = vreinterpretq_s16_s32(q0x2s32.val[0]); 71 int16x8_t *q8s16, 78 d16s16 = vget_low_s16(*q8s16); 79 d17s16 = vget_high_s16(*q8s16); 100 *q8s16 = vaddq_s16(q13s16, q14s16); 112 int16x8_t *q8s16, 119 d16s16 = vget_low_s16(*q8s16); 162 int16x8_t q3s16, q8s16, q9s16; local [all...] |
vp9_iht8x8_add_neon.c | 35 int16x8_t *q8s16, 48 d16s16 = vget_low_s16(*q8s16); 49 d17s16 = vget_high_s16(*q8s16); 65 *q8s16 = vcombine_s16(d16s16, d24s16); // vswp d17, d24 74 q0x2s32 = vtrnq_s32(vreinterpretq_s32_s16(*q8s16), 92 *q8s16 = q0x2s16.val[0]; 104 int16x8_t *q8s16, 125 d16s16 = vget_low_s16(*q8s16); 126 d17s16 = vget_high_s16(*q8s16); 248 *q8s16 = vaddq_s16(q0s16, q7s16) 495 int16x8_t q8s16, q9s16, q10s16, q11s16, q12s16, q13s16, q14s16, q15s16; local [all...] |
/external/libvpx/libvpx/vpx_dsp/arm/ |
idct4x4_add_neon.c | 22 int16x8_t q8s16, q9s16, q13s16, q14s16; local 33 q8s16 = vld1q_s16(input); 36 d16s16 = vget_low_s16(q8s16); 37 d17s16 = vget_high_s16(q8s16); 43 q8s16 = vcombine_s16(d0x2s16.val[0], d0x2s16.val[1]); 49 q0x2s32 = vtrnq_s32(vreinterpretq_s32_s16(q8s16), 78 q8s16 = vaddq_s16(q13s16, q14s16); 81 d16s16 = vget_low_s16(q8s16); 82 d17s16 = vget_high_s16(q8s16); 88 q8s16 = vcombine_s16(d0x2s16.val[0], d0x2s16.val[1]) [all...] |
idct32x32_add_neon.c | 30 q6s16, q7s16, q8s16, q9s16); 37 int16x8_t q8s16, 49 q8s16 = vrshrq_n_s16(q8s16, 6); 55 q8s16 = vreinterpretq_s16_u16(vaddw_u8(vreinterpretq_u16_s16(q8s16), 63 d10s16 = vreinterpret_s16_u8(vqmovun_s16(q8s16)); 176 int16x8_t q8s16, q9s16, q10s16, q11s16, q12s16, q13s16, q14s16, q15s16; local 182 q8s16 = vld1q_s16(in); 198 d16s16 = vget_low_s16(q8s16); 467 int16x8_t q8s16, q9s16, q10s16, q11s16, q12s16, q13s16, q14s16, q15s16; local [all...] |
idct8x8_add_neon.c | 17 int16x8_t *q8s16, 30 d16s16 = vget_low_s16(*q8s16); 31 d17s16 = vget_high_s16(*q8s16); 47 *q8s16 = vcombine_s16(d16s16, d24s16); // vswp d17, d24 56 q0x2s32 = vtrnq_s32(vreinterpretq_s32_s16(*q8s16), 74 *q8s16 = q0x2s16.val[0]; 86 int16x8_t *q8s16, 107 d16s16 = vget_low_s16(*q8s16); 108 d17s16 = vget_high_s16(*q8s16); 230 *q8s16 = vaddq_s16(q0s16, q7s16) 248 int16x8_t q8s16, q9s16, q10s16, q11s16, q12s16, q13s16, q14s16, q15s16; local 364 int16x8_t q8s16, q9s16, q10s16, q11s16, q12s16, q13s16, q14s16, q15s16; local [all...] |
idct16x16_add_neon.c | 17 int16x8_t *q8s16, 30 d16s16 = vget_low_s16(*q8s16); 31 d17s16 = vget_high_s16(*q8s16); 47 *q8s16 = vcombine_s16(d16s16, d24s16); // vswp d17, d24 56 q0x2s32 = vtrnq_s32(vreinterpretq_s32_s16(*q8s16), 74 *q8s16 = q0x2s16.val[0]; 96 int16x8_t q8s16, q9s16, q10s16, q11s16, q12s16, q13s16, q14s16, q15s16; local 102 q8s16 = q0x2s16.val[0]; 125 TRANSPOSE8X8(&q8s16, &q9s16, &q10s16, &q11s16, 128 d16s16 = vget_low_s16(q8s16); 341 int16x8_t q8s16, q9s16, q10s16, q11s16, q12s16, q13s16, q14s16, q15s16; local 891 int16x8_t q8s16, q9s16, q10s16, q11s16, q12s16, q13s16, q14s16, q15s16; local 1035 int16x8_t q8s16, q9s16, q10s16, q11s16, q12s16, q13s16, q14s16, q15s16; local [all...] |
intrapred_neon.c | 665 int16x8_t q0s16, q1s16, q8s16, q11s16; local 686 q8s16 = vaddq_s16(vreinterpretq_s16_u16(q8u16), 691 d23u8 = vqmovun_s16(q8s16); 707 q8s16 = vaddq_s16(vreinterpretq_s16_u16(q8u16), 712 d23u8 = vqmovun_s16(q8s16);
|
/external/libvpx/libvpx/vp8/common/arm/neon/ |
sixtappredict_neon.c | 39 int16x8_t q8s16, q9s16, q10s16, q11s16, q12s16; local 228 q8s16 = vreinterpretq_s16_u16(q8u16); 232 q8s16 = vqaddq_s16(q8s16, q10s16); 235 d28u8 = vqrshrun_n_s16(q8s16, 7); 333 q8s16 = vreinterpretq_s16_u16(q8u16); 339 q8s16 = vqaddq_s16(q8s16, q10s16); 343 d30u8 = vqrshrun_n_s16(q8s16, 7); 417 int16x8_t q8s16, q9s16, q10s16, q11s16, q12s16 local 820 int16x8_t q8s16, q9s16, q10s16, q11s16, q12s16; local 1295 int16x8_t q3s16, q4s16, q5s16, q6s16, q7s16, q8s16, q9s16, q10s16; local [all...] |