/external/libvpx/libvpx/vp9/common/arm/neon/ |
vp9_iht8x8_add_neon.asm | 101 ; Transpose a 8x8 16bits data matrix. Datas are loaded in q8-q15. 111 vtrn.32 q13, q15 115 vtrn.16 q14, q15 119 ; loaded in q8-q15. The IDCT constants are loaded in r3 - r9. The output 120 ; will be stored back into q8-q15 registers. This macro will touch q0-q7 187 vmull.s16 q15, d17, d0 195 vmlsl.s16 q15, d25, d0 206 vqrshrn.s32 d23, q15, #14 ; >> 14 232 vadd.s16 q0, q9, q15 ; output[0] = step[0] + step[3] 235 vsub.s16 q3, q9, q15 ; output[3] = step[0] - step[3 [all...] |
vp9_idct16x16_add_neon.asm | 21 ; Transpose a 8x8 16bit data matrix. Datas are loaded in q8-q15. 31 vtrn.32 q13, q15 35 vtrn.16 q14, q15 46 ; idct16 stage1 - stage6 on all the elements loaded in q8-q15. The output 47 ; will be stored back into q8-q15 registers. This function will touch q0-q7 52 ; load elements of 0, 2, 4, 6, 8, 10, 12, 14 into q8 - q15 59 vld2.s16 {q14,q15}, [r0]! 61 vmov.s16 q15, q1 129 vmull.s16 q15, d27, d3 137 vmlal.s16 q15, d23, d [all...] |
vp9_reconintra_neon.asm | 544 vadd.s16 q15, q0, q11 550 vqmovun.s16 d3, q15 552 vadd.s16 q15, q2, q11 557 vqmovun.s16 d27, q15 566 vadd.s16 q15, q1, q11 572 vqmovun.s16 d3, q15 574 vadd.s16 q15, q2, q11 579 vqmovun.s16 d27, q15 588 vadd.s16 q15, q0, q11 594 vqmovun.s16 d3, q15 [all...] |
/hardware/intel/common/omx-components/videocodec/libvpx_internal/libvpx/vp9/common/arm/neon/ |
vp9_iht8x8_add_neon.asm | 101 ; Transpose a 8x8 16bits data matrix. Datas are loaded in q8-q15. 111 vtrn.32 q13, q15 115 vtrn.16 q14, q15 119 ; loaded in q8-q15. The IDCT constants are loaded in r3 - r9. The output 120 ; will be stored back into q8-q15 registers. This macro will touch q0-q7 187 vmull.s16 q15, d17, d0 195 vmlsl.s16 q15, d25, d0 206 vqrshrn.s32 d23, q15, #14 ; >> 14 232 vadd.s16 q0, q9, q15 ; output[0] = step[0] + step[3] 235 vsub.s16 q3, q9, q15 ; output[3] = step[0] - step[3 [all...] |
vp9_idct16x16_add_neon.asm | 21 ; Transpose a 8x8 16bit data matrix. Datas are loaded in q8-q15. 31 vtrn.32 q13, q15 35 vtrn.16 q14, q15 46 ; idct16 stage1 - stage6 on all the elements loaded in q8-q15. The output 47 ; will be stored back into q8-q15 registers. This function will touch q0-q7 52 ; load elements of 0, 2, 4, 6, 8, 10, 12, 14 into q8 - q15 59 vld2.s16 {q14,q15}, [r0]! 61 vmov.s16 q15, q1 129 vmull.s16 q15, d27, d3 137 vmlal.s16 q15, d23, d [all...] |
/frameworks/rs/cpu_ref/ |
rsCpuIntrinsics_neon_Blend.S | 90 vmull.u8 q15, d15, d7 100 vrshrn.u16 d15, q15, #8 109 vaddw.u8 q15, d15 118 vrshrn.u16 d7, q15, #8 136 vmull.u8 q15, d15, d23 146 vrshrn.u16 d15, q15, #8 155 vaddw.u8 q15, d15 164 vrshrn.u16 d23, q15, #8 180 vmull.u8 q15, d7, d23 190 vrshrn.u16 d15, q15, # [all...] |
/external/chromium_org/third_party/libjpeg_turbo/simd/ |
jsimd_arm_neon.S | 238 * 7 | d30 | d31 ( q15 ) 258 vmul.s16 q15, q15, q3 511 vqrshrn.s16 d23, q15, #2 725 * 7 | d30 | d31 ( q15 ) [all...] |
/external/chromium_org/third_party/libvpx/source/libvpx/vp9/common/arm/neon/ |
vp9_idct16x16_add_neon.asm | 21 ; Transpose a 8x8 16bit data matrix. Datas are loaded in q8-q15. 31 vtrn.32 q13, q15 35 vtrn.16 q14, q15 46 ; idct16 stage1 - stage6 on all the elements loaded in q8-q15. The output 47 ; will be stored back into q8-q15 registers. This function will touch q0-q7 52 ; load elements of 0, 2, 4, 6, 8, 10, 12, 14 into q8 - q15 59 vld2.s16 {q14,q15}, [r0]! 61 vmov.s16 q15, q1 129 vmull.s16 q15, d27, d3 137 vmlal.s16 q15, d23, d [all...] |
vp9_reconintra_neon.asm | 544 vadd.s16 q15, q0, q11 550 vqmovun.s16 d3, q15 552 vadd.s16 q15, q2, q11 557 vqmovun.s16 d27, q15 566 vadd.s16 q15, q1, q11 572 vqmovun.s16 d3, q15 574 vadd.s16 q15, q2, q11 579 vqmovun.s16 d27, q15 588 vadd.s16 q15, q0, q11 594 vqmovun.s16 d3, q15 [all...] |
/external/pixman/pixman/ |
pixman-arm-neon-asm.S | 171 vrshr.u16 q15, q12, #8 174 vraddhn.u16 d22, q12, q15 282 vrshr.u16 q15, q12, #8 289 vraddhn.u16 d22, q12, q15 369 vrshr.u16 q15, q12, #8 372 vraddhn.u16 d22, q12, q15 503 vqadd.u8 q15, q1, q3 525 vqadd.u8 q15, q1, q3 557 vqadd.u8 q15, q1, q3 594 vrshr.u16 q15, q9, # [all...] |
/external/chromium_org/third_party/openmax_dl/dl/api/arm/ |
arm64COMM_s.h | 179 str q15, [sp, #112] 228 ldr q15, [sp, #112]
|
/hardware/samsung_slsi/exynos5/libswconverter/ |
csc_interleave_memcpy_neon.s | 91 vld1.8 {q15}, [r12]! 100 vst2.8 {q14, q15}, [r10]!
|
/external/chromium_org/third_party/boringssl/linux-arm/crypto/sha/ |
sha512-armv4.S | 1050 vshr.u64 q15,q7,#6 1054 veor q15,q12 1056 veor q15,q13 @ sigma1(X[i+14]) 1058 vadd.i64 q0,q15 1059 vshr.u64 q15,q14,#7 1063 veor q15,q12 1067 veor q15,q13 @ sigma0(X[i+1]) 1069 vadd.i64 q0,q15 1138 vshr.u64 q15,q0,#6 1142 veor q15,q1 [all...] |
/external/openssl/crypto/sha/asm/ |
sha512-armv4.S | 1047 vshr.u64 q15,q7,#6 1051 veor q15,q12 1053 veor q15,q13 @ sigma1(X[i+14]) 1055 vadd.i64 q0,q15 1056 vshr.u64 q15,q14,#7 1060 veor q15,q12 1064 veor q15,q13 @ sigma0(X[i+1]) 1066 vadd.i64 q0,q15 1137 vshr.u64 q15,q0,#6 1141 veor q15,q1 [all...] |
/external/chromium_org/third_party/webrtc/modules/audio_coding/codecs/isac/fix/source/ |
lpc_masking_model_neon.S | 51 vmov.s64 q15, #0 @ Initialize the sum64_tmp. 75 vqadd.s64 q14, q0, q15 @ Sum and test overflow. 79 vshr.s64 q15, #1 80 vadd.s64 q14, q0, q15 85 vmov.s64 q15, q14 93 vqadd.s64 q0, q13, q15 @ Sum and test overflow. 96 vshr.s64 q15, #1 97 vadd.s64 q0, q13, q15
|
/external/libhevc/common/arm/ |
ihevc_intra_pred_luma_planar.s | 199 vdup.16 q15, r4 @(2) 205 vmlal.u8 q15, d5, d0 @(2) 208 vmlal.u8 q15, d8, d1 @(2) 210 vmlal.u8 q15, d6, d3 @(2) 211 vmlal.u8 q15, d9, d21 @(2) 230 vshl.s16 q15, q15, q7 @(2)shr 235 vmovn.i16 d30, q15 @(2) 358 vdup.16 q15, r4 @(2) 368 vmlal.u8 q15, d5, d0 @(2 [all...] |
ihevc_weighted_pred_uni.s | 143 vdup.s32 q15,r10 @vmovq_n_s32(tmp_lvl_shift) 161 vadd.i32 q2,q2,q15 @vaddq_s32(i4_tmp1_t, tmp_lvl_shift_t) 168 vadd.i32 q3,q3,q15 @vaddq_s32(i4_tmp2_t, tmp_lvl_shift_t) ii iteration 173 vadd.i32 q5,q5,q15 @vaddq_s32(i4_tmp1_t, tmp_lvl_shift_t) iii iteration 184 vadd.i32 q6,q6,q15 @vaddq_s32(i4_tmp2_t, tmp_lvl_shift_t) iv iteration
|
ihevc_weighted_pred_bi_default.s | 200 vqshrun.s16 d30,q15,#7 276 vld1.s16 {q15},[r12],r4 @load and increment the pi2_src2 ii iteration 278 vqadd.s16 q11,q14,q15 @vaddq_s32(i4_tmp2_t1, i4_tmp2_t2) 283 vqadd.s16 q15,q8,q9 286 vqadd.s16 q15,q15,q0 @vaddq_s32(i4_tmp1_t1, tmp_lvl_shift_t) iii iteration 291 vqshrun.s16 d30,q15,#7 333 vld1.s16 {q15},[r12],r4 @load and increment the pi2_src2 ii iteration 335 vqadd.s16 q11,q14,q15 @vaddq_s32(i4_tmp2_t1, i4_tmp2_t2) 414 vqadd.s16 q15,q13,q [all...] |
ihevc_inter_pred_chroma_horz.s | 170 vmull.u8 q15,d2,d25 @mul_res = vmull_u8(src[0_3], coeffabs_3)@ 172 vmlsl.u8 q15,d0,d24 @mul_res = vmlsl_u8(src[0_2], coeffabs_2)@ 174 vmlal.u8 q15,d4,d26 @mul_res = vmlsl_u8(src[0_0], coeffabs_0)@ 176 vmlsl.u8 q15,d6,d27 @mul_res = vmlal_u8(src[0_1], coeffabs_1)@ 216 vqrshrun.s16 d30,q15,#6 238 vst1.16 {q15}, [r1],r3 246 vmull.u8 q15,d2,d25 @mul_res = vmull_u8(src[0_3], coeffabs_3)@ 249 vmlsl.u8 q15,d0,d24 @mul_res = vmlsl_u8(src[0_2], coeffabs_2)@ 252 vmlal.u8 q15,d4,d26 @mul_res = vmlsl_u8(src[0_0], coeffabs_0)@ 260 vmlsl.u8 q15,d6,d27 @mul_res = vmlal_u8(src[0_1], coeffabs_1) [all...] |
ihevc_inter_pred_luma_vert_w16inp_w16out.s | 139 vmov.i32 q15,#0x80000 187 vsub.s32 q4, q4, q15 201 vsub.s32 q5, q5, q15 220 vsub.s32 q6, q6, q15 245 vsub.s32 q7, q7, q15 263 vsub.s32 q4, q4, q15 290 vsub.s32 q5, q5, q15 311 vsub.s32 q6, q6, q15 332 vsub.s32 q7, q7, q15 347 vsub.s32 q4, q4, q15 [all...] |
/external/libhevc/decoder/arm/ |
ihevcd_itrans_recon_dc_luma.s | 106 vaddw.u8 q15,q0,d2 116 vqmovun.s16 d2,q15 165 vaddw.u8 q15,q0,d2 172 vqmovun.s16 d2,q15
|
/external/libvpx/libvpx/vp8/encoder/arm/neon/ |
vp8_memcpy_neon.asm | 46 vld1.8 {q14, q15}, [r1]! 48 vst1.8 {q14, q15}, [r0]!
|
/hardware/intel/common/omx-components/videocodec/libvpx_internal/libvpx/vp8/encoder/arm/neon/ |
vp8_memcpy_neon.asm | 46 vld1.8 {q14, q15}, [r1]! 48 vst1.8 {q14, q15}, [r0]!
|
/external/libvpx/libvpx/vp8/common/arm/neon/ |
vp8_subpixelvariance16x16s_neon.asm | 151 vld1.u8 {q15}, [r0], r1 157 vrhadd.u8 q6, q6, q15 194 vmov q0, q15 238 vmov.i8 q15, #0 285 vmlal.s16 q15, d19, d19 289 vmlal.s16 q15, d21, d21 293 vmlal.s16 q15, d23, d23 297 vmlal.s16 q15, d25, d25 303 vmlal.s16 q15, d1, d1 307 vmlal.s16 q15, d3, d [all...] |
/hardware/intel/common/omx-components/videocodec/libvpx_internal/libvpx/vp8/common/arm/neon/ |
vp8_subpixelvariance16x16s_neon.asm | 151 vld1.u8 {q15}, [r0], r1 157 vrhadd.u8 q6, q6, q15 194 vmov q0, q15 238 vmov.i8 q15, #0 285 vmlal.s16 q15, d19, d19 289 vmlal.s16 q15, d21, d21 293 vmlal.s16 q15, d23, d23 297 vmlal.s16 q15, d25, d25 303 vmlal.s16 q15, d1, d1 307 vmlal.s16 q15, d3, d [all...] |