/external/libopus/celt/x86/ |
pitch_sse4_1.c | 70 acc1 = _mm_add_epi32(acc1, inVec1_76543210); 71 acc2 = _mm_add_epi32(acc2, inVec1_FEDCBA98); 74 acc1 = _mm_add_epi32(acc1, acc2); 83 acc1 = _mm_add_epi32(acc1, inVec1_76543210); 94 acc1 = _mm_add_epi32(acc1, inVec1_3210); 98 acc1 = _mm_add_epi32(acc1, _mm_unpackhi_epi64(acc1, acc1)); 99 acc1 = _mm_add_epi32(acc1, _mm_shufflelo_epi16(acc1, 0x0E)); 135 sum0 = _mm_add_epi32(sum0, _mm_madd_epi16(vecX, vecY0)); 136 sum1 = _mm_add_epi32(sum1, _mm_madd_epi16(vecX, vecY1)); 137 sum2 = _mm_add_epi32(sum2, _mm_madd_epi16(vecX, vecY2)) [all...] |
pitch_sse2.c | 68 acc1 = _mm_add_epi32(acc1, inVec1_76543210); 69 acc2 = _mm_add_epi32(acc2, inVec1_FEDCBA98); 72 acc1 = _mm_add_epi32( acc1, acc2 ); 81 acc1 = _mm_add_epi32(acc1, inVec1_76543210); 85 acc1 = _mm_add_epi32(acc1, _mm_unpackhi_epi64( acc1, acc1)); 86 acc1 = _mm_add_epi32(acc1, _mm_shufflelo_epi16( acc1, 0x0E));
|
/external/libhevc/common/x86/ |
ihevc_32x32_itrans_recon_sse42_intr.c | 362 m_temp_reg_34 = _mm_add_epi32(m_temp_reg_40, m_temp_reg_30); 376 m_temp_reg_34 = _mm_add_epi32(m_temp_reg_44, m_temp_reg_30); 389 m_temp_reg_34 = _mm_add_epi32(m_temp_reg_41, m_temp_reg_30); 403 m_temp_reg_34 = _mm_add_epi32(m_temp_reg_45, m_temp_reg_30); 417 m_temp_reg_34 = _mm_add_epi32(m_temp_reg_42, m_temp_reg_30); 431 m_temp_reg_34 = _mm_add_epi32(m_temp_reg_46, m_temp_reg_30); 448 m_temp_reg_34 = _mm_add_epi32(m_temp_reg_43, m_temp_reg_30); 462 m_temp_reg_34 = _mm_add_epi32(m_temp_reg_47, m_temp_reg_30); 477 m_temp_reg_34 = _mm_add_epi32(m_temp_reg_43, m_temp_reg_30); 490 m_temp_reg_34 = _mm_add_epi32(m_temp_reg_47, m_temp_reg_30) [all...] |
ihevc_itrans_recon_32x32_ssse3_intr.c | 373 m_temp_reg_34 = _mm_add_epi32(m_temp_reg_40, m_temp_reg_30); 387 m_temp_reg_34 = _mm_add_epi32(m_temp_reg_44, m_temp_reg_30); 400 m_temp_reg_34 = _mm_add_epi32(m_temp_reg_41, m_temp_reg_30); 414 m_temp_reg_34 = _mm_add_epi32(m_temp_reg_45, m_temp_reg_30); 428 m_temp_reg_34 = _mm_add_epi32(m_temp_reg_42, m_temp_reg_30); 442 m_temp_reg_34 = _mm_add_epi32(m_temp_reg_46, m_temp_reg_30); 459 m_temp_reg_34 = _mm_add_epi32(m_temp_reg_43, m_temp_reg_30); 473 m_temp_reg_34 = _mm_add_epi32(m_temp_reg_47, m_temp_reg_30); 488 m_temp_reg_34 = _mm_add_epi32(m_temp_reg_43, m_temp_reg_30); 501 m_temp_reg_34 = _mm_add_epi32(m_temp_reg_47, m_temp_reg_30) [all...] |
ihevc_itrans_recon_ssse3_intr.c | 194 m_temp_reg_23 = _mm_add_epi32(m_temp_reg_20, m_temp_reg_21); 195 m_temp_reg_13 = _mm_add_epi32(m_temp_reg_22, m_temp_reg_23); 201 m_temp_reg_10 = _mm_add_epi32(m_temp_reg_0, m_temp_reg_2); 206 m_temp_reg_11 = _mm_add_epi32(m_temp_reg_2, m_temp_reg_3); 217 m_temp_reg_14 = _mm_add_epi32(m_temp_reg_14, m_temp_reg_3); 265 m_temp_reg_23 = _mm_add_epi32(m_temp_reg_20, m_temp_reg_21); 266 m_temp_reg_36 = _mm_add_epi32(m_temp_reg_22, m_temp_reg_23); 272 m_temp_reg_20 = _mm_add_epi32(m_temp_reg_30, m_temp_reg_31); 273 m_temp_reg_4 = _mm_add_epi32(m_rdng_factor, m_temp_reg_13); 274 m_temp_reg_20 = _mm_add_epi32(m_temp_reg_20, m_temp_reg_4) [all...] |
ihevc_weighted_pred_sse42_intr.c | 176 src_temp0_4x32b = _mm_add_epi32(src_temp0_4x32b, lvl_shift_4x32b); 177 src_temp1_4x32b = _mm_add_epi32(src_temp1_4x32b, lvl_shift_4x32b); 178 src_temp2_4x32b = _mm_add_epi32(src_temp2_4x32b, lvl_shift_4x32b); 179 src_temp3_4x32b = _mm_add_epi32(src_temp3_4x32b, lvl_shift_4x32b); 194 src_temp4_4x32b = _mm_add_epi32(src_temp4_4x32b, lvl_shift_4x32b); 195 src_temp5_4x32b = _mm_add_epi32(src_temp5_4x32b, lvl_shift_4x32b); 196 src_temp6_4x32b = _mm_add_epi32(src_temp6_4x32b, lvl_shift_4x32b); 197 src_temp7_4x32b = _mm_add_epi32(src_temp7_4x32b, lvl_shift_4x32b); 206 src_temp0_4x32b = _mm_add_epi32(src_temp0_4x32b, const_temp_4x32b); 207 src_temp1_4x32b = _mm_add_epi32(src_temp1_4x32b, const_temp_4x32b) [all...] |
ihevc_itrans_recon_sse42_intr.c | 182 m_temp_reg_10 = _mm_add_epi32(m_temp_reg_0, m_temp_reg_2); 187 m_temp_reg_11 = _mm_add_epi32(m_temp_reg_2, m_temp_reg_3); 198 m_temp_reg_14 = _mm_add_epi32(m_temp_reg_14, m_temp_reg_3); 223 m_temp_reg_20 = _mm_add_epi32(m_temp_reg_30, m_temp_reg_31); 224 m_temp_reg_4 = _mm_add_epi32(m_rdng_factor, m_temp_reg_13); 225 m_temp_reg_20 = _mm_add_epi32(m_temp_reg_20, m_temp_reg_4); 228 m_temp_reg_21 = _mm_add_epi32(m_temp_reg_21, m_temp_reg_4); 230 m_temp_reg_23 = _mm_add_epi32(m_temp_reg_34, m_temp_reg_35); 232 m_temp_reg_23 = _mm_add_epi32(m_temp_reg_23, m_temp_reg_4); 234 m_temp_reg_22 = _mm_add_epi32(m_temp_reg_36, m_rdng_factor) [all...] |
ihevc_16x16_itrans_recon_sse42_intr.c | 262 m_temp_reg_34 = _mm_add_epi32(m_temp_reg_24, m_temp_reg_30); 281 m_temp_reg_34 = _mm_add_epi32(m_temp_reg_25, m_temp_reg_31); 300 m_temp_reg_34 = _mm_add_epi32(m_temp_reg_26, m_temp_reg_30); 317 m_temp_reg_34 = _mm_add_epi32(m_temp_reg_27, m_temp_reg_31); 335 m_temp_reg_34 = _mm_add_epi32(m_temp_reg_26, m_temp_reg_30); 351 m_temp_reg_34 = _mm_add_epi32(m_temp_reg_27, m_temp_reg_31); 369 m_temp_reg_34 = _mm_add_epi32(m_temp_reg_24, m_temp_reg_30); 384 m_temp_reg_34 = _mm_add_epi32(m_temp_reg_25, m_temp_reg_31); 445 m_temp_reg_40 = _mm_add_epi32(m_temp_reg_24, m_temp_reg_20); 450 m_temp_reg_34 = _mm_add_epi32(m_temp_reg_40, m_temp_reg_30) [all...] |
ihevc_itrans_recon_16x16_ssse3_intr.c | 268 m_temp_reg_34 = _mm_add_epi32(m_temp_reg_24, m_temp_reg_30); 287 m_temp_reg_34 = _mm_add_epi32(m_temp_reg_25, m_temp_reg_31); 306 m_temp_reg_34 = _mm_add_epi32(m_temp_reg_26, m_temp_reg_30); 323 m_temp_reg_34 = _mm_add_epi32(m_temp_reg_27, m_temp_reg_31); 341 m_temp_reg_34 = _mm_add_epi32(m_temp_reg_26, m_temp_reg_30); 357 m_temp_reg_34 = _mm_add_epi32(m_temp_reg_27, m_temp_reg_31); 375 m_temp_reg_34 = _mm_add_epi32(m_temp_reg_24, m_temp_reg_30); 390 m_temp_reg_34 = _mm_add_epi32(m_temp_reg_25, m_temp_reg_31); 449 m_temp_reg_40 = _mm_add_epi32(m_temp_reg_24, m_temp_reg_20); 454 m_temp_reg_34 = _mm_add_epi32(m_temp_reg_40, m_temp_reg_30) [all...] |
/external/libmpeg2/common/x86/ |
impeg2_idct_recon_sse42_intr.c | 263 m_temp_reg_42 = _mm_add_epi32(m_temp_reg_12, m_temp_reg_16); 266 m_temp_reg_40 = _mm_add_epi32(m_temp_reg_10, m_temp_reg_14); 294 m_temp_reg_62 = _mm_add_epi32(m_temp_reg_40, m_temp_reg_30); 297 m_temp_reg_62 = _mm_add_epi32(m_temp_reg_62, m_rdng_factor); 298 m_temp_reg_66 = _mm_add_epi32(m_temp_reg_66, m_rdng_factor); 324 m_temp_reg_62 = _mm_add_epi32(m_temp_reg_42, m_temp_reg_32); 327 m_temp_reg_62 = _mm_add_epi32(m_temp_reg_62, m_rdng_factor); 328 m_temp_reg_66 = _mm_add_epi32(m_temp_reg_66, m_rdng_factor); 354 m_temp_reg_62 = _mm_add_epi32(m_temp_reg_44, m_temp_reg_34); 357 m_temp_reg_62 = _mm_add_epi32(m_temp_reg_62, m_rdng_factor) [all...] |
/external/libavc/common/x86/ |
ih264_ihadamard_scaling_ssse3.c | 136 temp0 = _mm_add_epi32(src_r0, src_r3); 137 temp1 = _mm_add_epi32(src_r1, src_r2); 141 src_r0 = _mm_add_epi32(temp0, temp1); 142 src_r1 = _mm_add_epi32(temp2, temp3); 165 temp0 = _mm_add_epi32(src_r0, src_r3); 166 temp1 = _mm_add_epi32(src_r1, src_r2); 170 src_r0 = _mm_add_epi32(temp0, temp1); 171 src_r1 = _mm_add_epi32(temp2, temp3); 195 temp0 = _mm_add_epi32(src_r0, add_rshift); 196 temp1 = _mm_add_epi32(src_r1, add_rshift) [all...] |
ih264_iquant_itrans_recon_sse42.c | 160 temp4 = _mm_add_epi32(temp4, add_rshift); 161 temp5 = _mm_add_epi32(temp5, add_rshift); 162 temp6 = _mm_add_epi32(temp6, add_rshift); 163 temp7 = _mm_add_epi32(temp7, add_rshift); 194 temp0 = _mm_add_epi32(resq_r0, resq_r2); 202 temp3 = _mm_add_epi32(temp3, resq_r1); 205 resq_r0 = _mm_add_epi32(temp0, temp3); 207 resq_r1 = _mm_add_epi32(temp1, temp2); 246 temp0 = _mm_add_epi32(resq_r0, resq_r2); 254 temp3 = _mm_add_epi32(temp3, resq_r1) [all...] |
ih264_iquant_itrans_recon_ssse3.c | 161 temp4 = _mm_add_epi32(temp4, add_rshift); 162 temp5 = _mm_add_epi32(temp5, add_rshift); 163 temp6 = _mm_add_epi32(temp6, add_rshift); 164 temp7 = _mm_add_epi32(temp7, add_rshift); 201 temp0 = _mm_add_epi32(resq_r0, resq_r2); 209 temp3 = _mm_add_epi32(temp3, resq_r1); 212 resq_r0 = _mm_add_epi32(temp0, temp3); 214 resq_r1 = _mm_add_epi32(temp1, temp2); 260 temp0 = _mm_add_epi32(resq_r0, resq_r2); 268 temp3 = _mm_add_epi32(temp3, resq_r1) [all...] |
ih264_ihadamard_scaling_sse42.c | 134 temp0 = _mm_add_epi32(src_r0, src_r3); 135 temp1 = _mm_add_epi32(src_r1, src_r2); 139 src_r0 = _mm_add_epi32(temp0, temp1); 140 src_r1 = _mm_add_epi32(temp2, temp3); 163 temp0 = _mm_add_epi32(src_r0, src_r3); 164 temp1 = _mm_add_epi32(src_r1, src_r2); 168 src_r0 = _mm_add_epi32(temp0, temp1); 169 src_r1 = _mm_add_epi32(temp2, temp3); 188 temp0 = _mm_add_epi32(src_r0, add_rshift); 189 temp1 = _mm_add_epi32(src_r1, add_rshift) [all...] |
/external/libvpx/libvpx/vpx_dsp/x86/ |
sum_squares_sse2.c | 33 const __m128i v_sum_01_d = _mm_add_epi32(v_sq_0_d, v_sq_1_d); 34 const __m128i v_sum_23_d = _mm_add_epi32(v_sq_2_d, v_sq_3_d); 35 const __m128i v_sum_0123_d = _mm_add_epi32(v_sum_01_d, v_sum_23_d); 38 _mm_add_epi32(v_sum_0123_d, _mm_srli_epi64(v_sum_0123_d, 32)); 87 const __m128i v_sum_01_d = _mm_add_epi32(v_sq_0_d, v_sq_1_d); 88 const __m128i v_sum_23_d = _mm_add_epi32(v_sq_2_d, v_sq_3_d); 89 const __m128i v_sum_45_d = _mm_add_epi32(v_sq_4_d, v_sq_5_d); 90 const __m128i v_sum_67_d = _mm_add_epi32(v_sq_6_d, v_sq_7_d); 92 const __m128i v_sum_0123_d = _mm_add_epi32(v_sum_01_d, v_sum_23_d); 93 const __m128i v_sum_4567_d = _mm_add_epi32(v_sum_45_d, v_sum_67_d) [all...] |
highbd_idct32x32_add_sse2.c | 32 step1[8] = _mm_add_epi32(step2[8], step2[11]); 33 step1[9] = _mm_add_epi32(step2[9], step2[10]); 38 step1[14] = _mm_add_epi32(step2[14], step2[13]); 39 step1[15] = _mm_add_epi32(step2[15], step2[12]); 57 step2[16] = _mm_add_epi32(step1[16], step1[19]); 58 step2[17] = _mm_add_epi32(step1[17], step1[18]); 63 step2[22] = _mm_add_epi32(step1[21], step1[22]); 64 step2[23] = _mm_add_epi32(step1[20], step1[23]); 66 step2[24] = _mm_add_epi32(step1[27], step1[24]); 67 step2[25] = _mm_add_epi32(step1[26], step1[25]) [all...] |
highbd_idct32x32_add_sse4.c | 36 step1[8] = _mm_add_epi32(step2[8], step2[11]); 37 step1[9] = _mm_add_epi32(step2[9], step2[10]); 42 step1[14] = _mm_add_epi32(step2[14], step2[13]); 43 step1[15] = _mm_add_epi32(step2[15], step2[12]); 61 step2[16] = _mm_add_epi32(step1[16], step1[19]); 62 step2[17] = _mm_add_epi32(step1[17], step1[18]); 67 step2[22] = _mm_add_epi32(step1[22], step1[21]); 68 step2[23] = _mm_add_epi32(step1[23], step1[20]); 70 step2[24] = _mm_add_epi32(step1[24], step1[27]); 71 step2[25] = _mm_add_epi32(step1[25], step1[26]) [all...] |
fwd_dct32x32_impl_sse2.h | 420 const __m128i s2_20_4 = _mm_add_epi32(s2_20_2, k__DCT_CONST_ROUNDING); 421 const __m128i s2_20_5 = _mm_add_epi32(s2_20_3, k__DCT_CONST_ROUNDING); 422 const __m128i s2_21_4 = _mm_add_epi32(s2_21_2, k__DCT_CONST_ROUNDING); 423 const __m128i s2_21_5 = _mm_add_epi32(s2_21_3, k__DCT_CONST_ROUNDING); 424 const __m128i s2_22_4 = _mm_add_epi32(s2_22_2, k__DCT_CONST_ROUNDING); 425 const __m128i s2_22_5 = _mm_add_epi32(s2_22_3, k__DCT_CONST_ROUNDING); 426 const __m128i s2_23_4 = _mm_add_epi32(s2_23_2, k__DCT_CONST_ROUNDING); 427 const __m128i s2_23_5 = _mm_add_epi32(s2_23_3, k__DCT_CONST_ROUNDING); 428 const __m128i s2_24_4 = _mm_add_epi32(s2_24_2, k__DCT_CONST_ROUNDING); 429 const __m128i s2_24_5 = _mm_add_epi32(s2_24_3, k__DCT_CONST_ROUNDING) [all...] |
inv_txfm_sse2.c | 129 u[0] = _mm_add_epi32(v[0], v[1]); 130 u[1] = _mm_add_epi32(v[3], v[4]); 132 u[3] = _mm_add_epi32(u[0], u[1]); 134 u[5] = _mm_add_epi32(u[3], v[5]); 137 v[0] = _mm_add_epi32(u[0], k__DCT_CONST_ROUNDING); 138 v[1] = _mm_add_epi32(u[1], k__DCT_CONST_ROUNDING); 139 v[2] = _mm_add_epi32(u[2], k__DCT_CONST_ROUNDING); 140 v[3] = _mm_add_epi32(u[6], k__DCT_CONST_ROUNDING); 303 w0 = _mm_add_epi32(u0, u8); 304 w1 = _mm_add_epi32(u1, u9) [all...] |
highbd_idct16x16_add_sse2.c | 22 out[0] = _mm_add_epi32(in[0], in[3]); 23 out[1] = _mm_add_epi32(in[1], in[2]); 27 out[8] = _mm_add_epi32(in[8], in[11]); 28 out[9] = _mm_add_epi32(in[9], in[10]); 33 out[14] = _mm_add_epi32(in[14], in[13]); 34 out[15] = _mm_add_epi32(in[15], in[12]); 39 out[0] = _mm_add_epi32(in[0], in[7]); 40 out[1] = _mm_add_epi32(in[1], in[6]); 41 out[2] = _mm_add_epi32(in[2], in[5]); 42 out[3] = _mm_add_epi32(in[3], in[4]) [all...] |
highbd_idct16x16_add_sse4.c | 23 out[0] = _mm_add_epi32(in[0], in[3]); 24 out[1] = _mm_add_epi32(in[1], in[2]); 28 out[8] = _mm_add_epi32(in[8], in[11]); 29 out[9] = _mm_add_epi32(in[9], in[10]); 34 out[14] = _mm_add_epi32(in[14], in[13]); 35 out[15] = _mm_add_epi32(in[15], in[12]); 40 out[0] = _mm_add_epi32(in[0], in[7]); 41 out[1] = _mm_add_epi32(in[1], in[6]); 42 out[2] = _mm_add_epi32(in[2], in[5]); 43 out[3] = _mm_add_epi32(in[3], in[4]) [all...] |
/external/libvpx/libvpx/vp9/encoder/x86/ |
vp9_dct_intrin_sse2.c | 93 v[0] = _mm_add_epi32(u[0], k__DCT_CONST_ROUNDING); 94 v[1] = _mm_add_epi32(u[1], k__DCT_CONST_ROUNDING); 95 v[2] = _mm_add_epi32(u[2], k__DCT_CONST_ROUNDING); 96 v[3] = _mm_add_epi32(u[3], k__DCT_CONST_ROUNDING); 132 u[0] = _mm_add_epi32(v[0], v[1]); 134 u[2] = _mm_add_epi32(v[3], v[4]); 138 u[6] = _mm_add_epi32(u[3], u[5]); 140 v[0] = _mm_add_epi32(u[0], k__DCT_CONST_ROUNDING); 141 v[1] = _mm_add_epi32(u[1], k__DCT_CONST_ROUNDING); 142 v[2] = _mm_add_epi32(u[2], k__DCT_CONST_ROUNDING) [all...] |
/external/python/cpython3/Modules/_blake2/impl/ |
blake2s-round.h | 44 row1 = _mm_add_epi32( _mm_add_epi32( row1, buf), row2 ); \ 47 row3 = _mm_add_epi32( row3, row4 ); \ 52 row1 = _mm_add_epi32( _mm_add_epi32( row1, buf), row2 ); \ 55 row3 = _mm_add_epi32( row3, row4 ); \
|
/external/mesa3d/src/gallium/drivers/llvmpipe/ |
lp_rast_tri.c | 155 __m128i cstep1 = _mm_add_epi32(cstep0, xdcdy); 156 __m128i cstep2 = _mm_add_epi32(cstep1, xdcdy); 157 __m128i cstep3 = _mm_add_epi32(cstep2, xdcdy); 174 cstep0 = _mm_add_epi32(cstep0, cio4); 175 cstep1 = _mm_add_epi32(cstep1, cio4); 176 cstep2 = _mm_add_epi32(cstep2, cio4); 177 cstep3 = _mm_add_epi32(cstep3, cio4); 196 __m128i cstep1 = _mm_add_epi32(cstep0, xdcdy); 197 __m128i cstep2 = _mm_add_epi32(cstep1, xdcdy); 198 __m128i cstep3 = _mm_add_epi32(cstep2, xdcdy) [all...] |
/external/flac/libFLAC/ |
lpc_intrin_sse2.c | 87 mull = _mm_madd_epi16(q10, _mm_loadu_si128((const __m128i*)(data+i-11))); summ = _mm_add_epi32(summ, mull); 88 mull = _mm_madd_epi16(q9, _mm_loadu_si128((const __m128i*)(data+i-10))); summ = _mm_add_epi32(summ, mull); 89 mull = _mm_madd_epi16(q8, _mm_loadu_si128((const __m128i*)(data+i-9))); summ = _mm_add_epi32(summ, mull); 90 mull = _mm_madd_epi16(q7, _mm_loadu_si128((const __m128i*)(data+i-8))); summ = _mm_add_epi32(summ, mull); 91 mull = _mm_madd_epi16(q6, _mm_loadu_si128((const __m128i*)(data+i-7))); summ = _mm_add_epi32(summ, mull); 92 mull = _mm_madd_epi16(q5, _mm_loadu_si128((const __m128i*)(data+i-6))); summ = _mm_add_epi32(summ, mull); 93 mull = _mm_madd_epi16(q4, _mm_loadu_si128((const __m128i*)(data+i-5))); summ = _mm_add_epi32(summ, mull); 94 mull = _mm_madd_epi16(q3, _mm_loadu_si128((const __m128i*)(data+i-4))); summ = _mm_add_epi32(summ, mull); 95 mull = _mm_madd_epi16(q2, _mm_loadu_si128((const __m128i*)(data+i-3))); summ = _mm_add_epi32(summ, mull); 96 mull = _mm_madd_epi16(q1, _mm_loadu_si128((const __m128i*)(data+i-2))); summ = _mm_add_epi32(summ, mull) [all...] |