Lines Matching full:src_ptr
56 void ScaleRowDown2_NEON(const uint8* src_ptr, ptrdiff_t /* src_stride */,
59 void ScaleRowDown2Int_NEON(const uint8* src_ptr, ptrdiff_t src_stride,
63 void ScaleRowDown4_NEON(const uint8* src_ptr, ptrdiff_t /* src_stride */,
65 void ScaleRowDown4Int_NEON(const uint8* src_ptr, ptrdiff_t src_stride,
72 void ScaleRowDown34_NEON(const uint8* src_ptr,
75 void ScaleRowDown34_0_Int_NEON(const uint8* src_ptr,
78 void ScaleRowDown34_1_Int_NEON(const uint8* src_ptr,
84 void ScaleRowDown38_NEON(const uint8* src_ptr,
88 void ScaleRowDown38_3_Int_NEON(const uint8* src_ptr,
92 void ScaleRowDown38_2_Int_NEON(const uint8* src_ptr,
98 const uint8* src_ptr, ptrdiff_t src_stride,
200 // Alignment requirement: src_ptr 16 byte aligned, dst_ptr 16 byte aligned.
202 static void ScaleRowDown2_SSE2(const uint8* src_ptr, ptrdiff_t src_stride,
205 mov eax, [esp + 4] // src_ptr
229 // Alignment requirement: src_ptr 16 byte aligned, dst_ptr 16 byte aligned.
231 void ScaleRowDown2Int_SSE2(const uint8* src_ptr, ptrdiff_t src_stride,
235 mov eax, [esp + 4 + 4] // src_ptr
273 // Alignment requirement: src_ptr 16 byte aligned, dst_ptr 16 byte aligned.
275 static void ScaleRowDown2_Unaligned_SSE2(const uint8* src_ptr,
279 mov eax, [esp + 4] // src_ptr
303 // Alignment requirement: src_ptr 16 byte aligned, dst_ptr 16 byte aligned.
305 static void ScaleRowDown2Int_Unaligned_SSE2(const uint8* src_ptr,
310 mov eax, [esp + 4 + 4] // src_ptr
349 // Alignment requirement: src_ptr 16 byte aligned, dst_ptr 8 byte aligned.
351 static void ScaleRowDown4_SSE2(const uint8* src_ptr, ptrdiff_t src_stride,
354 mov eax, [esp + 4] // src_ptr
380 // Alignment requirement: src_ptr 16 byte aligned, dst_ptr 8 byte aligned.
382 static void ScaleRowDown4Int_SSE2(const uint8* src_ptr, ptrdiff_t src_stride,
387 mov eax, [esp + 8 + 4] // src_ptr
442 // Alignment requirement: src_ptr 16 byte aligned, dst_ptr 4 byte aligned.
444 static void ScaleRowDown8_SSE2(const uint8* src_ptr, ptrdiff_t src_stride,
447 mov eax, [esp + 4] // src_ptr
474 // Alignment requirement: src_ptr 16 byte aligned, dst_ptr 4 byte aligned.
476 static void ScaleRowDown8Int_SSE2(const uint8* src_ptr, ptrdiff_t src_stride,
482 mov eax, [esp + 12 + 4] // src_ptr
552 // Alignment requirement: src_ptr 16 byte aligned, dst_ptr 8 byte aligned.
554 static void ScaleRowDown34_SSSE3(const uint8* src_ptr, ptrdiff_t src_stride,
557 mov eax, [esp + 4] // src_ptr
601 // Alignment requirement: src_ptr 16 byte aligned, dst_ptr 8 byte aligned.
603 static void ScaleRowDown34_1_Int_SSSE3(const uint8* src_ptr,
608 mov eax, [esp + 4 + 4] // src_ptr
660 // Alignment requirement: src_ptr 16 byte aligned, dst_ptr 8 byte aligned.
662 static void ScaleRowDown34_0_Int_SSSE3(const uint8* src_ptr,
667 mov eax, [esp + 4 + 4] // src_ptr
726 static void ScaleRowDown38_SSSE3(const uint8* src_ptr, ptrdiff_t src_stride,
729 mov eax, [esp + 4] // src_ptr
758 static void ScaleRowDown38_3_Int_SSSE3(const uint8* src_ptr,
763 mov eax, [esp + 4 + 4] // src_ptr
824 static void ScaleRowDown38_2_Int_SSSE3(const uint8* src_ptr,
829 mov eax, [esp + 4 + 4] // src_ptr
871 static void ScaleAddRows_SSE2(const uint8* src_ptr, ptrdiff_t src_stride,
879 mov esi, [esp + 16 + 4] // src_ptr
936 static void ScaleFilterRows_SSE2(uint8* dst_ptr, const uint8* src_ptr,
943 mov esi, [esp + 8 + 8] // src_ptr
1027 static void ScaleFilterRows_SSSE3(uint8* dst_ptr, const uint8* src_ptr,
1034 mov esi, [esp + 8 + 8] // src_ptr
1119 static void ScaleRowDown2_SSE2(const uint8* src_ptr, ptrdiff_t src_stride,
1136 : "+r"(src_ptr), // %0
1147 void ScaleRowDown2Int_SSE2(const uint8* src_ptr, ptrdiff_t src_stride,
1174 : "+r"(src_ptr), // %0
1184 static void ScaleRowDown2_Unaligned_SSE2(const uint8* src_ptr,
1202 : "+r"(src_ptr), // %0
1213 static void ScaleRowDown2Int_Unaligned_SSE2(const uint8* src_ptr,
1241 : "+r"(src_ptr), // %0
1253 static void ScaleRowDown4_SSE2(const uint8* src_ptr, ptrdiff_t src_stride,
1271 : "+r"(src_ptr), // %0
1282 static void ScaleRowDown4Int_SSE2(const uint8* src_ptr, ptrdiff_t src_stride,
1324 : "+r"(src_ptr), // %0
1337 static void ScaleRowDown8_SSE2(const uint8* src_ptr, ptrdiff_t src_stride,
1356 : "+r"(src_ptr), // %0
1367 static void ScaleRowDown8Int_SSE2(const uint8* src_ptr, ptrdiff_t src_stride,
1420 : "+r"(src_ptr), // %0
1434 static void ScaleRowDown34_SSSE3(const uint8* src_ptr, ptrdiff_t src_stride,
1462 : "+r"(src_ptr), // %0
1473 static void ScaleRowDown34_1_Int_SSSE3(const uint8* src_ptr,
1528 : "+r"(src_ptr), // %0
1540 static void ScaleRowDown34_0_Int_SSSE3(const uint8* src_ptr,
1599 : "+r"(src_ptr), // %0
1612 static void ScaleRowDown38_SSSE3(const uint8* src_ptr, ptrdiff_t src_stride,
1631 : "+r"(src_ptr), // %0
1643 static void ScaleRowDown38_2_Int_SSSE3(const uint8* src_ptr,
1678 : "+r"(src_ptr), // %0
1689 static void ScaleRowDown38_3_Int_SSSE3(const uint8* src_ptr,
1743 : "+r"(src_ptr), // %0
1755 static void ScaleAddRows_SSE2(const uint8* src_ptr, ptrdiff_t src_stride,
1790 : "+r"(src_ptr), // %0
1808 const uint8* src_ptr, ptrdiff_t src_stride,
1866 "+r"(src_ptr), // %1
1881 const uint8* src_ptr, ptrdiff_t src_stride,
1937 "+r"(src_ptr), // %1
1950 static void ScaleRowDown2_C(const uint8* src_ptr, ptrdiff_t /* src_stride */,
1954 dst[0] = src_ptr[0];
1955 dst[1] = src_ptr[2];
1957 src_ptr += 4;
1960 dst[0] = src_ptr[0];
1964 void ScaleRowDown2Int_C(const uint8* src_ptr, ptrdiff_t src_stride,
1966 const uint8* s = src_ptr;
1967 const uint8* t = src_ptr + src_stride;
1981 static void ScaleRowDown4_C(const uint8* src_ptr, ptrdiff_t /* src_stride */,
1985 dst[0] = src_ptr[0];
1986 dst[1] = src_ptr[4];
1988 src_ptr += 8;
1991 dst[0] = src_ptr[0];
1995 static void ScaleRowDown4Int_C(const uint8* src_ptr, ptrdiff_t src_stride,
2000 dst[0] = (src_ptr[0] + src_ptr[1] + src_ptr[2] + src_ptr[3] +
2001 src_ptr[stride + 0] + src_ptr[stride + 1] +
2002 src_ptr[stride + 2] + src_ptr[stride + 3] +
2003 src_ptr[stride * 2 + 0] + src_ptr[stride * 2 + 1] +
2004 src_ptr[stride * 2 + 2] + src_ptr[stride * 2 + 3] +
2005 src_ptr[stride * 3 + 0] + src_ptr[stride * 3 + 1] +
2006 src_ptr[stride * 3 + 2] + src_ptr[stride * 3 + 3] +
2008 dst[1] = (src_ptr[4] + src_ptr[5] + src_ptr[6] + src_ptr[7] +
2009 src_ptr[stride + 4] + src_ptr[stride + 5] +
2010 src_ptr[stride + 6] + src_ptr[stride + 7] +
2011 src_ptr[stride * 2 + 4] + src_ptr[stride * 2 + 5] +
2012 src_ptr[stride * 2 + 6] + src_ptr[stride * 2 + 7] +
2013 src_ptr[stride * 3 + 4] + src_ptr[stride * 3 + 5] +
2014 src_ptr[stride * 3 + 6] + src_ptr[stride * 3 + 7] +
2017 src_ptr += 8;
2020 dst[0] = (src_ptr[0] + src_ptr[1] + src_ptr[2] + src_ptr[3] +
2021 src_ptr[stride + 0] + src_ptr[stride + 1] +
2022 src_ptr[stride + 2] + src_ptr[stride + 3] +
2023 src_ptr[stride * 2 + 0] + src_ptr[stride * 2 + 1] +
2024 src_ptr[stride * 2 + 2] + src_ptr[stride * 2 + 3] +
2025 src_ptr[stride * 3 + 0] + src_ptr[stride * 3 + 1] +
2026 src_ptr[stride * 3 + 2] + src_ptr[stride * 3 + 3] +
2036 static void ScaleRowDown8_C(const uint8* src_ptr, ptrdiff_t /* src_stride */,
2040 dst[0] = src_ptr[0];
2041 dst[1] = src_ptr[8];
2043 src_ptr += 16;
2046 dst[0] = src_ptr[0];
2052 static void ScaleRowDown8Int_C(const uint8* src_ptr, ptrdiff_t src_stride,
2056 ScaleRowDown4Int_C(src_ptr, src_stride, src_row, dst_width * 2);
2057 ScaleRowDown4Int_C(src_ptr + src_stride * 4, src_stride,
2063 static void ScaleRowDown34_C(const uint8* src_ptr, ptrdiff_t /* src_stride */,
2068 dst[0] = src_ptr[0];
2069 dst[1] = src_ptr[1];
2070 dst[2] = src_ptr[3];
2072 src_ptr += 4;
2077 static void ScaleRowDown34_0_Int_C(const uint8* src_ptr, ptrdiff_t src_stride,
2080 const uint8* s = src_ptr;
2081 const uint8* t = src_ptr + src_stride;
2100 static void ScaleRowDown34_1_Int_C(const uint8* src_ptr, ptrdiff_t src_stride,
2103 const uint8* s = src_ptr;
2104 const uint8* t = src_ptr + src_stride;
2126 static void ScaleFilterCols_C(uint8* dst_ptr, const uint8* src_ptr,
2130 int a = src_ptr[xi];
2131 int b = src_ptr[xi + 1];
2135 a = src_ptr[xi];
2136 b = src_ptr[xi + 1];
2143 int a = src_ptr[xi];
2144 int b = src_ptr[xi + 1];
2153 static void ScaleFilterCols34_C(uint8* dst_ptr, const uint8* src_ptr,
2156 const uint8* s = src_ptr;
2169 static void ScaleRowDown34_0_Int_SSE2(const uint8* src_ptr,
2174 ScaleFilterRows_SSE2(row, src_ptr, src_stride, dst_width * 4 / 3, 256 / 4);
2179 static void ScaleRowDown34_1_Int_SSE2(const uint8* src_ptr,
2184 ScaleFilterRows_SSE2(row, src_ptr, src_stride, dst_width * 4 / 3, 256 / 2);
2189 static void ScaleRowDown38_C(const uint8* src_ptr, ptrdiff_t /* src_stride */,
2193 dst[0] = src_ptr[0];
2194 dst[1] = src_ptr[3];
2195 dst[2] = src_ptr[6];
2197 src_ptr += 8;
2202 static void ScaleRowDown38_3_Int_C(const uint8* src_ptr,
2208 dst_ptr[0] = (src_ptr[0] + src_ptr[1] + src_ptr[2] +
2209 src_ptr[stride + 0] + src_ptr[stride + 1] +
2210 src_ptr[stride + 2] + src_ptr[stride * 2 + 0] +
2211 src_ptr[stride * 2 + 1] + src_ptr[stride * 2 + 2]) *
2213 dst_ptr[1] = (src_ptr[3] + src_ptr[4] + src_ptr[5] +
2214 src_ptr[stride + 3] + src_ptr[stride + 4] +
2215 src_ptr[stride + 5] + src_ptr[stride * 2 + 3] +
2216 src_ptr[stride * 2 + 4] + src_ptr[stride * 2 + 5]) *
2218 dst_ptr[2] = (src_ptr[6] + src_ptr[7] +
2219 src_ptr[stride + 6] + src_ptr[stride + 7] +
2220 src_ptr[stride * 2 + 6] + src_ptr[stride * 2 + 7]) *
2222 src_ptr += 8;
2228 static void ScaleRowDown38_2_Int_C(const uint8* src_ptr, ptrdiff_t src_stride,
2233 dst_ptr[0] = (src_ptr[0] + src_ptr[1] + src_ptr[2] +
2234 src_ptr[stride + 0] + src_ptr[stride + 1] +
2235 src_ptr[stride + 2]) * (65536 / 6) >> 16;
2236 dst_ptr[1] = (src_ptr[3] + src_ptr[4] + src_ptr[5] +
2237 src_ptr[stride + 3] + src_ptr[stride + 4] +
2238 src_ptr[stride + 5]) * (65536 / 6) >> 16;
2239 dst_ptr[2] = (src_ptr[6] + src_ptr[7] +
2240 src_ptr[stride + 6] + src_ptr[stride + 7]) *
2242 src_ptr += 8;
2249 const uint8* src_ptr, ptrdiff_t src_stride,
2254 const uint8* src_ptr1 = src_ptr + src_stride;
2257 dst_ptr[0] = (src_ptr[0] * y0_fraction + src_ptr1[0] * y1_fraction) >> 8;
2258 dst_ptr[1] = (src_ptr[1] * y0_fraction + src_ptr1[1] * y1_fraction) >> 8;
2259 dst_ptr[2] = (src_ptr[2] * y0_fraction + src_ptr1[2] * y1_fraction) >> 8;
2260 dst_ptr[3] = (src_ptr[3] * y0_fraction + src_ptr1[3] * y1_fraction) >> 8;
2261 dst_ptr[4] = (src_ptr[4] * y0_fraction + src_ptr1[4] * y1_fraction) >> 8;
2262 dst_ptr[5] = (src_ptr[5] * y0_fraction + src_ptr1[5] * y1_fraction) >> 8;
2263 dst_ptr[6] = (src_ptr[6] * y0_fraction + src_ptr1[6] * y1_fraction) >> 8;
2264 dst_ptr[7] = (src_ptr[7] * y0_fraction + src_ptr1[7] * y1_fraction) >> 8;
2265 src_ptr += 8;
2272 void ScaleAddRows_C(const uint8* src_ptr, ptrdiff_t src_stride,
2277 const uint8* s = src_ptr + x;
2297 const uint8* src_ptr, uint8* dst_ptr,
2299 void (*ScaleRowDown2)(const uint8* src_ptr, ptrdiff_t src_stride,
2311 if (IS_ALIGNED(src_ptr, 16) && IS_ALIGNED(src_stride, 16) &&
2320 ScaleRowDown2(src_ptr, src_stride, dst_ptr, dst_width);
2321 src_ptr += (src_stride << 1);
2335 const uint8* src_ptr, uint8* dst_ptr,
2337 void (*ScaleRowDown4)(const uint8* src_ptr, ptrdiff_t src_stride,
2348 IS_ALIGNED(src_ptr, 16) && IS_ALIGNED(src_stride, 16)) {
2354 ScaleRowDown4(src_ptr, src_stride, dst_ptr, dst_width);
2355 src_ptr += (src_stride << 2);
2370 const uint8* src_ptr, uint8* dst_ptr,
2372 void (*ScaleRowDown8)(const uint8* src_ptr, ptrdiff_t src_stride,
2379 IS_ALIGNED(src_ptr, 16) && IS_ALIGNED(src_stride, 16)) {
2385 ScaleRowDown8(src_ptr, src_stride, dst_ptr, dst_width);
2386 src_ptr += (src_stride << 3);
2400 const uint8* src_ptr, uint8* dst_ptr,
2403 void (*ScaleRowDown34_0)(const uint8* src_ptr, ptrdiff_t src_stride,
2405 void (*ScaleRowDown34_1)(const uint8* src_ptr, ptrdiff_t src_stride,
2427 IS_ALIGNED(src_ptr, 16) && IS_ALIGNED(src_stride, 16) && filtering) {
2434 IS_ALIGNED(src_ptr, 16) && IS_ALIGNED(src_stride, 16)) {
2446 ScaleRowDown34_0(src_ptr, src_stride, dst_ptr, dst_width);
2447 src_ptr += src_stride;
2449 ScaleRowDown34_1(src_ptr, src_stride, dst_ptr, dst_width);
2450 src_ptr += src_stride;
2452 ScaleRowDown34_0(src_ptr + src_stride, -src_stride,
2454 src_ptr += src_stride * 2;
2460 ScaleRowDown34_0(src_ptr, src_stride, dst_ptr, dst_width);
2461 src_ptr += src_stride;
2463 ScaleRowDown34_1(src_ptr, 0, dst_ptr, dst_width);
2465 ScaleRowDown34_0(src_ptr, 0, dst_ptr, dst_width);
2489 const uint8* src_ptr, uint8* dst_ptr,
2492 void (*ScaleRowDown38_3)(const uint8* src_ptr, ptrdiff_t src_stride,
2494 void (*ScaleRowDown38_2)(const uint8* src_ptr, ptrdiff_t src_stride,
2515 IS_ALIGNED(src_ptr, 16) && IS_ALIGNED(src_stride, 16)) {
2527 ScaleRowDown38_3(src_ptr, src_stride, dst_ptr, dst_width);
2528 src_ptr += src_stride * 3;
2530 ScaleRowDown38_3(src_ptr, src_stride, dst_ptr, dst_width);
2531 src_ptr += src_stride * 3;
2533 ScaleRowDown38_2(src_ptr, src_stride, dst_ptr, dst_width);
2534 src_ptr += src_stride * 2;
2540 ScaleRowDown38_3(src_ptr, src_stride, dst_ptr, dst_width);
2541 src_ptr += src_stride * 3;
2543 ScaleRowDown38_3(src_ptr, 0, dst_ptr, dst_width);
2545 ScaleRowDown38_3(src_ptr, 0, dst_ptr, dst_width);
2550 ptrdiff_t src_stride, const uint8* src_ptr) {
2556 sum += src_ptr[x];
2558 src_ptr += src_stride;
2565 const uint8* src_ptr, uint8* dst_ptr) {
2570 *dst_ptr++ = SumBox(boxwidth, boxheight, src_stride, src_ptr + ix) /
2575 static __inline uint32 SumPixels(int iboxwidth, const uint16* src_ptr) {
2579 sum += src_ptr[x];
2585 const uint16* src_ptr, uint8* dst_ptr) {
2595 *dst_ptr++ = SumPixels(boxwidth, src_ptr + ix) * scaleptr[boxwidth] >> 16;
2600 const uint16* src_ptr, uint8* dst_ptr) {
2604 *dst_ptr++ = SumPixels(boxwidth, src_ptr + x) * scaleval >> 16;
2621 const uint8* src_ptr, uint8* dst_ptr) {
2634 const uint8* src = src_ptr + iy * src_stride;
2647 void (*ScaleAddRows)(const uint8* src_ptr, ptrdiff_t src_stride,
2651 const uint16* src_ptr, uint8* dst_ptr);
2659 IS_ALIGNED(src_stride, 16) && IS_ALIGNED(src_ptr, 16)) {
2666 const uint8* src = src_ptr + iy * src_stride;
2685 const uint8* src_ptr, uint8* dst_ptr) {
2695 const uint8* src0 = src_ptr + yi * src_stride;
2727 const uint8* src_ptr, uint8* dst_ptr) {
2732 src_stride, dst_stride, src_ptr, dst_ptr);
2736 void (*ScaleFilterRows)(uint8* dst_ptr, const uint8* src_ptr,
2747 IS_ALIGNED(src_stride, 16) && IS_ALIGNED(src_ptr, 16)) {
2753 IS_ALIGNED(src_stride, 16) && IS_ALIGNED(src_ptr, 16)) {
2766 const uint8* src = src_ptr + yi * src_stride;
2787 const uint8* src_ptr, uint8* dst_ptr) {
2794 const uint8* src = src_ptr + yi * src_stride;
2811 const uint8* src_ptr, uint8* dst_ptr,
2815 src_stride, dst_stride, src_ptr, dst_ptr);
2819 src_stride, dst_stride, src_ptr, dst_ptr);
2834 const uint8* src_ptr, uint8* dst_ptr,
2838 src_stride, dst_stride, src_ptr, dst_ptr);
2842 src_stride, dst_stride, src_ptr, dst_ptr);
2845 src_stride, dst_stride, src_ptr, dst_ptr);