Home | History | Annotate | Download | only in x86

Lines Matching refs:_mm_madd_epi16

295                 m_temp_reg_14 = _mm_madd_epi16(m_temp_reg_1, m_coeff3);
318 m_temp_reg_14 = _mm_madd_epi16(m_temp_reg_1, m_coeff3);
358 m_temp_reg_30 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
374 m_temp_reg_30 = _mm_madd_epi16(m_temp_reg_14, m_coeff1);
387 m_temp_reg_30 = _mm_madd_epi16(m_temp_reg_10, m_coeff2);
401 m_temp_reg_30 = _mm_madd_epi16(m_temp_reg_14, m_coeff2);
415 m_temp_reg_30 = _mm_madd_epi16(m_temp_reg_10, m_coeff3);
429 m_temp_reg_30 = _mm_madd_epi16(m_temp_reg_14, m_coeff3);
446 m_temp_reg_30 = _mm_madd_epi16(m_temp_reg_10, m_coeff4);
460 m_temp_reg_30 = _mm_madd_epi16(m_temp_reg_14, m_coeff4);
475 m_temp_reg_30 = _mm_madd_epi16(m_temp_reg_10, m_coeff5);
488 m_temp_reg_30 = _mm_madd_epi16(m_temp_reg_14, m_coeff5);
504 m_temp_reg_30 = _mm_madd_epi16(m_temp_reg_10, m_coeff6);
519 m_temp_reg_30 = _mm_madd_epi16(m_temp_reg_14, m_coeff6);
533 m_temp_reg_30 = _mm_madd_epi16(m_temp_reg_10, m_coeff7);
548 m_temp_reg_30 = _mm_madd_epi16(m_temp_reg_14, m_coeff7);
563 m_temp_reg_30 = _mm_madd_epi16(m_temp_reg_10, m_coeff8);
578 m_temp_reg_30 = _mm_madd_epi16(m_temp_reg_14, m_coeff8);
606 m_temp_reg_14 = _mm_madd_epi16(m_temp_reg_1, m_coeff3);
631 m_temp_reg_14 = _mm_madd_epi16(m_temp_reg_1, m_coeff3);
671 m_temp_reg_30 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
681 m_temp_reg_30 = _mm_madd_epi16(m_temp_reg_14, m_coeff1);
693 m_temp_reg_30 = _mm_madd_epi16(m_temp_reg_10, m_coeff2);
707 m_temp_reg_30 = _mm_madd_epi16(m_temp_reg_14, m_coeff2);
722 m_temp_reg_30 = _mm_madd_epi16(m_temp_reg_10, m_coeff4);
736 m_temp_reg_30 = _mm_madd_epi16(m_temp_reg_14, m_coeff4);
750 m_temp_reg_30 = _mm_madd_epi16(m_temp_reg_10, m_coeff3);
765 m_temp_reg_30 = _mm_madd_epi16(m_temp_reg_14, m_coeff3);
798 m_temp_reg_30 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
815 m_temp_reg_30 = _mm_madd_epi16(m_temp_reg_14, m_coeff1);
831 m_temp_reg_30 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
846 m_temp_reg_30 = _mm_madd_epi16(m_temp_reg_14, m_coeff1);
863 m_temp_reg_30 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
878 m_temp_reg_30 = _mm_madd_epi16(m_temp_reg_14, m_coeff1);
899 m_temp_reg_30 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
915 m_temp_reg_30 = _mm_madd_epi16(m_temp_reg_14, m_coeff1);
931 m_temp_reg_30 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
944 m_temp_reg_30 = _mm_madd_epi16(m_temp_reg_14, m_coeff1);
963 m_temp_reg_30 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
978 m_temp_reg_30 = _mm_madd_epi16(m_temp_reg_14, m_coeff1);
994 m_temp_reg_30 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
1010 m_temp_reg_30 = _mm_madd_epi16(m_temp_reg_14, m_coeff1);
1027 m_temp_reg_30 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
1042 m_temp_reg_30 = _mm_madd_epi16(m_temp_reg_14, m_coeff1);
1075 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_0, m_coeff1); /* eeeo[0] */
1076 m_temp_reg_22 = _mm_madd_epi16(m_temp_reg_0, m_coeff2); /* eeeo[1] */
1078 m_temp_reg_21 = _mm_madd_epi16(m_temp_reg_1, m_coeff3); /* eeee[0] */
1079 m_temp_reg_23 = _mm_madd_epi16(m_temp_reg_1, m_coeff4); /* eeee[1] */
1112 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_0, m_coeff1); /* eeeo[0] */
1113 m_temp_reg_22 = _mm_madd_epi16(m_temp_reg_0, m_coeff2); /* eeeo[1] */
1115 m_temp_reg_21 = _mm_madd_epi16(m_temp_reg_1, m_coeff3); /* eeee[0] */
1116 m_temp_reg_23 = _mm_madd_epi16(m_temp_reg_1, m_coeff4); /* eeee[1] */
1150 m_temp_reg_30 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
1151 m_temp_reg_31 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
1170 m_temp_reg_30 = _mm_madd_epi16(m_temp_reg_14, m_coeff1);
1171 m_temp_reg_31 = _mm_madd_epi16(m_temp_reg_15, m_coeff2);
1186 m_temp_reg_30 = _mm_madd_epi16(m_temp_reg_10, m_coeff3);
1187 m_temp_reg_31 = _mm_madd_epi16(m_temp_reg_11, m_coeff4);
1200 m_temp_reg_30 = _mm_madd_epi16(m_temp_reg_14, m_coeff3);
1201 m_temp_reg_31 = _mm_madd_epi16(m_temp_reg_15, m_coeff4);
1218 m_temp_reg_30 = _mm_madd_epi16(m_temp_reg_10, m_coeff3);
1219 m_temp_reg_31 = _mm_madd_epi16(m_temp_reg_11, m_coeff4);
1235 m_temp_reg_30 = _mm_madd_epi16(m_temp_reg_14, m_coeff3);
1236 m_temp_reg_31 = _mm_madd_epi16(m_temp_reg_15, m_coeff4);
1255 m_temp_reg_30 = _mm_madd_epi16(m_temp_reg_10, m_coeff3);
1256 m_temp_reg_31 = _mm_madd_epi16(m_temp_reg_11, m_coeff4);
1273 m_temp_reg_30 = _mm_madd_epi16(m_temp_reg_14, m_coeff3);
1274 m_temp_reg_31 = _mm_madd_epi16(m_temp_reg_15, m_coeff4);
1318 m_temp_reg_30 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
1319 m_temp_reg_31 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
1323 m_temp_reg_32 = _mm_madd_epi16(m_temp_reg_12, m_coeff3);
1324 m_temp_reg_33 = _mm_madd_epi16(m_temp_reg_13, m_coeff4);
1346 m_temp_reg_30 = _mm_madd_epi16(m_temp_reg_14, m_coeff1);
1347 m_temp_reg_31 = _mm_madd_epi16(m_temp_reg_15, m_coeff2);
1351 m_temp_reg_32 = _mm_madd_epi16(m_temp_reg_16, m_coeff3);
1352 m_temp_reg_33 = _mm_madd_epi16(m_temp_reg_17, m_coeff4);
1376 m_temp_reg_30 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
1377 m_temp_reg_31 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
1381 m_temp_reg_32 = _mm_madd_epi16(m_temp_reg_12, m_coeff3);
1382 m_temp_reg_33 = _mm_madd_epi16(m_temp_reg_13, m_coeff4);
1400 m_temp_reg_30 = _mm_madd_epi16(m_temp_reg_14, m_coeff1);
1401 m_temp_reg_31 = _mm_madd_epi16(m_temp_reg_15, m_coeff2);
1405 m_temp_reg_32 = _mm_madd_epi16(m_temp_reg_16, m_coeff3);
1406 m_temp_reg_33 = _mm_madd_epi16(m_temp_reg_17, m_coeff4);
1429 m_temp_reg_30 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
1430 m_temp_reg_31 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
1434 m_temp_reg_32 = _mm_madd_epi16(m_temp_reg_12, m_coeff3);
1435 m_temp_reg_33 = _mm_madd_epi16(m_temp_reg_13, m_coeff4);
1455 m_temp_reg_30 = _mm_madd_epi16(m_temp_reg_14, m_coeff1);
1456 m_temp_reg_31 = _mm_madd_epi16(m_temp_reg_15, m_coeff2);
1460 m_temp_reg_32 = _mm_madd_epi16(m_temp_reg_16, m_coeff3);
1461 m_temp_reg_33 = _mm_madd_epi16(m_temp_reg_17, m_coeff4);
1485 m_temp_reg_30 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
1486 m_temp_reg_31 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
1490 m_temp_reg_32 = _mm_madd_epi16(m_temp_reg_12, m_coeff3);
1491 m_temp_reg_33 = _mm_madd_epi16(m_temp_reg_13, m_coeff4);
1510 m_temp_reg_30 = _mm_madd_epi16(m_temp_reg_14, m_coeff1);
1511 m_temp_reg_31 = _mm_madd_epi16(m_temp_reg_15, m_coeff2);
1515 m_temp_reg_32 = _mm_madd_epi16(m_temp_reg_16, m_coeff3);
1516 m_temp_reg_33 = _mm_madd_epi16(m_temp_reg_17, m_coeff4);
1540 m_temp_reg_30 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
1541 m_temp_reg_31 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
1545 m_temp_reg_32 = _mm_madd_epi16(m_temp_reg_12, m_coeff3);
1546 m_temp_reg_33 = _mm_madd_epi16(m_temp_reg_13, m_coeff4);
1565 m_temp_reg_30 = _mm_madd_epi16(m_temp_reg_14, m_coeff1);
1566 m_temp_reg_31 = _mm_madd_epi16(m_temp_reg_15, m_coeff2);
1570 m_temp_reg_32 = _mm_madd_epi16(m_temp_reg_16, m_coeff3);
1571 m_temp_reg_33 = _mm_madd_epi16(m_temp_reg_17, m_coeff4);
1596 m_temp_reg_30 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
1597 m_temp_reg_31 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
1601 m_temp_reg_32 = _mm_madd_epi16(m_temp_reg_12, m_coeff3);
1602 m_temp_reg_33 = _mm_madd_epi16(m_temp_reg_13, m_coeff4);
1621 m_temp_reg_30 = _mm_madd_epi16(m_temp_reg_14, m_coeff1);
1622 m_temp_reg_31 = _mm_madd_epi16(m_temp_reg_15, m_coeff2);
1626 m_temp_reg_32 = _mm_madd_epi16(m_temp_reg_16, m_coeff3);
1627 m_temp_reg_33 = _mm_madd_epi16(m_temp_reg_17, m_coeff4);
1651 m_temp_reg_30 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
1652 m_temp_reg_31 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
1656 m_temp_reg_32 = _mm_madd_epi16(m_temp_reg_12, m_coeff3);
1657 m_temp_reg_33 = _mm_madd_epi16(m_temp_reg_13, m_coeff4);
1676 m_temp_reg_30 = _mm_madd_epi16(m_temp_reg_14, m_coeff1);
1677 m_temp_reg_31 = _mm_madd_epi16(m_temp_reg_15, m_coeff2);
1681 m_temp_reg_32 = _mm_madd_epi16(m_temp_reg_16, m_coeff3);
1682 m_temp_reg_33 = _mm_madd_epi16(m_temp_reg_17, m_coeff4);
1706 m_temp_reg_30 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
1707 m_temp_reg_31 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
1711 m_temp_reg_32 = _mm_madd_epi16(m_temp_reg_12, m_coeff3);
1712 m_temp_reg_33 = _mm_madd_epi16(m_temp_reg_13, m_coeff4);
1732 m_temp_reg_30 = _mm_madd_epi16(m_temp_reg_14, m_coeff1);
1733 m_temp_reg_31 = _mm_madd_epi16(m_temp_reg_15, m_coeff2);
1737 m_temp_reg_32 = _mm_madd_epi16(m_temp_reg_16, m_coeff3);
1738 m_temp_reg_33 = _mm_madd_epi16(m_temp_reg_17, m_coeff4);
1822 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
1852 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
1882 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
1911 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
1940 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
1970 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
1999 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
2029 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
2058 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
2086 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
2114 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
2142 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
2171 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
2200 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
2228 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
2257 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
2315 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
2316 m_temp_reg_21 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
2348 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
2349 m_temp_reg_21 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
2381 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
2382 m_temp_reg_21 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
2414 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
2415 m_temp_reg_21 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
2447 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
2448 m_temp_reg_21 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
2480 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
2481 m_temp_reg_21 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
2513 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
2514 m_temp_reg_21 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
2546 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
2547 m_temp_reg_21 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
2579 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
2580 m_temp_reg_21 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
2611 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
2612 m_temp_reg_21 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
2643 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
2644 m_temp_reg_21 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
2676 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
2677 m_temp_reg_21 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
2709 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
2710 m_temp_reg_21 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
2742 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
2743 m_temp_reg_21 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
2774 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
2775 m_temp_reg_21 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
2807 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
2808 m_temp_reg_21 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
2894 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
2895 m_temp_reg_21 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
2896 m_temp_reg_22 = _mm_madd_epi16(m_temp_reg_12, m_coeff3);
2897 m_temp_reg_23 = _mm_madd_epi16(m_temp_reg_13, m_coeff4);
2904 m_temp_reg_40 = _mm_madd_epi16(temp1, m_coeff5);
2905 m_temp_reg_41 = _mm_madd_epi16(temp2, m_coeff6);
2906 m_temp_reg_42 = _mm_madd_epi16(temp3, m_coeff7);
2907 m_temp_reg_43 = _mm_madd_epi16(temp4, m_coeff8);
2951 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
2952 m_temp_reg_21 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
2953 m_temp_reg_22 = _mm_madd_epi16(m_temp_reg_12, m_coeff3);
2954 m_temp_reg_23 = _mm_madd_epi16(m_temp_reg_13, m_coeff4);
2961 m_temp_reg_40 = _mm_madd_epi16(temp1, m_coeff5);
2962 m_temp_reg_41 = _mm_madd_epi16(temp2, m_coeff6);
2963 m_temp_reg_42 = _mm_madd_epi16(temp3, m_coeff7);
2964 m_temp_reg_43 = _mm_madd_epi16(temp4, m_coeff8);
3007 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
3008 m_temp_reg_21 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
3009 m_temp_reg_22 = _mm_madd_epi16(m_temp_reg_12, m_coeff3);
3010 m_temp_reg_23 = _mm_madd_epi16(m_temp_reg_13, m_coeff4);
3017 m_temp_reg_40 = _mm_madd_epi16(temp1, m_coeff5);
3018 m_temp_reg_41 = _mm_madd_epi16(temp2, m_coeff6);
3019 m_temp_reg_42 = _mm_madd_epi16(temp3, m_coeff7);
3020 m_temp_reg_43 = _mm_madd_epi16(temp4, m_coeff8);
3064 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
3065 m_temp_reg_21 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
3066 m_temp_reg_22 = _mm_madd_epi16(m_temp_reg_12, m_coeff3);
3067 m_temp_reg_23 = _mm_madd_epi16(m_temp_reg_13, m_coeff4);
3074 m_temp_reg_40 = _mm_madd_epi16(temp1, m_coeff5);
3075 m_temp_reg_41 = _mm_madd_epi16(temp2, m_coeff6);
3076 m_temp_reg_42 = _mm_madd_epi16(temp3, m_coeff7);
3077 m_temp_reg_43 = _mm_madd_epi16(temp4, m_coeff8);
3120 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
3121 m_temp_reg_21 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
3122 m_temp_reg_22 = _mm_madd_epi16(m_temp_reg_12, m_coeff3);
3123 m_temp_reg_23 = _mm_madd_epi16(m_temp_reg_13, m_coeff4);
3130 m_temp_reg_40 = _mm_madd_epi16(temp1, m_coeff5);
3131 m_temp_reg_41 = _mm_madd_epi16(temp2, m_coeff6);
3132 m_temp_reg_42 = _mm_madd_epi16(temp3, m_coeff7);
3133 m_temp_reg_43 = _mm_madd_epi16(temp4, m_coeff8);
3177 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
3178 m_temp_reg_21 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
3179 m_temp_reg_22 = _mm_madd_epi16(m_temp_reg_12, m_coeff3);
3180 m_temp_reg_23 = _mm_madd_epi16(m_temp_reg_13, m_coeff4);
3187 m_temp_reg_40 = _mm_madd_epi16(temp1, m_coeff5);
3188 m_temp_reg_41 = _mm_madd_epi16(temp2, m_coeff6);
3189 m_temp_reg_42 = _mm_madd_epi16(temp3, m_coeff7);
3190 m_temp_reg_43 = _mm_madd_epi16(temp4, m_coeff8);
3234 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
3235 m_temp_reg_21 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
3236 m_temp_reg_22 = _mm_madd_epi16(m_temp_reg_12, m_coeff3);
3237 _mm_madd_epi16(m_temp_reg_13, m_coeff4);
3244 m_temp_reg_40 = _mm_madd_epi16(temp1, m_coeff5);
3245 m_temp_reg_41 = _mm_madd_epi16(temp2, m_coeff6);
3246 m_temp_reg_42 = _mm_madd_epi16(temp3, m_coeff7);
3247 m_temp_reg_43 = _mm_madd_epi16(temp4, m_coeff8);
3290 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
3291 m_temp_reg_21 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
3292 m_temp_reg_22 = _mm_madd_epi16(m_temp_reg_12, m_coeff3);
3293 m_temp_reg_23 = _mm_madd_epi16(m_temp_reg_13, m_coeff4);
3300 m_temp_reg_40 = _mm_madd_epi16(temp1, m_coeff5);
3301 m_temp_reg_41 = _mm_madd_epi16(temp2, m_coeff6);
3302 m_temp_reg_42 = _mm_madd_epi16(temp3, m_coeff7);
3303 m_temp_reg_43 = _mm_madd_epi16(temp4, m_coeff8);
3348 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
3349 m_temp_reg_21 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
3350 m_temp_reg_22 = _mm_madd_epi16(m_temp_reg_12, m_coeff3);
3351 m_temp_reg_23 = _mm_madd_epi16(m_temp_reg_13, m_coeff4);
3358 m_temp_reg_40 = _mm_madd_epi16(temp1, m_coeff5);
3359 m_temp_reg_41 = _mm_madd_epi16(temp2, m_coeff6);
3360 m_temp_reg_42 = _mm_madd_epi16(temp3, m_coeff7);
3361 m_temp_reg_43 = _mm_madd_epi16(temp4, m_coeff8);
3404 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
3405 m_temp_reg_21 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
3406 m_temp_reg_22 = _mm_madd_epi16(m_temp_reg_12, m_coeff3);
3407 m_temp_reg_23 = _mm_madd_epi16(m_temp_reg_13, m_coeff4);
3414 m_temp_reg_40 = _mm_madd_epi16(temp1, m_coeff5);
3415 m_temp_reg_41 = _mm_madd_epi16(temp2, m_coeff6);
3416 m_temp_reg_42 = _mm_madd_epi16(temp3, m_coeff7);
3417 m_temp_reg_43 = _mm_madd_epi16(temp4, m_coeff8);
3459 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
3460 m_temp_reg_21 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
3461 m_temp_reg_22 = _mm_madd_epi16(m_temp_reg_12, m_coeff3);
3462 m_temp_reg_23 = _mm_madd_epi16(m_temp_reg_13, m_coeff4);
3469 m_temp_reg_40 = _mm_madd_epi16(temp1, m_coeff5);
3470 m_temp_reg_41 = _mm_madd_epi16(temp2, m_coeff6);
3471 m_temp_reg_42 = _mm_madd_epi16(temp3, m_coeff7);
3472 m_temp_reg_43 = _mm_madd_epi16(temp4, m_coeff8);
3514 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
3515 m_temp_reg_21 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
3516 m_temp_reg_22 = _mm_madd_epi16(m_temp_reg_12, m_coeff3);
3517 m_temp_reg_23 = _mm_madd_epi16(m_temp_reg_13, m_coeff4);
3524 m_temp_reg_40 = _mm_madd_epi16(temp1, m_coeff5);
3525 m_temp_reg_41 = _mm_madd_epi16(temp2, m_coeff6);
3526 m_temp_reg_42 = _mm_madd_epi16(temp3, m_coeff7);
3527 m_temp_reg_43 = _mm_madd_epi16(temp4, m_coeff8);
3571 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
3572 m_temp_reg_21 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
3573 m_temp_reg_22 = _mm_madd_epi16(m_temp_reg_12, m_coeff3);
3574 m_temp_reg_23 = _mm_madd_epi16(m_temp_reg_13, m_coeff4);
3581 m_temp_reg_40 = _mm_madd_epi16(temp1, m_coeff5);
3582 m_temp_reg_41 = _mm_madd_epi16(temp2, m_coeff6);
3583 m_temp_reg_42 = _mm_madd_epi16(temp3, m_coeff7);
3584 m_temp_reg_43 = _mm_madd_epi16(temp4, m_coeff8);
3628 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
3629 m_temp_reg_21 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
3630 m_temp_reg_22 = _mm_madd_epi16(m_temp_reg_12, m_coeff3);
3631 m_temp_reg_23 = _mm_madd_epi16(m_temp_reg_13, m_coeff4);
3638 m_temp_reg_40 = _mm_madd_epi16(temp1, m_coeff5);
3639 m_temp_reg_41 = _mm_madd_epi16(temp2, m_coeff6);
3640 m_temp_reg_42 = _mm_madd_epi16(temp3, m_coeff7);
3641 m_temp_reg_43 = _mm_madd_epi16(temp4, m_coeff8);
3684 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
3685 m_temp_reg_21 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
3686 m_temp_reg_22 = _mm_madd_epi16(m_temp_reg_12, m_coeff3);
3687 m_temp_reg_23 = _mm_madd_epi16(m_temp_reg_13, m_coeff4);
3694 m_temp_reg_40 = _mm_madd_epi16(temp1, m_coeff5);
3695 m_temp_reg_41 = _mm_madd_epi16(temp2, m_coeff6);
3696 m_temp_reg_42 = _mm_madd_epi16(temp3, m_coeff7);
3697 m_temp_reg_43 = _mm_madd_epi16(temp4, m_coeff8);
3740 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
3741 m_temp_reg_21 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
3742 m_temp_reg_22 = _mm_madd_epi16(m_temp_reg_12, m_coeff3);
3743 m_temp_reg_23 = _mm_madd_epi16(m_temp_reg_13, m_coeff4);
3750 m_temp_reg_40 = _mm_madd_epi16(temp1, m_coeff5);
3751 m_temp_reg_41 = _mm_madd_epi16(temp2, m_coeff6);
3752 m_temp_reg_42 = _mm_madd_epi16(temp3, m_coeff7);
3753 m_temp_reg_43 = _mm_madd_epi16(temp4, m_coeff8);
4016 m_temp_reg_90 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
4021 m_temp_reg_91 = _mm_madd_epi16(m_temp_reg_10, m_coeff2);
4026 m_temp_reg_92 = _mm_madd_epi16(m_temp_reg_10, m_coeff3);
4031 m_temp_reg_93 = _mm_madd_epi16(m_temp_reg_10, m_coeff4);
4035 m_temp_reg_94 = _mm_madd_epi16(m_temp_reg_10, m_coeff5);
4040 m_temp_reg_95 = _mm_madd_epi16(m_temp_reg_10, m_coeff6);
4045 m_temp_reg_96 = _mm_madd_epi16(m_temp_reg_10, m_coeff7);
4049 m_temp_reg_97 = _mm_madd_epi16(m_temp_reg_10, m_coeff8);
4059 m_temp_reg_14 = _mm_madd_epi16(m_temp_reg_1, m_coeff3);
4061 m_temp_reg_16 = _mm_madd_epi16(m_temp_reg_1, m_coeff3);
4105 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
4131 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
4157 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
4183 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
4209 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
4235 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
4261 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
4287 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
4313 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
4338 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
4364 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
4389 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
4415 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
4441 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
4466 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
4492 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
4530 m_temp_reg_90 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
4538 m_temp_reg_91 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
4545 m_temp_reg_92 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
4554 m_temp_reg_93 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
4562 m_temp_reg_94 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
4570 m_temp_reg_95 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
4576 m_temp_reg_96 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
4582 m_temp_reg_97 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
4602 temp1 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
4608 temp2 = _mm_madd_epi16(m_temp_reg_10, m_coeff2);
4614 temp3 = _mm_madd_epi16(m_temp_reg_10, m_coeff4);
4621 temp4 = _mm_madd_epi16(m_temp_reg_10, m_coeff3);
4636 m_temp_reg_14 = _mm_madd_epi16(m_temp_reg_1, m_coeff3);
4637 m_temp_reg_16 = _mm_madd_epi16(m_temp_reg_1, m_coeff3);
4696 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
4697 m_temp_reg_21 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
4727 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
4728 m_temp_reg_21 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
4757 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
4758 m_temp_reg_21 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
4787 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
4788 m_temp_reg_21 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
4817 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
4818 m_temp_reg_21 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
4847 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
4848 m_temp_reg_21 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
4877 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
4878 m_temp_reg_21 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
4907 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
4908 m_temp_reg_21 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
4937 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
4938 m_temp_reg_21 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
4966 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
4967 m_temp_reg_21 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
4995 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
4996 m_temp_reg_21 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
5024 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
5025 m_temp_reg_21 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
5054 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
5055 m_temp_reg_21 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
5084 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
5085 m_temp_reg_21 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
5113 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
5114 m_temp_reg_21 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
5142 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
5143 m_temp_reg_21 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
5195 m_temp_reg_30 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
5196 m_temp_reg_31 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
5200 m_temp_reg_32 = _mm_madd_epi16(m_temp_reg_12, m_coeff3);
5201 m_temp_reg_33 = _mm_madd_epi16(m_temp_reg_13, m_coeff4);
5216 m_temp_reg_30 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
5217 m_temp_reg_31 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
5221 m_temp_reg_32 = _mm_madd_epi16(m_temp_reg_12, m_coeff3);
5222 m_temp_reg_33 = _mm_madd_epi16(m_temp_reg_13, m_coeff4);
5237 m_temp_reg_30 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
5238 m_temp_reg_31 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
5242 m_temp_reg_32 = _mm_madd_epi16(m_temp_reg_12, m_coeff3);
5243 m_temp_reg_33 = _mm_madd_epi16(m_temp_reg_13, m_coeff4);
5258 m_temp_reg_30 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
5259 m_temp_reg_31 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
5263 m_temp_reg_32 = _mm_madd_epi16(m_temp_reg_12, m_coeff3);
5264 m_temp_reg_33 = _mm_madd_epi16(m_temp_reg_13, m_coeff4);
5280 m_temp_reg_30 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
5281 m_temp_reg_31 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
5285 m_temp_reg_32 = _mm_madd_epi16(m_temp_reg_12, m_coeff3);
5286 m_temp_reg_33 = _mm_madd_epi16(m_temp_reg_13, m_coeff4);
5301 m_temp_reg_30 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
5302 m_temp_reg_31 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
5306 m_temp_reg_32 = _mm_madd_epi16(m_temp_reg_12, m_coeff3);
5307 m_temp_reg_33 = _mm_madd_epi16(m_temp_reg_13, m_coeff4);
5321 m_temp_reg_30 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
5322 m_temp_reg_31 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
5326 m_temp_reg_32 = _mm_madd_epi16(m_temp_reg_12, m_coeff3);
5327 m_temp_reg_33 = _mm_madd_epi16(m_temp_reg_13, m_coeff4);
5342 m_temp_reg_30 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
5343 m_temp_reg_31 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
5347 m_temp_reg_32 = _mm_madd_epi16(m_temp_reg_12, m_coeff3);
5348 m_temp_reg_33 = _mm_madd_epi16(m_temp_reg_13, m_coeff4);
5375 m_temp_reg_30 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
5376 m_temp_reg_31 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
5387 m_temp_reg_30 = _mm_madd_epi16(m_temp_reg_10, m_coeff3);
5388 m_temp_reg_31 = _mm_madd_epi16(m_temp_reg_11, m_coeff4);
5399 m_temp_reg_30 = _mm_madd_epi16(m_temp_reg_10, m_coeff3);
5400 m_temp_reg_31 = _mm_madd_epi16(m_temp_reg_11, m_coeff4);
5411 m_temp_reg_30 = _mm_madd_epi16(m_temp_reg_10, m_coeff3);
5412 m_temp_reg_31 = _mm_madd_epi16(m_temp_reg_11, m_coeff4);
5437 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_0, m_coeff1); /* eeeo[0] */
5438 m_temp_reg_22 = _mm_madd_epi16(m_temp_reg_0, m_coeff2); /* eeeo[1] */
5440 m_temp_reg_21 = _mm_madd_epi16(m_temp_reg_1, m_coeff3); /* eeee[0] */
5441 m_temp_reg_23 = _mm_madd_epi16(m_temp_reg_1, m_coeff4); /* eeee[1] */
5543 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
5544 m_temp_reg_21 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
5545 m_temp_reg_22 = _mm_madd_epi16(m_temp_reg_12, m_coeff3);
5546 m_temp_reg_23 = _mm_madd_epi16(m_temp_reg_13, m_coeff4);
5553 m_temp_reg_40 = _mm_madd_epi16(m_temp_reg_14, m_coeff5);
5554 m_temp_reg_41 = _mm_madd_epi16(m_temp_reg_15, m_coeff6);
5555 m_temp_reg_42 = _mm_madd_epi16(m_temp_reg_16, m_coeff7);
5556 m_temp_reg_43 = _mm_madd_epi16(m_temp_reg_17, m_coeff8);
5596 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
5597 m_temp_reg_21 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
5598 m_temp_reg_22 = _mm_madd_epi16(m_temp_reg_12, m_coeff3);
5599 m_temp_reg_23 = _mm_madd_epi16(m_temp_reg_13, m_coeff4);
5606 m_temp_reg_40 = _mm_madd_epi16(m_temp_reg_14, m_coeff5);
5607 m_temp_reg_41 = _mm_madd_epi16(m_temp_reg_15, m_coeff6);
5608 m_temp_reg_42 = _mm_madd_epi16(m_temp_reg_16, m_coeff7);
5609 m_temp_reg_43 = _mm_madd_epi16(m_temp_reg_17, m_coeff8);
5649 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
5650 m_temp_reg_21 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
5651 m_temp_reg_22 = _mm_madd_epi16(m_temp_reg_12, m_coeff3);
5652 m_temp_reg_23 = _mm_madd_epi16(m_temp_reg_13, m_coeff4);
5659 m_temp_reg_40 = _mm_madd_epi16(m_temp_reg_14, m_coeff5);
5660 m_temp_reg_41 = _mm_madd_epi16(m_temp_reg_15, m_coeff6);
5661 m_temp_reg_42 = _mm_madd_epi16(m_temp_reg_16, m_coeff7);
5662 m_temp_reg_43 = _mm_madd_epi16(m_temp_reg_17, m_coeff8);
5702 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
5703 m_temp_reg_21 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
5704 m_temp_reg_22 = _mm_madd_epi16(m_temp_reg_12, m_coeff3);
5705 m_temp_reg_23 = _mm_madd_epi16(m_temp_reg_13, m_coeff4);
5712 m_temp_reg_40 = _mm_madd_epi16(m_temp_reg_14, m_coeff5);
5713 m_temp_reg_41 = _mm_madd_epi16(m_temp_reg_15, m_coeff6);
5714 m_temp_reg_42 = _mm_madd_epi16(m_temp_reg_16, m_coeff7);
5715 m_temp_reg_43 = _mm_madd_epi16(m_temp_reg_17, m_coeff8);
5755 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
5756 m_temp_reg_21 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
5757 m_temp_reg_22 = _mm_madd_epi16(m_temp_reg_12, m_coeff3);
5758 m_temp_reg_23 = _mm_madd_epi16(m_temp_reg_13, m_coeff4);
5765 m_temp_reg_40 = _mm_madd_epi16(m_temp_reg_14, m_coeff5);
5766 m_temp_reg_41 = _mm_madd_epi16(m_temp_reg_15, m_coeff6);
5767 m_temp_reg_42 = _mm_madd_epi16
5768 m_temp_reg_43 = _mm_madd_epi16(m_temp_reg_17, m_coeff8);
5807 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
5808 m_temp_reg_21 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
5809 m_temp_reg_22 = _mm_madd_epi16(m_temp_reg_12, m_coeff3);
5810 m_temp_reg_23 = _mm_madd_epi16(m_temp_reg_13, m_coeff4);
5817 m_temp_reg_40 = _mm_madd_epi16(m_temp_reg_14, m_coeff5);
5818 m_temp_reg_41 = _mm_madd_epi16(m_temp_reg_15, m_coeff6);
5819 m_temp_reg_42 = _mm_madd_epi16(m_temp_reg_16, m_coeff7);
5820 m_temp_reg_43 = _mm_madd_epi16(m_temp_reg_17, m_coeff8);
5860 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
5861 m_temp_reg_21 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
5862 m_temp_reg_22 = _mm_madd_epi16(m_temp_reg_12, m_coeff3);
5863 m_temp_reg_23 = _mm_madd_epi16(m_temp_reg_13, m_coeff4);
5870 m_temp_reg_40 = _mm_madd_epi16(m_temp_reg_14, m_coeff5);
5871 m_temp_reg_41 = _mm_madd_epi16(m_temp_reg_15, m_coeff6);
5872 m_temp_reg_42 = _mm_madd_epi16(m_temp_reg_16, m_coeff7);
5873 m_temp_reg_43 = _mm_madd_epi16(m_temp_reg_17, m_coeff8);
5913 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
5914 m_temp_reg_21 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
5915 m_temp_reg_22 = _mm_madd_epi16(m_temp_reg_12, m_coeff3);
5916 m_temp_reg_23 = _mm_madd_epi16(m_temp_reg_13, m_coeff4);
5923 m_temp_reg_40 = _mm_madd_epi16(m_temp_reg_14, m_coeff5);
5924 m_temp_reg_41 = _mm_madd_epi16(m_temp_reg_15, m_coeff6);
5925 m_temp_reg_42 = _mm_madd_epi16(m_temp_reg_16, m_coeff7);
5926 m_temp_reg_43 = _mm_madd_epi16(m_temp_reg_17, m_coeff8);
5966 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
5967 m_temp_reg_21 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
5968 m_temp_reg_22 = _mm_madd_epi16(m_temp_reg_12, m_coeff3);
5969 m_temp_reg_23 = _mm_madd_epi16(m_temp_reg_13, m_coeff4);
5976 m_temp_reg_40 = _mm_madd_epi16(m_temp_reg_14, m_coeff5);
5977 m_temp_reg_41 = _mm_madd_epi16(m_temp_reg_15, m_coeff6);
5978 m_temp_reg_42 = _mm_madd_epi16(m_temp_reg_16, m_coeff7);
5979 m_temp_reg_43 = _mm_madd_epi16(m_temp_reg_17, m_coeff8);
6018 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
6019 m_temp_reg_21 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
6020 m_temp_reg_22 = _mm_madd_epi16(m_temp_reg_12, m_coeff3);
6021 m_temp_reg_23 = _mm_madd_epi16(m_temp_reg_13, m_coeff4);
6028 m_temp_reg_40 = _mm_madd_epi16(m_temp_reg_14, m_coeff5);
6029 m_temp_reg_41 = _mm_madd_epi16(m_temp_reg_15, m_coeff6);
6030 m_temp_reg_42 = _mm_madd_epi16(m_temp_reg_16, m_coeff7);
6031 m_temp_reg_43 = _mm_madd_epi16(m_temp_reg_17, m_coeff8);
6070 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
6071 m_temp_reg_21 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
6072 m_temp_reg_22 = _mm_madd_epi16(m_temp_reg_12, m_coeff3);
6073 m_temp_reg_23 = _mm_madd_epi16(m_temp_reg_13, m_coeff4);
6080 m_temp_reg_40 = _mm_madd_epi16(m_temp_reg_14, m_coeff5);
6081 m_temp_reg_41 = _mm_madd_epi16(m_temp_reg_15, m_coeff6);
6082 m_temp_reg_42 = _mm_madd_epi16(m_temp_reg_16, m_coeff7);
6083 m_temp_reg_43 = _mm_madd_epi16(m_temp_reg_17, m_coeff8);
6123 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
6124 m_temp_reg_21 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
6125 m_temp_reg_22 = _mm_madd_epi16(m_temp_reg_12, m_coeff3);
6126 m_temp_reg_23 = _mm_madd_epi16(m_temp_reg_13, m_coeff4);
6133 m_temp_reg_40 = _mm_madd_epi16(m_temp_reg_14, m_coeff5);
6134 m_temp_reg_41 = _mm_madd_epi16(m_temp_reg_15, m_coeff6);
6135 m_temp_reg_42 = _mm_madd_epi16(m_temp_reg_16, m_coeff7);
6136 m_temp_reg_43 = _mm_madd_epi16(m_temp_reg_17, m_coeff8);
6176 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
6177 m_temp_reg_21 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
6178 m_temp_reg_22 = _mm_madd_epi16(m_temp_reg_12, m_coeff3);
6179 m_temp_reg_23 = _mm_madd_epi16(m_temp_reg_13, m_coeff4);
6186 m_temp_reg_40 = _mm_madd_epi16(m_temp_reg_14, m_coeff5);
6187 m_temp_reg_41 = _mm_madd_epi16(m_temp_reg_15, m_coeff6);
6188 m_temp_reg_42 = _mm_madd_epi16(m_temp_reg_16, m_coeff7);
6189 m_temp_reg_43 = _mm_madd_epi16(m_temp_reg_17, m_coeff8);
6229 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
6230 m_temp_reg_21 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
6231 m_temp_reg_22 = _mm_madd_epi16(m_temp_reg_12, m_coeff3);
6232 m_temp_reg_23 = _mm_madd_epi16(m_temp_reg_13, m_coeff4);
6239 m_temp_reg_40 = _mm_madd_epi16(m_temp_reg_14, m_coeff5);
6240 m_temp_reg_41 = _mm_madd_epi16(m_temp_reg_15, m_coeff6);
6241 m_temp_reg_42 = _mm_madd_epi16(m_temp_reg_16, m_coeff7);
6242 m_temp_reg_43 = _mm_madd_epi16(m_temp_reg_17, m_coeff8);
6281 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
6282 m_temp_reg_21 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
6283 m_temp_reg_22 = _mm_madd_epi16(m_temp_reg_12, m_coeff3);
6284 m_temp_reg_23 = _mm_madd_epi16(m_temp_reg_13, m_coeff4);
6291 m_temp_reg_40 = _mm_madd_epi16(m_temp_reg_14, m_coeff5);
6292 m_temp_reg_41 = _mm_madd_epi16(m_temp_reg_15, m_coeff6);
6293 m_temp_reg_42 = _mm_madd_epi16(m_temp_reg_16, m_coeff7);
6294 m_temp_reg_43 = _mm_madd_epi16(m_temp_reg_17, m_coeff8);
6334 m_temp_reg_20 = _mm_madd_epi16(m_temp_reg_10, m_coeff1);
6335 m_temp_reg_21 = _mm_madd_epi16(m_temp_reg_11, m_coeff2);
6336 m_temp_reg_22 = _mm_madd_epi16(m_temp_reg_12, m_coeff3);
6337 m_temp_reg_23 = _mm_madd_epi16(m_temp_reg_13, m_coeff4);
6344 m_temp_reg_40 = _mm_madd_epi16(m_temp_reg_14, m_coeff5);
6345 m_temp_reg_41 = _mm_madd_epi16(m_temp_reg_15, m_coeff6);
6346 m_temp_reg_42 = _mm_madd_epi16(m_temp_reg_16, m_coeff7);
6347 m_temp_reg_43 = _mm_madd_epi16(m_temp_reg_17, m_coeff8);