Lines Matching full:s16
211 vmull.s16 q12,d8,d0[1] @// y1 * cos1(part of b0)
212 vmull.s16 q13,d8,d0[3] @// y1 * cos3(part of b1)
213 vmull.s16 q14,d8,d1[1] @// y1 * sin3(part of b2)
214 vmull.s16 q15,d8,d1[3] @// y1 * sin1(part of b3)
216 vmlal.s16 q12,d9,d0[3] @// y1 * cos1 + y3 * cos3(part of b0)
217 vmlal.s16 q13,d9,d2[1] @// y1 * cos3 - y3 * sin1(part of b1)
218 vmlal.s16 q14,d9,d3[3] @// y1 * sin3 - y3 * cos1(part of b2)
219 vmlal.s16 q15,d9,d5[1] @// y1 * sin1 - y3 * sin3(part of b3)
225 vmull.s16 q10,d10,d0[0]
226 vmlal.s16 q10,d11,d0[2]
229 vmull.s16 q11,d10,d0[0]
230 vmlal.s16 q11,d11,d1[2]
232 vmull.s16 q8,d10,d0[0]
233 vmlal.s16 q8,d11,d2[2]
235 vmull.s16 q9,d10,d0[0]
236 vmlal.s16 q9,d11,d3[2]
251 vmlal.s16 q12,d14,d1[1]
252 vmlal.s16 q13,d14,d3[3]
253 vmlal.s16 q14,d14,d6[1]
254 vmlsl.s16 q15,d14,d7[1]
257 vmlal.s16 q12,d15,d1[3]
258 vmlal.s16 q13,d15,d5[1]
259 vmlsl.s16 q14,d15,d7[1]
260 vmlsl.s16 q15,d15,d3[3]
263 vmlal.s16 q10,d12,d1[0]
264 vmlal.s16 q10,d13,d1[2]
265 vmlal.s16 q11,d12,d3[0]
266 vmlal.s16 q11,d13,d4[2]
267 vmlal.s16 q8,d12,d5[0]
268 vmlal.s16 q8,d13,d7[2]
269 vmlal.s16 q9,d12,d7[0]
270 vmlsl.s16 q9,d13,d5[2]
281 vmlal.s16 q12,d8,d2[1] @// y1 * cos1(part of b0)
282 vmlal.s16 q13,d8,d6[3] @// y1 * cos3(part of b1)
283 vmlsl.s16 q14,d8,d4[3] @// y1 * sin3(part of b2)
284 vmlsl.s16 q15,d8,d0[1] @// y1 * sin1(part of b3)
286 vmlal.s16 q12,d9,d2[3] @// y1 * cos1 + y3 * cos3(part of b0)
287 vmlsl.s16 q13,d9,d7[3] @// y1 * cos3 - y3 * sin1(part of b1)
288 vmlsl.s16 q14,d9,d2[1] @// y1 * sin3 - y3 * cos1(part of b2)
289 vmlsl.s16 q15,d9,d3[1] @// y1 * sin1 - y3 * sin3(part of b3)
295 vmlal.s16 q10,d10,d2[0]
296 vmlal.s16 q10,d11,d2[2]
299 vmlal.s16 q11,d10,d6[0]
300 vmlal.s16 q11,d11,d7[2]
302 vmlsl.s16 q8,d10,d6[0]
303 vmlsl.s16 q8,d11,d3[2]
305 vmlsl.s16 q9,d10,d2[0]
306 vmlsl.s16 q9,d11,d1[2]
325 vmlal.s16 q12,d14,d3[1]
326 vmlsl.s16 q13,d14,d6[1]
327 vmlsl.s16 q14,d14,d0[1]
328 vmlsl.s16 q15,d14,d6[3]
331 vmlal.s16 q12,d15,d3[3]
332 vmlsl.s16 q13,d15,d4[3]
333 vmlsl.s16 q14,d15,d2[3]
334 vmlal.s16 q15,d15,d5[3]
337 vmlal.s16 q10,d12,d3[0]
338 vmlal.s16 q10,d13,d3[2]
339 vmlsl.s16 q11,d12,d7[0]
340 vmlsl.s16 q11,d13,d5[2]
341 vmlsl.s16 q8,d12,d1[0]
342 vmlsl.s16 q8,d13,d1[2]
343 vmlsl.s16 q9,d12,d5[0]
344 vmlal.s16 q9,d13,d7[2]
357 vmlal.s16 q12,d8,d4[1] @// y1 * cos1(part of b0)
358 vmlsl.s16 q13,d8,d3[1] @// y1 * cos3(part of b1)
359 vmlsl.s16 q14,d8,d5[1] @// y1 * sin3(part of b2)
360 vmlal.s16 q15,d8,d2[1] @// y1 * sin1(part of b3)
362 vmlal.s16 q12,d9,d4[3] @// y1 * cos1 + y3 * cos3(part of b0)
363 vmlsl.s16 q13,d9,d1[3] @// y1 * cos3 - y3 * sin1(part of b1)
364 vmlsl.s16 q14,d9,d7[3] @// y1 * sin3 - y3 * cos1(part of b2)
365 vmlal.s16 q15,d9,d1[1] @// y1 * sin1 - y3 * sin3(part of b3)
371 vmlal.s16 q10,d10,d0[0]
372 vmlal.s16 q10,d11,d4[2]
375 vmlsl.s16 q11,d10,d0[0]
376 vmlsl.s16 q11,d11,d2[2]
378 vmlsl.s16 q8,d10,d0[0]
379 vmlsl.s16 q8,d11,d6[2]
381 vmlal.s16 q9,d10,d0[0]
382 vmlal.s16 q9,d11,d0[2]
394 vmlal.s16 q12,d14,d5[1]
395 vmlsl.s16 q13,d14,d0[2]
396 vmlal.s16 q14,d14,d5[3]
397 vmlal.s16 q15,d14,d4[3]
400 vmlal.s16 q12,d15,d5[3]
401 vmlsl.s16 q13,d15,d1[1]
402 vmlal.s16 q14,d15,d3[1]
403 vmlsl.s16 q15,d15,d7[3]
406 vmlal.s16 q10,d12,d5[0]
407 vmlal.s16 q10,d13,d5[2]
408 vmlsl.s16 q11,d12,d1[0]
409 vmlsl.s16 q11,d13,d0[2]
410 vmlal.s16 q8,d12,d7[0]
411 vmlal.s16 q8,d13,d4[2]
412 vmlal.s16 q9,d12,d3[0]
413 vmlal.s16 q9,d13,d6[2]
427 vmlal.s16 q12,d8,d6[1] @// y1 * cos1(part of b0)
428 vmlsl.s16 q13,d8,d2[3] @// y1 * cos3(part of b1)
429 vmlal.s16 q14,d8,d0[1] @// y1 * sin3(part of b2)
430 vmlsl.s16 q15,d8,d4[1] @// y1 * sin1(part of b3)
432 vmlal.s16 q12,d9,d6[3] @// y1 * cos1 + y3 * cos3(part of b0)
433 vmlsl.s16 q13,d9,d4[1] @// y1 * cos3 - y3 * sin1(part of b1)
434 vmlal.s16 q14,d9,d1[3] @// y1 * sin3 - y3 * cos1(part of b2)
435 vmlsl.s16 q15,d9,d0[1] @// y1 * sin1 - y3 * sin3(part of b3)
441 vmlal.s16 q10,d10,d6[0]
442 vmlal.s16 q10,d11,d6[2]
445 vmlsl.s16 q11,d10,d2[0]
446 vmlsl.s16 q11,d11,d3[2]
448 vmlal.s16 q8,d10,d2[0]
449 vmlal.s16 q8,d11,d0[2]
451 vmlsl.s16 q9,d10,d6[0]
452 vmlsl.s16 q9,d11,d2[2]
460 vmlal.s16 q12,d14,d7[1]
461 vmlsl.s16 q13,d14,d5[3]
462 vmlal.s16 q14,d14,d4[1]
463 vmlsl.s16 q15,d14,d2[3]
466 vmlal.s16 q12,d15,d7[3]
467 vmlsl.s16 q13,d15,d7[1]
468 vmlal.s16 q14,d15,d6[3]
469 vmlsl.s16 q15,d15,d6[1]
472 vmlal.s16 q10,d12,d7[0]
473 vmlal.s16 q10,d13,d7[2]
474 vmlsl.s16 q11,d12,d5[0]
475 vmlsl.s16 q11,d13,d6[2]
476 vmlal.s16 q8,d12,d3[0]
477 vmlal.s16 q8,d13,d5[2]
478 vmlsl.s16 q9,d12,d1[0]
479 vmlsl.s16 q9,d13,d4[2]
552 vmull.s16 q12,d8,d2[1] @// y1 * cos1(part of b0)
553 vmull.s16 q13,d8,d2[3] @// y1 * cos3(part of b1)
554 vmull.s16 q14,d8,d3[1] @// y1 * sin3(part of b2)
555 vmull.s16 q15,d8,d3[3] @// y1 * sin1(part of b3)
557 vmlal.s16 q12,d9,d6[3] @// y1 * cos1 + y3 * cos3(part of b0)
558 vmlsl.s16 q13,d9,d7[3] @// y1 * cos3 - y3 * sin1(part of b1)
559 vmlsl.s16 q14,d9,d6[1] @// y1 * sin3 - y3 * cos1(part of b2)
560 vmlsl.s16 q15,d9,d4[3] @// y1 * sin1 - y3 * sin3(part of b3)
566 vmull.s16 q10,d10,d0[0]
567 vmlal.s16 q10,d11,d4[2]
570 vmull.s16 q11,d10,d0[0]
571 vmlal.s16 q11,d11,d5[2]
573 vmull.s16 q8,d10,d0[0]
574 vmlal.s16 q8,d11,d6[2]
576 vmull.s16 q9,d10,d0[0]
577 vmlal.s16 q9,d11,d7[2]
587 vmlsl.s16 q12,d14,d4[3]
588 vmlsl.s16 q13,d14,d2[1]
589 vmlsl.s16 q14,d14,d0[1]
590 vmlsl.s16 q15,d14,d2[3]
593 vmlsl.s16 q12,d15,d0[3]
594 vmlsl.s16 q13,d15,d3[1]
595 vmlsl.s16 q14,d15,d6[3]
596 vmlal.s16 q15,d15,d5[3]
599 vmlsl.s16 q10,d12,d7[0]
600 vmlsl.s16 q10,d13,d2[2]
601 vmlsl.s16 q11,d12,d5[0]
602 vmlsl.s16 q11,d13,d0[2]
603 vmlsl.s16 q8,d12,d3[0]
604 vmlsl.s16 q8,d13,d3[2]
605 vmlsl.s16 q9,d12,d1[0]
606 vmlsl.s16 q9,d13,d6[2]
623 vmlsl.s16 q12,d8,d4[1] @// y1 * cos1(part of b0)
624 vmlal.s16 q13,d8,d7[1] @// y1 * cos3(part of b1)
625 vmlal.s16 q14,d8,d2[3] @// y1 * sin3(part of b2)
626 vmlal.s16 q15,d8,d1[3] @// y1 * sin1(part of b3)
628 vmlal.s16 q12,d9,d7[1] @// y1 * cos1 + y3 * cos3(part of b0)
629 vmlal.s16 q13,d9,d1[3] @// y1 * cos3 - y3 * sin1(part of b1)
630 vmlal.s16 q14,d9,d3[3] @// y1 * sin3 - y3 * cos1(part of b2)
631 vmlsl.s16 q15,d9,d6[3] @// y1 * sin1 - y3 * sin3(part of b3)
637 vmlsl.s16 q10,d10,d2[0]
638 vmlsl.s16 q10,d11,d6[2]
641 vmlsl.s16 q11,d10,d6[0]
642 vmlal.s16 q11,d11,d4[2]
644 vmlal.s16 q8,d10,d6[0]
645 vmlal.s16 q8,d11,d0[2]
647 vmlal.s16 q9,d10,d2[0]
648 vmlal.s16 q9,d11,d5[2]
663 vmlal.s16 q12,d14,d2[3]
664 vmlal.s16 q13,d14,d3[3]
665 vmlsl.s16 q14,d14,d5[3]
666 vmlsl.s16 q15,d14,d0[3]
669 vmlal.s16 q12,d15,d1[3]
670 vmlsl.s16 q13,d15,d6[3]
671 vmlsl.s16 q14,d15,d0[3]
672 vmlal.s16 q15,d15,d7[3]
675 vmlal.s16 q10,d12,d5[0]
676 vmlal.s16 q10,d13,d0[2]
677 vmlal.s16 q11,d12,d1[0]
678 vmlal.s16 q11,d13,d6[2]
679 vmlal.s16 q8,d12,d7[0]
680 vmlsl.s16 q8,d13,d2[2]
681 vmlsl.s16 q9,d12,d3[0]
682 vmlsl.s16 q9,d13,d4[2]
700 vmlal.s16 q12,d8,d6[1] @// y1 * cos1(part of b0)
701 vmlsl.s16 q13,d8,d1[1] @// y1 * cos3(part of b1)
702 vmlsl.s16
703 vmlal.s16 q15,d8,d0[3] @// y1 * sin1(part of b3)
705 vmlsl.s16 q12,d9,d5[1] @// y1 * cos1 + y3 * cos3(part of b0)
706 vmlsl.s16 q13,d9,d4[1] @// y1 * cos3 - y3 * sin1(part of b1)
707 vmlal.s16 q14,d9,d2[1] @// y1 * sin3 - y3 * cos1(part of b2)
708 vmlal.s16 q15,d9,d7[1] @// y1 * sin1 - y3 * sin3(part of b3)
714 vmlal.s16 q10,d10,d0[0]
715 vmlsl.s16 q10,d11,d7[2]
718 vmlsl.s16 q11,d10,d0[0]
719 vmlsl.s16 q11,d11,d1[2]
721 vmlsl.s16 q8,d10,d0[0]
722 vmlal.s16 q8,d11,d5[2]
724 vmlal.s16 q9,d10,d0[0]
725 vmlal.s16 q9,d11,d3[2]
735 vmlsl.s16 q12,d14,d0[1]
736 vmlal.s16 q13,d14,d6[1]
737 vmlal.s16 q14,d14,d4[1]
738 vmlsl.s16 q15,d14,d1[1]
741 vmlsl.s16 q12,d15,d3[3]
742 vmlal.s16 q13,d15,d0[1]
743 vmlsl.s16 q14,d15,d5[1]
744 vmlsl.s16 q15,d15,d6[1]
747 vmlsl.s16 q10,d12,d3[0]
748 vmlsl.s16 q10,d13,d1[2]
749 vmlsl.s16 q11,d12,d7[0]
750 vmlal.s16 q11,d13,d3[2]
751 vmlal.s16 q8,d12,d1[0]
752 vmlal.s16 q8,d13,d7[2]
753 vmlsl.s16 q9,d12,d5[0]
754 vmlsl.s16 q9,d13,d2[2]
764 vmlal.s16 q12,d8,d7[3] @// y1 * cos1(part of b0)
765 vmlal.s16 q13,d8,d4[3] @// y1 * cos3(part of b1)
766 vmlsl.s16 q14,d8,d1[1] @// y1 * sin3(part of b2)
767 vmlal.s16 q15,d8,d2[1] @// y1 * sin1(part of b3)
769 vmlal.s16 q12,d9,d3[1] @// y1 * cos1 + y3 * cos3(part of b0)
770 vmlsl.s16 q13,d9,d5[3] @// y1 * cos3 - y3 * sin1(part of b1)
771 vmlsl.s16 q14,d9,d7[3] @// y1 * sin3 - y3 * cos1(part of b2)
772 vmlal.s16 q15,d9,d5[1] @// y1 * sin1 - y3 * sin3(part of b3)
778 vmlsl.s16 q10,d10,d6[0]
779 vmlal.s16 q10,d11,d5[2]
782 vmlal.s16 q11,d10,d2[0]
783 vmlal.s16 q11,d11,d7[2]
785 vmlsl.s16 q8,d10,d2[0]
786 vmlsl.s16 q8,d11,d4[2]
788 vmlal.s16 q9,d10,d6[0]
789 vmlal.s16 q9,d11,d1[2]
801 vmlal.s16 q12,d14,d1[1]
802 vmlsl.s16 q13,d14,d0[3]
803 vmlal.s16 q14,d14,d1[3]
804 vmlsl.s16 q15,d14,d3[1]
807 vmlal.s16 q12,d15,d5[3]
808 vmlsl.s16 q13,d15,d5[1]
809 vmlal.s16 q14,d15,d4[3]
810 vmlsl.s16 q15,d15,d4[1]
813 vmlal.s16 q10,d12,d1[0]
814 vmlal.s16 q10,d13,d3[2]
815 vmlsl.s16 q11,d12,d3[0]
816 vmlsl.s16 q11,d13,d2[2]
817 vmlal.s16 q8,d12,d5[0]
818 vmlal.s16 q8,d13,d1[2]
819 vmlsl.s16 q9,d12,d7[0]
820 vmlsl.s16 q9,d13,d0[2]
871 vmull.s16 q12,d8,d4[1] @// y1 * cos1(part of b0)
872 vmull.s16 q13,d8,d4[3] @// y1 * cos3(part of b1)
873 vmull.s16 q14,d8,d5[1] @// y1 * sin3(part of b2)
874 vmull.s16 q15,d8,d5[3] @// y1 * sin1(part of b3)
876 vmlsl.s16 q12,d9,d3[1] @// y1 * cos1 + y3 * cos3(part of b0)
877 vmlsl.s16 q13,d9,d1[3] @// y1 * cos3 - y3 * sin1(part of b1)
878 vmlsl.s16 q14,d9,d0[2] @// y1 * sin3 - y3 * cos1(part of b2)
879 vmlsl.s16 q15,d9,d1[1] @// y1 * sin1 - y3 * sin3(part of b3)
885 vmull.s16 q10,d10,d0[0]
886 vmlsl.s16 q10,d11,d7[2]
889 vmull.s16 q11,d10,d0[0]
890 vmlsl.s16 q11,d11,d6[2]
892 vmull.s16 q8,d10,d0[0]
893 vmlsl.s16 q8,d11,d5[2]
895 vmull.s16 q9,d10,d0[0]
896 vmlsl.s16 q9,d11,d4[2]
909 vmlsl.s16 q12,d14,d5[1]
910 vmlsl.s16 q13,d14,d7[3]
911 vmlal.s16 q14,d14,d5[3]
912 vmlal.s16 q15,d14,d3[1]
915 vmlal.s16 q12,d15,d2[1]
916 vmlal.s16 q13,d15,d1[1]
917 vmlal.s16 q14,d15,d4[3]
918 vmlsl.s16 q15,d15,d7[3]
921 vmlsl.s16 q10,d12,d1[0]
922 vmlal.s16 q10,d13,d6[2]
923 vmlsl.s16 q11,d12,d3[0]
924 vmlal.s16 q11,d13,d3[2]
925 vmlsl.s16 q8,d12,d5[0]
926 vmlal.s16 q8,d13,d0[2]
927 vmlsl.s16 q9,d12,d7[0]
928 vmlal.s16 q9,d13,d2[2]
938 vmlal.s16 q12,d8,d6[1] @// y1 * cos1(part of b0)
939 vmlsl.s16 q13,d8,d5[1] @// y1 * cos3(part of b1)
940 vmlsl.s16 q14,d8,d0[3] @// y1 * sin3(part of b2)
941 vmlsl.s16 q15,d8,d3[3] @// y1 * sin1(part of b3)
943 vmlsl.s16 q12,d9,d1[1] @// y1 * cos1 + y3 * cos3(part of b0)
944 vmlsl.s16 q13,d9,d4[1] @// y1 * cos3 - y3 * sin1(part of b1)
945 vmlal.s16 q14,d9,d6[1] @// y1 * sin3 - y3 * cos1(part of b2)
946 vmlal.s16 q15,d9,d0[1] @// y1 * sin1 - y3 * sin3(part of b3)
952 vmlal.s16 q10,d10,d2[0]
953 vmlsl.s16 q10,d11,d5[2]
956 vmlal.s16 q11,d10,d6[0]
957 vmlsl.s16 q11,d11,d0[2]
959 vmlsl.s16 q8,d10,d6[0]
960 vmlsl.s16 q8,d11,d4[2]
962 vmlsl.s16 q9,d10,d2[0]
963 vmlal.s16 q9,d11,d6[2]
979 vmlsl.s16 q12,d14,d7[1]
980 vmlal.s16 q13,d14,d2[1]
981 vmlal.s16 q14,d14,d4[1]
982 vmlsl.s16 q15,d14,d5[1]
985 vmlal.s16 q12,d15,d0[3]
986 vmlal.s16 q13,d15,d7[1]
987 vmlsl.s16 q14,d15,d1[1]
988 vmlsl.s16 q15,d15,d6[1]
991 vmlsl.s16 q10,d12,d3[0]
992 vmlal.s16 q10,d13,d4[2]
993 vmlal.s16 q11,d12,d7[0]
994 vmlal.s16 q11,d13,d2[2]
995 vmlal.s16 q8,d12,d1[0]
996 vmlsl.s16 q8,d13,d6[2]
997 vmlal.s16 q9,d12,d5[0]
998 vmlsl.s16 q9,d13,d0[2]
1011 vmlsl.s16 q12,d8,d7[3] @// y1 * cos1(part of b0)
1012 vmlsl.s16 q13,d8,d0[1] @// y1 * cos3(part of b1)
1013 vmlal.s16 q14,d8,d6[3] @// y1 * sin3(part of b2)
1014 vmlal.s16 q15,d8,d1[3] @// y1 * sin1(part of b3)
1016 vmlsl.s16 q12,d9,d0[1] @// y1 * cos1 + y3 * cos3(part of b0)
1017 vmlal.s16 q13,d9,d5[3] @// y1 * cos3 - y3 * sin1(part of b1)
1018 vmlal.s16 q14,d9,d3[3] @// y1 * sin3 - y3 * cos1(part of b2)
1019 vmlsl.s16 q15,d9,d2[3] @// y1 * sin1 - y3 * sin3(part of b3)
1025 vmlal.s16 q10,d10,d0[0]
1026 vmlsl.s16 q10,d11,d3[2]
1029 vmlsl.s16 q11,d10,d0[0]
1030 vmlsl.s16 q11,d11,d5[2]
1032 vmlsl.s16 q8,d10,d0[0]
1033 vmlal.s16 q8,d11,d1[2]
1035 vmlal.s16 q9,d10,d0[0]
1036 vmlal.s16 q9,d11,d7[2]
1046 vmlal.s16 q12,d14,d6[3]
1047 vmlal.s16 q13,d14,d3[3]
1048 vmlsl.s16 q14,d14,d1[3]
1049 vmlal.s16 q15,d14,d7[1]
1052 vmlal.s16 q12,d15,d1[3]
1053 vmlsl.s16 q13,d15,d2[3]
1054 vmlal.s16 q14,d15,d7[1]
1055 vmlal.s16 q15,d15,d4[1]
1058 vmlsl.s16 q10,d12,d5[0]
1059 vmlal.s16 q10,d13,d2[2]
1060 vmlal.s16 q11,d12,d1[0]
1061 vmlsl.s16 q11,d13,d7[2]
1062 vmlsl.s16 q8,d12,d7[0]
1063 vmlsl.s16 q8,d13,d3[2]
1064 vmlsl.s16 q9,d12,d3[0]
1065 vmlal.s16 q9,d13,d1[2]
1077 vmlsl.s16 q12,d8,d5[3] @// y1 * cos1(part of b0)
1078 vmlsl.s16 q13,d8,d6[3] @// y1 * cos3(part of b1)
1079 vmlal.s16 q14,d8,d3[1] @// y1 * sin3(part of b2)
1080 vmlsl.s16 q15,d8,d0[1] @// y1 * sin1(part of b3)
1082 vmlsl.s16 q12,d9,d2[3] @// y1 * cos1 + y3 * cos3(part of b0)
1083 vmlal.s16 q13,d9,d0[1] @// y1 * cos3 - y3 * sin1(part of b1)
1084 vmlsl.s16 q14,d9,d2[1] @// y1 * sin3 - y3 * cos1(part of b2)
1085 vmlal.s16 q15,d9,d4[3] @// y1 * sin1 - y3 * sin3(part of b3)
1091 vmlal.s16 q10,d10,d6[0]
1092 vmlsl.s16 q10,d11,d1[2]
1095 vmlsl.s16 q11,d10,d2[0]
1096 vmlal.s16 q11,d11,d4[2]
1098 vmlal.s16 q8,d10,d2[0]
1099 vmlsl.s16 q8,d11,d7[2]
1101 vmlsl.s16 q9,d10,d6[0]
1102 vmlsl.s16 q9,d11,d5[2]
1110 vmlal.s16 q12,d14,d4[3]
1111 vmlsl.s16 q13,d14,d6[1]
1112 vmlal.s16 q14,d14,d7[3]
1113 vmlal.s16 q15,d14,d6[3]
1116 vmlal.s16 q12,d15,d3[3]
1117 vmlsl.s16 q13,d15,d3[1]
1118 vmlal.s16 q14,d15,d2[3]
1119 vmlsl.s16 q15,d15,d2[1]
1122 vmlsl.s16 q10,d12,d7[0]
1123 vmlal.s16 q10,d13,d0[2]
1124 vmlal.s16 q11,d12,d5[0]
1125 vmlsl.s16 q11,d13,d1[2]
1126 vmlsl.s16 q8,d12,d3[0]
1127 vmlal.s16 q8,d13,d2[2]
1128 vmlal.s16 q9,d12,d1[0]
1129 vmlsl.s16 q9,d13,d3[2]
1181 vmull.s16 q12,d8,d6[1] @// y1 * cos1(part of b0)
1182 vmull.s16 q13,d8,d6[3] @// y1 * cos3(part of b1)
1183 vmull.s16 q14,d8,d7[1] @// y1 * sin3(part of b2)
1184 vmull.s16 q15,d8,d7[3] @// y1 * sin1(part of b3)
1186 vmlsl.s16 q12,d9,d2[3] @// y1 * cos1 + y3 * cos3(part of b0)
1187 vmlsl.s16 q13,d9,d4[1] @// y1 * cos3 - y3 * sin1(part of b1)
1188 vmlsl.s16 q14,d9,d5[3] @// y1 * sin3 - y3 * cos1(part of b2)
1189 vmlsl.s16 q15,d9,d7[1] @// y1 * sin1 - y3 * sin3(part of b3)
1195 vmull.s16 q10,d10,d0[0]
1196 vmlsl.s16 q10,d11,d3[2]
1199 vmull.s16 q11,d10,d0[0]
1200 vmlsl.s16 q11,d11,d2[2]
1202 vmull.s16 q8,d10,d0[0]
1203 vmlsl.s16 q8,d11,d1[2]
1205 vmull.s16 q9,d10,d0[0]
1206 vmlsl.s16 q9,d11,d0[2]
1221 vmlal.s16 q12,d14,d0[1]
1222 vmlal.s16 q13,d14,d1[3]
1223 vmlal.s16 q14,d14,d4[1]
1224 vmlal.s16 q15,d14,d6[3]
1227 vmlsl.s16 q12,d15,d4[1]
1228 vmlsl.s16 q13,d15,d0[3]
1229 vmlsl.s16 q14,d15,d2[3]
1230 vmlsl.s16 q15,d15,d6[1]
1233 vmlal.s16 q10,d12,d7[0]
1234 vmlal.s16 q10,d13,d5[2]
1235 vmlal.s16 q11,d12,d5[0]
1236 vmlsl.s16 q11,d13,d7[2]
1237 vmlal.s16 q8,d12,d3[0]
1238 vmlsl.s16 q8,d13,d4[2]
1239 vmlal.s16 q9,d12,d1[0]
1240 vmlsl.s16 q9,d13,d1[2]
1252 vmlal.s16 q12,d8,d7[3] @// y1 * cos1(part of b0)
1253 vmlal.s16 q13,d8,d3[1] @// y1 * cos3(part of b1)
1254 vmlal.s16 q14,d8,d1[1] @// y1 * sin3(part of b2)
1255 vmlal.s16 q15,d8,d5[3] @// y1 * sin1(part of b3)
1257 vmlal.s16 q12,d9,d4[3] @// y1 * cos1 + y3 * cos3(part of b0)
1258 vmlsl.s16 q13,d9,d5[3] @// y1 * cos3 - y3 * sin1(part of b1)
1259 vmlsl.s16 q14,d9,d0[1] @// y1 * sin3 - y3 * cos1(part of b2)
1260 vmlsl.s16 q15,d9,d5[1] @// y1 * sin1 - y3 * sin3(part of b3)
1266 vmlsl.s16 q10,d10,d2[0]
1267 vmlal.s16 q10,d11,d1[2]
1270 vmlsl.s16 q11,d10,d6[0]
1271 vmlal.s16 q11,d11,d3[2]
1273 vmlal.s16 q8,d10,d6[0]
1274 vmlsl.s16 q8,d11,d7[2]
1276 vmlal.s16 q9,d10,d2[0]
1277 vmlsl.s16 q9,d11,d2[2]
1293 vmlsl.s16 q12,d14,d1[1]
1294 vmlsl.s16 q13,d14,d7[3]
1295 vmlal.s16 q14,d14,d1[3]
1296 vmlal.s16 q15,d14,d4[3]
1299 vmlal.s16 q12,d15,d2[1]
1300 vmlal.s16 q13,d15,d5[1]
1301 vmlsl.s16 q14,d15,d3[1]
1302 vmlsl.s16 q15,d15,d4[1]
1305 vmlsl.s16 q10,d12,d5[0]
1306 vmlsl.s16 q10,d13,d7[2]
1307 vmlsl.s16 q11,d12,d1[0]
1308 vmlal.s16 q11,d13,d1[2]
1309 vmlsl.s16 q8,d12,d7[0]
1310 vmlal.s16 q8,d13,d5[2]
1311 vmlal.s16 q9,d12,d3[0]
1312 vmlsl.s16 q9,d13,d3[2]
1324 vmlsl.s16 q12,d8,d5[3] @// y1 * cos1(part of b0)
1325 vmlsl.s16 q13,d8,d2[3] @// y1 * cos3(part of b1)
1326 vmlal.s16 q14,d8,d4[3] @// y1 * sin3(part of b2)
1327 vmlal.s16 q15,d8,d3[3] @// y1 * sin1(part of b3)
1329 vmlsl.s16 q12,d9,d6[3] @// y1 * cos1 + y3 * cos3(part of b0)
1330 vmlal.s16 q13,d9,d0[3] @// y1 * cos3 - y3 * sin1(part of b1)
1331 vmlsl.s16 q14,d9,d6[1] @// y1 * sin3 - y3 * cos1(part of b2)
1332 vmlsl.s16 q15,d9,d3[1] @// y1 * sin1 - y3 * sin3(part of b3)
1338 vmlal.s16 q10,d10,d0[0]
1339 vmlsl.s16 q10,d11,d0[2]
1342 vmlsl.s16 q11,d10,d0[0]
1343 vmlal.s16 q11,d11,d6[2]
1345 vmlsl.s16 q8,d10,d0[0]
1346 vmlal.s16 q8,d11,d2[2]
1348 vmlal.s16 q9,d10,d0[0]
1349 vmlsl.s16 q9,d11,d4[2]
1364 vmlal.s16 q12,d14,d3[1]
1365 vmlsl.s16 q13,d14,d2[1]
1366 vmlal.s16
1367 vmlal.s16 q15,d14,d2[3]
1370 vmlsl.s16 q12,d15,d0[3]
1371 vmlal.s16 q13,d15,d4[3]
1372 vmlal.s16 q14,d15,d6[3]
1373 vmlsl.s16 q15,d15,d2[1]
1376 vmlal.s16 q10,d12,d3[0]
1377 vmlsl.s16 q10,d13,d6[2]
1378 vmlal.s16 q11,d12,d7[0]
1379 vmlsl.s16 q11,d13,d4[2]
1380 vmlsl.s16 q8,d12,d1[0]
1381 vmlal.s16 q8,d13,d0[2]
1382 vmlal.s16 q9,d12,d5[0]
1383 vmlsl.s16 q9,d13,d5[2]
1395 vmlal.s16 q12,d8,d3[3] @// y1 * cos1(part of b0)
1396 vmlsl.s16 q13,d8,d7[1] @// y1 * cos3(part of b1)
1397 vmlsl.s16 q14,d8,d5[1] @// y1 * sin3(part of b2)
1398 vmlal.s16 q15,d8,d1[3] @// y1 * sin1(part of b3)
1400 vmlsl.s16 q12,d9,d7[1] @// y1 * cos1 + y3 * cos3(part of b0)
1401 vmlsl.s16 q13,d9,d6[1] @// y1 * cos3 - y3 * sin1(part of b1)
1402 vmlal.s16 q14,d9,d3[3] @// y1 * sin3 - y3 * cos1(part of b2)
1403 vmlsl.s16 q15,d9,d1[1] @// y1 * sin1 - y3 * sin3(part of b3)
1409 vmlsl.s16 q10,d10,d6[0]
1410 vmlal.s16 q10,d11,d2[2]
1413 vmlal.s16 q11,d10,d2[0]
1414 vmlsl.s16 q11,d11,d0[2]
1416 vmlsl.s16 q8,d10,d2[0]
1417 vmlal.s16 q8,d11,d3[2]
1419 vmlal.s16 q9,d10,d6[0]
1420 vmlsl.s16 q9,d11,d6[2]
1431 vmlsl.s16 q12,d14,d5[1]
1432 vmlal.s16 q13,d14,d3[3]
1433 vmlsl.s16 q14,d14,d2[1]
1434 vmlal.s16 q15,d14,d0[3]
1437 vmlal.s16 q12,d15,d1[3]
1438 vmlsl.s16 q13,d15,d1[1]
1439 vmlal.s16 q14,d15,d0[3]
1440 vmlsl.s16 q15,d15,d0[1]
1443 vmlsl.s16 q10,d12,d1[0]
1444 vmlal.s16 q10,d13,d4[2]
1445 vmlal.s16 q11,d12,d3[0]
1446 vmlsl.s16 q11,d13,d5[2]
1447 vmlsl.s16 q8,d12,d5[0]
1448 vmlal.s16 q8,d13,d6[2]
1449 vmlal.s16 q9,d12,d7[0]
1450 vmlsl.s16 q9,d13,d7[2]
1536 vmull.s16 q12,d8,d0[1] @// y1 * cos1(part of b0)
1537 vmull.s16 q13,d8,d0[3] @// y1 * cos3(part of b1)
1538 vmull.s16 q14,d8,d1[1] @// y1 * sin3(part of b2)
1539 vmull.s16 q15,d8,d1[3] @// y1 * sin1(part of b3)
1541 vmlal.s16 q12,d9,d0[3] @// y1 * cos1 + y3 * cos3(part of b0)
1542 vmlal.s16 q13,d9,d2[1] @// y1 * cos3 - y3 * sin1(part of b1)
1543 vmlal.s16 q14,d9,d3[3] @// y1 * sin3 - y3 * cos1(part of b2)
1544 vmlal.s16 q15,d9,d5[1] @// y1 * sin1 - y3 * sin3(part of b3)
1548 vmull.s16 q10,d10,d0[0]
1549 vmlal.s16 q10,d11,d0[2]
1552 vmull.s16 q11,d10,d0[0]
1553 vmlal.s16 q11,d11,d1[2]
1555 vmull.s16 q8,d10,d0[0]
1556 vmlal.s16 q8,d11,d2[2]
1558 vmull.s16 q9,d10,d0[0]
1559 vmlal.s16 q9,d11,d3[2]
1571 vmlal.s16 q12,d14,d1[1]
1572 vmlal.s16 q13,d14,d3[3]
1573 vmlal.s16 q14,d14,d6[1]
1574 vmlsl.s16 q15,d14,d7[1]
1577 vmlal.s16 q12,d15,d1[3]
1578 vmlal.s16 q13,d15,d5[1]
1579 vmlsl.s16 q14,d15,d7[1]
1580 vmlsl.s16 q15,d15,d3[3]
1583 vmlal.s16 q10,d12,d1[0]
1584 vmlal.s16 q10,d13,d1[2]
1585 vmlal.s16 q11,d12,d3[0]
1586 vmlal.s16 q11,d13,d4[2]
1587 vmlal.s16 q8,d12,d5[0]
1588 vmlal.s16 q8,d13,d7[2]
1589 vmlal.s16 q9,d12,d7[0]
1590 vmlsl.s16 q9,d13,d5[2]
1597 vmlal.s16 q12,d8,d2[1] @// y1 * cos1(part of b0)
1598 vmlal.s16 q13,d8,d6[3] @// y1 * cos3(part of b1)
1599 vmlsl.s16 q14,d8,d4[3] @// y1 * sin3(part of b2)
1600 vmlsl.s16 q15,d8,d0[1] @// y1 * sin1(part of b3)
1602 vmlal.s16 q12,d9,d2[3] @// y1 * cos1 + y3 * cos3(part of b0)
1603 vmlsl.s16 q13,d9,d7[3] @// y1 * cos3 - y3 * sin1(part of b1)
1604 vmlsl.s16 q14,d9,d2[1] @// y1 * sin3 - y3 * cos1(part of b2)
1605 vmlsl.s16 q15,d9,d3[1] @// y1 * sin1 - y3 * sin3(part of b3)
1611 vmlal.s16 q10,d10,d2[0]
1612 vmlal.s16 q10,d11,d2[2]
1615 vmlal.s16 q11,d10,d6[0]
1616 vmlal.s16 q11,d11,d7[2]
1618 vmlsl.s16 q8,d10,d6[0]
1619 vmlsl.s16 q8,d11,d3[2]
1621 vmlsl.s16 q9,d10,d2[0]
1622 vmlsl.s16 q9,d11,d1[2]
1635 vmlal.s16 q12,d14,d3[1]
1636 vmlsl.s16 q13,d14,d6[1]
1637 vmlsl.s16 q14,d14,d0[1]
1638 vmlsl.s16 q15,d14,d6[3]
1641 vmlal.s16 q12,d15,d3[3]
1642 vmlsl.s16 q13,d15,d4[3]
1643 vmlsl.s16 q14,d15,d2[3]
1644 vmlal.s16 q15,d15,d5[3]
1647 vmlal.s16 q10,d12,d3[0]
1648 vmlal.s16 q10,d13,d3[2]
1649 vmlsl.s16 q11,d12,d7[0]
1650 vmlsl.s16 q11,d13,d5[2]
1651 vmlsl.s16 q8,d12,d1[0]
1652 vmlsl.s16 q8,d13,d1[2]
1653 vmlsl.s16 q9,d12,d5[0]
1654 vmlal.s16 q9,d13,d7[2]
1664 vmlal.s16 q12,d8,d4[1] @// y1 * cos1(part of b0)
1665 vmlsl.s16 q13,d8,d3[1] @// y1 * cos3(part of b1)
1666 vmlsl.s16 q14,d8,d5[1] @// y1 * sin3(part of b2)
1667 vmlal.s16 q15,d8,d2[1] @// y1 * sin1(part of b3)
1669 vmlal.s16 q12,d9,d4[3] @// y1 * cos1 + y3 * cos3(part of b0)
1670 vmlsl.s16 q13,d9,d1[3] @// y1 * cos3 - y3 * sin1(part of b1)
1671 vmlsl.s16 q14,d9,d7[3] @// y1 * sin3 - y3 * cos1(part of b2)
1672 vmlal.s16 q15,d9,d1[1] @// y1 * sin1 - y3 * sin3(part of b3)
1678 vmlal.s16 q10,d10,d0[0]
1679 vmlal.s16 q10,d11,d4[2]
1682 vmlsl.s16 q11,d10,d0[0]
1683 vmlsl.s16 q11,d11,d2[2]
1685 vmlsl.s16 q8,d10,d0[0]
1686 vmlsl.s16 q8,d11,d6[2]
1688 vmlal.s16 q9,d10,d0[0]
1689 vmlal.s16 q9,d11,d0[2]
1698 vmlal.s16 q12,d14,d5[1]
1699 vmlsl.s16 q13,d14,d0[2]
1700 vmlal.s16 q14,d14,d5[3]
1701 vmlal.s16 q15,d14,d4[3]
1704 vmlal.s16 q12,d15,d5[3]
1705 vmlsl.s16 q13,d15,d1[1]
1706 vmlal.s16 q14,d15,d3[1]
1707 vmlsl.s16 q15,d15,d7[3]
1710 vmlal.s16 q10,d12,d5[0]
1711 vmlal.s16 q10,d13,d5[2]
1712 vmlsl.s16 q11,d12,d1[0]
1713 vmlsl.s16 q11,d13,d0[2]
1714 vmlal.s16 q8,d12,d7[0]
1715 vmlal.s16 q8,d13,d4[2]
1716 vmlal.s16 q9,d12,d3[0]
1717 vmlal.s16 q9,d13,d6[2]
1726 vmlal.s16 q12,d8,d6[1] @// y1 * cos1(part of b0)
1727 vmlsl.s16 q13,d8,d2[3] @// y1 * cos3(part of b1)
1728 vmlal.s16 q14,d8,d0[1] @// y1 * sin3(part of b2)
1729 vmlsl.s16 q15,d8,d4[1] @// y1 * sin1(part of b3)
1731 vmlal.s16 q12,d9,d6[3] @// y1 * cos1 + y3 * cos3(part of b0)
1732 vmlsl.s16 q13,d9,d4[1] @// y1 * cos3 - y3 * sin1(part of b1)
1733 vmlal.s16 q14,d9,d1[3] @// y1 * sin3 - y3 * cos1(part of b2)
1734 vmlsl.s16 q15,d9,d0[1] @// y1 * sin1 - y3 * sin3(part of b3)
1740 vmlal.s16 q10,d10,d6[0]
1741 vmlal.s16 q10,d11,d6[2]
1744 vmlsl.s16 q11,d10,d2[0]
1745 vmlsl.s16 q11,d11,d3[2]
1747 vmlal.s16 q8,d10,d2[0]
1748 vmlal.s16 q8,d11,d0[2]
1750 vmlsl.s16 q9,d10,d6[0]
1751 vmlsl.s16 q9,d11,d2[2]
1756 vmlal.s16 q12,d14,d7[1]
1757 vmlsl.s16 q13,d14,d5[3]
1758 vmlal.s16 q14,d14,d4[1]
1759 vmlsl.s16 q15,d14,d2[3]
1762 vmlal.s16 q12,d15,d7[3]
1763 vmlsl.s16 q13,d15,d7[1]
1764 vmlal.s16 q14,d15,d6[3]
1765 vmlsl.s16 q15,d15,d6[1]
1768 vmlal.s16 q10,d12,d7[0]
1769 vmlal.s16 q10,d13,d7[2]
1770 vmlsl.s16 q11,d12,d5[0]
1771 vmlsl.s16 q11,d13,d6[2]
1772 vmlal.s16 q8,d12,d3[0]
1773 vmlal.s16 q8,d13,d5[2]
1774 vmlsl.s16 q9,d12,d1[0]
1775 vmlsl.s16 q9,d13,d4[2]
1828 vmull.s16 q12,d8,d2[1] @// y1 * cos1(part of b0)
1829 vmull.s16 q13,d8,d2[3] @// y1 * cos3(part of b1)
1830 vmull.s16 q14,d8,d3[1] @// y1 * sin3(part of b2)
1831 vmull.s16 q15,d8,d3[3] @// y1 * sin1(part of b3)
1833 vmlal.s16 q12,d9,d6[3] @// y1 * cos1 + y3 * cos3(part of b0)
1834 vmlsl.s16 q13,d9,d7[3] @// y1 * cos3 - y3 * sin1(part of b1)
1835 vmlsl.s16 q14,d9,d6[1] @// y1 * sin3 - y3 * cos1(part of b2)
1836 vmlsl.s16 q15,d9,d4[3] @// y1 * sin1 - y3 * sin3(part of b3)
1842 vmull.s16 q10,d10,d0[0]
1843 vmlal.s16 q10,d11,d4[2]
1846 vmull.s16 q11,d10,d0[0]
1847 vmlal.s16 q11,d11,d5[2]
1849 vmull.s16 q8,d10,d0[0]
1850 vmlal.s16 q8,d11,d6[2]
1852 vmull.s16 q9,d10,d0[0]
1853 vmlal.s16 q9,d11,d7[2]
1862 vmlsl.s16 q12,d14,d4[3]
1863 vmlsl.s16 q13,d14,d2[1]
1864 vmlsl.s16 q14,d14,d0[1]
1865 vmlsl.s16 q15,d14,d2[3]
1868 vmlsl.s16 q12,d15,d0[3]
1869 vmlsl.s16 q13,d15,d3[1]
1870 vmlsl.s16 q14,d15,d6[3]
1871 vmlal.s16 q15,d15,d5[3]
1874 vmlsl.s16 q10,d12,d7[0]
1875 vmlsl.s16 q10,d13,d2[2]
1876 vmlsl.s16 q11,d12,d5[0]
1877 vmlsl.s16 q11,d13,d0[2]
1878 vmlsl.s16 q8,d12,d3[0]
1879 vmlsl.s16 q8,d13,d3[2]
1880 vmlsl.s16 q9,d12,d1[0]
1881 vmlsl.s16 q9,d13,d6[2]
1893 vmlsl.s16 q12,d8,d4[1] @// y1 * cos1(part of b0)
1894 vmlal.s16 q13,d8,d7[1] @// y1 * cos3(part of b1)
1895 vmlal.s16 q14,d8,d2[3] @// y1 * sin3(part of b2)
1896 vmlal.s16 q15,d8,d1[3] @// y1 * sin1(part of b3)
1898 vmlal.s16 q12,d9,d7[1] @// y1 * cos1 + y3 * cos3(part of b0)
1899 vmlal.s16 q13,d9,d1[3] @// y1 * cos3 - y3 * sin1(part of b1)
1900 vmlal.s16 q14,d9,d3[3] @// y1 * sin3 - y3 * cos1(part of b2)
1901 vmlsl.s16 q15,d9,d6[3] @// y1 * sin1 - y3 * sin3(part of b3)
1907 vmlsl.s16 q10,d10,d2[0]
1908 vmlsl.s16 q10,d11,d6[2]
1911 vmlsl.s16 q11,d10,d6[0]
1912 vmlal.s16 q11,d11,d4[2]
1914 vmlal.s16 q8,d10,d6[0]
1915 vmlal.s16 q8,d11,d0[2]
1917 vmlal.s16 q9,d10,d2[0]
1918 vmlal.s16 q9,d11,d5[2]
1932 vmlal.s16 q12,d14,d2[3]
1933 vmlal.s16 q13,d14,d3[3]
1934 vmlsl.s16 q14,d14,d5[3]
1935 vmlsl.s16 q15,d14,d0[3]
1938 vmlal.s16 q12,d15,d1[3]
1939 vmlsl.s16 q13,d15,d6[3]
1940 vmlsl.s16 q14,d15,d0[3]
1941 vmlal.s16 q15,d15,d7[3]
1944 vmlal.s16 q10,d12,d5[0]
1945 vmlal.s16 q10,d13,d0[2]
1946 vmlal.s16 q11,d12,d1[0]
1947 vmlal.s16 q11,d13,d6[2]
1948 vmlal.s16 q8,d12,d7[0]
1949 vmlsl.s16 q8,d13,d2[2]
1950 vmlsl.s16 q9,d12,d3[0]
1951 vmlsl.s16 q9,d13,d4[2]
1962 vmlal.s16 q12,d8,d6[1] @// y1 * cos1(part of b0)
1963 vmlsl.s16 q13,d8,d1[1] @// y1 * cos3(part of b1)
1964 vmlsl.s16 q14,d8,d7[1] @// y1 * sin3(part of b2)
1965 vmlal.s16 q15,d8,d0[3] @// y1 * sin1(part of b3)
1967 vmlsl.s16 q12,d9,d5[1] @// y1 * cos1 + y3 * cos3(part of b0)
1968 vmlsl.s16 q13,d9,d4[1] @// y1 * cos3 - y3 * sin1(part of b1)
1969 vmlal.s16 q14,d9,d2[1] @// y1 * sin3 - y3 * cos1(part of b2)
1970 vmlal.s16 q15,d9,d7[1] @// y1 * sin1 - y3 * sin3(part of b3)
1976 vmlal.s16 q10,d10,d0[0]
1977 vmlsl.s16 q10,d11,d7[2]
1980 vmlsl.s16 q11,d10,d0[0]
1981 vmlsl.s16 q11,d11,d1[2]
1983 vmlsl.s16 q8,d10,d0[0]
1984 vmlal.s16 q8,d11,d5[2]
1986 vmlal.s16 q9,d10,d0[0]
1987 vmlal.s16 q9,d11,d3[2]
1995 vmlsl.s16 q12,d14,d0[1]
1996 vmlal.s16 q13,d14,d6[1]
1997 vmlal.s16 q14,d14,d4[1]
1998 vmlsl.s16 q15,d14,d1[1]
2001 vmlsl.s16 q12,d15,d3[3]
2002 vmlal.s16 q13,d15,d0[1]
2003 vmlsl.s16 q14,d15,d5[1]
2004 vmlsl.s16 q15,d15,d6[1]
2007 vmlsl.s16 q10,d12,d3[0]
2008 vmlsl.s16 q10,d13,d1[2]
2009 vmlsl.s16 q11,d12,d7[0]
2010 vmlal.s16 q11,d13,d3[2]
2011 vmlal.s16 q8,d12,d1[0]
2012 vmlal.s16 q8,d13,d7[2]
2013 vmlsl.s16 q9,d12,d5[0]
2014 vmlsl.s16 q9,d13,d2[2]
2021 vmlal.s16
2022 vmlal.s16 q13,d8,d4[3] @// y1 * cos3(part of b1)
2023 vmlsl.s16 q14,d8,d1[1] @// y1 * sin3(part of b2)
2024 vmlal.s16 q15,d8,d2[1] @// y1 * sin1(part of b3)
2026 vmlal.s16 q12,d9,d3[1] @// y1 * cos1 + y3 * cos3(part of b0)
2027 vmlsl.s16 q13,d9,d5[3] @// y1 * cos3 - y3 * sin1(part of b1)
2028 vmlsl.s16 q14,d9,d7[3] @// y1 * sin3 - y3 * cos1(part of b2)
2029 vmlal.s16 q15,d9,d5[1] @// y1 * sin1 - y3 * sin3(part of b3)
2035 vmlsl.s16 q10,d10,d6[0]
2036 vmlal.s16 q10,d11,d5[2]
2039 vmlal.s16 q11,d10,d2[0]
2040 vmlal.s16 q11,d11,d7[2]
2042 vmlsl.s16 q8,d10,d2[0]
2043 vmlsl.s16 q8,d11,d4[2]
2045 vmlal.s16 q9,d10,d6[0]
2046 vmlal.s16 q9,d11,d1[2]
2054 vmlal.s16 q12,d14,d1[1]
2055 vmlsl.s16 q13,d14,d0[3]
2056 vmlal.s16 q14,d14,d1[3]
2057 vmlsl.s16 q15,d14,d3[1]
2060 vmlal.s16 q12,d15,d5[3]
2061 vmlsl.s16 q13,d15,d5[1]
2062 vmlal.s16 q14,d15,d4[3]
2063 vmlsl.s16 q15,d15,d4[1]
2066 vmlal.s16 q10,d12,d1[0]
2067 vmlal.s16 q10,d13,d3[2]
2068 vmlsl.s16 q11,d12,d3[0]
2069 vmlsl.s16 q11,d13,d2[2]
2070 vmlal.s16 q8,d12,d5[0]
2071 vmlal.s16 q8,d13,d1[2]
2072 vmlsl.s16 q9,d12,d7[0]
2073 vmlsl.s16 q9,d13,d0[2]
2123 vmull.s16 q12,d8,d4[1] @// y1 * cos1(part of b0)
2124 vmull.s16 q13,d8,d4[3] @// y1 * cos3(part of b1)
2125 vmull.s16 q14,d8,d5[1] @// y1 * sin3(part of b2)
2126 vmull.s16 q15,d8,d5[3] @// y1 * sin1(part of b3)
2128 vmlsl.s16 q12,d9,d3[1] @// y1 * cos1 + y3 * cos3(part of b0)
2129 vmlsl.s16 q13,d9,d1[3] @// y1 * cos3 - y3 * sin1(part of b1)
2130 vmlsl.s16 q14,d9,d0[2] @// y1 * sin3 - y3 * cos1(part of b2)
2131 vmlsl.s16 q15,d9,d1[1] @// y1 * sin1 - y3 * sin3(part of b3)
2137 vmull.s16 q10,d10,d0[0]
2138 vmlsl.s16 q10,d11,d7[2]
2141 vmull.s16 q11,d10,d0[0]
2142 vmlsl.s16 q11,d11,d6[2]
2144 vmull.s16 q8,d10,d0[0]
2145 vmlsl.s16 q8,d11,d5[2]
2147 vmull.s16 q9,d10,d0[0]
2148 vmlsl.s16 q9,d11,d4[2]
2156 vmlsl.s16 q12,d14,d5[1]
2157 vmlsl.s16 q13,d14,d7[3]
2158 vmlal.s16 q14,d14,d5[3]
2159 vmlal.s16 q15,d14,d3[1]
2162 vmlal.s16 q12,d15,d2[1]
2163 vmlal.s16 q13,d15,d1[1]
2164 vmlal.s16 q14,d15,d4[3]
2165 vmlsl.s16 q15,d15,d7[3]
2168 vmlsl.s16 q10,d12,d1[0]
2169 vmlal.s16 q10,d13,d6[2]
2170 vmlsl.s16 q11,d12,d3[0]
2171 vmlal.s16 q11,d13,d3[2]
2172 vmlsl.s16 q8,d12,d5[0]
2173 vmlal.s16 q8,d13,d0[2]
2174 vmlsl.s16 q9,d12,d7[0]
2175 vmlal.s16 q9,d13,d2[2]
2185 vmlal.s16 q12,d8,d6[1] @// y1 * cos1(part of b0)
2186 vmlsl.s16 q13,d8,d5[1] @// y1 * cos3(part of b1)
2187 vmlsl.s16 q14,d8,d0[3] @// y1 * sin3(part of b2)
2188 vmlsl.s16 q15,d8,d3[3] @// y1 * sin1(part of b3)
2190 vmlsl.s16 q12,d9,d1[1] @// y1 * cos1 + y3 * cos3(part of b0)
2191 vmlsl.s16 q13,d9,d4[1] @// y1 * cos3 - y3 * sin1(part of b1)
2192 vmlal.s16 q14,d9,d6[1] @// y1 * sin3 - y3 * cos1(part of b2)
2193 vmlal.s16 q15,d9,d0[1] @// y1 * sin1 - y3 * sin3(part of b3)
2199 vmlal.s16 q10,d10,d2[0]
2200 vmlsl.s16 q10,d11,d5[2]
2203 vmlal.s16 q11,d10,d6[0]
2204 vmlsl.s16 q11,d11,d0[2]
2206 vmlsl.s16 q8,d10,d6[0]
2207 vmlsl.s16 q8,d11,d4[2]
2209 vmlsl.s16 q9,d10,d2[0]
2210 vmlal.s16 q9,d11,d6[2]
2222 vmlsl.s16 q12,d14,d7[1]
2223 vmlal.s16 q13,d14,d2[1]
2224 vmlal.s16 q14,d14,d4[1]
2225 vmlsl.s16 q15,d14,d5[1]
2228 vmlal.s16 q12,d15,d0[3]
2229 vmlal.s16 q13,d15,d7[1]
2230 vmlsl.s16 q14,d15,d1[1]
2231 vmlsl.s16 q15,d15,d6[1]
2234 vmlsl.s16 q10,d12,d3[0]
2235 vmlal.s16 q10,d13,d4[2]
2236 vmlal.s16 q11,d12,d7[0]
2237 vmlal.s16 q11,d13,d2[2]
2238 vmlal.s16 q8,d12,d1[0]
2239 vmlsl.s16 q8,d13,d6[2]
2240 vmlal.s16 q9,d12,d5[0]
2241 vmlsl.s16 q9,d13,d0[2]
2251 vmlsl.s16 q12,d8,d7[3] @// y1 * cos1(part of b0)
2252 vmlsl.s16 q13,d8,d0[1] @// y1 * cos3(part of b1)
2253 vmlal.s16 q14,d8,d6[3] @// y1 * sin3(part of b2)
2254 vmlal.s16 q15,d8,d1[3] @// y1 * sin1(part of b3)
2256 vmlsl.s16 q12,d9,d0[1] @// y1 * cos1 + y3 * cos3(part of b0)
2257 vmlal.s16 q13,d9,d5[3] @// y1 * cos3 - y3 * sin1(part of b1)
2258 vmlal.s16 q14,d9,d3[3] @// y1 * sin3 - y3 * cos1(part of b2)
2259 vmlsl.s16 q15,d9,d2[3] @// y1 * sin1 - y3 * sin3(part of b3)
2265 vmlal.s16 q10,d10,d0[0]
2266 vmlsl.s16 q10,d11,d3[2]
2269 vmlsl.s16 q11,d10,d0[0]
2270 vmlsl.s16 q11,d11,d5[2]
2272 vmlsl.s16 q8,d10,d0[0]
2273 vmlal.s16 q8,d11,d1[2]
2275 vmlal.s16 q9,d10,d0[0]
2276 vmlal.s16 q9,d11,d7[2]
2284 vmlal.s16 q12,d14,d6[3]
2285 vmlal.s16 q13,d14,d3[3]
2286 vmlsl.s16 q14,d14,d1[3]
2287 vmlal.s16 q15,d14,d7[1]
2290 vmlal.s16 q12,d15,d1[3]
2291 vmlsl.s16 q13,d15,d2[3]
2292 vmlal.s16 q14,d15,d7[1]
2293 vmlal.s16 q15,d15,d4[1]
2296 vmlsl.s16 q10,d12,d5[0]
2297 vmlal.s16 q10,d13,d2[2]
2298 vmlal.s16 q11,d12,d1[0]
2299 vmlsl.s16 q11,d13,d7[2]
2300 vmlsl.s16 q8,d12,d7[0]
2301 vmlsl.s16 q8,d13,d3[2]
2302 vmlsl.s16 q9,d12,d3[0]
2303 vmlal.s16 q9,d13,d1[2]
2310 vmlsl.s16 q12,d8,d5[3] @// y1 * cos1(part of b0)
2311 vmlsl.s16 q13,d8,d6[3] @// y1 * cos3(part of b1)
2312 vmlal.s16 q14,d8,d3[1] @// y1 * sin3(part of b2)
2313 vmlsl.s16 q15,d8,d0[1] @// y1 * sin1(part of b3)
2315 vmlsl.s16 q12,d9,d2[3] @// y1 * cos1 + y3 * cos3(part of b0)
2316 vmlal.s16 q13,d9,d0[1] @// y1 * cos3 - y3 * sin1(part of b1)
2317 vmlsl.s16 q14,d9,d2[1] @// y1 * sin3 - y3 * cos1(part of b2)
2318 vmlal.s16 q15,d9,d4[3] @// y1 * sin1 - y3 * sin3(part of b3)
2324 vmlal.s16 q10,d10,d6[0]
2325 vmlsl.s16 q10,d11,d1[2]
2328 vmlsl.s16 q11,d10,d2[0]
2329 vmlal.s16 q11,d11,d4[2]
2331 vmlal.s16 q8,d10,d2[0]
2332 vmlsl.s16 q8,d11,d7[2]
2334 vmlsl.s16 q9,d10,d6[0]
2335 vmlsl.s16 q9,d11,d5[2]
2342 vmlal.s16 q12,d14,d4[3]
2343 vmlsl.s16 q13,d14,d6[1]
2344 vmlal.s16 q14,d14,d7[3]
2345 vmlal.s16 q15,d14,d6[3]
2348 vmlal.s16 q12,d15,d3[3]
2349 vmlsl.s16 q13,d15,d3[1]
2350 vmlal.s16 q14,d15,d2[3]
2351 vmlsl.s16 q15,d15,d2[1]
2354 vmlsl.s16 q10,d12,d7[0]
2355 vmlal.s16 q10,d13,d0[2]
2356 vmlal.s16 q11,d12,d5[0]
2357 vmlsl.s16 q11,d13,d1[2]
2358 vmlsl.s16 q8,d12,d3[0]
2359 vmlal.s16 q8,d13,d2[2]
2360 vmlal.s16 q9,d12,d1[0]
2361 vmlsl.s16 q9,d13,d3[2]
2413 vmull.s16 q12,d8,d6[1] @// y1 * cos1(part of b0)
2414 vmull.s16 q13,d8,d6[3] @// y1 * cos3(part of b1)
2415 vmull.s16 q14,d8,d7[1] @// y1 * sin3(part of b2)
2416 vmull.s16 q15,d8,d7[3] @// y1 * sin1(part of b3)
2418 vmlsl.s16 q12,d9,d2[3] @// y1 * cos1 + y3 * cos3(part of b0)
2419 vmlsl.s16 q13,d9,d4[1] @// y1 * cos3 - y3 * sin1(part of b1)
2420 vmlsl.s16 q14,d9,d5[3] @// y1 * sin3 - y3 * cos1(part of b2)
2421 vmlsl.s16 q15,d9,d7[1] @// y1 * sin1 - y3 * sin3(part of b3)
2427 vmull.s16 q10,d10,d0[0]
2428 vmlsl.s16 q10,d11,d3[2]
2431 vmull.s16 q11,d10,d0[0]
2432 vmlsl.s16 q11,d11,d2[2]
2434 vmull.s16 q8,d10,d0[0]
2435 vmlsl.s16 q8,d11,d1[2]
2437 vmull.s16 q9,d10,d0[0]
2438 vmlsl.s16 q9,d11,d0[2]
2450 vmlal.s16 q12,d14,d0[1]
2451 vmlal.s16 q13,d14,d1[3]
2452 vmlal.s16 q14,d14,d4[1]
2453 vmlal.s16 q15,d14,d6[3]
2456 vmlsl.s16 q12,d15,d4[1]
2457 vmlsl.s16 q13,d15,d0[3]
2458 vmlsl.s16 q14,d15,d2[3]
2459 vmlsl.s16 q15,d15,d6[1]
2462 vmlal.s16 q10,d12,d7[0]
2463 vmlal.s16 q10,d13,d5[2]
2464 vmlal.s16 q11,d12,d5[0]
2465 vmlsl.s16 q11,d13,d7[2]
2466 vmlal.s16 q8,d12,d3[0]
2467 vmlsl.s16 q8,d13,d4[2]
2468 vmlal.s16 q9,d12,d1[0]
2469 vmlsl.s16 q9,d13,d1[2]
2479 vmlal.s16 q12,d8,d7[3] @// y1 * cos1(part of b0)
2480 vmlal.s16 q13,d8,d3[1] @// y1 * cos3(part of b1)
2481 vmlal.s16 q14,d8,d1[1] @// y1 * sin3(part of b2)
2482 vmlal.s16 q15,d8,d5[3] @// y1 * sin1(part of b3)
2484 vmlal.s16 q12,d9,d4[3] @// y1 * cos1 + y3 * cos3(part of b0)
2485 vmlsl.s16 q13,d9,d5[3] @// y1 * cos3 - y3 * sin1(part of b1)
2486 vmlsl.s16 q14,d9,d0[1] @// y1 * sin3 - y3 * cos1(part of b2)
2487 vmlsl.s16 q15,d9,d5[1] @// y1 * sin1 - y3 * sin3(part of b3)
2493 vmlsl.s16 q10,d10,d2[0]
2494 vmlal.s16 q10,d11,d1[2]
2497 vmlsl.s16 q11,d10,d6[0]
2498 vmlal.s16 q11,d11,d3[2]
2500 vmlal.s16 q8,d10,d6[0]
2501 vmlsl.s16 q8,d11,d7[2]
2503 vmlal.s16 q9,d10,d2[0]
2504 vmlsl.s16 q9,d11,d2[2]
2518 vmlsl.s16 q12,d14,d1[1]
2519 vmlsl.s16 q13,d14,d7[3]
2520 vmlal.s16 q14,d14,d1[3]
2521 vmlal.s16 q15,d14,d4[3]
2524 vmlal.s16 q12,d15,d2[1]
2525 vmlal.s16 q13,d15,d5[1]
2526 vmlsl.s16 q14,d15,d3[1]
2527 vmlsl.s16 q15,d15,d4[1]
2530 vmlsl.s16 q10,d12,d5[0]
2531 vmlsl.s16 q10,d13,d7[2]
2532 vmlsl.s16 q11,d12,d1[0]
2533 vmlal.s16 q11,d13,d1[2]
2534 vmlsl.s16 q8,d12,d7[0]
2535 vmlal.s16 q8,d13,d5[2]
2536 vmlal.s16 q9,d12,d3[0]
2537 vmlsl.s16 q9,d13,d3[2]
2547 vmlsl.s16 q12,d8,d5[3] @// y1 * cos1(part of b0)
2548 vmlsl.s16 q13,d8,d2[3] @// y1 * cos3(part of b1)
2549 vmlal.s16 q14,d8,d4[3] @// y1 * sin3(part of b2)
2550 vmlal.s16 q15,d8,d3[3] @// y1 * sin1(part of b3)
2552 vmlsl.s16 q12,d9,d6[3] @// y1 * cos1 + y3 * cos3(part of b0)
2553 vmlal.s16 q13,d9,d0[3] @// y1 * cos3 - y3 * sin1(part of b1)
2554 vmlsl.s16 q14,d9,d6[1] @// y1 * sin3 - y3 * cos1(part of b2)
2555 vmlsl.s16 q15,d9,d3[1] @// y1 * sin1 - y3 * sin3(part of b3)
2561 vmlal.s16 q10,d10,d0[0]
2562 vmlsl.s16 q10,d11,d0[2]
2565 vmlsl.s16 q11,d10,d0[0]
2566 vmlal.s16 q11,d11,d6[2]
2568 vmlsl.s16 q8,d10,d0[0]
2569 vmlal.s16 q8,d11,d2[2]
2571 vmlal.s16 q9,d10,d0[0]
2572 vmlsl.s16 q9,d11,d4[2]
2580 vmlal.s16 q12,d14,d3[1]
2581 vmlsl.s16 q13,d14,d2[1]
2582 vmlal.s16 q14,d14,d7[3]
2583 vmlal.s16 q15,d14,d2[3]
2586 vmlsl.s16 q12,d15,d0[3]
2587 vmlal.s16 q13,d15,d4[3]
2588 vmlal.s16 q14,d15,d6[3]
2589 vmlsl.s16 q15,d15,d2[1]
2592 vmlal.s16 q10,d12,d3[0]
2593 vmlsl.s16 q10,d13,d6[2]
2594 vmlal.s16 q11,d12,d7[0]
2595 vmlsl.s16 q11,d13,d4[2]
2596 vmlsl.s16 q8,d12,d1[0]
2597 vmlal.s16 q8,d13,d0[2]
2598 vmlal.s16 q9,d12,d5[0]
2599 vmlsl.s16 q9,d13,d5[2]
2608 vmlal.s16 q12,d8,d3[3] @// y1 * cos1(part of b0)
2609 vmlsl.s16 q13,d8,d7[1] @// y1 * cos3(part of b1)
2610 vmlsl.s16 q14,d8,d5[1] @// y1 * sin3(part of b2)
2611 vmlal.s16 q15,d8,d1[3] @// y1 * sin1(part of b3)
2613 vmlsl.s16 q12,d9,d7[1] @// y1 * cos1 + y3 * cos3(part of b0)
2614 vmlsl.s16 q13,d9,d6[1] @// y1 * cos3 - y3 * sin1(part of b1)
2615 vmlal.s16 q14,d9,d3[3] @// y1 * sin3 - y3 * cos1(part of b2)
2616 vmlsl.s16 q15,d9,d1[1] @// y1 * sin1 - y3 * sin3(part of b3)
2622 vmlsl.s16 q10,d10,d6[0]
2623 vmlal.s16 q10,d11,d2[2]
2626 vmlal.s16 q11,d10,d2[0]
2627 vmlsl.s16 q11,d11,d0[2]
2629 vmlsl.s16 q8,d10,d2[0]
2630 vmlal.s16 q8,d11,d3[2]
2632 vmlal.s16 q9,d10,d6[0]
2633 vmlsl.s16 q9,d11,d6[2]
2641 vmlsl.s16 q12,d14,d5[1]
2642 vmlal.s16 q13,d14,d3[3]
2643 vmlsl.s16 q14,d14,d2[1]
2644 vmlal.s16 q15,d14,d0[3]
2647 vmlal.s16 q12,d15,d1[3]
2648 vmlsl.s16 q13,d15,d1[1]
2649 vmlal.s16 q14,d15,d0[3]
2650 vmlsl.s16 q15,d15,d0[1]
2653 vmlsl.s16 q10,d12,d1[0]
2654 vmlal.s16 q10,d13,d4[2]
2655 vmlal.s16 q11,d12,d3[0]
2656 vmlsl.s16 q11,d13,d5[2]
2657 vmlsl.s16 q8,d12,d5[0]
2658 vmlal.s16 q8,d13,d6[2]
2659 vmlal.s16 q9,d12,d7[0]
2660 vmlsl.s16 q9,d13,d7[2]
2774 vqmovun.s16 d12,q6
2775 vqmovun.s16 d13,q10
2776 vqmovun.s16 d20,q7
2777 vqmovun.s16 d21,q11
2778 vqmovun.s16 d14,q8
2779 vqmovun.s16 d15,q12
2780 vqmovun.s16 d22,q9
2781 vqmovun.s16 d23,q13
2839 vqmovun.s16 d12,q6
2840 vqmovun.s16 d13,q10
2841 vqmovun.s16 d20,q7
2842 vqmovun.s16 d21,q11
2843 vqmovun.s16 d14,q8
2844 vqmovun.s16 d15,q12
2845 vqmovun.s16 d22,q9
2846 vqmovun.s16 d23,q13