Lines Matching refs:__m256d
39 typedef double __m256d __attribute__((__vector_size__(32)));
43 static __inline __m256d __attribute__((__always_inline__, __nodebug__))
44 _mm256_add_pd(__m256d __a, __m256d __b)
55 static __inline __m256d __attribute__((__always_inline__, __nodebug__))
56 _mm256_sub_pd(__m256d __a, __m256d __b)
67 static __inline __m256d __attribute__((__always_inline__, __nodebug__))
68 _mm256_addsub_pd(__m256d __a, __m256d __b)
70 return (__m256d)__builtin_ia32_addsubpd256((__v4df)__a, (__v4df)__b);
79 static __inline __m256d __attribute__((__always_inline__, __nodebug__))
80 _mm256_div_pd(__m256d __a, __m256d __b)
91 static __inline __m256d __attribute__((__always_inline__, __nodebug__))
92 _mm256_max_pd(__m256d __a, __m256d __b)
94 return (__m256d)__builtin_ia32_maxpd256((__v4df)__a, (__v4df)__b);
103 static __inline __m256d __attribute__((__always_inline__, __nodebug__))
104 _mm256_min_pd(__m256d __a, __m256d __b)
106 return (__m256d)__builtin_ia32_minpd256((__v4df)__a, (__v4df)__b);
115 static __inline __m256d __attribute__((__always_inline__, __nodebug__))
116 _mm256_mul_pd(__m256d __a, __m256d __b)
127 static __inline __m256d __attribute__((__always_inline__, __nodebug__))
128 _mm256_sqrt_pd(__m256d __a)
130 return (__m256d)__builtin_ia32_sqrtpd256((__v4df)__a);
152 __m256d __V = (V); \
153 (__m256d)__builtin_ia32_roundpd256((__v4df)__V, (M)); })
165 static __inline __m256d __attribute__((__always_inline__, __nodebug__))
166 _mm256_and_pd(__m256d __a, __m256d __b)
168 return (__m256d)((__v4di)__a & (__v4di)__b);
177 static __inline __m256d __attribute__((__always_inline__, __nodebug__))
178 _mm256_andnot_pd(__m256d __a, __m256d __b)
180 return (__m256d)(~(__v4di)__a & (__v4di)__b);
189 static __inline __m256d __attribute__((__always_inline__, __nodebug__))
190 _mm256_or_pd(__m256d __a, __m256d __b)
192 return (__m256d)((__v4di)__a | (__v4di)__b);
201 static __inline __m256d __attribute__((__always_inline__, __nodebug__))
202 _mm256_xor_pd(__m256d __a, __m256d __b)
204 return (__m256d)((__v4di)__a ^ (__v4di)__b);
214 static __inline __m256d __attribute__((__always_inline__, __nodebug__))
215 _mm256_hadd_pd(__m256d __a, __m256d __b)
217 return (__m256d)__builtin_ia32_haddpd256((__v4df)__a, (__v4df)__b);
226 static __inline __m256d __attribute__((__always_inline__, __nodebug__))
227 _mm256_hsub_pd(__m256d __a, __m256d __b)
229 return (__m256d)__builtin_ia32_hsubpd256((__v4df)__a, (__v4df)__b);
245 static __inline __m256d __attribute__((__always_inline__, __nodebug__))
246 _mm256_permutevar_pd(__m256d __a, __m256i __c)
248 return (__m256d)__builtin_ia32_vpermilvarpd256((__v4df)__a, (__v4di)__c);
270 __m256d __A = (A); \
271 (__m256d)__builtin_shufflevector((__v4df)__A, (__v4df) _mm256_setzero_pd(), \
293 __m256d __V1 = (V1); \
294 __m256d __V2 = (V2); \
295 (__m256d)__builtin_ia32_vperm2f128_pd256((__v4df)__V1, (__v4df)__V2, (M)); })
309 __m256d __V1 = (V1); \
310 __m256d __V2 = (V2); \
311 (__m256d)__builtin_ia32_blendpd256((__v4df)__V1, (__v4df)__V2, (M)); })
318 static __inline __m256d __attribute__((__always_inline__, __nodebug__))
319 _mm256_blendv_pd(__m256d __a, __m256d __b, __m256d __c)
321 return (__m256d)__builtin_ia32_blendvpd256(
349 __m256d __a = (a); \
350 __m256d __b = (b); \
351 (__m256d)__builtin_shufflevector((__v4df)__a, (__v4df)__b, \
402 __m256d __a = (a); \
403 __m256d __b = (b); \
404 (__m256d)__builtin_ia32_cmppd256((__v4df)__a, (__v4df)__b, (c)); })
423 __m256d __A = (A); \
466 __m256d __V1 = (V1); \
468 (__m256d)__builtin_ia32_vinsertf128_pd256((__v4df)__V1, (__v2df)__V2, (O)); })
515 static __inline __m256d __attribute__((__always_inline__, __nodebug__))
518 return (__m256d)__builtin_ia32_cvtdq2pd256((__v4si) __a);
528 _mm256_cvtpd_ps(__m256d __a)
539 static __inline __m256d __attribute__((__always_inline__, __nodebug__))
542 return (__m256d)__builtin_ia32_cvtps2pd256((__v4sf) __a);
546 _mm256_cvttpd_epi32(__m256d __a)
552 _mm256_cvtpd_epi32(__m256d __a)
576 static __inline __m256d __attribute__((__always_inline__, __nodebug__))
577 _mm256_movedup_pd(__m256d __a)
583 static __inline __m256d __attribute__((__always_inline__, __nodebug__))
584 _mm256_unpackhi_pd(__m256d __a, __m256d __b)
589 static __inline __m256d __attribute__((__always_inline__, __nodebug__))
590 _mm256_unpacklo_pd(__m256d __a, __m256d __b)
645 _mm256_testz_pd(__m256d __a, __m256d __b)
651 _mm256_testc_pd(__m256d __a, __m256d __b)
657 _mm256_testnzc_pd(__m256d __a, __m256d __b)
700 _mm256_movemask_pd(__m256d __a)
731 static __inline __m256d __attribute__((__always_inline__, __nodebug__))
734 return (__m256d)__builtin_ia32_vbroadcastsd256(__a);
743 static __inline __m256d __attribute__((__always_inline__, __nodebug__))
746 return (__m256d)__builtin_ia32_vbroadcastf128_pd256(__a);
756 static __inline __m256d __attribute__((__always_inline__, __nodebug__))
759 return *(__m256d *)__p;
768 static __inline __m256d __attribute__((__always_inline__, __nodebug__))
772 __m256d __v;
809 _mm256_store_pd(double *__p, __m256d __a)
811 *(__m256d *)__p = __a;
821 _mm256_storeu_pd(double *__p, __m256d __a)
851 static __inline __m256d __attribute__((__always_inline__, __nodebug__))
852 _mm256_maskload_pd(double const *__p, __m256d __m)
854 return (__m256d)__builtin_ia32_maskloadpd256((const __v4df *)__p,
884 _mm256_maskstore_pd(double *__p, __m256d __m, __m256d __a)
903 _mm256_stream_pd(double *__a, __m256d __b)
915 static __inline __m256d __attribute__((__always_inline__, __nodebug__))
918 return (__m256d){ __d, __c, __b, __a };
970 static __inline __m256d __attribute__((__always_inline__, __nodebug__))
973 return (__m256d){ __a, __b, __c, __d };
1024 static __inline __m256d __attribute__((__always_inline__, __nodebug__))
1027 return (__m256d){ __w, __w, __w, __w };
1064 static __inline __m256d __attribute__((__always_inline__, __nodebug__))
1067 return (__m256d){ 0, 0, 0, 0 };
1084 _mm256_castpd_ps(__m256d __a)
1090 _mm256_castpd_si256(__m256d __a)
1095 static __inline __m256d __attribute__((__always_inline__, __nodebug__))
1098 return (__m256d)__a;
1113 static __inline __m256d __attribute__((__always_inline__, __nodebug__))
1116 return (__m256d)__a;
1120 _mm256_castpd256_pd128(__m256d __a)
1137 static __inline __m256d __attribute__((__always_inline__, __nodebug__))
1167 static __inline __m256d __attribute__((__always_inline__, __nodebug__))
1174 __m256d __v256 = _mm256_castpd128_pd256(((struct __loadu_pd*)__addr_lo)->__v);
1203 _mm256_storeu2_m128d(double *__addr_hi, double *__addr_lo, __m256d __a)