Lines Matching refs:__m256
35 typedef float __m256 __attribute__ ((__vector_size__ (32)));
46 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
47 _mm256_add_ps(__m256 __a, __m256 __b)
58 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
59 _mm256_sub_ps(__m256 __a, __m256 __b)
70 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
71 _mm256_addsub_ps(__m256 __a, __m256 __b)
73 return (__m256)__builtin_ia32_addsubps256((__v8sf)__a, (__v8sf)__b);
82 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
83 _mm256_div_ps(__m256 __a, __m256 __b)
94 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
95 _mm256_max_ps(__m256 __a, __m256 __b)
97 return (__m256)__builtin_ia32_maxps256((__v8sf)__a, (__v8sf)__b);
106 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
107 _mm256_min_ps(__m256 __a, __m256 __b)
109 return (__m256)__builtin_ia32_minps256((__v8sf)__a, (__v8sf)__b);
118 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
119 _mm256_mul_ps(__m256 __a, __m256 __b)
130 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
131 _mm256_sqrt_ps(__m256 __a)
133 return (__m256)__builtin_ia32_sqrtps256((__v8sf)__a);
136 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
137 _mm256_rsqrt_ps(__m256 __a)
139 return (__m256)__builtin_ia32_rsqrtps256((__v8sf)__a);
142 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
143 _mm256_rcp_ps(__m256 __a)
145 return (__m256)__builtin_ia32_rcpps256((__v8sf)__a);
153 __m256 __V = (V); \
154 (__m256)__builtin_ia32_roundps256((__v8sf)__V, (M)); })
168 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
169 _mm256_and_ps(__m256 __a, __m256 __b)
171 return (__m256)((__v8si)__a & (__v8si)__b);
180 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
181 _mm256_andnot_ps(__m256 __a, __m256 __b)
183 return (__m256)(~(__v8si)__a & (__v8si)__b);
192 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
193 _mm256_or_ps(__m256 __a, __m256 __b)
195 return (__m256)((__v8si)__a | (__v8si)__b);
204 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
205 _mm256_xor_ps(__m256 __a, __m256 __b)
207 return (__m256)((__v8si)__a ^ (__v8si)__b);
217 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
218 _mm256_hadd_ps(__m256 __a, __m256 __b)
220 return (__m256)__builtin_ia32_haddps256((__v8sf)__a, (__v8sf)__b);
229 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
230 _mm256_hsub_ps(__m256 __a, __m256 __b)
232 return (__m256)__builtin_ia32_hsubps256((__v8sf)__a, (__v8sf)__b);
254 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
255 _mm256_permutevar_ps(__m256 __a, __m256i __c)
257 return (__m256)__builtin_ia32_vpermilvarps256((__v8sf)__a,
280 __m256 __A = (A); \
281 (__m256)__builtin_shufflevector((__v8sf)__A, (__v8sf) _mm256_setzero_ps(), \
295 __m256 __V1 = (V1); \
296 __m256 __V2 = (V2); \
297 (__m256)__builtin_ia32_vperm2f128_ps256((__v8sf)__V1, (__v8sf)__V2, (M)); })
311 __m256 __V1 = (V1); \
312 __m256 __V2 = (V2); \
313 (__m256)__builtin_ia32_blendps256((__v8sf)__V1, (__v8sf)__V2, (M)); })
322 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
323 _mm256_blendv_ps(__m256 __a, __m256 __b, __m256 __c)
325 return (__m256)__builtin_ia32_blendvps256(
331 __m256 __V1 = (V1); \
332 __m256 __V2 = (V2); \
333 (__m256)__builtin_ia32_dpps256((__v8sf)__V1, (__v8sf)__V2, (M)); })
337 __m256 __a = (a); \
338 __m256 __b = (b); \
339 (__m256)__builtin_shufflevector((__v8sf)__a, (__v8sf)__b, \
404 __m256 __a = (a); \
405 __m256 __b = (b); \
406 (__m256)__builtin_ia32_cmpps256((__v8sf)__a, (__v8sf)__b, (c)); })
424 __m256 __A = (A); \
468 __m256 __V1 = (V1); \
470 (__m256)__builtin_ia32_vinsertf128_ps256((__v8sf)__V1, (__v4sf)__V2, (O)); })
518 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
521 return (__m256)__builtin_ia32_cvtdq2ps256((__v8si) __a);
531 _mm256_cvtps_epi32(__m256 __a)
555 _mm256_cvttps_epi32(__m256 __a)
561 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
562 _mm256_movehdup_ps(__m256 __a)
567 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
568 _mm256_moveldup_ps(__m256 __a)
592 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
593 _mm256_unpackhi_ps(__m256 __a, __m256 __b)
598 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
599 _mm256_unpacklo_ps(__m256 __a, __m256 __b)
660 _mm256_testz_ps(__m256 __a, __m256 __b)
666 _mm256_testc_ps(__m256 __a, __m256 __b)
672 _mm256_testnzc_ps(__m256 __a, __m256 __b)
703 _mm256_movemask_ps(__m256 __a)
734 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
737 return (__m256)__builtin_ia32_vbroadcastss256(__a);
746 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
749 return (__m256)__builtin_ia32_vbroadcastf128_ps256(__a);
759 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
762 return *(__m256 *)__p;
774 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
778 __m256 __v;
812 _mm256_store_ps(float *__p, __m256 __a)
814 *(__m256 *)__p = __a;
824 _mm256_storeu_ps(float *__p, __m256 __a)
861 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
862 _mm256_maskload_ps(float const *__p, __m256 __m)
864 return (__m256)__builtin_ia32_maskloadps256((const __v8sf *)__p, (__v8sf)__m);
869 _mm256_maskstore_ps(float *__p, __m256 __m, __m256 __a)
906 _mm256_stream_ps(float *__p, __m256 __a)
918 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
922 return (__m256){ __h, __g, __f, __e, __d, __c, __b, __a };
973 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
977 return (__m256){ __a, __b, __c, __d, __e, __f, __g, __h };
1027 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
1030 return (__m256){ __w, __w, __w, __w, __w, __w, __w, __w };
1067 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
1070 return (__m256){ 0, 0, 0, 0, 0, 0, 0, 0 };
1080 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
1083 return (__m256)__in;
1093 _mm256_castps_pd(__m256 __in)
1099 _mm256_castps_si256(__m256 __in)
1104 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
1107 return (__m256)__in;
1123 _mm256_castps256_ps128(__m256 __in)
1141 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
1156 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
1163 __m256 __v256 = _mm256_castps128_ps256(((struct __loadu_ps*)__addr_lo)->__v);
1192 _mm256_storeu2_m128(float *__addr_hi, float *__addr_lo, __m256 __a)