Lines Matching defs:__m256
38 typedef float __m256 __attribute__ ((__vector_size__ (32)));
49 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
50 _mm256_add_ps(__m256 __a, __m256 __b)
61 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
62 _mm256_sub_ps(__m256 __a, __m256 __b)
73 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
74 _mm256_addsub_ps(__m256 __a, __m256 __b)
76 return (__m256)__builtin_ia32_addsubps256((__v8sf)__a, (__v8sf)__b);
85 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
86 _mm256_div_ps(__m256 __a, __m256 __b)
97 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
98 _mm256_max_ps(__m256 __a, __m256 __b)
100 return (__m256)__builtin_ia32_maxps256((__v8sf)__a, (__v8sf)__b);
109 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
110 _mm256_min_ps(__m256 __a, __m256 __b)
112 return (__m256)__builtin_ia32_minps256((__v8sf)__a, (__v8sf)__b);
121 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
122 _mm256_mul_ps(__m256 __a, __m256 __b)
133 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
134 _mm256_sqrt_ps(__m256 __a)
136 return (__m256)__builtin_ia32_sqrtps256((__v8sf)__a);
139 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
140 _mm256_rsqrt_ps(__m256 __a)
142 return (__m256)__builtin_ia32_rsqrtps256((__v8sf)__a);
145 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
146 _mm256_rcp_ps(__m256 __a)
148 return (__m256)__builtin_ia32_rcpps256((__v8sf)__a);
156 __m256 __V = (V); \
157 (__m256)__builtin_ia32_roundps256((__v8sf)__V, (M)); })
171 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
172 _mm256_and_ps(__m256 __a, __m256 __b)
174 return (__m256)((__v8si)__a & (__v8si)__b);
183 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
184 _mm256_andnot_ps(__m256 __a, __m256 __b)
186 return (__m256)(~(__v8si)__a & (__v8si)__b);
195 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
196 _mm256_or_ps(__m256 __a, __m256 __b)
198 return (__m256)((__v8si)__a | (__v8si)__b);
207 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
208 _mm256_xor_ps(__m256 __a, __m256 __b)
210 return (__m256)((__v8si)__a ^ (__v8si)__b);
220 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
221 _mm256_hadd_ps(__m256 __a, __m256 __b)
223 return (__m256)__builtin_ia32_haddps256((__v8sf)__a, (__v8sf)__b);
232 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
233 _mm256_hsub_ps(__m256 __a, __m256 __b)
235 return (__m256)__builtin_ia32_hsubps256((__v8sf)__a, (__v8sf)__b);
257 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
258 _mm256_permutevar_ps(__m256 __a, __m256i __c)
260 return (__m256)__builtin_ia32_vpermilvarps256((__v8sf)__a,
283 __m256 __A = (A); \
284 (__m256)__builtin_shufflevector((__v8sf)__A, (__v8sf) _mm256_setzero_ps(), \
298 __m256 __V1 = (V1); \
299 __m256 __V2 = (V2); \
300 (__m256)__builtin_ia32_vperm2f128_ps256((__v8sf)__V1, (__v8sf)__V2, (M)); })
318 __m256 __V1 = (V1); \
319 __m256 __V2 = (V2); \
320 (__m256)__builtin_shufflevector((__v8sf)__V1, (__v8sf)__V2, \
337 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
338 _mm256_blendv_ps(__m256 __a, __m256 __b, __m256 __c)
340 return (__m256)__builtin_ia32_blendvps256(
346 __m256 __V1 = (V1); \
347 __m256 __V2 = (V2); \
348 (__m256)__builtin_ia32_dpps256((__v8sf)__V1, (__v8sf)__V2, (M)); })
352 __m256 __a = (a); \
353 __m256 __b = (b); \
354 (__m256)__builtin_shufflevector((__v8sf)__a, (__v8sf)__b, \
419 __m256 __a = (a); \
420 __m256 __b = (b); \
421 (__m256)__builtin_ia32_cmpps256((__v8sf)__a, (__v8sf)__b, (c)); })
439 __m256 __A = (A); \
483 __m256 __V1 = (V1); \
485 (__m256)__builtin_ia32_vinsertf128_ps256((__v8sf)__V1, (__v4sf)__V2, (O)); })
533 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
536 return (__m256)__builtin_ia32_cvtdq2ps256((__v8si) __a);
546 _mm256_cvtps_epi32(__m256 __a)
570 _mm256_cvttps_epi32(__m256 __a)
576 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
577 _mm256_movehdup_ps(__m256 __a)
582 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
583 _mm256_moveldup_ps(__m256 __a)
607 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
608 _mm256_unpackhi_ps(__m256 __a, __m256 __b)
613 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
614 _mm256_unpacklo_ps(__m256 __a, __m256 __b)
675 _mm256_testz_ps(__m256 __a, __m256 __b)
681 _mm256_testc_ps(__m256 __a, __m256 __b)
687 _mm256_testnzc_ps(__m256 __a, __m256 __b)
718 _mm256_movemask_ps(__m256 __a)
751 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
755 return (__m256)(__v8sf){ __f, __f, __f, __f, __f, __f, __f, __f };
764 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
767 return (__m256)__builtin_ia32_vbroadcastf128_ps256(__a);
777 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
780 return *(__m256 *)__p;
792 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
796 __m256 __v;
830 _mm256_store_ps(float *__p, __m256 __a)
832 *(__m256 *)__p = __a;
842 _mm256_storeu_ps(float *__p, __m256 __a)
879 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
880 _mm256_maskload_ps(float const *__p, __m256 __m)
882 return (__m256)__builtin_ia32_maskloadps256((const __v8sf *)__p, (__v8sf)__m);
887 _mm256_maskstore_ps(float *__p, __m256 __m, __m256 __a)
924 _mm256_stream_ps(float *__p, __m256 __a)
936 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
940 return (__m256){ __h, __g, __f, __e, __d, __c, __b, __a };
991 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
995 return (__m256){ __a, __b, __c, __d, __e, __f, __g, __h };
1045 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
1048 return (__m256){ __w, __w, __w, __w, __w, __w, __w, __w };
1085 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
1088 return (__m256){ 0, 0, 0, 0, 0, 0, 0, 0 };
1098 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
1101 return (__m256)__a;
1111 _mm256_castps_pd(__m256 __a)
1117 _mm256_castps_si256(__m256 __a)
1122 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
1125 return (__m256)__a;
1141 _mm256_castps256_ps128(__m256 __a)
1158 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
1171 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
1178 __m256 __v256 = _mm256_castps128_ps256(((struct __loadu_ps*)__addr_lo)->__v);
1207 _mm256_storeu2_m128(float *__addr_hi, float *__addr_lo, __m256 __a)