Home | History | Annotate | Download | only in Headers

Lines Matching defs:__m256

35 typedef float __m256 __attribute__ ((__vector_size__ (32)));
46 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
47 _mm256_add_ps(__m256 a, __m256 b)
58 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
59 _mm256_sub_ps(__m256 a, __m256 b)
70 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
71 _mm256_addsub_ps(__m256 a, __m256 b)
73 return (__m256)__builtin_ia32_addsubps256((__v8sf)a, (__v8sf)b);
82 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
83 _mm256_div_ps(__m256 a, __m256 b)
94 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
95 _mm256_max_ps(__m256 a, __m256 b)
97 return (__m256)__builtin_ia32_maxps256((__v8sf)a, (__v8sf)b);
106 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
107 _mm256_min_ps(__m256 a, __m256 b)
109 return (__m256)__builtin_ia32_minps256((__v8sf)a, (__v8sf)b);
118 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
119 _mm256_mul_ps(__m256 a, __m256 b)
130 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
131 _mm256_sqrt_ps(__m256 a)
133 return (__m256)__builtin_ia32_sqrtps256((__v8sf)a);
136 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
137 _mm256_rsqrt_ps(__m256 a)
139 return (__m256)__builtin_ia32_rsqrtps256((__v8sf)a);
142 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
143 _mm256_rcp_ps(__m256 a)
145 return (__m256)__builtin_ia32_rcpps256((__v8sf)a);
153 __m256 __V = (V); \
154 (__m256)__builtin_ia32_roundps256((__v8sf)__V, (M)); })
168 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
169 _mm256_and_ps(__m256 a, __m256 b)
171 return (__m256)((__v8si)a & (__v8si)b);
180 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
181 _mm256_andnot_ps(__m256 a, __m256 b)
183 return (__m256)(~(__v8si)a & (__v8si)b);
192 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
193 _mm256_or_ps(__m256 a, __m256 b)
195 return (__m256)((__v8si)a | (__v8si)b);
204 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
205 _mm256_xor_ps(__m256 a, __m256 b)
207 return (__m256)((__v8si)a ^ (__v8si)b);
217 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
218 _mm256_hadd_ps(__m256 a, __m256 b)
220 return (__m256)__builtin_ia32_haddps256((__v8sf)a, (__v8sf)b);
229 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
230 _mm256_hsub_ps(__m256 a, __m256 b)
232 return (__m256)__builtin_ia32_hsubps256((__v8sf)a, (__v8sf)b);
254 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
255 _mm256_permutevar_ps(__m256 a, __m256i c)
257 return (__m256)__builtin_ia32_vpermilvarps256((__v8sf)a,
280 __m256 __A = (A); \
281 (__m256)__builtin_shufflevector((__v8sf)__A, (__v8sf) _mm256_setzero_ps(), \
295 __m256 __V1 = (V1); \
296 __m256 __V2 = (V2); \
297 (__m256)__builtin_ia32_vperm2f128_ps256((__v8sf)__V1, (__v8sf)__V2, (M)); })
311 __m256 __V1 = (V1); \
312 __m256 __V2 = (V2); \
313 (__m256)__builtin_ia32_blendps256((__v8sf)__V1, (__v8sf)__V2, (M)); })
321 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
322 _mm256_blendv_ps(__m256 a, __m256 b, __m256 c)
324 return (__m256)__builtin_ia32_blendvps256((__v8sf)a, (__v8sf)b, (__v8sf)c);
329 __m256 __V1 = (V1); \
330 __m256 __V2 = (V2); \
331 (__m256)__builtin_ia32_dpps256((__v8sf)__V1, (__v8sf)__V2, (M)); })
335 __m256 __a = (a); \
336 __m256 __b = (b); \
337 (__m256)__builtin_shufflevector((__v8sf)__a, (__v8sf)__b, \
402 __m256 __a = (a); \
403 __m256 __b = (b); \
404 (__m256)__builtin_ia32_cmpps256((__v8sf)__a, (__v8sf)__b, (c)); })
422 __m256 __A = (A); \
466 __m256 __V1 = (V1); \
468 (__m256
516 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
519 return (__m256)__builtin_ia32_cvtdq2ps256((__v8si) a);
529 _mm256_cvtps_epi32(__m256 a)
553 _mm256_cvttps_epi32(__m256 a)
559 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
560 _mm256_movehdup_ps(__m256 a)
565 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
566 _mm256_moveldup_ps(__m256 a)
590 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
591 _mm256_unpackhi_ps(__m256 a, __m256 b)
596 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
597 _mm256_unpacklo_ps(__m256 a, __m256 b)
658 _mm256_testz_ps(__m256 a, __m256 b)
664 _mm256_testc_ps(__m256 a, __m256 b)
670 _mm256_testnzc_ps(__m256 a, __m256 b)
701 _mm256_movemask_ps(__m256 a)
732 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
735 return (__m256)__builtin_ia32_vbroadcastss256(a);
744 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
747 return (__m256)__builtin_ia32_vbroadcastf128_ps256(a);
757 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
760 return *(__m256 *)p;
772 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
776 __m256 v;
810 _mm256_store_ps(float *p, __m256 a)
812 *(__m256 *)p = a;
822 _mm256_storeu_ps(float *p, __m256 a)
858 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
859 _mm256_maskload_ps(float const *p, __m256 m)
861 return (__m256)__builtin_ia32_maskloadps256((const __v8sf *)p, (__v8sf)m);
866 _mm256_maskstore_ps(float *p, __m256 m, __m256 a)
903 _mm256_stream_ps(float *p, __m256 a)
915 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
919 return (__m256){ h, g, f, e, d, c, b, a };
970 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
974 return (__m256){ a, b, c, d, e, f, g, h };
1024 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
1027 return (__m256){ w, w, w, w, w, w, w, w };
1062 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
1065 return (__m256){ 0, 0, 0, 0, 0, 0, 0, 0 };
1075 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
1078 return (__m256)in;
1088 _mm256_castps_pd(__m256 in)
1094 _mm256_castps_si256(__m256 in)
1099 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
1102 return (__m256)in;
1118 _mm256_castps256_ps128(__m256 in)
1136 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
1151 static __inline __m256 __attribute__((__always_inline__, __nodebug__))
1158 __m256 v256 = _mm256_castps128_ps256(((struct __loadu_ps*)addr_lo)->v);
1185 _mm256_storeu2_m128(float *addr_hi, float *addr_lo, __m256 a)