Home | History | Annotate | Download | only in include

Lines Matching defs:__m256

48 typedef float __m256 __attribute__ ((__vector_size__ (32)));
86 static __inline __m256 __DEFAULT_FN_ATTRS
87 _mm256_add_ps(__m256 __a, __m256 __b)
89 return (__m256)((__v8sf)__a+(__v8sf)__b);
122 static __inline __m256 __DEFAULT_FN_ATTRS
123 _mm256_sub_ps(__m256 __a, __m256 __b)
125 return (__m256)((__v8sf)__a-(__v8sf)__b);
160 static __inline __m256 __DEFAULT_FN_ATTRS
161 _mm256_addsub_ps(__m256 __a, __m256 __b)
163 return (__m256)__builtin_ia32_addsubps256((__v8sf)__a, (__v8sf)__b);
196 static __inline __m256 __DEFAULT_FN_ATTRS
197 _mm256_div_ps(__m256 __a, __m256 __b)
199 return (__m256)((__v8sf)__a/(__v8sf)__b);
234 static __inline __m256 __DEFAULT_FN_ATTRS
235 _mm256_max_ps(__m256 __a, __m256 __b)
237 return (__m256)__builtin_ia32_maxps256((__v8sf)__a, (__v8sf)__b);
272 static __inline __m256 __DEFAULT_FN_ATTRS
273 _mm256_min_ps(__m256 __a, __m256 __b)
275 return (__m256)__builtin_ia32_minps256((__v8sf)__a, (__v8sf)__b);
308 static __inline __m256 __DEFAULT_FN_ATTRS
309 _mm256_mul_ps(__m256 __a, __m256 __b)
311 return (__m256)((__v8sf)__a * (__v8sf)__b);
342 static __inline __m256 __DEFAULT_FN_ATTRS
343 _mm256_sqrt_ps(__m256 __a)
345 return (__m256)__builtin_ia32_sqrtps256((__v8sf)__a);
359 static __inline __m256 __DEFAULT_FN_ATTRS
360 _mm256_rsqrt_ps(__m256 __a)
362 return (__m256)__builtin_ia32_rsqrtps256((__v8sf)__a);
376 static __inline __m256 __DEFAULT_FN_ATTRS
377 _mm256_rcp_ps(__m256 __a)
379 return (__m256)__builtin_ia32_rcpps256((__v8sf)__a);
421 /// __m256 _mm256_round_ps(__m256 V, const int M);
444 (__m256)__builtin_ia32_roundps256((__v8sf)(__m256)(V), (M)); })
488 /// __m256 _mm256_ceil_ps(__m256 V);
505 /// __m256 _mm256_floor_ps(__m256 V);
546 static __inline __m256 __DEFAULT_FN_ATTRS
547 _mm256_and_ps(__m256 __a, __m256 __b)
549 return (__m256)((__v8su)__a & (__v8su)__b);
588 static __inline __m256 __DEFAULT_FN_ATTRS
589 _mm256_andnot_ps(__m256 __a, __m256 __b)
591 return (__m256)(~(__v8su)__a & (__v8su)__b);
624 static __inline __m256 __DEFAULT_FN_ATTRS
625 _mm256_or_ps(__m256 __a, __m256 __b)
627 return (__m256)((__v8su)__a | (__v8su)__b);
660 static __inline __m256 __DEFAULT_FN_ATTRS
661 _mm256_xor_ps(__m256 __a, __m256 __b)
663 return (__m256)((__v8su)__a ^ (__v8su)__b);
707 static __inline __m256 __DEFAULT_FN_ATTRS
708 _mm256_hadd_ps(__m256 __a, __m256 __b)
710 return (__m256)__builtin_ia32_haddps256((__v8sf)__a, (__v8sf)__b);
753 static __inline __m256 __DEFAULT_FN_ATTRS
754 _mm256_hsub_ps(__m256 __a, __m256 __b)
756 return (__m256)__builtin_ia32_hsubps256((__v8sf)__a, (__v8sf)__b);
967 static __inline __m256 __DEFAULT_FN_ATTRS
968 _mm256_permutevar_ps(__m256 __a, __m256i __c)
970 return (__m256)__builtin_ia32_vpermilvarps256((__v8sf)__a, (__v8si)__c);
1115 /// __m256 _mm256_permute_ps(__m256 A, const int C);
1199 (__m256)__builtin_shufflevector((__v8sf)(__m256)(A), \
1257 /// __m256 _mm256_permute2f128_ps(__m256 V1, __m256 V2, const int M);
1289 (__m256)__builtin_ia32_vperm2f128_ps256((__v8sf)(__m256)(V1), \
1290 (__v8sf)(__m256)(V2), (M)); })
1372 /// __m256 _mm256_blend_ps(__m256 V1, __m256 V2, const int M);
1390 (__m256)__builtin_shufflevector((__v8sf)(__m256)(V1), \
1391 (__v8sf)(__m256)(V2), \
1450 static __inline __m256 __DEFAULT_FN_ATTRS
1451 _mm256_blendv_ps(__m256 __a, __m256 __b, __m256 __c)
1453 return (__m256)__builtin_ia32_blendvps256(
1471 /// __m256 _mm256_dp_ps(__m256 V1, __m256 V2, const int M);
1495 (__m256)__builtin_ia32_dpps256((__v8sf)(__m256)(V1), \
1496 (__v8sf)(__m256)(V2), (M)); })
1513 /// __m256 _mm256_shuffle_ps(__m256 a, __m256 b, const int mask);
1548 (__m256)__builtin_shufflevector((__v8sf)(__m256)(a), \
1549 (__v8sf)(__m256)(b), \
1825 /// __m256 _mm256_cmp_ps(__m256 a, __m256 b, const int c);
1871 (__m256)__builtin_ia32_cmpps256((__v8sf)(__m256)(a), \
1872 (__v8sf)(__m256)(b), (c)); })
2210 static __inline __m256 __DEFAULT_FN_ATTRS
2213 return (__m256)__builtin_ia32_cvtdq2ps256((__v8si) __a);
2242 _mm256_cvtps_epi32(__m256 __a)
2308 _mm256_cvttps_epi32(__m256 __a)
2357 _mm256_cvtss_f32(__m256 __a)
2383 static __inline __m256 __DEFAULT_FN_ATTRS
2384 _mm256_movehdup_ps(__m256 __a)
2408 static __inline __m256 __DEFAULT_FN_ATTRS
2409 _mm256_moveldup_ps(__m256 __a)
2502 static __inline __m256 __DEFAULT_FN_ATTRS
2503 _mm256_unpackhi_ps(__m256 __a, __m256 __b)
2529 static __inline __m256 __DEFAULT_FN_ATTRS
2530 _mm256_unpacklo_ps(__m256 __a, __m256 __b)
2804 _mm256_testz_ps(__m256 __a, __m256 __b)
2831 _mm256_testc_ps(__m256 __a, __m256 __b)
2859 _mm256_testnzc_ps(__m256 __a, __m256 __b)
2969 _mm256_movemask_ps(__m256 __a)
3048 static __inline __m256 __DEFAULT_FN_ATTRS
3052 return (__m256)(__v8sf){ __f, __f, __f, __f, __f, __f, __f, __f };
3085 static __inline __m256 __DEFAULT_FN_ATTRS
3088 return (__m256)__builtin_ia32_vbroadcastf128_ps256((__v4sf const *)__a);
3119 static __inline __m256 __DEFAULT_FN_ATTRS
3122 return *(__m256 *)__p;
3156 static __inline __m256 __DEFAULT_FN_ATTRS
3160 __m256 __v;
3252 _mm256_store_ps(float *__p, __m256 __a)
3254 *(__m256 *)__p = __a;
3290 _mm256_storeu_ps(float *__p, __m256 __a)
3293 __m256 __v;
3428 static __inline __m256 __DEFAULT_FN_ATTRS
3431 return (__m256)__builtin_ia32_maskloadps256((const __v8sf *)__p, (__v8si)__m);
3454 _mm256_maskstore_ps(float *__p, __m256i __m, __m256 __a)
3585 _mm256_stream_ps(float *__p, __m256 __a)
3611 static __inline__ __m256 __DEFAULT_FN_ATTRS
3614 return (__m256)__builtin_ia32_undef256();
3690 static __inline __m256 __DEFAULT_FN_ATTRS
3694 return (__m256){ __h, __g, __f, __e, __d, __c, __b, __a };
3957 static __inline __m256 __DEFAULT_FN_ATTRS
3961 return (__m256){ __a, __b, __c, __d, __e, __f, __g, __h };
4192 static __inline __m256 __DEFAULT_FN_ATTRS
4195 return (__m256){ __w, __w, __w, __w, __w, __w, __w, __w };
4296 static __inline __m256 __DEFAULT_FN_ATTRS
4299 return (__m256){ 0, 0, 0, 0, 0, 0, 0, 0 };
4327 static __inline __m256 __DEFAULT_FN_ATTRS
4330 return (__m256)__a;
4362 _mm256_castps_pd(__m256 __a)
4379 _mm256_castps_si256(__m256 __a)
4395 static __inline __m256 __DEFAULT_FN_ATTRS
4398 return (__m256)__a;
4447 _mm256_castps256_ps128(__m256 __a)
4502 static __inline __m256 __DEFAULT_FN_ATTRS
4540 /// __m256 _mm256_insertf128_ps(__m256 V1, __m128 V2, const int M);
4564 (__m256)__builtin_shufflevector( \
4565 (__v8sf)(__m256)(V1), \
4670 /// __m128 _mm256_extractf128_ps(__m256 V, const int M);
4686 (__v8sf)(__m256)(V), \
4771 static __inline __m256 __DEFAULT_FN_ATTRS
4774 __m256 __v256 = _mm256_castps128_ps256(_mm_loadu_ps(__addr_lo));
4851 _mm256_storeu2_m128(float *__addr_hi, float *__addr_lo, __m256 __a)
4934 static __inline __m256 __DEFAULT_FN_ATTRS
4937 return (__m256) __builtin_shufflevector((__v4sf)__lo, (__v4sf)__hi, 0, 1, 2, 3, 4, 5, 6, 7);
4998 static __inline __m256 __DEFAULT_FN_ATTRS