Home | History | Annotate | Download | only in include

Lines Matching defs:__m256

48 typedef float __m256 __attribute__ ((__vector_size__ (32)));
86 static __inline __m256 __DEFAULT_FN_ATTRS
87 _mm256_add_ps(__m256 __a, __m256 __b)
89 return (__m256)((__v8sf)__a+(__v8sf)__b);
122 static __inline __m256 __DEFAULT_FN_ATTRS
123 _mm256_sub_ps(__m256 __a, __m256 __b)
125 return (__m256)((__v8sf)__a-(__v8sf)__b);
160 static __inline __m256 __DEFAULT_FN_ATTRS
161 _mm256_addsub_ps(__m256 __a, __m256 __b)
163 return (__m256)__builtin_ia32_addsubps256((__v8sf)__a, (__v8sf)__b);
196 static __inline __m256 __DEFAULT_FN_ATTRS
197 _mm256_div_ps(__m256 __a, __m256 __b)
199 return (__m256)((__v8sf)__a/(__v8sf)__b);
234 static __inline __m256 __DEFAULT_FN_ATTRS
235 _mm256_max_ps(__m256 __a, __m256 __b)
237 return (__m256)__builtin_ia32_maxps256((__v8sf)__a, (__v8sf)__b);
272 static __inline __m256 __DEFAULT_FN_ATTRS
273 _mm256_min_ps(__m256 __a, __m256 __b)
275 return (__m256)__builtin_ia32_minps256((__v8sf)__a, (__v8sf)__b);
308 static __inline __m256 __DEFAULT_FN_ATTRS
309 _mm256_mul_ps(__m256 __a, __m256 __b)
311 return (__m256)((__v8sf)__a * (__v8sf)__b);
342 static __inline __m256 __DEFAULT_FN_ATTRS
343 _mm256_sqrt_ps(__m256 __a)
345 return (__m256)__builtin_ia32_sqrtps256((__v8sf)__a);
359 static __inline __m256 __DEFAULT_FN_ATTRS
360 _mm256_rsqrt_ps(__m256 __a)
362 return (__m256)__builtin_ia32_rsqrtps256((__v8sf)__a);
376 static __inline __m256 __DEFAULT_FN_ATTRS
377 _mm256_rcp_ps(__m256 __a)
379 return (__m256)__builtin_ia32_rcpps256((__v8sf)__a);
421 /// __m256 _mm256_round_ps(__m256 V, const int M);
444 (__m256)__builtin_ia32_roundps256((__v8sf)(__m256)(V), (M)); })
488 /// __m256 _mm256_ceil_ps(__m256 V);
505 /// __m256 _mm256_floor_ps(__m256 V);
546 static __inline __m256 __DEFAULT_FN_ATTRS
547 _mm256_and_ps(__m256 __a, __m256 __b)
549 return (__m256)((__v8su)__a & (__v8su)__b);
588 static __inline __m256 __DEFAULT_FN_ATTRS
589 _mm256_andnot_ps(__m256 __a, __m256 __b)
591 return (__m256)(~(__v8su)__a & (__v8su)__b);
624 static __inline __m256 __DEFAULT_FN_ATTRS
625 _mm256_or_ps(__m256 __a, __m256 __b)
627 return (__m256)((__v8su)__a | (__v8su)__b);
660 static __inline __m256 __DEFAULT_FN_ATTRS
661 _mm256_xor_ps(__m256 __a, __m256 __b)
663 return (__m256)((__v8su)__a ^ (__v8su)__b);
707 static __inline __m256 __DEFAULT_FN_ATTRS
708 _mm256_hadd_ps(__m256 __a, __m256 __b)
710 return (__m256)__builtin_ia32_haddps256((__v8sf)__a, (__v8sf)__b);
753 static __inline __m256 __DEFAULT_FN_ATTRS
754 _mm256_hsub_ps(__m256 __a, __m256 __b)
756 return (__m256)__builtin_ia32_hsubps256((__v8sf)__a, (__v8sf)__b);
968 static __inline __m256 __DEFAULT_FN_ATTRS
969 _mm256_permutevar_ps(__m256 __a, __m256i __c)
971 return (__m256)__builtin_ia32_vpermilvarps256((__v8sf)__a, (__v8si)__c);
1113 /// __m256 _mm256_permute_ps(__m256 A, const int C);
1196 (__m256)__builtin_shufflevector((__v8sf)(__m256)(A), \
1254 /// __m256 _mm256_permute2f128_ps(__m256 V1, __m256 V2, const int M);
1286 (__m256)__builtin_ia32_vperm2f128_ps256((__v8sf)(__m256)(V1), \
1287 (__v8sf)(__m256)(V2), (M)); })
1369 /// __m256 _mm256_blend_ps(__m256 V1, __m256 V2, const int M);
1387 (__m256)__builtin_shufflevector((__v8sf)(__m256)(V1), \
1388 (__v8sf)(__m256)(V2), \
1447 static __inline __m256 __DEFAULT_FN_ATTRS
1448 _mm256_blendv_ps(__m256 __a, __m256 __b, __m256 __c)
1450 return (__m256)__builtin_ia32_blendvps256(
1468 /// __m256 _mm256_dp_ps(__m256 V1, __m256 V2, const int M);
1492 (__m256)__builtin_ia32_dpps256((__v8sf)(__m256)(V1), \
1493 (__v8sf)(__m256)(V2), (M)); })
1510 /// __m256 _mm256_shuffle_ps(__m256 a, __m256 b, const int mask);
1544 (__m256)__builtin_shufflevector((__v8sf)(__m256)(a), \
1545 (__v8sf)(__m256)(b), \
1755 /// __m256 _mm256_cmp_ps(__m256 a, __m256 b, const int c);
1779 (__m256)__builtin_ia32_cmpps256((__v8sf)(__m256)(a), \
1780 (__v8sf)(__m256)(b), (c)); })
2074 static __inline __m256 __DEFAULT_FN_ATTRS
2077 return (__m256)__builtin_ia32_cvtdq2ps256((__v8si) __a);
2106 _mm256_cvtps_epi32(__m256 __a)
2130 _mm256_cvttps_epi32(__m256 __a)
2149 _mm256_cvtss_f32(__m256 __a)
2155 static __inline __m256 __DEFAULT_FN_ATTRS
2156 _mm256_movehdup_ps(__m256 __a)
2161 static __inline __m256 __DEFAULT_FN_ATTRS
2162 _mm256_moveldup_ps(__m256 __a)
2186 static __inline __m256 __DEFAULT_FN_ATTRS
2187 _mm256_unpackhi_ps(__m256 __a, __m256 __b)
2192 static __inline __m256 __DEFAULT_FN_ATTRS
2193 _mm256_unpacklo_ps(__m256 __a, __m256 __b)
2254 _mm256_testz_ps(__m256 __a, __m256 __b)
2260 _mm256_testc_ps(__m256 __a, __m256 __b)
2266 _mm256_testnzc_ps(__m256 __a, __m256 __b)
2297 _mm256_movemask_ps(__m256 __a)
2330 static __inline __m256 __DEFAULT_FN_ATTRS
2334 return (__m256)(__v8sf){ __f, __f, __f, __f, __f, __f, __f, __f };
2343 static __inline __m256 __DEFAULT_FN_ATTRS
2346 return (__m256)__builtin_ia32_vbroadcastf128_ps256((__v4sf const *)__a);
2356 static __inline __m256 __DEFAULT_FN_ATTRS
2359 return *(__m256 *)__p;
2371 static __inline __m256 __DEFAULT_FN_ATTRS
2375 __m256 __v;
2409 _mm256_store_ps(float *__p, __m256 __a)
2411 *(__m256 *)__p = __a;
2424 _mm256_storeu_ps(float *__p, __m256 __a)
2427 __m256 __v;
2467 static __inline __m256 __DEFAULT_FN_ATTRS
2470 return (__m256)__builtin_ia32_maskloadps256((const __v8sf *)__p, (__v8si)__m);
2475 _mm256_maskstore_ps(float *__p, __m256i __m, __m256 __a)
2512 _mm256_stream_ps(float *__p, __m256 __a)
2524 static __inline__ __m256 __DEFAULT_FN_ATTRS
2527 return (__m256)__builtin_ia32_undef256();
2542 static __inline __m256 __DEFAULT_FN_ATTRS
2546 return (__m256){ __h, __g, __f, __e, __d, __c, __b, __a };
2597 static __inline __m256 __DEFAULT_FN_ATTRS
2601 return (__m256){ __a, __b, __c, __d, __e, __f, __g, __h };
2651 static __inline __m256
2654 return (__m256){ __w, __w, __w, __w, __w, __w, __w, __w };
2691 static __inline __m256 __DEFAULT_FN_ATTRS
2694 return (__m256){ 0, 0, 0, 0, 0, 0, 0, 0 };
2704 static __inline __m256 __DEFAULT_FN_ATTRS
2707 return (__m256)__a;
2717 _mm256_castps_pd(__m256 __a)
2723 _mm256_castps_si256(__m256 __a)
2728 static __inline __m256 __DEFAULT_FN_ATTRS
2731 return (__m256)__a;
2747 _mm256_castps256_ps128(__m256 __a)
2764 static __inline __m256 __DEFAULT_FN_ATTRS
2782 (__m256)__builtin_shufflevector( \
2783 (__v8sf)(__m256)(V1), \
2819 (__v8sf)(__m256)(V), \
2841 static __inline __m256 __DEFAULT_FN_ATTRS
2844 __m256 __v256 = _mm256_castps128_ps256(_mm_loadu_ps(__addr_lo));
2864 _mm256_storeu2_m128(float *__addr_hi, float *__addr_lo, __m256 __a)
2896 static __inline __m256 __DEFAULT_FN_ATTRS
2898 return (__m256) __builtin_shufflevector((__v4sf)__lo, (__v4sf)__hi, 0, 1, 2, 3, 4, 5, 6, 7);
2911 static __inline __m256 __DEFAULT_FN_ATTRS