RubyGems - numo-narray-alt - Versions diffs - 0.10.5 → 0.11.0 - Mend

numo-narray-alt 0.10.5 → 0.11.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (27) hide show

checksums.yaml +4 -4
data/README.md +9 -0
data/ext/numo/narray/extconf.rb +2 -0
data/ext/numo/narray/numo/narray.h +3 -3
data/ext/numo/narray/src/mh/math/sqrt.h +372 -0
data/ext/numo/narray/src/mh/mulsum.h +1360 -74
data/ext/numo/narray/src/mh/op/add.h +20 -0
data/ext/numo/narray/src/mh/op/binary_func.h +542 -0
data/ext/numo/narray/src/mh/op/div.h +20 -0
data/ext/numo/narray/src/mh/op/mul.h +20 -0
data/ext/numo/narray/src/mh/op/sub.h +20 -0
data/ext/numo/narray/src/mh/sort.h +4 -4
data/ext/numo/narray/src/t_bit.c +0 -5
data/ext/numo/narray/src/t_dcomplex.c +0 -5
data/ext/numo/narray/src/t_dfloat.c +35 -3
data/ext/numo/narray/src/t_int16.c +0 -5
data/ext/numo/narray/src/t_int32.c +0 -5
data/ext/numo/narray/src/t_int64.c +0 -5
data/ext/numo/narray/src/t_int8.c +0 -5
data/ext/numo/narray/src/t_robject.c +0 -5
data/ext/numo/narray/src/t_scomplex.c +0 -5
data/ext/numo/narray/src/t_sfloat.c +35 -3
data/ext/numo/narray/src/t_uint16.c +0 -5
data/ext/numo/narray/src/t_uint32.c +0 -5
data/ext/numo/narray/src/t_uint64.c +0 -5
data/ext/numo/narray/src/t_uint8.c +0 -5
metadata +2 -2

data/ext/numo/narray/src/mh/op/mul.h CHANGED Viewed

@@ -75,4 +75,24 @@
   DEF_BINARY_SELF_FUNC(mul, dfloat, numo_cDFloat)                                              \
   DEF_BINARY_FUNC(mul, '*', dfloat, numo_cDFloat)
+#define DEF_NARRAY_SFLT_MUL_AVX_METHOD_FUNC()                                                  \
+  DEF_BINARY_SFLT_AVX_ITER_FUNC(mul, _mm256_mul_ps)                                            \
+  DEF_BINARY_SELF_FUNC(mul, sfloat, numo_cSFloat)                                              \
+  DEF_BINARY_FUNC(mul, '*', sfloat, numo_cSFloat)
+#define DEF_NARRAY_DFLT_MUL_AVX_METHOD_FUNC()                                                  \
+  DEF_BINARY_DFLT_AVX_ITER_FUNC(mul, _mm256_mul_pd)                                            \
+  DEF_BINARY_SELF_FUNC(mul, dfloat, numo_cDFloat)                                              \
+  DEF_BINARY_FUNC(mul, '*', dfloat, numo_cDFloat)
+#define DEF_NARRAY_SFLT_MUL_NEON_METHOD_FUNC()                                                 \
+  DEF_BINARY_SFLT_NEON_ITER_FUNC(mul, vmulq_f32)                                               \
+  DEF_BINARY_SELF_FUNC(mul, sfloat, numo_cSFloat)                                              \
+  DEF_BINARY_FUNC(mul, '*', sfloat, numo_cSFloat)
+#define DEF_NARRAY_DFLT_MUL_NEON_METHOD_FUNC()                                                 \
+  DEF_BINARY_DFLT_NEON_ITER_FUNC(mul, vmulq_f64)                                               \
+  DEF_BINARY_SELF_FUNC(mul, dfloat, numo_cDFloat)                                              \
+  DEF_BINARY_FUNC(mul, '*', dfloat, numo_cDFloat)
 #endif /* NUMO_NARRAY_MH_OP_MUL_H */

data/ext/numo/narray/src/mh/op/sub.h CHANGED Viewed

@@ -75,4 +75,24 @@
   DEF_BINARY_SELF_FUNC(sub, dfloat, numo_cDFloat)                                              \
   DEF_BINARY_FUNC(sub, '-', dfloat, numo_cDFloat)
+#define DEF_NARRAY_SFLT_SUB_AVX_METHOD_FUNC()                                                  \
+  DEF_BINARY_SFLT_AVX_ITER_FUNC(sub, _mm256_sub_ps)                                            \
+  DEF_BINARY_SELF_FUNC(sub, sfloat, numo_cSFloat)                                              \
+  DEF_BINARY_FUNC(sub, '-', sfloat, numo_cSFloat)
+#define DEF_NARRAY_DFLT_SUB_AVX_METHOD_FUNC()                                                  \
+  DEF_BINARY_DFLT_AVX_ITER_FUNC(sub, _mm256_sub_pd)                                            \
+  DEF_BINARY_SELF_FUNC(sub, dfloat, numo_cDFloat)                                              \
+  DEF_BINARY_FUNC(sub, '-', dfloat, numo_cDFloat)
+#define DEF_NARRAY_SFLT_SUB_NEON_METHOD_FUNC()                                                 \
+  DEF_BINARY_SFLT_NEON_ITER_FUNC(sub, vsubq_f32)                                               \
+  DEF_BINARY_SELF_FUNC(sub, sfloat, numo_cSFloat)                                              \
+  DEF_BINARY_FUNC(sub, '-', sfloat, numo_cSFloat)
+#define DEF_NARRAY_DFLT_SUB_NEON_METHOD_FUNC()                                                 \
+  DEF_BINARY_DFLT_NEON_ITER_FUNC(sub, vsubq_f64)                                               \
+  DEF_BINARY_SELF_FUNC(sub, dfloat, numo_cDFloat)                                              \
+  DEF_BINARY_FUNC(sub, '-', dfloat, numo_cDFloat)
 #endif /* NUMO_NARRAY_MH_OP_SUB_H */

data/ext/numo/narray/src/mh/sort.h CHANGED Viewed

@@ -321,9 +321,9 @@ static inline void swapfunc(char* a, char* b, size_t n, int swaptype) {
     rb_funcall(idx, rb_intern("seq"), 0);                                                      \
     size_t size = na->size * sizeof(void*);                                                    \
     VALUE tmp;                                                                                 \
-    char* buf = rb_alloc_tmp_buffer(&tmp, size);                                               \
+    char* buf = RB_ALLOCV(tmp, size);                                                          \
     VALUE res = na_ndloop3(&ndf, buf, 3, self, idx, reduce);                                   \
-    rb_free_tmp_buffer(&tmp);                                                                  \
+    RB_ALLOCV_END(tmp);                                                                        \
     return res;                                                                                \
   }
@@ -475,9 +475,9 @@ static inline void swapfunc(char* a, char* b, size_t n, int swaptype) {
     rb_funcall(idx, rb_intern("seq"), 0);                                                      \
     size_t size = na->size * sizeof(void*);                                                    \
     VALUE tmp;                                                                                 \
-    char* buf = rb_alloc_tmp_buffer(&tmp, size);                                               \
+    char* buf = RB_ALLOCV(tmp, size);                                                          \
     VALUE res = na_ndloop3(&ndf, buf, 3, self, idx, reduce);                                   \
-    rb_free_tmp_buffer(&tmp);                                                                  \
+    RB_ALLOCV_END(tmp);                                                                        \
     return res;                                                                                \
   }

data/ext/numo/narray/src/t_bit.c CHANGED Viewed

@@ -14,11 +14,6 @@
 #define m_map(x) m_num_to_data(rb_yield(m_data_to_num(x)))
-#ifdef __SSE2__
-#include <emmintrin.h>
-#define SIMD_ALIGNMENT_SIZE 16
-#endif
 static ID id_cast;
 static ID id_divmod;
 static ID id_eq;

data/ext/numo/narray/src/t_dcomplex.c CHANGED Viewed

@@ -14,11 +14,6 @@
 #define m_map(x) m_num_to_data(rb_yield(m_data_to_num(x)))
-#ifdef __SSE2__
-#include <emmintrin.h>
-#define SIMD_ALIGNMENT_SIZE 16
-#endif
 static ID id_pow;
 static ID id_cast;
 static ID id_copysign;

data/ext/numo/narray/src/t_dfloat.c CHANGED Viewed

@@ -14,11 +14,21 @@
 #define m_map(x) m_num_to_data(rb_yield(m_data_to_num(x)))
-#ifdef __SSE2__
+#if !defined(NUMO_NO_SIMD) && defined(__SSE2__)
 #include <emmintrin.h>
 #define SIMD_ALIGNMENT_SIZE 16
 #endif
+#if !defined(NUMO_NO_SIMD) && defined(__AVX__)
+#include <immintrin.h>
+#define AVX_ALIGNMENT_SIZE 32
+#endif
+#if !defined(NUMO_NO_SIMD) && defined(__ARM_NEON) && defined(__aarch64__)
+#include <arm_neon.h>
+#define NEON_ALIGNMENT_SIZE 16
+#endif
 static ID id_pow;
 static ID id_cast;
 static ID id_copysign;
@@ -167,11 +177,21 @@ DEF_NARRAY_MAP_METHOD_FUNC(dfloat, numo_cDFloat)
 DEF_NARRAY_EACH_WITH_INDEX_METHOD_FUNC(dfloat)
 DEF_NARRAY_MAP_WITH_INDEX_METHOD_FUNC(dfloat, numo_cDFloat)
 DEF_NARRAY_ABS_METHOD_FUNC(dfloat, numo_cDFloat, dfloat, numo_cDFloat)
-#ifdef __SSE2__
+#if !defined(NUMO_NO_SIMD) && defined(__AVX__)
+DEF_NARRAY_DFLT_ADD_AVX_METHOD_FUNC()
+DEF_NARRAY_DFLT_SUB_AVX_METHOD_FUNC()
+DEF_NARRAY_DFLT_MUL_AVX_METHOD_FUNC()
+DEF_NARRAY_DFLT_DIV_AVX_METHOD_FUNC()
+#elif !defined(NUMO_NO_SIMD) && defined(__SSE2__)
 DEF_NARRAY_DFLT_ADD_SSE2_METHOD_FUNC()
 DEF_NARRAY_DFLT_SUB_SSE2_METHOD_FUNC()
 DEF_NARRAY_DFLT_MUL_SSE2_METHOD_FUNC()
 DEF_NARRAY_DFLT_DIV_SSE2_METHOD_FUNC()
+#elif !defined(NUMO_NO_SIMD) && defined(__ARM_NEON) && defined(__aarch64__)
+DEF_NARRAY_DFLT_ADD_NEON_METHOD_FUNC()
+DEF_NARRAY_DFLT_SUB_NEON_METHOD_FUNC()
+DEF_NARRAY_DFLT_MUL_NEON_METHOD_FUNC()
+DEF_NARRAY_DFLT_DIV_NEON_METHOD_FUNC()
 #else
 DEF_NARRAY_ADD_METHOD_FUNC(dfloat, numo_cDFloat)
 DEF_NARRAY_SUB_METHOD_FUNC(dfloat, numo_cDFloat)
@@ -225,7 +245,15 @@ DEF_NARRAY_FLT_MINIMUM_METHOD_FUNC(dfloat, numo_cDFloat)
 DEF_NARRAY_FLT_MINMAX_METHOD_FUNC(dfloat, numo_cDFloat)
 DEF_NARRAY_FLT_CUMSUM_METHOD_FUNC(dfloat, numo_cDFloat)
 DEF_NARRAY_FLT_CUMPROD_METHOD_FUNC(dfloat, numo_cDFloat)
+#if !defined(NUMO_NO_SIMD) && defined(__AVX__)
+DEF_NARRAY_DFLT_MULSUM_AVX_METHOD_FUNC()
+#elif !defined(NUMO_NO_SIMD) && defined(__SSE2__)
+DEF_NARRAY_DFLT_MULSUM_SSE2_METHOD_FUNC()
+#elif !defined(NUMO_NO_SIMD) && defined(__ARM_NEON) && defined(__aarch64__)
+DEF_NARRAY_DFLT_MULSUM_NEON_METHOD_FUNC()
+#else
 DEF_NARRAY_FLT_MULSUM_METHOD_FUNC(dfloat, numo_cDFloat)
+#endif
 DEF_NARRAY_FLT_SEQ_METHOD_FUNC(dfloat)
 DEF_NARRAY_FLT_LOGSEQ_METHOD_FUNC(dfloat)
 DEF_NARRAY_EYE_METHOD_FUNC(dfloat)
@@ -243,8 +271,12 @@ DEF_NARRAY_FLT_SORT_METHOD_FUNC(dfloat)
 #define qsort_cast **(dfloat**)
 DEF_NARRAY_FLT_SORT_INDEX_METHOD_FUNC(dfloat, numo_cDFloat)
 DEF_NARRAY_FLT_MEDIAN_METHOD_FUNC(dfloat)
-#ifdef __SSE2__
+#if !defined(NUMO_NO_SIMD) && defined(__AVX__)
+DEF_NARRAY_FLT_SQRT_AVX_DBL_METHOD_FUNC(dfloat, numo_cDFloat)
+#elif !defined(NUMO_NO_SIMD) && defined(__SSE2__)
 DEF_NARRAY_FLT_SQRT_SSE2_DBL_METHOD_FUNC(dfloat, numo_cDFloat)
+#elif !defined(NUMO_NO_SIMD) && defined(__ARM_NEON) && defined(__aarch64__)
+DEF_NARRAY_FLT_SQRT_NEON_DBL_METHOD_FUNC(dfloat, numo_cDFloat)
 #else
 DEF_NARRAY_FLT_SQRT_METHOD_FUNC(dfloat, numo_cDFloat)
 #endif

data/ext/numo/narray/src/t_int16.c CHANGED Viewed

@@ -14,11 +14,6 @@
 #define m_map(x) m_num_to_data(rb_yield(m_data_to_num(x)))
-#ifdef __SSE2__
-#include <emmintrin.h>
-#define SIMD_ALIGNMENT_SIZE 16
-#endif
 static ID id_pow;
 static ID id_left_shift;
 static ID id_right_shift;

data/ext/numo/narray/src/t_int32.c CHANGED Viewed

@@ -14,11 +14,6 @@
 #define m_map(x) m_num_to_data(rb_yield(m_data_to_num(x)))
-#ifdef __SSE2__
-#include <emmintrin.h>
-#define SIMD_ALIGNMENT_SIZE 16
-#endif
 static ID id_pow;
 static ID id_left_shift;
 static ID id_right_shift;

data/ext/numo/narray/src/t_int64.c CHANGED Viewed

@@ -14,11 +14,6 @@
 #define m_map(x) m_num_to_data(rb_yield(m_data_to_num(x)))
-#ifdef __SSE2__
-#include <emmintrin.h>
-#define SIMD_ALIGNMENT_SIZE 16
-#endif
 static ID id_pow;
 static ID id_left_shift;
 static ID id_right_shift;

data/ext/numo/narray/src/t_int8.c CHANGED Viewed

@@ -14,11 +14,6 @@
 #define m_map(x) m_num_to_data(rb_yield(m_data_to_num(x)))
-#ifdef __SSE2__
-#include <emmintrin.h>
-#define SIMD_ALIGNMENT_SIZE 16
-#endif
 static ID id_pow;
 static ID id_left_shift;
 static ID id_right_shift;

data/ext/numo/narray/src/t_robject.c CHANGED Viewed

@@ -14,11 +14,6 @@
 #define m_map(x) m_num_to_data(rb_yield(m_data_to_num(x)))
-#ifdef __SSE2__
-#include <emmintrin.h>
-#define SIMD_ALIGNMENT_SIZE 16
-#endif
 static ID id_ne;
 static ID id_pow;
 static ID id_minus;

data/ext/numo/narray/src/t_scomplex.c CHANGED Viewed

@@ -14,11 +14,6 @@
 #define m_map(x) m_num_to_data(rb_yield(m_data_to_num(x)))
-#ifdef __SSE2__
-#include <emmintrin.h>
-#define SIMD_ALIGNMENT_SIZE 16
-#endif
 static ID id_pow;
 static ID id_cast;
 static ID id_copysign;

data/ext/numo/narray/src/t_sfloat.c CHANGED Viewed

@@ -14,11 +14,21 @@
 #define m_map(x) m_num_to_data(rb_yield(m_data_to_num(x)))
-#ifdef __SSE2__
+#if !defined(NUMO_NO_SIMD) && defined(__SSE2__)
 #include <emmintrin.h>
 #define SIMD_ALIGNMENT_SIZE 16
 #endif
+#if !defined(NUMO_NO_SIMD) && defined(__AVX__)
+#include <immintrin.h>
+#define AVX_ALIGNMENT_SIZE 32
+#endif
+#if !defined(NUMO_NO_SIMD) && defined(__ARM_NEON) && defined(__aarch64__)
+#include <arm_neon.h>
+#define NEON_ALIGNMENT_SIZE 16
+#endif
 static ID id_pow;
 static ID id_cast;
 static ID id_copysign;
@@ -166,11 +176,21 @@ DEF_NARRAY_MAP_METHOD_FUNC(sfloat, numo_cSFloat)
 DEF_NARRAY_EACH_WITH_INDEX_METHOD_FUNC(sfloat)
 DEF_NARRAY_MAP_WITH_INDEX_METHOD_FUNC(sfloat, numo_cSFloat)
 DEF_NARRAY_ABS_METHOD_FUNC(sfloat, numo_cSFloat, sfloat, numo_cSFloat)
-#ifdef __SSE2__
+#if !defined(NUMO_NO_SIMD) && defined(__AVX__)
+DEF_NARRAY_SFLT_ADD_AVX_METHOD_FUNC()
+DEF_NARRAY_SFLT_SUB_AVX_METHOD_FUNC()
+DEF_NARRAY_SFLT_MUL_AVX_METHOD_FUNC()
+DEF_NARRAY_SFLT_DIV_AVX_METHOD_FUNC()
+#elif !defined(NUMO_NO_SIMD) && defined(__SSE2__)
 DEF_NARRAY_SFLT_ADD_SSE2_METHOD_FUNC()
 DEF_NARRAY_SFLT_SUB_SSE2_METHOD_FUNC()
 DEF_NARRAY_SFLT_MUL_SSE2_METHOD_FUNC()
 DEF_NARRAY_SFLT_DIV_SSE2_METHOD_FUNC()
+#elif !defined(NUMO_NO_SIMD) && defined(__ARM_NEON) && defined(__aarch64__)
+DEF_NARRAY_SFLT_ADD_NEON_METHOD_FUNC()
+DEF_NARRAY_SFLT_SUB_NEON_METHOD_FUNC()
+DEF_NARRAY_SFLT_MUL_NEON_METHOD_FUNC()
+DEF_NARRAY_SFLT_DIV_NEON_METHOD_FUNC()
 #else
 DEF_NARRAY_ADD_METHOD_FUNC(sfloat, numo_cSFloat)
 DEF_NARRAY_SUB_METHOD_FUNC(sfloat, numo_cSFloat)
@@ -223,7 +243,15 @@ DEF_NARRAY_FLT_MINIMUM_METHOD_FUNC(sfloat, numo_cSFloat)
 DEF_NARRAY_FLT_MINMAX_METHOD_FUNC(sfloat, numo_cSFloat)
 DEF_NARRAY_FLT_CUMSUM_METHOD_FUNC(sfloat, numo_cSFloat)
 DEF_NARRAY_FLT_CUMPROD_METHOD_FUNC(sfloat, numo_cSFloat)
+#if !defined(NUMO_NO_SIMD) && defined(__AVX__)
+DEF_NARRAY_SFLT_MULSUM_AVX_METHOD_FUNC()
+#elif !defined(NUMO_NO_SIMD) && defined(__SSE2__)
+DEF_NARRAY_SFLT_MULSUM_SSE2_METHOD_FUNC()
+#elif !defined(NUMO_NO_SIMD) && defined(__ARM_NEON) && defined(__aarch64__)
+DEF_NARRAY_SFLT_MULSUM_NEON_METHOD_FUNC()
+#else
 DEF_NARRAY_FLT_MULSUM_METHOD_FUNC(sfloat, numo_cSFloat)
+#endif
 DEF_NARRAY_FLT_SEQ_METHOD_FUNC(sfloat)
 DEF_NARRAY_FLT_LOGSEQ_METHOD_FUNC(sfloat)
 DEF_NARRAY_EYE_METHOD_FUNC(sfloat)
@@ -241,8 +269,12 @@ DEF_NARRAY_FLT_SORT_METHOD_FUNC(sfloat)
 #define qsort_cast **(sfloat**)
 DEF_NARRAY_FLT_SORT_INDEX_METHOD_FUNC(sfloat, numo_cSFloat)
 DEF_NARRAY_FLT_MEDIAN_METHOD_FUNC(sfloat)
-#ifdef __SSE2__
+#if !defined(NUMO_NO_SIMD) && defined(__AVX__)
+DEF_NARRAY_FLT_SQRT_AVX_SGL_METHOD_FUNC(sfloat, numo_cSFloat)
+#elif !defined(NUMO_NO_SIMD) && defined(__SSE2__)
 DEF_NARRAY_FLT_SQRT_SSE2_SGL_METHOD_FUNC(sfloat, numo_cSFloat)
+#elif !defined(NUMO_NO_SIMD) && defined(__ARM_NEON) && defined(__aarch64__)
+DEF_NARRAY_FLT_SQRT_NEON_SGL_METHOD_FUNC(sfloat, numo_cSFloat)
 #else
 DEF_NARRAY_FLT_SQRT_METHOD_FUNC(sfloat, numo_cSFloat)
 #endif

data/ext/numo/narray/src/t_uint16.c CHANGED Viewed

@@ -14,11 +14,6 @@
 #define m_map(x) m_num_to_data(rb_yield(m_data_to_num(x)))
-#ifdef __SSE2__
-#include <emmintrin.h>
-#define SIMD_ALIGNMENT_SIZE 16
-#endif
 static ID id_pow;
 static ID id_left_shift;
 static ID id_right_shift;

data/ext/numo/narray/src/t_uint32.c CHANGED Viewed

@@ -14,11 +14,6 @@
 #define m_map(x) m_num_to_data(rb_yield(m_data_to_num(x)))
-#ifdef __SSE2__
-#include <emmintrin.h>
-#define SIMD_ALIGNMENT_SIZE 16
-#endif
 static ID id_pow;
 static ID id_left_shift;
 static ID id_right_shift;

data/ext/numo/narray/src/t_uint64.c CHANGED Viewed

@@ -14,11 +14,6 @@
 #define m_map(x) m_num_to_data(rb_yield(m_data_to_num(x)))
-#ifdef __SSE2__
-#include <emmintrin.h>
-#define SIMD_ALIGNMENT_SIZE 16
-#endif
 static ID id_pow;
 static ID id_left_shift;
 static ID id_right_shift;

data/ext/numo/narray/src/t_uint8.c CHANGED Viewed

@@ -14,11 +14,6 @@
 #define m_map(x) m_num_to_data(rb_yield(m_data_to_num(x)))
-#ifdef __SSE2__
-#include <emmintrin.h>
-#define SIMD_ALIGNMENT_SIZE 16
-#endif
 static ID id_pow;
 static ID id_left_shift;
 static ID id_right_shift;

metadata CHANGED Viewed

@@ -1,7 +1,7 @@
 --- !ruby/object:Gem::Specification
 name: numo-narray-alt
 version: !ruby/object:Gem::Version
-  version: 0.10.5
+  version: 0.11.0
 platform: ruby
 authors:
 - yoshoku
@@ -214,7 +214,7 @@ licenses:
 metadata:
   homepage_uri: https://github.com/yoshoku/numo-narray-alt
   changelog_uri: https://github.com/yoshoku/numo-narray-alt/blob/main/CHANGELOG.md
-  documentation_uri: https://gemdocs.org/gems/numo-narray-alt/0.10.5/
+  documentation_uri: https://gemdocs.org/gems/numo-narray-alt/0.11.0/
   rubygems_mfa_required: 'true'
 post_install_message: |
   ===