RubyGems - numo-linalg-alt - Versions diffs - 0.3.0 → 0.4.0 - Mend

numo-linalg-alt 0.3.0 → 0.4.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (53) hide show

checksums.yaml +4 -4
data/CHANGELOG.md +4 -0
data/ext/numo/linalg/blas/dot.c +59 -59
data/ext/numo/linalg/blas/dot_sub.c +58 -58
data/ext/numo/linalg/blas/gemm.c +157 -148
data/ext/numo/linalg/blas/gemv.c +131 -127
data/ext/numo/linalg/blas/nrm2.c +50 -50
data/ext/numo/linalg/lapack/gees.c +239 -220
data/ext/numo/linalg/lapack/geev.c +127 -110
data/ext/numo/linalg/lapack/gelsd.c +81 -70
data/ext/numo/linalg/lapack/geqrf.c +52 -51
data/ext/numo/linalg/lapack/gerqf.c +70 -0
data/ext/numo/linalg/lapack/gerqf.h +15 -0
data/ext/numo/linalg/lapack/gesdd.c +96 -86
data/ext/numo/linalg/lapack/gesv.c +80 -78
data/ext/numo/linalg/lapack/gesvd.c +140 -129
data/ext/numo/linalg/lapack/getrf.c +51 -50
data/ext/numo/linalg/lapack/getri.c +64 -63
data/ext/numo/linalg/lapack/getrs.c +92 -88
data/ext/numo/linalg/lapack/gges.c +214 -0
data/ext/numo/linalg/lapack/gges.h +15 -0
data/ext/numo/linalg/lapack/heev.c +54 -52
data/ext/numo/linalg/lapack/heevd.c +54 -52
data/ext/numo/linalg/lapack/heevr.c +109 -98
data/ext/numo/linalg/lapack/hegv.c +77 -74
data/ext/numo/linalg/lapack/hegvd.c +77 -74
data/ext/numo/linalg/lapack/hegvx.c +132 -120
data/ext/numo/linalg/lapack/hetrf.c +54 -50
data/ext/numo/linalg/lapack/lange.c +45 -44
data/ext/numo/linalg/lapack/orgqr.c +63 -62
data/ext/numo/linalg/lapack/orgrq.c +78 -0
data/ext/numo/linalg/lapack/orgrq.h +15 -0
data/ext/numo/linalg/lapack/potrf.c +49 -48
data/ext/numo/linalg/lapack/potri.c +49 -48
data/ext/numo/linalg/lapack/potrs.c +74 -72
data/ext/numo/linalg/lapack/syev.c +54 -52
data/ext/numo/linalg/lapack/syevd.c +54 -52
data/ext/numo/linalg/lapack/syevr.c +107 -98
data/ext/numo/linalg/lapack/sygv.c +77 -73
data/ext/numo/linalg/lapack/sygvd.c +77 -73
data/ext/numo/linalg/lapack/sygvx.c +132 -120
data/ext/numo/linalg/lapack/sytrf.c +54 -50
data/ext/numo/linalg/lapack/trtrs.c +79 -75
data/ext/numo/linalg/lapack/ungqr.c +63 -62
data/ext/numo/linalg/lapack/ungrq.c +78 -0
data/ext/numo/linalg/lapack/ungrq.h +15 -0
data/ext/numo/linalg/linalg.c +20 -10
data/ext/numo/linalg/linalg.h +4 -0
data/ext/numo/linalg/util.c +8 -0
data/ext/numo/linalg/util.h +1 -0
data/lib/numo/linalg/version.rb +1 -1
data/lib/numo/linalg.rb +139 -3
metadata +10 -2

data/ext/numo/linalg/lapack/getrs.c CHANGED Viewed

@@ -5,94 +5,98 @@ struct _getrs_option {
   char trans;
 };
-#define DEF_LINALG_FUNC(tDType, tNAryClass, fLapackFunc)                                                       \
-  static void _iter_##fLapackFunc(na_loop_t* const lp) {                                                       \
-    tDType* a = (tDType*)NDL_PTR(lp, 0);                                                                       \
-    int* ipiv = (int*)NDL_PTR(lp, 1);                                                                          \
-    tDType* b = (tDType*)NDL_PTR(lp, 2);                                                                       \
-    int* info = (int*)NDL_PTR(lp, 3);                                                                          \
-    struct _getrs_option* opt = (struct _getrs_option*)(lp->opt_ptr);                                          \
-    const lapack_int n = (lapack_int)NDL_SHAPE(lp, 0)[0];                                                      \
-    const lapack_int nrhs = lp->args[2].ndim == 1 ? 1 : (lapack_int)NDL_SHAPE(lp, 2)[1];                       \
-    const lapack_int lda = n;                                                                                  \
-    const lapack_int ldb = nrhs;                                                                               \
-    const lapack_int i = LAPACKE_##fLapackFunc(opt->matrix_layout, opt->trans, n, nrhs, a, lda, ipiv, b, ldb); \
-    *info = (int)i;                                                                                            \
-  }                                                                                                            \
-                                                                                                               \
-  static VALUE _linalg_lapack_##fLapackFunc(int argc, VALUE* argv, VALUE self) {                               \
-    VALUE a_vnary = Qnil;                                                                                      \
-    VALUE ipiv_vnary = Qnil;                                                                                   \
-    VALUE b_vnary = Qnil;                                                                                      \
-    VALUE kw_args = Qnil;                                                                                      \
-    rb_scan_args(argc, argv, "3:", &a_vnary, &ipiv_vnary, &b_vnary, &kw_args);                                 \
-    ID kw_table[2] = { rb_intern("order"), rb_intern("trans") };                                               \
-    VALUE kw_values[2] = { Qundef, Qundef };                                                                   \
-    rb_get_kwargs(kw_args, kw_table, 0, 2, kw_values);                                                         \
-    const int matrix_layout = kw_values[0] != Qundef ? get_matrix_layout(kw_values[0]) : LAPACK_ROW_MAJOR;     \
-    const char trans = kw_values[1] != Qundef ? NUM2CHR(kw_values[1]) : 'N';                                   \
-                                                                                                               \
-    if (CLASS_OF(a_vnary) != tNAryClass) {                                                                     \
-      a_vnary = rb_funcall(tNAryClass, rb_intern("cast"), 1, a_vnary);                                         \
-    }                                                                                                          \
-    if (!RTEST(nary_check_contiguous(a_vnary))) {                                                              \
-      a_vnary = nary_dup(a_vnary);                                                                             \
-    }                                                                                                          \
-    if (CLASS_OF(ipiv_vnary) != numo_cInt32) {                                                                 \
-      ipiv_vnary = rb_funcall(numo_cInt32, rb_intern("cast"), 1, ipiv_vnary);                                  \
-    }                                                                                                          \
-    if (!RTEST(nary_check_contiguous(ipiv_vnary))) {                                                           \
-      ipiv_vnary = nary_dup(ipiv_vnary);                                                                       \
-    }                                                                                                          \
-    if (CLASS_OF(b_vnary) != tNAryClass) {                                                                     \
-      b_vnary = rb_funcall(tNAryClass, rb_intern("cast"), 1, b_vnary);                                         \
-    }                                                                                                          \
-    if (!RTEST(nary_check_contiguous(b_vnary))) {                                                              \
-      b_vnary = nary_dup(b_vnary);                                                                             \
-    }                                                                                                          \
-                                                                                                               \
-    narray_t* a_nary = NULL;                                                                                   \
-    GetNArray(a_vnary, a_nary);                                                                                \
-    const int n_dims = NA_NDIM(a_nary);                                                                        \
-    if (n_dims != 2) {                                                                                         \
-      rb_raise(rb_eArgError, "input array a must be 2-dimensional");                                           \
-      return Qnil;                                                                                             \
-    }                                                                                                          \
-    if (NA_SHAPE(a_nary)[0] != NA_SHAPE(a_nary)[1]) {                                                          \
-      rb_raise(rb_eArgError, "input array a must be square");                                                  \
-      return Qnil;                                                                                             \
-    }                                                                                                          \
-    narray_t* ipiv_nary = NULL;                                                                                \
-    GetNArray(ipiv_vnary, ipiv_nary);                                                                          \
-    const int ipiv_n_dims = NA_NDIM(ipiv_nary);                                                                \
-    if (ipiv_n_dims != 1) {                                                                                    \
-      rb_raise(rb_eArgError, "input array ipiv must be 1-dimensional");                                        \
-      return Qnil;                                                                                             \
-    }                                                                                                          \
-    narray_t* b_nary = NULL;                                                                                   \
-    GetNArray(b_vnary, b_nary);                                                                                \
-    const int b_n_dims = NA_NDIM(b_nary);                                                                      \
-    if (b_n_dims != 1 && b_n_dims != 2) {                                                                      \
-      rb_raise(rb_eArgError, "input array b must be 1 or 2-dimensional");                                      \
-      return Qnil;                                                                                             \
-    }                                                                                                          \
-    lapack_int n = (lapack_int)NA_SHAPE(a_nary)[0];                                                            \
-    lapack_int nb = (lapack_int)NA_SHAPE(b_nary)[0];                                                           \
-    if (n != nb) {                                                                                             \
-      rb_raise(nary_eShapeError, "shape1[0](=%d) != shape2[0](=%d)", n, nb);                                   \
-    }                                                                                                          \
-                                                                                                               \
-    ndfunc_arg_in_t ain[3] = { { tNAryClass, 2 }, { numo_cInt32, 1 }, { OVERWRITE, b_n_dims } };               \
-    ndfunc_arg_out_t aout[1] = { { numo_cInt32, 0 } };                                                         \
-    ndfunc_t ndf = { _iter_##fLapackFunc, NO_LOOP | NDF_EXTRACT, 3, 1, ain, aout };                            \
-    struct _getrs_option opt = { matrix_layout, trans };                                                       \
-    VALUE info = na_ndloop3(&ndf, &opt, 3, a_vnary, ipiv_vnary, b_vnary);                                      \
-    VALUE ret = rb_ary_new3(2, b_vnary, info);                                                                 \
-                                                                                                               \
-    RB_GC_GUARD(a_vnary);                                                                                      \
-    RB_GC_GUARD(ipiv_vnary);                                                                                   \
-    RB_GC_GUARD(b_vnary);                                                                                      \
-    return ret;                                                                                                \
+#define DEF_LINALG_FUNC(tDType, tNAryClass, fLapackFunc)                                       \
+  static void _iter_##fLapackFunc(na_loop_t* const lp) {                                       \
+    tDType* a = (tDType*)NDL_PTR(lp, 0);                                                       \
+    int* ipiv = (int*)NDL_PTR(lp, 1);                                                          \
+    tDType* b = (tDType*)NDL_PTR(lp, 2);                                                       \
+    int* info = (int*)NDL_PTR(lp, 3);                                                          \
+    struct _getrs_option* opt = (struct _getrs_option*)(lp->opt_ptr);                          \
+    const lapack_int n = (lapack_int)NDL_SHAPE(lp, 0)[0];                                      \
+    const lapack_int nrhs = lp->args[2].ndim == 1 ? 1 : (lapack_int)NDL_SHAPE(lp, 2)[1];       \
+    const lapack_int lda = n;                                                                  \
+    const lapack_int ldb = nrhs;                                                               \
+    const lapack_int i =                                                                       \
+      LAPACKE_##fLapackFunc(opt->matrix_layout, opt->trans, n, nrhs, a, lda, ipiv, b, ldb);    \
+    *info = (int)i;                                                                            \
+  }                                                                                            \
+                                                                                               \
+  static VALUE _linalg_lapack_##fLapackFunc(int argc, VALUE* argv, VALUE self) {               \
+    VALUE a_vnary = Qnil;                                                                      \
+    VALUE ipiv_vnary = Qnil;                                                                   \
+    VALUE b_vnary = Qnil;                                                                      \
+    VALUE kw_args = Qnil;                                                                      \
+    rb_scan_args(argc, argv, "3:", &a_vnary, &ipiv_vnary, &b_vnary, &kw_args);                 \
+    ID kw_table[2] = { rb_intern("order"), rb_intern("trans") };                               \
+    VALUE kw_values[2] = { Qundef, Qundef };                                                   \
+    rb_get_kwargs(kw_args, kw_table, 0, 2, kw_values);                                         \
+    const int matrix_layout =                                                                  \
+      kw_values[0] != Qundef ? get_matrix_layout(kw_values[0]) : LAPACK_ROW_MAJOR;             \
+    const char trans = kw_values[1] != Qundef ? NUM2CHR(kw_values[1]) : 'N';                   \
+                                                                                               \
+    if (CLASS_OF(a_vnary) != tNAryClass) {                                                     \
+      a_vnary = rb_funcall(tNAryClass, rb_intern("cast"), 1, a_vnary);                         \
+    }                                                                                          \
+    if (!RTEST(nary_check_contiguous(a_vnary))) {                                              \
+      a_vnary = nary_dup(a_vnary);                                                             \
+    }                                                                                          \
+    if (CLASS_OF(ipiv_vnary) != numo_cInt32) {                                                 \
+      ipiv_vnary = rb_funcall(numo_cInt32, rb_intern("cast"), 1, ipiv_vnary);                  \
+    }                                                                                          \
+    if (!RTEST(nary_check_contiguous(ipiv_vnary))) {                                           \
+      ipiv_vnary = nary_dup(ipiv_vnary);                                                       \
+    }                                                                                          \
+    if (CLASS_OF(b_vnary) != tNAryClass) {                                                     \
+      b_vnary = rb_funcall(tNAryClass, rb_intern("cast"), 1, b_vnary);                         \
+    }                                                                                          \
+    if (!RTEST(nary_check_contiguous(b_vnary))) {                                              \
+      b_vnary = nary_dup(b_vnary);                                                             \
+    }                                                                                          \
+                                                                                               \
+    narray_t* a_nary = NULL;                                                                   \
+    GetNArray(a_vnary, a_nary);                                                                \
+    const int n_dims = NA_NDIM(a_nary);                                                        \
+    if (n_dims != 2) {                                                                         \
+      rb_raise(rb_eArgError, "input array a must be 2-dimensional");                           \
+      return Qnil;                                                                             \
+    }                                                                                          \
+    if (NA_SHAPE(a_nary)[0] != NA_SHAPE(a_nary)[1]) {                                          \
+      rb_raise(rb_eArgError, "input array a must be square");                                  \
+      return Qnil;                                                                             \
+    }                                                                                          \
+    narray_t* ipiv_nary = NULL;                                                                \
+    GetNArray(ipiv_vnary, ipiv_nary);                                                          \
+    const int ipiv_n_dims = NA_NDIM(ipiv_nary);                                                \
+    if (ipiv_n_dims != 1) {                                                                    \
+      rb_raise(rb_eArgError, "input array ipiv must be 1-dimensional");                        \
+      return Qnil;                                                                             \
+    }                                                                                          \
+    narray_t* b_nary = NULL;                                                                   \
+    GetNArray(b_vnary, b_nary);                                                                \
+    const int b_n_dims = NA_NDIM(b_nary);                                                      \
+    if (b_n_dims != 1 && b_n_dims != 2) {                                                      \
+      rb_raise(rb_eArgError, "input array b must be 1 or 2-dimensional");                      \
+      return Qnil;                                                                             \
+    }                                                                                          \
+    lapack_int n = (lapack_int)NA_SHAPE(a_nary)[0];                                            \
+    lapack_int nb = (lapack_int)NA_SHAPE(b_nary)[0];                                           \
+    if (n != nb) {                                                                             \
+      rb_raise(nary_eShapeError, "shape1[0](=%d) != shape2[0](=%d)", n, nb);                   \
+    }                                                                                          \
+                                                                                               \
+    ndfunc_arg_in_t ain[3] = { { tNAryClass, 2 },                                              \
+                               { numo_cInt32, 1 },                                             \
+                               { OVERWRITE, b_n_dims } };                                      \
+    ndfunc_arg_out_t aout[1] = { { numo_cInt32, 0 } };                                         \
+    ndfunc_t ndf = { _iter_##fLapackFunc, NO_LOOP | NDF_EXTRACT, 3, 1, ain, aout };            \
+    struct _getrs_option opt = { matrix_layout, trans };                                       \
+    VALUE info = na_ndloop3(&ndf, &opt, 3, a_vnary, ipiv_vnary, b_vnary);                      \
+    VALUE ret = rb_ary_new3(2, b_vnary, info);                                                 \
+                                                                                               \
+    RB_GC_GUARD(a_vnary);                                                                      \
+    RB_GC_GUARD(ipiv_vnary);                                                                   \
+    RB_GC_GUARD(b_vnary);                                                                      \
+    return ret;                                                                                \
   }
 DEF_LINALG_FUNC(double, numo_cDFloat, dgetrs)

data/ext/numo/linalg/lapack/gges.c ADDED Viewed

@@ -0,0 +1,214 @@
+#include "gges.h"
+#define DEF_GGES_OPTION(fLapackFunc, tSelectFunc)                                              \
+  struct _gges_option_##fLapackFunc {                                                          \
+    int matrix_layout;                                                                         \
+    char jobvsl;                                                                               \
+    char jobvsr;                                                                               \
+    char sort;                                                                                 \
+    tSelectFunc select;                                                                        \
+  };
+#define DEF_LINALG_FUNC(tDType, tNAryClass, fLapackFunc)                                       \
+  static void _iter_##fLapackFunc(na_loop_t* const lp) {                                       \
+    tDType* a = (tDType*)(NDL_PTR(lp, 0));                                                     \
+    tDType* b = (tDType*)(NDL_PTR(lp, 1));                                                     \
+    tDType* alpha_r = (tDType*)(NDL_PTR(lp, 2));                                               \
+    tDType* alpha_i = (tDType*)(NDL_PTR(lp, 3));                                               \
+    tDType* beta = (tDType*)(NDL_PTR(lp, 4));                                                  \
+    tDType* vsl = (tDType*)(NDL_PTR(lp, 5));                                                   \
+    tDType* vsr = (tDType*)(NDL_PTR(lp, 6));                                                   \
+    int* sdim = (int*)(NDL_PTR(lp, 7));                                                        \
+    int* info = (int*)(NDL_PTR(lp, 8));                                                        \
+    struct _gges_option_##fLapackFunc* opt =                                                   \
+      (struct _gges_option_##fLapackFunc*)(lp->opt_ptr);                                       \
+    const lapack_int n =                                                                       \
+      (lapack_int)(opt->matrix_layout == LAPACK_ROW_MAJOR ? NDL_SHAPE(lp, 0)[0]                \
+                                                          : NDL_SHAPE(lp, 0)[1]);              \
+    const lapack_int lda = n;                                                                  \
+    const lapack_int ldb = n;                                                                  \
+    const lapack_int ldvsl = (opt->jobvsl == 'N') ? 1 : n;                                     \
+    const lapack_int ldvsr = (opt->jobvsr == 'N') ? 1 : n;                                     \
+    lapack_int s = 0;                                                                          \
+    lapack_int i = LAPACKE_##fLapackFunc(                                                      \
+      opt->matrix_layout, opt->jobvsl, opt->jobvsr, opt->sort, opt->select, n, a, lda, b, ldb, \
+      &s, alpha_r, alpha_i, beta, vsl, ldvsl, vsr, ldvsr                                       \
+    );                                                                                         \
+    *sdim = (int)s;                                                                            \
+    *info = (int)i;                                                                            \
+  }                                                                                            \
+                                                                                               \
+  static VALUE _linalg_lapack_##fLapackFunc(int argc, VALUE* argv, VALUE self) {               \
+    VALUE a_vnary = Qnil;                                                                      \
+    VALUE b_vnary = Qnil;                                                                      \
+    VALUE kw_args = Qnil;                                                                      \
+    rb_scan_args(argc, argv, "2:", &a_vnary, &b_vnary, &kw_args);                              \
+    ID kw_table[4] = { rb_intern("order"), rb_intern("jobvsl"), rb_intern("jobvsr"),           \
+                       rb_intern("sort") };                                                    \
+    VALUE kw_values[4] = { Qundef, Qundef, Qundef, Qundef };                                   \
+    rb_get_kwargs(kw_args, kw_table, 0, 4, kw_values);                                         \
+    const int matrix_layout =                                                                  \
+      kw_values[0] != Qundef ? get_matrix_layout(kw_values[0]) : LAPACK_ROW_MAJOR;             \
+    const char jobvsl = kw_values[1] != Qundef ? get_jobvs(kw_values[1]) : 'V';                \
+    const char jobvsr = kw_values[2] != Qundef ? get_jobvs(kw_values[2]) : 'V';                \
+                                                                                               \
+    if (CLASS_OF(a_vnary) != tNAryClass) {                                                     \
+      a_vnary = rb_funcall(tNAryClass, rb_intern("cast"), 1, a_vnary);                         \
+    }                                                                                          \
+    if (!RTEST(nary_check_contiguous(a_vnary))) {                                              \
+      a_vnary = nary_dup(a_vnary);                                                             \
+    }                                                                                          \
+    if (CLASS_OF(b_vnary) != tNAryClass) {                                                     \
+      b_vnary = rb_funcall(tNAryClass, rb_intern("cast"), 1, b_vnary);                         \
+    }                                                                                          \
+    if (!RTEST(nary_check_contiguous(b_vnary))) {                                              \
+      b_vnary = nary_dup(b_vnary);                                                             \
+    }                                                                                          \
+                                                                                               \
+    narray_t* a_nary = NULL;                                                                   \
+    GetNArray(a_vnary, a_nary);                                                                \
+    if (NA_NDIM(a_nary) != 2) {                                                                \
+      rb_raise(rb_eArgError, "input array a must be 2-dimensional array");                     \
+      return Qnil;                                                                             \
+    }                                                                                          \
+    narray_t* b_nary = NULL;                                                                   \
+    GetNArray(b_vnary, b_nary);                                                                \
+    if (NA_NDIM(b_nary) != 2) {                                                                \
+      rb_raise(rb_eArgError, "input array b must be 2-dimensional array");                     \
+      return Qnil;                                                                             \
+    }                                                                                          \
+                                                                                               \
+    size_t n = matrix_layout == LAPACK_ROW_MAJOR ? NA_SHAPE(a_nary)[0] : NA_SHAPE(a_nary)[1];  \
+    size_t shape_alphar[1] = { n };                                                            \
+    size_t shape_alphai[1] = { n };                                                            \
+    size_t shape_beta[1] = { n };                                                              \
+    size_t shape_vsl[2] = { n, jobvsl == 'N' ? 1 : n };                                        \
+    size_t shape_vsr[2] = { n, jobvsr == 'N' ? 1 : n };                                        \
+    ndfunc_arg_in_t ain[2] = { { OVERWRITE, 2 }, { OVERWRITE, 2 } };                           \
+    ndfunc_arg_out_t aout[7] = { { tNAryClass, 1, shape_alphar },                              \
+                                 { tNAryClass, 1, shape_alphai },                              \
+                                 { tNAryClass, 1, shape_beta },                                \
+                                 { tNAryClass, 2, shape_vsl },                                 \
+                                 { tNAryClass, 2, shape_vsr },                                 \
+                                 { numo_cInt32, 0 },                                           \
+                                 { numo_cInt32, 0 } };                                         \
+    ndfunc_t ndf = { _iter_##fLapackFunc, NO_LOOP | NDF_EXTRACT, 2, 7, ain, aout };            \
+    struct _gges_option_##fLapackFunc opt = { matrix_layout, jobvsl, jobvsr, 'N', NULL };      \
+    VALUE res = na_ndloop3(&ndf, &opt, 2, a_vnary, b_vnary);                                   \
+    VALUE ret = rb_ary_concat(rb_ary_new3(2, a_vnary, b_vnary), res);                          \
+                                                                                               \
+    RB_GC_GUARD(a_vnary);                                                                      \
+    RB_GC_GUARD(b_vnary);                                                                      \
+    return ret;                                                                                \
+  }
+#define DEF_LINALG_FUNC_COMPLEX(tDType, tNAryClass, fLapackFunc)                               \
+  static void _iter_##fLapackFunc(na_loop_t* const lp) {                                       \
+    tDType* a = (tDType*)(NDL_PTR(lp, 0));                                                     \
+    tDType* b = (tDType*)(NDL_PTR(lp, 1));                                                     \
+    tDType* alpha = (tDType*)(NDL_PTR(lp, 2));                                                 \
+    tDType* beta = (tDType*)(NDL_PTR(lp, 3));                                                  \
+    tDType* vsl = (tDType*)(NDL_PTR(lp, 4));                                                   \
+    tDType* vsr = (tDType*)(NDL_PTR(lp, 5));                                                   \
+    int* sdim = (int*)(NDL_PTR(lp, 6));                                                        \
+    int* info = (int*)(NDL_PTR(lp, 7));                                                        \
+    struct _gges_option_##fLapackFunc* opt =                                                   \
+      (struct _gges_option_##fLapackFunc*)(lp->opt_ptr);                                       \
+    const lapack_int n =                                                                       \
+      (lapack_int)(opt->matrix_layout == LAPACK_ROW_MAJOR ? NDL_SHAPE(lp, 0)[0]                \
+                                                          : NDL_SHAPE(lp, 0)[1]);              \
+    const lapack_int lda = n;                                                                  \
+    const lapack_int ldb = n;                                                                  \
+    const lapack_int ldvsl = (opt->jobvsl == 'N') ? 1 : n;                                     \
+    const lapack_int ldvsr = (opt->jobvsr == 'N') ? 1 : n;                                     \
+    lapack_int s = 0;                                                                          \
+    lapack_int i = LAPACKE_##fLapackFunc(                                                      \
+      opt->matrix_layout, opt->jobvsl, opt->jobvsr, opt->sort, opt->select, n, a, lda, b, ldb, \
+      &s, alpha, beta, vsl, ldvsl, vsr, ldvsr                                                  \
+    );                                                                                         \
+    *sdim = (int)s;                                                                            \
+    *info = (int)i;                                                                            \
+  }                                                                                            \
+                                                                                               \
+  static VALUE _linalg_lapack_##fLapackFunc(int argc, VALUE* argv, VALUE self) {               \
+    VALUE a_vnary = Qnil;                                                                      \
+    VALUE b_vnary = Qnil;                                                                      \
+    VALUE kw_args = Qnil;                                                                      \
+    rb_scan_args(argc, argv, "2:", &a_vnary, &b_vnary, &kw_args);                              \
+    ID kw_table[4] = { rb_intern("order"), rb_intern("jobvsl"), rb_intern("jobvsr"),           \
+                       rb_intern("sort") };                                                    \
+    VALUE kw_values[4] = { Qundef, Qundef, Qundef, Qundef };                                   \
+    rb_get_kwargs(kw_args, kw_table, 0, 4, kw_values);                                         \
+    const int matrix_layout =                                                                  \
+      kw_values[0] != Qundef ? get_matrix_layout(kw_values[0]) : LAPACK_ROW_MAJOR;             \
+    const char jobvsl = kw_values[1] != Qundef ? get_jobvs(kw_values[1]) : 'V';                \
+    const char jobvsr = kw_values[2] != Qundef ? get_jobvs(kw_values[1]) : 'V';                \
+                                                                                               \
+    if (CLASS_OF(a_vnary) != tNAryClass) {                                                     \
+      a_vnary = rb_funcall(tNAryClass, rb_intern("cast"), 1, a_vnary);                         \
+    }                                                                                          \
+    if (!RTEST(nary_check_contiguous(a_vnary))) {                                              \
+      a_vnary = nary_dup(a_vnary);                                                             \
+    }                                                                                          \
+    if (CLASS_OF(b_vnary) != tNAryClass) {                                                     \
+      b_vnary = rb_funcall(tNAryClass, rb_intern("cast"), 1, b_vnary);                         \
+    }                                                                                          \
+    if (!RTEST(nary_check_contiguous(b_vnary))) {                                              \
+      b_vnary = nary_dup(b_vnary);                                                             \
+    }                                                                                          \
+                                                                                               \
+    narray_t* a_nary = NULL;                                                                   \
+    GetNArray(a_vnary, a_nary);                                                                \
+    if (NA_NDIM(a_nary) != 2) {                                                                \
+      rb_raise(rb_eArgError, "input array a must be 2-dimensional array");                     \
+      return Qnil;                                                                             \
+    }                                                                                          \
+    narray_t* b_nary = NULL;                                                                   \
+    GetNArray(b_vnary, b_nary);                                                                \
+    if (NA_NDIM(b_nary) != 2) {                                                                \
+      rb_raise(rb_eArgError, "input array b must be 2-dimensional array");                     \
+      return Qnil;                                                                             \
+    }                                                                                          \
+                                                                                               \
+    size_t n = matrix_layout == LAPACK_ROW_MAJOR ? NA_SHAPE(a_nary)[0] : NA_SHAPE(a_nary)[1];  \
+    size_t shape_alpha[1] = { n };                                                             \
+    size_t shape_beta[1] = { n };                                                              \
+    size_t shape_vsl[2] = { n, jobvsl == 'N' ? 1 : n };                                        \
+    size_t shape_vsr[2] = { n, jobvsr == 'N' ? 1 : n };                                        \
+    ndfunc_arg_in_t ain[2] = { { OVERWRITE, 2 }, { OVERWRITE, 2 } };                           \
+    ndfunc_arg_out_t aout[6] = { { tNAryClass, 1, shape_alpha },                               \
+                                 { tNAryClass, 1, shape_beta },                                \
+                                 { tNAryClass, 2, shape_vsl },                                 \
+                                 { tNAryClass, 2, shape_vsr },                                 \
+                                 { numo_cInt32, 0 },                                           \
+                                 { numo_cInt32, 0 } };                                         \
+    ndfunc_t ndf = { _iter_##fLapackFunc, NO_LOOP | NDF_EXTRACT, 2, 6, ain, aout };            \
+    struct _gges_option_##fLapackFunc opt = { matrix_layout, jobvsl, jobvsr, 'N', NULL };      \
+    VALUE res = na_ndloop3(&ndf, &opt, 2, a_vnary, b_vnary);                                   \
+    VALUE ret = rb_ary_concat(rb_ary_new3(2, a_vnary, b_vnary), res);                          \
+                                                                                               \
+    RB_GC_GUARD(a_vnary);                                                                      \
+    RB_GC_GUARD(b_vnary);                                                                      \
+    return ret;                                                                                \
+  }
+DEF_GGES_OPTION(dgges, LAPACK_D_SELECT3)
+DEF_GGES_OPTION(sgges, LAPACK_S_SELECT3)
+DEF_GGES_OPTION(zgges, LAPACK_Z_SELECT2)
+DEF_GGES_OPTION(cgges, LAPACK_C_SELECT2)
+DEF_LINALG_FUNC(double, numo_cDFloat, dgges)
+DEF_LINALG_FUNC(float, numo_cSFloat, sgges)
+DEF_LINALG_FUNC_COMPLEX(lapack_complex_double, numo_cDComplex, zgges)
+DEF_LINALG_FUNC_COMPLEX(lapack_complex_float, numo_cSComplex, cgges)
+#undef DEF_GGES_OPTION
+#undef DEF_LINALG_FUNC
+#undef DEF_LINALG_FUNC_COMPLEX
+void define_linalg_lapack_gges(VALUE mLapack) {
+  rb_define_module_function(mLapack, "dgges", RUBY_METHOD_FUNC(_linalg_lapack_dgges), -1);
+  rb_define_module_function(mLapack, "sgges", RUBY_METHOD_FUNC(_linalg_lapack_sgges), -1);
+  rb_define_module_function(mLapack, "zgges", RUBY_METHOD_FUNC(_linalg_lapack_zgges), -1);
+  rb_define_module_function(mLapack, "cgges", RUBY_METHOD_FUNC(_linalg_lapack_cgges), -1);
+}

data/ext/numo/linalg/lapack/gges.h ADDED Viewed

@@ -0,0 +1,15 @@
+#ifndef NUMO_LINALG_ALT_LAPACK_GGES_H
+#define NUMO_LINALG_ALT_LAPACK_GGES_H 1
+#include <lapacke.h>
+#include <ruby.h>
+#include <numo/narray.h>
+#include <numo/template.h>
+#include "../util.h"
+void define_linalg_lapack_gges(VALUE mLapack);
+#endif /* NUMO_LINALG_ALT_LAPACK_GGES_H */

data/ext/numo/linalg/lapack/heev.c CHANGED Viewed

@@ -6,58 +6,60 @@ struct _heev_option {
   char uplo;
 };
-#define DEF_LINALG_FUNC(tDType, tRtDType, tNAryClass, tRtNAryClass, fLapackFunc)                           \
-  static void _iter_##fLapackFunc(na_loop_t* const lp) {                                                   \
-    tDType* a = (tDType*)NDL_PTR(lp, 0);                                                                   \
-    tRtDType* w = (tRtDType*)NDL_PTR(lp, 1);                                                               \
-    int* info = (int*)NDL_PTR(lp, 2);                                                                      \
-    struct _heev_option* opt = (struct _heev_option*)(lp->opt_ptr);                                        \
-    const lapack_int n = (lapack_int)NDL_SHAPE(lp, 0)[1];                                                  \
-    const lapack_int lda = (lapack_int)NDL_SHAPE(lp, 0)[0];                                                \
-    const lapack_int i = LAPACKE_##fLapackFunc(opt->matrix_layout, opt->jobz, opt->uplo, n, a, lda, w);    \
-    *info = (int)i;                                                                                        \
-  }                                                                                                        \
-                                                                                                           \
-  static VALUE _linalg_lapack_##fLapackFunc(int argc, VALUE* argv, VALUE self) {                           \
-    VALUE a_vnary = Qnil;                                                                                  \
-    VALUE kw_args = Qnil;                                                                                  \
-    rb_scan_args(argc, argv, "1:", &a_vnary, &kw_args);                                                    \
-    ID kw_table[3] = { rb_intern("jobz"), rb_intern("uplo"), rb_intern("order") };                         \
-    VALUE kw_values[3] = { Qundef, Qundef, Qundef };                                                       \
-    rb_get_kwargs(kw_args, kw_table, 0, 3, kw_values);                                                     \
-    const char jobz = kw_values[0] != Qundef ? get_jobz(kw_values[0]) : 'V';                               \
-    const char uplo = kw_values[1] != Qundef ? get_uplo(kw_values[1]) : 'U';                               \
-    const int matrix_layout = kw_values[2] != Qundef ? get_matrix_layout(kw_values[2]) : LAPACK_ROW_MAJOR; \
-                                                                                                           \
-    if (CLASS_OF(a_vnary) != tNAryClass) {                                                                 \
-      a_vnary = rb_funcall(tNAryClass, rb_intern("cast"), 1, a_vnary);                                     \
-    }                                                                                                      \
-    if (!RTEST(nary_check_contiguous(a_vnary))) {                                                          \
-      a_vnary = nary_dup(a_vnary);                                                                         \
-    }                                                                                                      \
-                                                                                                           \
-    narray_t* a_nary = NULL;                                                                               \
-    GetNArray(a_vnary, a_nary);                                                                            \
-    if (NA_NDIM(a_nary) != 2) {                                                                            \
-      rb_raise(rb_eArgError, "input array a must be 2-dimensional");                                       \
-      return Qnil;                                                                                         \
-    }                                                                                                      \
-    if (NA_SHAPE(a_nary)[0] != NA_SHAPE(a_nary)[1]) {                                                      \
-      rb_raise(rb_eArgError, "input array a must be square");                                              \
-      return Qnil;                                                                                         \
-    }                                                                                                      \
-                                                                                                           \
-    const size_t n = NA_SHAPE(a_nary)[1];                                                                  \
-    size_t shape[1] = { n };                                                                               \
-    ndfunc_arg_in_t ain[1] = { { OVERWRITE, 2 } };                                                         \
-    ndfunc_arg_out_t aout[2] = { { tRtNAryClass, 1, shape }, { numo_cInt32, 0 } };                         \
-    ndfunc_t ndf = { _iter_##fLapackFunc, NO_LOOP | NDF_EXTRACT, 1, 2, ain, aout };                        \
-    struct _heev_option opt = { matrix_layout, jobz, uplo };                                               \
-    VALUE res = na_ndloop3(&ndf, &opt, 1, a_vnary);                                                        \
-    VALUE ret = rb_ary_new3(3, a_vnary, rb_ary_entry(res, 0), rb_ary_entry(res, 1));                       \
-                                                                                                           \
-    RB_GC_GUARD(a_vnary);                                                                                  \
-    return ret;                                                                                            \
+#define DEF_LINALG_FUNC(tDType, tRtDType, tNAryClass, tRtNAryClass, fLapackFunc)               \
+  static void _iter_##fLapackFunc(na_loop_t* const lp) {                                       \
+    tDType* a = (tDType*)NDL_PTR(lp, 0);                                                       \
+    tRtDType* w = (tRtDType*)NDL_PTR(lp, 1);                                                   \
+    int* info = (int*)NDL_PTR(lp, 2);                                                          \
+    struct _heev_option* opt = (struct _heev_option*)(lp->opt_ptr);                            \
+    const lapack_int n = (lapack_int)NDL_SHAPE(lp, 0)[1];                                      \
+    const lapack_int lda = (lapack_int)NDL_SHAPE(lp, 0)[0];                                    \
+    const lapack_int i =                                                                       \
+      LAPACKE_##fLapackFunc(opt->matrix_layout, opt->jobz, opt->uplo, n, a, lda, w);           \
+    *info = (int)i;                                                                            \
+  }                                                                                            \
+                                                                                               \
+  static VALUE _linalg_lapack_##fLapackFunc(int argc, VALUE* argv, VALUE self) {               \
+    VALUE a_vnary = Qnil;                                                                      \
+    VALUE kw_args = Qnil;                                                                      \
+    rb_scan_args(argc, argv, "1:", &a_vnary, &kw_args);                                        \
+    ID kw_table[3] = { rb_intern("jobz"), rb_intern("uplo"), rb_intern("order") };             \
+    VALUE kw_values[3] = { Qundef, Qundef, Qundef };                                           \
+    rb_get_kwargs(kw_args, kw_table, 0, 3, kw_values);                                         \
+    const char jobz = kw_values[0] != Qundef ? get_jobz(kw_values[0]) : 'V';                   \
+    const char uplo = kw_values[1] != Qundef ? get_uplo(kw_values[1]) : 'U';                   \
+    const int matrix_layout =                                                                  \
+      kw_values[2] != Qundef ? get_matrix_layout(kw_values[2]) : LAPACK_ROW_MAJOR;             \
+                                                                                               \
+    if (CLASS_OF(a_vnary) != tNAryClass) {                                                     \
+      a_vnary = rb_funcall(tNAryClass, rb_intern("cast"), 1, a_vnary);                         \
+    }                                                                                          \
+    if (!RTEST(nary_check_contiguous(a_vnary))) {                                              \
+      a_vnary = nary_dup(a_vnary);                                                             \
+    }                                                                                          \
+                                                                                               \
+    narray_t* a_nary = NULL;                                                                   \
+    GetNArray(a_vnary, a_nary);                                                                \
+    if (NA_NDIM(a_nary) != 2) {                                                                \
+      rb_raise(rb_eArgError, "input array a must be 2-dimensional");                           \
+      return Qnil;                                                                             \
+    }                                                                                          \
+    if (NA_SHAPE(a_nary)[0] != NA_SHAPE(a_nary)[1]) {                                          \
+      rb_raise(rb_eArgError, "input array a must be square");                                  \
+      return Qnil;                                                                             \
+    }                                                                                          \
+                                                                                               \
+    const size_t n = NA_SHAPE(a_nary)[1];                                                      \
+    size_t shape[1] = { n };                                                                   \
+    ndfunc_arg_in_t ain[1] = { { OVERWRITE, 2 } };                                             \
+    ndfunc_arg_out_t aout[2] = { { tRtNAryClass, 1, shape }, { numo_cInt32, 0 } };             \
+    ndfunc_t ndf = { _iter_##fLapackFunc, NO_LOOP | NDF_EXTRACT, 1, 2, ain, aout };            \
+    struct _heev_option opt = { matrix_layout, jobz, uplo };                                   \
+    VALUE res = na_ndloop3(&ndf, &opt, 1, a_vnary);                                            \
+    VALUE ret = rb_ary_new3(3, a_vnary, rb_ary_entry(res, 0), rb_ary_entry(res, 1));           \
+                                                                                               \
+    RB_GC_GUARD(a_vnary);                                                                      \
+    return ret;                                                                                \
   }
 DEF_LINALG_FUNC(lapack_complex_double, double, numo_cDComplex, numo_cDFloat, zheev)