RubyGems - numo-linalg-alt - Versions diffs - 0.3.0 → 0.4.0 - Mend

numo-linalg-alt 0.3.0 → 0.4.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (53) hide show

checksums.yaml +4 -4
data/CHANGELOG.md +4 -0
data/ext/numo/linalg/blas/dot.c +59 -59
data/ext/numo/linalg/blas/dot_sub.c +58 -58
data/ext/numo/linalg/blas/gemm.c +157 -148
data/ext/numo/linalg/blas/gemv.c +131 -127
data/ext/numo/linalg/blas/nrm2.c +50 -50
data/ext/numo/linalg/lapack/gees.c +239 -220
data/ext/numo/linalg/lapack/geev.c +127 -110
data/ext/numo/linalg/lapack/gelsd.c +81 -70
data/ext/numo/linalg/lapack/geqrf.c +52 -51
data/ext/numo/linalg/lapack/gerqf.c +70 -0
data/ext/numo/linalg/lapack/gerqf.h +15 -0
data/ext/numo/linalg/lapack/gesdd.c +96 -86
data/ext/numo/linalg/lapack/gesv.c +80 -78
data/ext/numo/linalg/lapack/gesvd.c +140 -129
data/ext/numo/linalg/lapack/getrf.c +51 -50
data/ext/numo/linalg/lapack/getri.c +64 -63
data/ext/numo/linalg/lapack/getrs.c +92 -88
data/ext/numo/linalg/lapack/gges.c +214 -0
data/ext/numo/linalg/lapack/gges.h +15 -0
data/ext/numo/linalg/lapack/heev.c +54 -52
data/ext/numo/linalg/lapack/heevd.c +54 -52
data/ext/numo/linalg/lapack/heevr.c +109 -98
data/ext/numo/linalg/lapack/hegv.c +77 -74
data/ext/numo/linalg/lapack/hegvd.c +77 -74
data/ext/numo/linalg/lapack/hegvx.c +132 -120
data/ext/numo/linalg/lapack/hetrf.c +54 -50
data/ext/numo/linalg/lapack/lange.c +45 -44
data/ext/numo/linalg/lapack/orgqr.c +63 -62
data/ext/numo/linalg/lapack/orgrq.c +78 -0
data/ext/numo/linalg/lapack/orgrq.h +15 -0
data/ext/numo/linalg/lapack/potrf.c +49 -48
data/ext/numo/linalg/lapack/potri.c +49 -48
data/ext/numo/linalg/lapack/potrs.c +74 -72
data/ext/numo/linalg/lapack/syev.c +54 -52
data/ext/numo/linalg/lapack/syevd.c +54 -52
data/ext/numo/linalg/lapack/syevr.c +107 -98
data/ext/numo/linalg/lapack/sygv.c +77 -73
data/ext/numo/linalg/lapack/sygvd.c +77 -73
data/ext/numo/linalg/lapack/sygvx.c +132 -120
data/ext/numo/linalg/lapack/sytrf.c +54 -50
data/ext/numo/linalg/lapack/trtrs.c +79 -75
data/ext/numo/linalg/lapack/ungqr.c +63 -62
data/ext/numo/linalg/lapack/ungrq.c +78 -0
data/ext/numo/linalg/lapack/ungrq.h +15 -0
data/ext/numo/linalg/linalg.c +20 -10
data/ext/numo/linalg/linalg.h +4 -0
data/ext/numo/linalg/util.c +8 -0
data/ext/numo/linalg/util.h +1 -0
data/lib/numo/linalg/version.rb +1 -1
data/lib/numo/linalg.rb +139 -3
metadata +10 -2

data/ext/numo/linalg/lapack/geev.c CHANGED Viewed

@@ -22,118 +22,135 @@ char _get_jobvr(VALUE val) {
   return jobvr;
 }
-#define DEF_LINALG_FUNC(tDType, tNAryClass, fLapackFunc)                                                                                                                   \
-  static void _iter_##fLapackFunc(na_loop_t* const lp) {                                                                                                                   \
-    tDType* a = (tDType*)NDL_PTR(lp, 0);                                                                                                                                   \
-    tDType* wr = (tDType*)NDL_PTR(lp, 1);                                                                                                                                  \
-    tDType* wi = (tDType*)NDL_PTR(lp, 2);                                                                                                                                  \
-    tDType* vl = (tDType*)NDL_PTR(lp, 3);                                                                                                                                  \
-    tDType* vr = (tDType*)NDL_PTR(lp, 4);                                                                                                                                  \
-    int* info = (int*)NDL_PTR(lp, 5);                                                                                                                                      \
-    struct _geev_option* opt = (struct _geev_option*)(lp->opt_ptr);                                                                                                        \
-    const lapack_int n = (lapack_int)(opt->matrix_layout == LAPACK_ROW_MAJOR ? NDL_SHAPE(lp, 0)[0] : NDL_SHAPE(lp, 0)[1]);                                                 \
-    const lapack_int lda = n;                                                                                                                                              \
-    const lapack_int ldvl = (opt->jobvl == 'N') ? 1 : n;                                                                                                                   \
-    const lapack_int ldvr = (opt->jobvr == 'N') ? 1 : n;                                                                                                                   \
-    lapack_int i = LAPACKE_##fLapackFunc(opt->matrix_layout, opt->jobvl, opt->jobvr, n, a, lda, wr, wi, vl, ldvl, vr, ldvr);                                               \
-    *info = (int)i;                                                                                                                                                        \
-  }                                                                                                                                                                        \
-                                                                                                                                                                           \
-  static VALUE _linalg_lapack_##fLapackFunc(int argc, VALUE* argv, VALUE self) {                                                                                           \
-    VALUE a_vnary = Qnil;                                                                                                                                                  \
-    VALUE kw_args = Qnil;                                                                                                                                                  \
-    rb_scan_args(argc, argv, "1:", &a_vnary, &kw_args);                                                                                                                    \
-    ID kw_table[3] = { rb_intern("order"), rb_intern("jobvl"), rb_intern("jobvr") };                                                                                       \
-    VALUE kw_values[3] = { Qundef, Qundef, Qundef };                                                                                                                       \
-    rb_get_kwargs(kw_args, kw_table, 0, 3, kw_values);                                                                                                                     \
-    const int matrix_layout = kw_values[0] != Qundef ? get_matrix_layout(kw_values[0]) : LAPACK_ROW_MAJOR;                                                                 \
-    const char jobvl = kw_values[1] != Qundef ? _get_jobvl(kw_values[1]) : 'V';                                                                                            \
-    const char jobvr = kw_values[2] != Qundef ? _get_jobvr(kw_values[2]) : 'V';                                                                                            \
-                                                                                                                                                                           \
-    if (CLASS_OF(a_vnary) != tNAryClass) {                                                                                                                                 \
-      a_vnary = rb_funcall(tNAryClass, rb_intern("cast"), 1, a_vnary);                                                                                                     \
-    }                                                                                                                                                                      \
-    if (!RTEST(nary_check_contiguous(a_vnary))) {                                                                                                                          \
-      a_vnary = nary_dup(a_vnary);                                                                                                                                         \
-    }                                                                                                                                                                      \
-                                                                                                                                                                           \
-    narray_t* a_nary = NULL;                                                                                                                                               \
-    GetNArray(a_vnary, a_nary);                                                                                                                                            \
-    const int n_dims = NA_NDIM(a_nary);                                                                                                                                    \
-    if (n_dims != 2) {                                                                                                                                                     \
-      rb_raise(rb_eArgError, "input array a must be 2-dimensional");                                                                                                       \
-      return Qnil;                                                                                                                                                         \
-    }                                                                                                                                                                      \
-                                                                                                                                                                           \
-    size_t n = matrix_layout == LAPACK_ROW_MAJOR ? NA_SHAPE(a_nary)[0] : NA_SHAPE(a_nary)[1];                                                                              \
-    size_t shape_wr[1] = { n };                                                                                                                                            \
-    size_t shape_wi[1] = { n };                                                                                                                                            \
-    size_t shape_vl[2] = { n, (jobvl == 'N') ? 1 : n };                                                                                                                    \
-    size_t shape_vr[2] = { n, (jobvr == 'N') ? 1 : n };                                                                                                                    \
-    ndfunc_arg_in_t ain[1] = { { OVERWRITE, 2 } };                                                                                                                         \
-    ndfunc_arg_out_t aout[5] = { { tNAryClass, 1, shape_wr }, { tNAryClass, 1, shape_wi }, { tNAryClass, 2, shape_vl }, { tNAryClass, 2, shape_vr }, { numo_cInt32, 0 } }; \
-    ndfunc_t ndf = { _iter_##fLapackFunc, NO_LOOP | NDF_EXTRACT, 1, 5, ain, aout };                                                                                        \
-    struct _geev_option opt = { matrix_layout, jobvl, jobvr };                                                                                                             \
-    VALUE ret = na_ndloop3(&ndf, &opt, 1, a_vnary);                                                                                                                        \
-                                                                                                                                                                           \
-    RB_GC_GUARD(a_vnary);                                                                                                                                                  \
-    return ret;                                                                                                                                                            \
+#define DEF_LINALG_FUNC(tDType, tNAryClass, fLapackFunc)                                       \
+  static void _iter_##fLapackFunc(na_loop_t* const lp) {                                       \
+    tDType* a = (tDType*)NDL_PTR(lp, 0);                                                       \
+    tDType* wr = (tDType*)NDL_PTR(lp, 1);                                                      \
+    tDType* wi = (tDType*)NDL_PTR(lp, 2);                                                      \
+    tDType* vl = (tDType*)NDL_PTR(lp, 3);                                                      \
+    tDType* vr = (tDType*)NDL_PTR(lp, 4);                                                      \
+    int* info = (int*)NDL_PTR(lp, 5);                                                          \
+    struct _geev_option* opt = (struct _geev_option*)(lp->opt_ptr);                            \
+    const lapack_int n =                                                                       \
+      (lapack_int)(opt->matrix_layout == LAPACK_ROW_MAJOR ? NDL_SHAPE(lp, 0)[0]                \
+                                                          : NDL_SHAPE(lp, 0)[1]);              \
+    const lapack_int lda = n;                                                                  \
+    const lapack_int ldvl = (opt->jobvl == 'N') ? 1 : n;                                       \
+    const lapack_int ldvr = (opt->jobvr == 'N') ? 1 : n;                                       \
+    lapack_int i = LAPACKE_##fLapackFunc(                                                      \
+      opt->matrix_layout, opt->jobvl, opt->jobvr, n, a, lda, wr, wi, vl, ldvl, vr, ldvr        \
+    );                                                                                         \
+    *info = (int)i;                                                                            \
+  }                                                                                            \
+                                                                                               \
+  static VALUE _linalg_lapack_##fLapackFunc(int argc, VALUE* argv, VALUE self) {               \
+    VALUE a_vnary = Qnil;                                                                      \
+    VALUE kw_args = Qnil;                                                                      \
+    rb_scan_args(argc, argv, "1:", &a_vnary, &kw_args);                                        \
+    ID kw_table[3] = { rb_intern("order"), rb_intern("jobvl"), rb_intern("jobvr") };           \
+    VALUE kw_values[3] = { Qundef, Qundef, Qundef };                                           \
+    rb_get_kwargs(kw_args, kw_table, 0, 3, kw_values);                                         \
+    const int matrix_layout =                                                                  \
+      kw_values[0] != Qundef ? get_matrix_layout(kw_values[0]) : LAPACK_ROW_MAJOR;             \
+    const char jobvl = kw_values[1] != Qundef ? _get_jobvl(kw_values[1]) : 'V';                \
+    const char jobvr = kw_values[2] != Qundef ? _get_jobvr(kw_values[2]) : 'V';                \
+                                                                                               \
+    if (CLASS_OF(a_vnary) != tNAryClass) {                                                     \
+      a_vnary = rb_funcall(tNAryClass, rb_intern("cast"), 1, a_vnary);                         \
+    }                                                                                          \
+    if (!RTEST(nary_check_contiguous(a_vnary))) {                                              \
+      a_vnary = nary_dup(a_vnary);                                                             \
+    }                                                                                          \
+                                                                                               \
+    narray_t* a_nary = NULL;                                                                   \
+    GetNArray(a_vnary, a_nary);                                                                \
+    const int n_dims = NA_NDIM(a_nary);                                                        \
+    if (n_dims != 2) {                                                                         \
+      rb_raise(rb_eArgError, "input array a must be 2-dimensional");                           \
+      return Qnil;                                                                             \
+    }                                                                                          \
+                                                                                               \
+    size_t n = matrix_layout == LAPACK_ROW_MAJOR ? NA_SHAPE(a_nary)[0] : NA_SHAPE(a_nary)[1];  \
+    size_t shape_wr[1] = { n };                                                                \
+    size_t shape_wi[1] = { n };                                                                \
+    size_t shape_vl[2] = { n, (jobvl == 'N') ? 1 : n };                                        \
+    size_t shape_vr[2] = { n, (jobvr == 'N') ? 1 : n };                                        \
+    ndfunc_arg_in_t ain[1] = { { OVERWRITE, 2 } };                                             \
+    ndfunc_arg_out_t aout[5] = { { tNAryClass, 1, shape_wr },                                  \
+                                 { tNAryClass, 1, shape_wi },                                  \
+                                 { tNAryClass, 2, shape_vl },                                  \
+                                 { tNAryClass, 2, shape_vr },                                  \
+                                 { numo_cInt32, 0 } };                                         \
+    ndfunc_t ndf = { _iter_##fLapackFunc, NO_LOOP | NDF_EXTRACT, 1, 5, ain, aout };            \
+    struct _geev_option opt = { matrix_layout, jobvl, jobvr };                                 \
+    VALUE ret = na_ndloop3(&ndf, &opt, 1, a_vnary);                                            \
+                                                                                               \
+    RB_GC_GUARD(a_vnary);                                                                      \
+    return ret;                                                                                \
   }
-#define DEF_LINALG_FUNC_COMPLEX(tDType, tNAryClass, fLapackFunc)                                                                             \
-  static void _iter_##fLapackFunc(na_loop_t* const lp) {                                                                                     \
-    tDType* a = (tDType*)NDL_PTR(lp, 0);                                                                                                     \
-    tDType* w = (tDType*)NDL_PTR(lp, 1);                                                                                                     \
-    tDType* vl = (tDType*)NDL_PTR(lp, 2);                                                                                                    \
-    tDType* vr = (tDType*)NDL_PTR(lp, 3);                                                                                                    \
-    int* info = (int*)NDL_PTR(lp, 4);                                                                                                        \
-    struct _geev_option* opt = (struct _geev_option*)(lp->opt_ptr);                                                                          \
-    const lapack_int n = (lapack_int)(opt->matrix_layout == LAPACK_ROW_MAJOR ? NDL_SHAPE(lp, 0)[0] : NDL_SHAPE(lp, 0)[1]);                   \
-    const lapack_int lda = n;                                                                                                                \
-    const lapack_int ldvl = (opt->jobvl == 'N') ? 1 : n;                                                                                     \
-    const lapack_int ldvr = (opt->jobvr == 'N') ? 1 : n;                                                                                     \
-    lapack_int i = LAPACKE_##fLapackFunc(opt->matrix_layout, opt->jobvl, opt->jobvr, n, a, lda, w, vl, ldvl, vr, ldvr);                      \
-    *info = (int)i;                                                                                                                          \
-  }                                                                                                                                          \
-                                                                                                                                             \
-  static VALUE _linalg_lapack_##fLapackFunc(int argc, VALUE* argv, VALUE self) {                                                             \
-    VALUE a_vnary = Qnil;                                                                                                                    \
-    VALUE kw_args = Qnil;                                                                                                                    \
-    rb_scan_args(argc, argv, "1:", &a_vnary, &kw_args);                                                                                      \
-    ID kw_table[3] = { rb_intern("order"), rb_intern("jobvl"), rb_intern("jobvr") };                                                         \
-    VALUE kw_values[3] = { Qundef, Qundef, Qundef };                                                                                         \
-    rb_get_kwargs(kw_args, kw_table, 0, 3, kw_values);                                                                                       \
-    const int matrix_layout = kw_values[0] != Qundef ? get_matrix_layout(kw_values[0]) : LAPACK_ROW_MAJOR;                                   \
-    const char jobvl = kw_values[1] != Qundef ? _get_jobvl(kw_values[1]) : 'V';                                                              \
-    const char jobvr = kw_values[2] != Qundef ? _get_jobvr(kw_values[2]) : 'V';                                                              \
-                                                                                                                                             \
-    if (CLASS_OF(a_vnary) != tNAryClass) {                                                                                                   \
-      a_vnary = rb_funcall(tNAryClass, rb_intern("cast"), 1, a_vnary);                                                                       \
-    }                                                                                                                                        \
-    if (!RTEST(nary_check_contiguous(a_vnary))) {                                                                                            \
-      a_vnary = nary_dup(a_vnary);                                                                                                           \
-    }                                                                                                                                        \
-                                                                                                                                             \
-    narray_t* a_nary = NULL;                                                                                                                 \
-    GetNArray(a_vnary, a_nary);                                                                                                              \
-    const int n_dims = NA_NDIM(a_nary);                                                                                                      \
-    if (n_dims != 2) {                                                                                                                       \
-      rb_raise(rb_eArgError, "input array a must be 2-dimensional");                                                                         \
-      return Qnil;                                                                                                                           \
-    }                                                                                                                                        \
-                                                                                                                                             \
-    size_t n = matrix_layout == LAPACK_ROW_MAJOR ? NA_SHAPE(a_nary)[0] : NA_SHAPE(a_nary)[1];                                                \
-    size_t shape_w[1] = { n };                                                                                                               \
-    size_t shape_vl[2] = { n, (jobvl == 'N') ? 1 : n };                                                                                      \
-    size_t shape_vr[2] = { n, (jobvr == 'N') ? 1 : n };                                                                                      \
-    ndfunc_arg_in_t ain[1] = { { OVERWRITE, 2 } };                                                                                           \
-    ndfunc_arg_out_t aout[4] = { { tNAryClass, 1, shape_w }, { tNAryClass, 2, shape_vl }, { tNAryClass, 2, shape_vr }, { numo_cInt32, 0 } }; \
-    ndfunc_t ndf = { _iter_##fLapackFunc, NO_LOOP | NDF_EXTRACT, 1, 4, ain, aout };                                                          \
-    struct _geev_option opt = { matrix_layout, jobvl, jobvr };                                                                               \
-    VALUE ret = na_ndloop3(&ndf, &opt, 1, a_vnary);                                                                                          \
-                                                                                                                                             \
-    RB_GC_GUARD(a_vnary);                                                                                                                    \
-    return ret;                                                                                                                              \
+#define DEF_LINALG_FUNC_COMPLEX(tDType, tNAryClass, fLapackFunc)                               \
+  static void _iter_##fLapackFunc(na_loop_t* const lp) {                                       \
+    tDType* a = (tDType*)NDL_PTR(lp, 0);                                                       \
+    tDType* w = (tDType*)NDL_PTR(lp, 1);                                                       \
+    tDType* vl = (tDType*)NDL_PTR(lp, 2);                                                      \
+    tDType* vr = (tDType*)NDL_PTR(lp, 3);                                                      \
+    int* info = (int*)NDL_PTR(lp, 4);                                                          \
+    struct _geev_option* opt = (struct _geev_option*)(lp->opt_ptr);                            \
+    const lapack_int n =                                                                       \
+      (lapack_int)(opt->matrix_layout == LAPACK_ROW_MAJOR ? NDL_SHAPE(lp, 0)[0]                \
+                                                          : NDL_SHAPE(lp, 0)[1]);              \
+    const lapack_int lda = n;                                                                  \
+    const lapack_int ldvl = (opt->jobvl == 'N') ? 1 : n;                                       \
+    const lapack_int ldvr = (opt->jobvr == 'N') ? 1 : n;                                       \
+    lapack_int i = LAPACKE_##fLapackFunc(                                                      \
+      opt->matrix_layout, opt->jobvl, opt->jobvr, n, a, lda, w, vl, ldvl, vr, ldvr             \
+    );                                                                                         \
+    *info = (int)i;                                                                            \
+  }                                                                                            \
+                                                                                               \
+  static VALUE _linalg_lapack_##fLapackFunc(int argc, VALUE* argv, VALUE self) {               \
+    VALUE a_vnary = Qnil;                                                                      \
+    VALUE kw_args = Qnil;                                                                      \
+    rb_scan_args(argc, argv, "1:", &a_vnary, &kw_args);                                        \
+    ID kw_table[3] = { rb_intern("order"), rb_intern("jobvl"), rb_intern("jobvr") };           \
+    VALUE kw_values[3] = { Qundef, Qundef, Qundef };                                           \
+    rb_get_kwargs(kw_args, kw_table, 0, 3, kw_values);                                         \
+    const int matrix_layout =                                                                  \
+      kw_values[0] != Qundef ? get_matrix_layout(kw_values[0]) : LAPACK_ROW_MAJOR;             \
+    const char jobvl = kw_values[1] != Qundef ? _get_jobvl(kw_values[1]) : 'V';                \
+    const char jobvr = kw_values[2] != Qundef ? _get_jobvr(kw_values[2]) : 'V';                \
+                                                                                               \
+    if (CLASS_OF(a_vnary) != tNAryClass) {                                                     \
+      a_vnary = rb_funcall(tNAryClass, rb_intern("cast"), 1, a_vnary);                         \
+    }                                                                                          \
+    if (!RTEST(nary_check_contiguous(a_vnary))) {                                              \
+      a_vnary = nary_dup(a_vnary);                                                             \
+    }                                                                                          \
+                                                                                               \
+    narray_t* a_nary = NULL;                                                                   \
+    GetNArray(a_vnary, a_nary);                                                                \
+    const int n_dims = NA_NDIM(a_nary);                                                        \
+    if (n_dims != 2) {                                                                         \
+      rb_raise(rb_eArgError, "input array a must be 2-dimensional");                           \
+      return Qnil;                                                                             \
+    }                                                                                          \
+                                                                                               \
+    size_t n = matrix_layout == LAPACK_ROW_MAJOR ? NA_SHAPE(a_nary)[0] : NA_SHAPE(a_nary)[1];  \
+    size_t shape_w[1] = { n };                                                                 \
+    size_t shape_vl[2] = { n, (jobvl == 'N') ? 1 : n };                                        \
+    size_t shape_vr[2] = { n, (jobvr == 'N') ? 1 : n };                                        \
+    ndfunc_arg_in_t ain[1] = { { OVERWRITE, 2 } };                                             \
+    ndfunc_arg_out_t aout[4] = { { tNAryClass, 1, shape_w },                                   \
+                                 { tNAryClass, 2, shape_vl },                                  \
+                                 { tNAryClass, 2, shape_vr },                                  \
+                                 { numo_cInt32, 0 } };                                         \
+    ndfunc_t ndf = { _iter_##fLapackFunc, NO_LOOP | NDF_EXTRACT, 1, 4, ain, aout };            \
+    struct _geev_option opt = { matrix_layout, jobvl, jobvr };                                 \
+    VALUE ret = na_ndloop3(&ndf, &opt, 1, a_vnary);                                            \
+                                                                                               \
+    RB_GC_GUARD(a_vnary);                                                                      \
+    return ret;                                                                                \
   }
 DEF_LINALG_FUNC(double, numo_cDFloat, dgeev)

data/ext/numo/linalg/lapack/gelsd.c CHANGED Viewed

@@ -5,76 +5,87 @@ struct _gelsd_option {
   double rcond;
 };
-#define DEF_LINALG_FUNC(tDType, tRtDType, tNAryClass, tRtNAryClass, fLapackFunc)                                                   \
-  static void _iter_##fLapackFunc(na_loop_t* const lp) {                                                                           \
-    tDType* a = (tDType*)NDL_PTR(lp, 0);                                                                                           \
-    tDType* b = (tDType*)NDL_PTR(lp, 1);                                                                                           \
-    tRtDType* s = (tRtDType*)NDL_PTR(lp, 2);                                                                                       \
-    int* rank = (int*)NDL_PTR(lp, 3);                                                                                              \
-    int* info = (int*)NDL_PTR(lp, 4);                                                                                              \
-    struct _gelsd_option* opt = (struct _gelsd_option*)(lp->opt_ptr);                                                              \
-    const lapack_int m = (lapack_int)(opt->matrix_layout == LAPACK_ROW_MAJOR ? NDL_SHAPE(lp, 0)[0] : NDL_SHAPE(lp, 0)[1]);         \
-    const lapack_int n = (lapack_int)(opt->matrix_layout == LAPACK_ROW_MAJOR ? NDL_SHAPE(lp, 0)[1] : NDL_SHAPE(lp, 0)[0]);         \
-    const lapack_int nrhs = lp->args[1].ndim == 1 ? 1 : (lapack_int)NDL_SHAPE(lp, 1)[1];                                           \
-    const lapack_int lda = n;                                                                                                      \
-    const lapack_int ldb = nrhs;                                                                                                   \
-    lapack_int r = 0;                                                                                                              \
-    lapack_int i = LAPACKE_##fLapackFunc(opt->matrix_layout, m, n, nrhs, a, lda, b, ldb, s, (tRtDType)(opt->rcond), &r);           \
-    *rank = (int)r;                                                                                                                \
-    *info = (int)i;                                                                                                                \
-  }                                                                                                                                \
-                                                                                                                                   \
-  static VALUE _linalg_lapack_##fLapackFunc(int argc, VALUE* argv, VALUE self) {                                                   \
-    VALUE a_vnary = Qnil;                                                                                                          \
-    VALUE b_vnary = Qnil;                                                                                                          \
-    VALUE kw_args = Qnil;                                                                                                          \
-    rb_scan_args(argc, argv, "2:", &a_vnary, &b_vnary, &kw_args);                                                                  \
-    ID kw_table[2] = { rb_intern("matrix_layout"), rb_intern("rcond") };                                                           \
-    VALUE kw_values[2] = { Qundef, Qundef };                                                                                       \
-    rb_get_kwargs(kw_args, kw_table, 0, 2, kw_values);                                                                             \
-    const int matrix_layout = kw_values[0] != Qundef && kw_values[0] != Qnil ? get_matrix_layout(kw_values[0]) : LAPACK_ROW_MAJOR; \
-    const double rcond = kw_values[1] != Qundef && kw_values[1] != Qnil ? NUM2DBL(kw_values[1]) : -1.0;                            \
-                                                                                                                                   \
-    if (CLASS_OF(a_vnary) != tNAryClass) {                                                                                         \
-      a_vnary = rb_funcall(tNAryClass, rb_intern("cast"), 1, a_vnary);                                                             \
-    }                                                                                                                              \
-    if (!RTEST(nary_check_contiguous(a_vnary))) {                                                                                  \
-      a_vnary = nary_dup(a_vnary);                                                                                                 \
-    }                                                                                                                              \
-    if (CLASS_OF(b_vnary) != tNAryClass) {                                                                                         \
-      b_vnary = rb_funcall(tNAryClass, rb_intern("cast"), 1, b_vnary);                                                             \
-    }                                                                                                                              \
-    if (!RTEST(nary_check_contiguous(b_vnary))) {                                                                                  \
-      b_vnary = nary_dup(b_vnary);                                                                                                 \
-    }                                                                                                                              \
-                                                                                                                                   \
-    narray_t* a_nary = NULL;                                                                                                       \
-    GetNArray(a_vnary, a_nary);                                                                                                    \
-    const int n_dims = NA_NDIM(a_nary);                                                                                            \
-    if (n_dims != 2) {                                                                                                             \
-      rb_raise(rb_eArgError, "input array a must be 2-dimensional");                                                               \
-      return Qnil;                                                                                                                 \
-    }                                                                                                                              \
-    narray_t* b_nary = NULL;                                                                                                       \
-    GetNArray(b_vnary, b_nary);                                                                                                    \
-    const int b_n_dims = NA_NDIM(b_nary);                                                                                          \
-    if (b_n_dims != 1 && b_n_dims != 2) {                                                                                          \
-      rb_raise(rb_eArgError, "input array b must be 1 or 2-dimensional");                                                          \
-      return Qnil;                                                                                                                 \
-    }                                                                                                                              \
-                                                                                                                                   \
-    const size_t m = NA_SHAPE(a_nary)[0];                                                                                          \
-    const size_t n = NA_SHAPE(a_nary)[1];                                                                                          \
-    size_t shape_s[1] = { m < n ? m : n };                                                                                         \
-    ndfunc_arg_in_t ain[2] = { { tNAryClass, 2 }, { OVERWRITE, b_n_dims } };                                                       \
-    ndfunc_arg_out_t aout[3] = { { tRtNAryClass, 1, shape_s }, { numo_cInt32, 0 }, { numo_cInt32, 0 } };                           \
-    ndfunc_t ndf = { _iter_##fLapackFunc, NO_LOOP | NDF_EXTRACT, 2, 3, ain, aout };                                                \
-    struct _gelsd_option opt = { matrix_layout, rcond };                                                                           \
-    VALUE ret = na_ndloop3(&ndf, &opt, 2, a_vnary, b_vnary);                                                                       \
-                                                                                                                                   \
-    RB_GC_GUARD(a_vnary);                                                                                                          \
-    RB_GC_GUARD(b_vnary);                                                                                                          \
-    return ret;                                                                                                                    \
+#define DEF_LINALG_FUNC(tDType, tRtDType, tNAryClass, tRtNAryClass, fLapackFunc)               \
+  static void _iter_##fLapackFunc(na_loop_t* const lp) {                                       \
+    tDType* a = (tDType*)NDL_PTR(lp, 0);                                                       \
+    tDType* b = (tDType*)NDL_PTR(lp, 1);                                                       \
+    tRtDType* s = (tRtDType*)NDL_PTR(lp, 2);                                                   \
+    int* rank = (int*)NDL_PTR(lp, 3);                                                          \
+    int* info = (int*)NDL_PTR(lp, 4);                                                          \
+    struct _gelsd_option* opt = (struct _gelsd_option*)(lp->opt_ptr);                          \
+    const lapack_int m =                                                                       \
+      (lapack_int)(opt->matrix_layout == LAPACK_ROW_MAJOR ? NDL_SHAPE(lp, 0)[0]                \
+                                                          : NDL_SHAPE(lp, 0)[1]);              \
+    const lapack_int n =                                                                       \
+      (lapack_int)(opt->matrix_layout == LAPACK_ROW_MAJOR ? NDL_SHAPE(lp, 0)[1]                \
+                                                          : NDL_SHAPE(lp, 0)[0]);              \
+    const lapack_int nrhs = lp->args[1].ndim == 1 ? 1 : (lapack_int)NDL_SHAPE(lp, 1)[1];       \
+    const lapack_int lda = n;                                                                  \
+    const lapack_int ldb = nrhs;                                                               \
+    lapack_int r = 0;                                                                          \
+    lapack_int i = LAPACKE_##fLapackFunc(                                                      \
+      opt->matrix_layout, m, n, nrhs, a, lda, b, ldb, s, (tRtDType)(opt->rcond), &r            \
+    );                                                                                         \
+    *rank = (int)r;                                                                            \
+    *info = (int)i;                                                                            \
+  }                                                                                            \
+                                                                                               \
+  static VALUE _linalg_lapack_##fLapackFunc(int argc, VALUE* argv, VALUE self) {               \
+    VALUE a_vnary = Qnil;                                                                      \
+    VALUE b_vnary = Qnil;                                                                      \
+    VALUE kw_args = Qnil;                                                                      \
+    rb_scan_args(argc, argv, "2:", &a_vnary, &b_vnary, &kw_args);                              \
+    ID kw_table[2] = { rb_intern("matrix_layout"), rb_intern("rcond") };                       \
+    VALUE kw_values[2] = { Qundef, Qundef };                                                   \
+    rb_get_kwargs(kw_args, kw_table, 0, 2, kw_values);                                         \
+    const int matrix_layout = kw_values[0] != Qundef && kw_values[0] != Qnil                   \
+                                ? get_matrix_layout(kw_values[0])                              \
+                                : LAPACK_ROW_MAJOR;                                            \
+    const double rcond =                                                                       \
+      kw_values[1] != Qundef && kw_values[1] != Qnil ? NUM2DBL(kw_values[1]) : -1.0;           \
+                                                                                               \
+    if (CLASS_OF(a_vnary) != tNAryClass) {                                                     \
+      a_vnary = rb_funcall(tNAryClass, rb_intern("cast"), 1, a_vnary);                         \
+    }                                                                                          \
+    if (!RTEST(nary_check_contiguous(a_vnary))) {                                              \
+      a_vnary = nary_dup(a_vnary);                                                             \
+    }                                                                                          \
+    if (CLASS_OF(b_vnary) != tNAryClass) {                                                     \
+      b_vnary = rb_funcall(tNAryClass, rb_intern("cast"), 1, b_vnary);                         \
+    }                                                                                          \
+    if (!RTEST(nary_check_contiguous(b_vnary))) {                                              \
+      b_vnary = nary_dup(b_vnary);                                                             \
+    }                                                                                          \
+                                                                                               \
+    narray_t* a_nary = NULL;                                                                   \
+    GetNArray(a_vnary, a_nary);                                                                \
+    const int n_dims = NA_NDIM(a_nary);                                                        \
+    if (n_dims != 2) {                                                                         \
+      rb_raise(rb_eArgError, "input array a must be 2-dimensional");                           \
+      return Qnil;                                                                             \
+    }                                                                                          \
+    narray_t* b_nary = NULL;                                                                   \
+    GetNArray(b_vnary, b_nary);                                                                \
+    const int b_n_dims = NA_NDIM(b_nary);                                                      \
+    if (b_n_dims != 1 && b_n_dims != 2) {                                                      \
+      rb_raise(rb_eArgError, "input array b must be 1 or 2-dimensional");                      \
+      return Qnil;                                                                             \
+    }                                                                                          \
+                                                                                               \
+    const size_t m = NA_SHAPE(a_nary)[0];                                                      \
+    const size_t n = NA_SHAPE(a_nary)[1];                                                      \
+    size_t shape_s[1] = { m < n ? m : n };                                                     \
+    ndfunc_arg_in_t ain[2] = { { tNAryClass, 2 }, { OVERWRITE, b_n_dims } };                   \
+    ndfunc_arg_out_t aout[3] = { { tRtNAryClass, 1, shape_s },                                 \
+                                 { numo_cInt32, 0 },                                           \
+                                 { numo_cInt32, 0 } };                                         \
+    ndfunc_t ndf = { _iter_##fLapackFunc, NO_LOOP | NDF_EXTRACT, 2, 3, ain, aout };            \
+    struct _gelsd_option opt = { matrix_layout, rcond };                                       \
+    VALUE ret = na_ndloop3(&ndf, &opt, 2, a_vnary, b_vnary);                                   \
+                                                                                               \
+    RB_GC_GUARD(a_vnary);                                                                      \
+    RB_GC_GUARD(b_vnary);                                                                      \
+    return ret;                                                                                \
   }
 DEF_LINALG_FUNC(double, double, numo_cDFloat, numo_cDFloat, dgelsd)

data/ext/numo/linalg/lapack/geqrf.c CHANGED Viewed

@@ -4,57 +4,58 @@ struct _geqrf_option {
   int matrix_layout;
 };
-#define DEF_LINALG_FUNC(tDType, tNAryClass, fLapackFunc)                                                   \
-  static void _iter_##fLapackFunc(na_loop_t* const lp) {                                                   \
-    tDType* a = (tDType*)NDL_PTR(lp, 0);                                                                   \
-    tDType* tau = (tDType*)NDL_PTR(lp, 1);                                                                 \
-    int* info = (int*)NDL_PTR(lp, 2);                                                                      \
-    struct _geqrf_option* opt = (struct _geqrf_option*)(lp->opt_ptr);                                      \
-    const lapack_int m = (lapack_int)NDL_SHAPE(lp, 0)[0];                                                  \
-    const lapack_int n = (lapack_int)NDL_SHAPE(lp, 0)[1];                                                  \
-    const lapack_int lda = n;                                                                              \
-    const lapack_int i = LAPACKE_##fLapackFunc(opt->matrix_layout, m, n, a, lda, tau);                     \
-    *info = (int)i;                                                                                        \
-  }                                                                                                        \
-                                                                                                           \
-  static VALUE _linalg_lapack_##fLapackFunc(int argc, VALUE* argv, VALUE self) {                           \
-    VALUE a_vnary = Qnil;                                                                                  \
-    VALUE kw_args = Qnil;                                                                                  \
-    rb_scan_args(argc, argv, "1:", &a_vnary, &kw_args);                                                    \
-    ID kw_table[1] = { rb_intern("order") };                                                               \
-    VALUE kw_values[1] = { Qundef };                                                                       \
-    rb_get_kwargs(kw_args, kw_table, 0, 1, kw_values);                                                     \
-    const int matrix_layout = kw_values[0] != Qundef ? get_matrix_layout(kw_values[0]) : LAPACK_ROW_MAJOR; \
-                                                                                                           \
-    if (CLASS_OF(a_vnary) != tNAryClass) {                                                                 \
-      a_vnary = rb_funcall(tNAryClass, rb_intern("cast"), 1, a_vnary);                                     \
-    }                                                                                                      \
-    if (!RTEST(nary_check_contiguous(a_vnary))) {                                                          \
-      a_vnary = nary_dup(a_vnary);                                                                         \
-    }                                                                                                      \
-                                                                                                           \
-    narray_t* a_nary = NULL;                                                                               \
-    GetNArray(a_vnary, a_nary);                                                                            \
-    const int n_dims = NA_NDIM(a_nary);                                                                    \
-    if (n_dims != 2) {                                                                                     \
-      rb_raise(rb_eArgError, "input array a must be 2-dimensional");                                       \
-      return Qnil;                                                                                         \
-    }                                                                                                      \
-                                                                                                           \
-    size_t m = NA_SHAPE(a_nary)[0];                                                                        \
-    size_t n = NA_SHAPE(a_nary)[1];                                                                        \
-    size_t shape[1] = { m < n ? m : n };                                                                   \
-    ndfunc_arg_in_t ain[1] = { { OVERWRITE, 2 } };                                                         \
-    ndfunc_arg_out_t aout[2] = { { tNAryClass, 1, shape }, { numo_cInt32, 0 } };                           \
-    ndfunc_t ndf = { _iter_##fLapackFunc, NO_LOOP | NDF_EXTRACT, 1, 2, ain, aout };                        \
-    struct _geqrf_option opt = { matrix_layout };                                                          \
-    VALUE res = na_ndloop3(&ndf, &opt, 1, a_vnary);                                                        \
-                                                                                                           \
-    VALUE ret = rb_ary_concat(rb_ary_new3(1, a_vnary), res);                                               \
-                                                                                                           \
-    RB_GC_GUARD(a_vnary);                                                                                  \
-                                                                                                           \
-    return ret;                                                                                            \
+#define DEF_LINALG_FUNC(tDType, tNAryClass, fLapackFunc)                                       \
+  static void _iter_##fLapackFunc(na_loop_t* const lp) {                                       \
+    tDType* a = (tDType*)NDL_PTR(lp, 0);                                                       \
+    tDType* tau = (tDType*)NDL_PTR(lp, 1);                                                     \
+    int* info = (int*)NDL_PTR(lp, 2);                                                          \
+    struct _geqrf_option* opt = (struct _geqrf_option*)(lp->opt_ptr);                          \
+    const lapack_int m = (lapack_int)NDL_SHAPE(lp, 0)[0];                                      \
+    const lapack_int n = (lapack_int)NDL_SHAPE(lp, 0)[1];                                      \
+    const lapack_int lda = n;                                                                  \
+    const lapack_int i = LAPACKE_##fLapackFunc(opt->matrix_layout, m, n, a, lda, tau);         \
+    *info = (int)i;                                                                            \
+  }                                                                                            \
+                                                                                               \
+  static VALUE _linalg_lapack_##fLapackFunc(int argc, VALUE* argv, VALUE self) {               \
+    VALUE a_vnary = Qnil;                                                                      \
+    VALUE kw_args = Qnil;                                                                      \
+    rb_scan_args(argc, argv, "1:", &a_vnary, &kw_args);                                        \
+    ID kw_table[1] = { rb_intern("order") };                                                   \
+    VALUE kw_values[1] = { Qundef };                                                           \
+    rb_get_kwargs(kw_args, kw_table, 0, 1, kw_values);                                         \
+    const int matrix_layout =                                                                  \
+      kw_values[0] != Qundef ? get_matrix_layout(kw_values[0]) : LAPACK_ROW_MAJOR;             \
+                                                                                               \
+    if (CLASS_OF(a_vnary) != tNAryClass) {                                                     \
+      a_vnary = rb_funcall(tNAryClass, rb_intern("cast"), 1, a_vnary);                         \
+    }                                                                                          \
+    if (!RTEST(nary_check_contiguous(a_vnary))) {                                              \
+      a_vnary = nary_dup(a_vnary);                                                             \
+    }                                                                                          \
+                                                                                               \
+    narray_t* a_nary = NULL;                                                                   \
+    GetNArray(a_vnary, a_nary);                                                                \
+    const int n_dims = NA_NDIM(a_nary);                                                        \
+    if (n_dims != 2) {                                                                         \
+      rb_raise(rb_eArgError, "input array a must be 2-dimensional");                           \
+      return Qnil;                                                                             \
+    }                                                                                          \
+                                                                                               \
+    size_t m = NA_SHAPE(a_nary)[0];                                                            \
+    size_t n = NA_SHAPE(a_nary)[1];                                                            \
+    size_t shape[1] = { m < n ? m : n };                                                       \
+    ndfunc_arg_in_t ain[1] = { { OVERWRITE, 2 } };                                             \
+    ndfunc_arg_out_t aout[2] = { { tNAryClass, 1, shape }, { numo_cInt32, 0 } };               \
+    ndfunc_t ndf = { _iter_##fLapackFunc, NO_LOOP | NDF_EXTRACT, 1, 2, ain, aout };            \
+    struct _geqrf_option opt = { matrix_layout };                                              \
+    VALUE res = na_ndloop3(&ndf, &opt, 1, a_vnary);                                            \
+                                                                                               \
+    VALUE ret = rb_ary_concat(rb_ary_new3(1, a_vnary), res);                                   \
+                                                                                               \
+    RB_GC_GUARD(a_vnary);                                                                      \
+                                                                                               \
+    return ret;                                                                                \
   }
 DEF_LINALG_FUNC(double, numo_cDFloat, dgeqrf)