RubyGems - numo-linalg-alt - Versions diffs - 0.3.0 → 0.4.0 - Mend

numo-linalg-alt 0.3.0 → 0.4.0

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (53) hide show

checksums.yaml +4 -4
data/CHANGELOG.md +4 -0
data/ext/numo/linalg/blas/dot.c +59 -59
data/ext/numo/linalg/blas/dot_sub.c +58 -58
data/ext/numo/linalg/blas/gemm.c +157 -148
data/ext/numo/linalg/blas/gemv.c +131 -127
data/ext/numo/linalg/blas/nrm2.c +50 -50
data/ext/numo/linalg/lapack/gees.c +239 -220
data/ext/numo/linalg/lapack/geev.c +127 -110
data/ext/numo/linalg/lapack/gelsd.c +81 -70
data/ext/numo/linalg/lapack/geqrf.c +52 -51
data/ext/numo/linalg/lapack/gerqf.c +70 -0
data/ext/numo/linalg/lapack/gerqf.h +15 -0
data/ext/numo/linalg/lapack/gesdd.c +96 -86
data/ext/numo/linalg/lapack/gesv.c +80 -78
data/ext/numo/linalg/lapack/gesvd.c +140 -129
data/ext/numo/linalg/lapack/getrf.c +51 -50
data/ext/numo/linalg/lapack/getri.c +64 -63
data/ext/numo/linalg/lapack/getrs.c +92 -88
data/ext/numo/linalg/lapack/gges.c +214 -0
data/ext/numo/linalg/lapack/gges.h +15 -0
data/ext/numo/linalg/lapack/heev.c +54 -52
data/ext/numo/linalg/lapack/heevd.c +54 -52
data/ext/numo/linalg/lapack/heevr.c +109 -98
data/ext/numo/linalg/lapack/hegv.c +77 -74
data/ext/numo/linalg/lapack/hegvd.c +77 -74
data/ext/numo/linalg/lapack/hegvx.c +132 -120
data/ext/numo/linalg/lapack/hetrf.c +54 -50
data/ext/numo/linalg/lapack/lange.c +45 -44
data/ext/numo/linalg/lapack/orgqr.c +63 -62
data/ext/numo/linalg/lapack/orgrq.c +78 -0
data/ext/numo/linalg/lapack/orgrq.h +15 -0
data/ext/numo/linalg/lapack/potrf.c +49 -48
data/ext/numo/linalg/lapack/potri.c +49 -48
data/ext/numo/linalg/lapack/potrs.c +74 -72
data/ext/numo/linalg/lapack/syev.c +54 -52
data/ext/numo/linalg/lapack/syevd.c +54 -52
data/ext/numo/linalg/lapack/syevr.c +107 -98
data/ext/numo/linalg/lapack/sygv.c +77 -73
data/ext/numo/linalg/lapack/sygvd.c +77 -73
data/ext/numo/linalg/lapack/sygvx.c +132 -120
data/ext/numo/linalg/lapack/sytrf.c +54 -50
data/ext/numo/linalg/lapack/trtrs.c +79 -75
data/ext/numo/linalg/lapack/ungqr.c +63 -62
data/ext/numo/linalg/lapack/ungrq.c +78 -0
data/ext/numo/linalg/lapack/ungrq.h +15 -0
data/ext/numo/linalg/linalg.c +20 -10
data/ext/numo/linalg/linalg.h +4 -0
data/ext/numo/linalg/util.c +8 -0
data/ext/numo/linalg/util.h +1 -0
data/lib/numo/linalg/version.rb +1 -1
data/lib/numo/linalg.rb +139 -3
metadata +10 -2

data/ext/numo/linalg/lapack/gesvd.c CHANGED Viewed

@@ -6,135 +6,146 @@ struct _gesvd_option {
   char jobvt;
 };
-#define DEF_LINALG_FUNC(tDType, tRtDType, tNAryClass, tRtNAryClass, fLapackFunc)                                                              \
-  static void _iter_##fLapackFunc(na_loop_t* const lp) {                                                                                      \
-    tDType* a = (tDType*)NDL_PTR(lp, 0);                                                                                                      \
-    tRtDType* s = (tRtDType*)NDL_PTR(lp, 1);                                                                                                  \
-    tDType* u = (tDType*)NDL_PTR(lp, 2);                                                                                                      \
-    tDType* vt = (tDType*)NDL_PTR(lp, 3);                                                                                                     \
-    int* info = (int*)NDL_PTR(lp, 4);                                                                                                         \
-    struct _gesvd_option* opt = (struct _gesvd_option*)(lp->opt_ptr);                                                                         \
-                                                                                                                                              \
-    const lapack_int m = (lapack_int)(opt->matrix_order == LAPACK_ROW_MAJOR ? NDL_SHAPE(lp, 0)[0] : NDL_SHAPE(lp, 0)[1]);                     \
-    const lapack_int n = (lapack_int)(opt->matrix_order == LAPACK_ROW_MAJOR ? NDL_SHAPE(lp, 0)[1] : NDL_SHAPE(lp, 0)[0]);                     \
-    const lapack_int min_mn = m < n ? m : n;                                                                                                  \
-    const lapack_int lda = n;                                                                                                                 \
-    const lapack_int ldu = opt->jobu == 'A' ? m : min_mn;                                                                                     \
-    const lapack_int ldvt = n;                                                                                                                \
-                                                                                                                                              \
-    tRtDType* superb = (tRtDType*)ruby_xmalloc(min_mn * sizeof(tRtDType));                                                                    \
-                                                                                                                                              \
-    lapack_int i = LAPACKE_##fLapackFunc(opt->matrix_order, opt->jobu, opt->jobvt, m, n, a, lda, s, u, ldu, vt, ldvt, superb);                \
-    *info = (int)i;                                                                                                                           \
-                                                                                                                                              \
-    ruby_xfree(superb);                                                                                                                       \
-  }                                                                                                                                           \
-                                                                                                                                              \
-  static VALUE _linalg_lapack_##fLapackFunc(int argc, VALUE* argv, VALUE self) {                                                              \
-    VALUE a_vnary = Qnil;                                                                                                                     \
-    VALUE kw_args = Qnil;                                                                                                                     \
-                                                                                                                                              \
-    rb_scan_args(argc, argv, "1:", &a_vnary, &kw_args);                                                                                       \
-                                                                                                                                              \
-    ID kw_table[3] = { rb_intern("jobu"), rb_intern("jobvt"), rb_intern("order") };                                                           \
-    VALUE kw_values[3] = { Qundef, Qundef, Qundef };                                                                                          \
-                                                                                                                                              \
-    rb_get_kwargs(kw_args, kw_table, 0, 3, kw_values);                                                                                        \
-                                                                                                                                              \
-    const char jobu = kw_values[0] == Qundef ? 'A' : StringValueCStr(kw_values[0])[0];                                                        \
-    const char jobvt = kw_values[1] == Qundef ? 'A' : StringValueCStr(kw_values[1])[0];                                                       \
-    const char order = kw_values[2] == Qundef ? 'R' : StringValueCStr(kw_values[2])[0];                                                       \
-                                                                                                                                              \
-    if (jobu == 'O' && jobvt == 'O') {                                                                                                        \
-      rb_raise(rb_eArgError, "jobu and jobvt cannot be both 'O'");                                                                            \
-      return Qnil;                                                                                                                            \
-    }                                                                                                                                         \
-    if (CLASS_OF(a_vnary) != tNAryClass) {                                                                                                    \
-      rb_raise(rb_eTypeError, "type of input array is invalid for overwriting");                                                              \
-      return Qnil;                                                                                                                            \
-    }                                                                                                                                         \
-                                                                                                                                              \
-    if (CLASS_OF(a_vnary) != tNAryClass) {                                                                                                    \
-      a_vnary = rb_funcall(tNAryClass, rb_intern("cast"), 1, a_vnary);                                                                        \
-    }                                                                                                                                         \
-    if (!RTEST(nary_check_contiguous(a_vnary))) {                                                                                             \
-      a_vnary = nary_dup(a_vnary);                                                                                                            \
-    }                                                                                                                                         \
-                                                                                                                                              \
-    narray_t* a_nary = NULL;                                                                                                                  \
-    GetNArray(a_vnary, a_nary);                                                                                                               \
-    const int n_dims = NA_NDIM(a_nary);                                                                                                       \
-    if (n_dims != 2) {                                                                                                                        \
-      rb_raise(rb_eArgError, "input array must be 2-dimensional");                                                                            \
-      return Qnil;                                                                                                                            \
-    }                                                                                                                                         \
-                                                                                                                                              \
-    const int matrix_order = order == 'C' ? LAPACK_COL_MAJOR : LAPACK_ROW_MAJOR;                                                              \
-    const size_t m = matrix_order == LAPACK_ROW_MAJOR ? NA_SHAPE(a_nary)[0] : NA_SHAPE(a_nary)[1];                                            \
-    const size_t n = matrix_order == LAPACK_ROW_MAJOR ? NA_SHAPE(a_nary)[1] : NA_SHAPE(a_nary)[0];                                            \
-                                                                                                                                              \
-    const size_t min_mn = m < n ? m : n;                                                                                                      \
-    size_t shape_s[1] = { min_mn };                                                                                                           \
-    size_t shape_u[2] = { m, m };                                                                                                             \
-    size_t shape_vt[2] = { n, n };                                                                                                            \
-                                                                                                                                              \
-    ndfunc_arg_in_t ain[1] = { { OVERWRITE, 2 } };                                                                                            \
-    ndfunc_arg_out_t aout[4] = { { tRtNAryClass, 1, shape_s }, { tNAryClass, 2, shape_u }, { tNAryClass, 2, shape_vt }, { numo_cInt32, 0 } }; \
-                                                                                                                                              \
-    switch (jobu) {                                                                                                                           \
-    case 'A':                                                                                                                                 \
-      break;                                                                                                                                  \
-    case 'S':                                                                                                                                 \
-      shape_u[matrix_order == LAPACK_ROW_MAJOR ? 1 : 0] = min_mn;                                                                             \
-      break;                                                                                                                                  \
-    case 'O':                                                                                                                                 \
-    case 'N':                                                                                                                                 \
-      aout[1].dim = 0;                                                                                                                        \
-      break;                                                                                                                                  \
-    default:                                                                                                                                  \
-      rb_raise(rb_eArgError, "jobu must be 'A', 'S', 'O', or 'N'");                                                                           \
-      return Qnil;                                                                                                                            \
-    }                                                                                                                                         \
-                                                                                                                                              \
-    switch (jobvt) {                                                                                                                          \
-    case 'A':                                                                                                                                 \
-      break;                                                                                                                                  \
-    case 'S':                                                                                                                                 \
-      shape_vt[matrix_order == LAPACK_ROW_MAJOR ? 0 : 1] = min_mn;                                                                            \
-      break;                                                                                                                                  \
-    case 'O':                                                                                                                                 \
-    case 'N':                                                                                                                                 \
-      aout[2].dim = 0;                                                                                                                        \
-      break;                                                                                                                                  \
-    default:                                                                                                                                  \
-      rb_raise(rb_eArgError, "jobvt must be 'A', 'S', 'O', or 'N'");                                                                          \
-      return Qnil;                                                                                                                            \
-    }                                                                                                                                         \
-                                                                                                                                              \
-    ndfunc_t ndf = { _iter_##fLapackFunc, NO_LOOP | NDF_EXTRACT, 1, 4, ain, aout };                                                           \
-    struct _gesvd_option opt = { matrix_order, jobu, jobvt };                                                                                 \
-    VALUE ret = na_ndloop3(&ndf, &opt, 1, a_vnary);                                                                                           \
-                                                                                                                                              \
-    switch (jobu) {                                                                                                                           \
-    case 'O':                                                                                                                                 \
-      rb_ary_store(ret, 1, a_vnary);                                                                                                          \
-      break;                                                                                                                                  \
-    case 'N':                                                                                                                                 \
-      rb_ary_store(ret, 1, Qnil);                                                                                                             \
-      break;                                                                                                                                  \
-    }                                                                                                                                         \
-                                                                                                                                              \
-    switch (jobvt) {                                                                                                                          \
-    case 'O':                                                                                                                                 \
-      rb_ary_store(ret, 2, a_vnary);                                                                                                          \
-      break;                                                                                                                                  \
-    case 'N':                                                                                                                                 \
-      rb_ary_store(ret, 2, Qnil);                                                                                                             \
-      break;                                                                                                                                  \
-    }                                                                                                                                         \
-                                                                                                                                              \
-    RB_GC_GUARD(a_vnary);                                                                                                                     \
-    return ret;                                                                                                                               \
+#define DEF_LINALG_FUNC(tDType, tRtDType, tNAryClass, tRtNAryClass, fLapackFunc)               \
+  static void _iter_##fLapackFunc(na_loop_t* const lp) {                                       \
+    tDType* a = (tDType*)NDL_PTR(lp, 0);                                                       \
+    tRtDType* s = (tRtDType*)NDL_PTR(lp, 1);                                                   \
+    tDType* u = (tDType*)NDL_PTR(lp, 2);                                                       \
+    tDType* vt = (tDType*)NDL_PTR(lp, 3);                                                      \
+    int* info = (int*)NDL_PTR(lp, 4);                                                          \
+    struct _gesvd_option* opt = (struct _gesvd_option*)(lp->opt_ptr);                          \
+                                                                                               \
+    const lapack_int m =                                                                       \
+      (lapack_int)(opt->matrix_order == LAPACK_ROW_MAJOR ? NDL_SHAPE(lp, 0)[0]                 \
+                                                         : NDL_SHAPE(lp, 0)[1]);               \
+    const lapack_int n =                                                                       \
+      (lapack_int)(opt->matrix_order == LAPACK_ROW_MAJOR ? NDL_SHAPE(lp, 0)[1]                 \
+                                                         : NDL_SHAPE(lp, 0)[0]);               \
+    const lapack_int min_mn = m < n ? m : n;                                                   \
+    const lapack_int lda = n;                                                                  \
+    const lapack_int ldu = opt->jobu == 'A' ? m : min_mn;                                      \
+    const lapack_int ldvt = n;                                                                 \
+                                                                                               \
+    tRtDType* superb = (tRtDType*)ruby_xmalloc(min_mn * sizeof(tRtDType));                     \
+                                                                                               \
+    lapack_int i = LAPACKE_##fLapackFunc(                                                      \
+      opt->matrix_order, opt->jobu, opt->jobvt, m, n, a, lda, s, u, ldu, vt, ldvt, superb      \
+    );                                                                                         \
+    *info = (int)i;                                                                            \
+                                                                                               \
+    ruby_xfree(superb);                                                                        \
+  }                                                                                            \
+                                                                                               \
+  static VALUE _linalg_lapack_##fLapackFunc(int argc, VALUE* argv, VALUE self) {               \
+    VALUE a_vnary = Qnil;                                                                      \
+    VALUE kw_args = Qnil;                                                                      \
+                                                                                               \
+    rb_scan_args(argc, argv, "1:", &a_vnary, &kw_args);                                        \
+                                                                                               \
+    ID kw_table[3] = { rb_intern("jobu"), rb_intern("jobvt"), rb_intern("order") };            \
+    VALUE kw_values[3] = { Qundef, Qundef, Qundef };                                           \
+                                                                                               \
+    rb_get_kwargs(kw_args, kw_table, 0, 3, kw_values);                                         \
+                                                                                               \
+    const char jobu = kw_values[0] == Qundef ? 'A' : StringValueCStr(kw_values[0])[0];         \
+    const char jobvt = kw_values[1] == Qundef ? 'A' : StringValueCStr(kw_values[1])[0];        \
+    const char order = kw_values[2] == Qundef ? 'R' : StringValueCStr(kw_values[2])[0];        \
+                                                                                               \
+    if (jobu == 'O' && jobvt == 'O') {                                                         \
+      rb_raise(rb_eArgError, "jobu and jobvt cannot be both 'O'");                             \
+      return Qnil;                                                                             \
+    }                                                                                          \
+    if (CLASS_OF(a_vnary) != tNAryClass) {                                                     \
+      rb_raise(rb_eTypeError, "type of input array is invalid for overwriting");               \
+      return Qnil;                                                                             \
+    }                                                                                          \
+                                                                                               \
+    if (CLASS_OF(a_vnary) != tNAryClass) {                                                     \
+      a_vnary = rb_funcall(tNAryClass, rb_intern("cast"), 1, a_vnary);                         \
+    }                                                                                          \
+    if (!RTEST(nary_check_contiguous(a_vnary))) {                                              \
+      a_vnary = nary_dup(a_vnary);                                                             \
+    }                                                                                          \
+                                                                                               \
+    narray_t* a_nary = NULL;                                                                   \
+    GetNArray(a_vnary, a_nary);                                                                \
+    const int n_dims = NA_NDIM(a_nary);                                                        \
+    if (n_dims != 2) {                                                                         \
+      rb_raise(rb_eArgError, "input array must be 2-dimensional");                             \
+      return Qnil;                                                                             \
+    }                                                                                          \
+                                                                                               \
+    const int matrix_order = order == 'C' ? LAPACK_COL_MAJOR : LAPACK_ROW_MAJOR;               \
+    const size_t m =                                                                           \
+      matrix_order == LAPACK_ROW_MAJOR ? NA_SHAPE(a_nary)[0] : NA_SHAPE(a_nary)[1];            \
+    const size_t n =                                                                           \
+      matrix_order == LAPACK_ROW_MAJOR ? NA_SHAPE(a_nary)[1] : NA_SHAPE(a_nary)[0];            \
+                                                                                               \
+    const size_t min_mn = m < n ? m : n;                                                       \
+    size_t shape_s[1] = { min_mn };                                                            \
+    size_t shape_u[2] = { m, m };                                                              \
+    size_t shape_vt[2] = { n, n };                                                             \
+                                                                                               \
+    ndfunc_arg_in_t ain[1] = { { OVERWRITE, 2 } };                                             \
+    ndfunc_arg_out_t aout[4] = { { tRtNAryClass, 1, shape_s },                                 \
+                                 { tNAryClass, 2, shape_u },                                   \
+                                 { tNAryClass, 2, shape_vt },                                  \
+                                 { numo_cInt32, 0 } };                                         \
+                                                                                               \
+    switch (jobu) {                                                                            \
+    case 'A':                                                                                  \
+      break;                                                                                   \
+    case 'S':                                                                                  \
+      shape_u[matrix_order == LAPACK_ROW_MAJOR ? 1 : 0] = min_mn;                              \
+      break;                                                                                   \
+    case 'O':                                                                                  \
+    case 'N':                                                                                  \
+      aout[1].dim = 0;                                                                         \
+      break;                                                                                   \
+    default:                                                                                   \
+      rb_raise(rb_eArgError, "jobu must be 'A', 'S', 'O', or 'N'");                            \
+      return Qnil;                                                                             \
+    }                                                                                          \
+                                                                                               \
+    switch (jobvt) {                                                                           \
+    case 'A':                                                                                  \
+      break;                                                                                   \
+    case 'S':                                                                                  \
+      shape_vt[matrix_order == LAPACK_ROW_MAJOR ? 0 : 1] = min_mn;                             \
+      break;                                                                                   \
+    case 'O':                                                                                  \
+    case 'N':                                                                                  \
+      aout[2].dim = 0;                                                                         \
+      break;                                                                                   \
+    default:                                                                                   \
+      rb_raise(rb_eArgError, "jobvt must be 'A', 'S', 'O', or 'N'");                           \
+      return Qnil;                                                                             \
+    }                                                                                          \
+                                                                                               \
+    ndfunc_t ndf = { _iter_##fLapackFunc, NO_LOOP | NDF_EXTRACT, 1, 4, ain, aout };            \
+    struct _gesvd_option opt = { matrix_order, jobu, jobvt };                                  \
+    VALUE ret = na_ndloop3(&ndf, &opt, 1, a_vnary);                                            \
+                                                                                               \
+    switch (jobu) {                                                                            \
+    case 'O':                                                                                  \
+      rb_ary_store(ret, 1, a_vnary);                                                           \
+      break;                                                                                   \
+    case 'N':                                                                                  \
+      rb_ary_store(ret, 1, Qnil);                                                              \
+      break;                                                                                   \
+    }                                                                                          \
+                                                                                               \
+    switch (jobvt) {                                                                           \
+    case 'O':                                                                                  \
+      rb_ary_store(ret, 2, a_vnary);                                                           \
+      break;                                                                                   \
+    case 'N':                                                                                  \
+      rb_ary_store(ret, 2, Qnil);                                                              \
+      break;                                                                                   \
+    }                                                                                          \
+                                                                                               \
+    RB_GC_GUARD(a_vnary);                                                                      \
+    return ret;                                                                                \
   }
 DEF_LINALG_FUNC(double, double, numo_cDFloat, numo_cDFloat, dgesvd)

data/ext/numo/linalg/lapack/getrf.c CHANGED Viewed

@@ -4,56 +4,57 @@ struct _getrf_option {
   int matrix_layout;
 };
-#define DEF_LINALG_FUNC(tDType, tNAryClass, fLapackFunc)                                                   \
-  static void _iter_##fLapackFunc(na_loop_t* const lp) {                                                   \
-    tDType* a = (tDType*)NDL_PTR(lp, 0);                                                                   \
-    int* ipiv = (int*)NDL_PTR(lp, 1);                                                                      \
-    int* info = (int*)NDL_PTR(lp, 2);                                                                      \
-    struct _getrf_option* opt = (struct _getrf_option*)(lp->opt_ptr);                                      \
-    const lapack_int m = (lapack_int)NDL_SHAPE(lp, 0)[0];                                                  \
-    const lapack_int n = (lapack_int)NDL_SHAPE(lp, 0)[1];                                                  \
-    const lapack_int lda = n;                                                                              \
-    const lapack_int i = LAPACKE_##fLapackFunc(opt->matrix_layout, m, n, a, lda, ipiv);                    \
-    *info = (int)i;                                                                                        \
-  }                                                                                                        \
-                                                                                                           \
-  static VALUE _linalg_lapack_##fLapackFunc(int argc, VALUE* argv, VALUE self) {                           \
-    VALUE a_vnary = Qnil;                                                                                  \
-    VALUE kw_args = Qnil;                                                                                  \
-    rb_scan_args(argc, argv, "1:", &a_vnary, &kw_args);                                                    \
-    ID kw_table[1] = { rb_intern("order") };                                                               \
-    VALUE kw_values[1] = { Qundef };                                                                       \
-    rb_get_kwargs(kw_args, kw_table, 0, 1, kw_values);                                                     \
-    const int matrix_layout = kw_values[0] != Qundef ? get_matrix_layout(kw_values[0]) : LAPACK_ROW_MAJOR; \
-                                                                                                           \
-    if (CLASS_OF(a_vnary) != tNAryClass) {                                                                 \
-      a_vnary = rb_funcall(tNAryClass, rb_intern("cast"), 1, a_vnary);                                     \
-    }                                                                                                      \
-    if (!RTEST(nary_check_contiguous(a_vnary))) {                                                          \
-      a_vnary = nary_dup(a_vnary);                                                                         \
-    }                                                                                                      \
-                                                                                                           \
-    narray_t* a_nary = NULL;                                                                               \
-    GetNArray(a_vnary, a_nary);                                                                            \
-    const int n_dims = NA_NDIM(a_nary);                                                                    \
-    if (n_dims != 2) {                                                                                     \
-      rb_raise(rb_eArgError, "input array a must be 2-dimensional");                                       \
-      return Qnil;                                                                                         \
-    }                                                                                                      \
-                                                                                                           \
-    size_t m = NA_SHAPE(a_nary)[0];                                                                        \
-    size_t n = NA_SHAPE(a_nary)[1];                                                                        \
-    size_t shape[1] = { m < n ? m : n };                                                                   \
-    ndfunc_arg_in_t ain[1] = { { OVERWRITE, 2 } };                                                         \
-    ndfunc_arg_out_t aout[2] = { { numo_cInt32, 1, shape }, { numo_cInt32, 0 } };                          \
-    ndfunc_t ndf = { _iter_##fLapackFunc, NO_LOOP | NDF_EXTRACT, 1, 2, ain, aout };                        \
-    struct _getrf_option opt = { matrix_layout };                                                          \
-    VALUE res = na_ndloop3(&ndf, &opt, 1, a_vnary);                                                        \
-                                                                                                           \
-    VALUE ret = rb_ary_concat(rb_ary_new3(1, a_vnary), res);                                               \
-                                                                                                           \
-    RB_GC_GUARD(a_vnary);                                                                                  \
-    return ret;                                                                                            \
+#define DEF_LINALG_FUNC(tDType, tNAryClass, fLapackFunc)                                       \
+  static void _iter_##fLapackFunc(na_loop_t* const lp) {                                       \
+    tDType* a = (tDType*)NDL_PTR(lp, 0);                                                       \
+    int* ipiv = (int*)NDL_PTR(lp, 1);                                                          \
+    int* info = (int*)NDL_PTR(lp, 2);                                                          \
+    struct _getrf_option* opt = (struct _getrf_option*)(lp->opt_ptr);                          \
+    const lapack_int m = (lapack_int)NDL_SHAPE(lp, 0)[0];                                      \
+    const lapack_int n = (lapack_int)NDL_SHAPE(lp, 0)[1];                                      \
+    const lapack_int lda = n;                                                                  \
+    const lapack_int i = LAPACKE_##fLapackFunc(opt->matrix_layout, m, n, a, lda, ipiv);        \
+    *info = (int)i;                                                                            \
+  }                                                                                            \
+                                                                                               \
+  static VALUE _linalg_lapack_##fLapackFunc(int argc, VALUE* argv, VALUE self) {               \
+    VALUE a_vnary = Qnil;                                                                      \
+    VALUE kw_args = Qnil;                                                                      \
+    rb_scan_args(argc, argv, "1:", &a_vnary, &kw_args);                                        \
+    ID kw_table[1] = { rb_intern("order") };                                                   \
+    VALUE kw_values[1] = { Qundef };                                                           \
+    rb_get_kwargs(kw_args, kw_table, 0, 1, kw_values);                                         \
+    const int matrix_layout =                                                                  \
+      kw_values[0] != Qundef ? get_matrix_layout(kw_values[0]) : LAPACK_ROW_MAJOR;             \
+                                                                                               \
+    if (CLASS_OF(a_vnary) != tNAryClass) {                                                     \
+      a_vnary = rb_funcall(tNAryClass, rb_intern("cast"), 1, a_vnary);                         \
+    }                                                                                          \
+    if (!RTEST(nary_check_contiguous(a_vnary))) {                                              \
+      a_vnary = nary_dup(a_vnary);                                                             \
+    }                                                                                          \
+                                                                                               \
+    narray_t* a_nary = NULL;                                                                   \
+    GetNArray(a_vnary, a_nary);                                                                \
+    const int n_dims = NA_NDIM(a_nary);                                                        \
+    if (n_dims != 2) {                                                                         \
+      rb_raise(rb_eArgError, "input array a must be 2-dimensional");                           \
+      return Qnil;                                                                             \
+    }                                                                                          \
+                                                                                               \
+    size_t m = NA_SHAPE(a_nary)[0];                                                            \
+    size_t n = NA_SHAPE(a_nary)[1];                                                            \
+    size_t shape[1] = { m < n ? m : n };                                                       \
+    ndfunc_arg_in_t ain[1] = { { OVERWRITE, 2 } };                                             \
+    ndfunc_arg_out_t aout[2] = { { numo_cInt32, 1, shape }, { numo_cInt32, 0 } };              \
+    ndfunc_t ndf = { _iter_##fLapackFunc, NO_LOOP | NDF_EXTRACT, 1, 2, ain, aout };            \
+    struct _getrf_option opt = { matrix_layout };                                              \
+    VALUE res = na_ndloop3(&ndf, &opt, 1, a_vnary);                                            \
+                                                                                               \
+    VALUE ret = rb_ary_concat(rb_ary_new3(1, a_vnary), res);                                   \
+                                                                                               \
+    RB_GC_GUARD(a_vnary);                                                                      \
+    return ret;                                                                                \
   }
 DEF_LINALG_FUNC(double, numo_cDFloat, dgetrf)

data/ext/numo/linalg/lapack/getri.c CHANGED Viewed

@@ -4,69 +4,70 @@ struct _getri_option {
   int matrix_layout;
 };
-#define DEF_LINALG_FUNC(tDType, tNAryClass, fLapackFunc)                                                   \
-  static void _iter_##fLapackFunc(na_loop_t* const lp) {                                                   \
-    tDType* a = (tDType*)NDL_PTR(lp, 0);                                                                   \
-    lapack_int* ipiv = (lapack_int*)NDL_PTR(lp, 1);                                                        \
-    int* info = (int*)NDL_PTR(lp, 2);                                                                      \
-    struct _getri_option* opt = (struct _getri_option*)(lp->opt_ptr);                                      \
-    const lapack_int n = (lapack_int)NDL_SHAPE(lp, 0)[0];                                                  \
-    const lapack_int lda = n;                                                                              \
-    const lapack_int i = LAPACKE_##fLapackFunc(opt->matrix_layout, n, a, lda, ipiv);                       \
-    *info = (int)i;                                                                                        \
-  }                                                                                                        \
-                                                                                                           \
-  static VALUE _linalg_lapack_##fLapackFunc(int argc, VALUE* argv, VALUE self) {                           \
-    VALUE a_vnary = Qnil;                                                                                  \
-    VALUE ipiv_vnary = Qnil;                                                                               \
-    VALUE kw_args = Qnil;                                                                                  \
-    rb_scan_args(argc, argv, "2:", &a_vnary, &ipiv_vnary, &kw_args);                                       \
-    ID kw_table[1] = { rb_intern("order") };                                                               \
-    VALUE kw_values[1] = { Qundef };                                                                       \
-    rb_get_kwargs(kw_args, kw_table, 0, 1, kw_values);                                                     \
-    const int matrix_layout = kw_values[0] != Qundef ? get_matrix_layout(kw_values[0]) : LAPACK_ROW_MAJOR; \
-                                                                                                           \
-    if (CLASS_OF(a_vnary) != tNAryClass) {                                                                 \
-      a_vnary = rb_funcall(tNAryClass, rb_intern("cast"), 1, a_vnary);                                     \
-    }                                                                                                      \
-    if (!RTEST(nary_check_contiguous(a_vnary))) {                                                          \
-      a_vnary = nary_dup(a_vnary);                                                                         \
-    }                                                                                                      \
-    if (CLASS_OF(ipiv_vnary) != numo_cInt32) {                                                             \
-      ipiv_vnary = rb_funcall(numo_cInt32, rb_intern("cast"), 1, ipiv_vnary);                              \
-    }                                                                                                      \
-    if (!RTEST(nary_check_contiguous(ipiv_vnary))) {                                                       \
-      ipiv_vnary = nary_dup(ipiv_vnary);                                                                   \
-    }                                                                                                      \
-                                                                                                           \
-    narray_t* a_nary = NULL;                                                                               \
-    GetNArray(a_vnary, a_nary);                                                                            \
-    if (NA_NDIM(a_nary) != 2) {                                                                            \
-      rb_raise(rb_eArgError, "input array a must be 2-dimensional");                                       \
-      return Qnil;                                                                                         \
-    }                                                                                                      \
-    if (NA_SHAPE(a_nary)[0] != NA_SHAPE(a_nary)[1]) {                                                      \
-      rb_raise(rb_eArgError, "input array a must be square");                                              \
-      return Qnil;                                                                                         \
-    }                                                                                                      \
-    narray_t* ipiv_nary = NULL;                                                                            \
-    GetNArray(ipiv_vnary, ipiv_nary);                                                                      \
-    if (NA_NDIM(ipiv_nary) != 1) {                                                                         \
-      rb_raise(rb_eArgError, "input array ipiv must be 1-dimensional");                                    \
-      return Qnil;                                                                                         \
-    }                                                                                                      \
-                                                                                                           \
-    ndfunc_arg_in_t ain[2] = { { OVERWRITE, 2 }, { numo_cInt32, 1 } };                                     \
-    ndfunc_arg_out_t aout[1] = { { numo_cInt32, 0 } };                                                     \
-    ndfunc_t ndf = { _iter_##fLapackFunc, NO_LOOP | NDF_EXTRACT, 2, 1, ain, aout };                        \
-    struct _getri_option opt = { matrix_layout };                                                          \
-    VALUE res = na_ndloop3(&ndf, &opt, 2, a_vnary, ipiv_vnary);                                            \
-                                                                                                           \
-    VALUE ret = rb_ary_new3(2, a_vnary, res);                                                              \
-                                                                                                           \
-    RB_GC_GUARD(a_vnary);                                                                                  \
-    RB_GC_GUARD(ipiv_vnary);                                                                               \
-    return ret;                                                                                            \
+#define DEF_LINALG_FUNC(tDType, tNAryClass, fLapackFunc)                                       \
+  static void _iter_##fLapackFunc(na_loop_t* const lp) {                                       \
+    tDType* a = (tDType*)NDL_PTR(lp, 0);                                                       \
+    lapack_int* ipiv = (lapack_int*)NDL_PTR(lp, 1);                                            \
+    int* info = (int*)NDL_PTR(lp, 2);                                                          \
+    struct _getri_option* opt = (struct _getri_option*)(lp->opt_ptr);                          \
+    const lapack_int n = (lapack_int)NDL_SHAPE(lp, 0)[0];                                      \
+    const lapack_int lda = n;                                                                  \
+    const lapack_int i = LAPACKE_##fLapackFunc(opt->matrix_layout, n, a, lda, ipiv);           \
+    *info = (int)i;                                                                            \
+  }                                                                                            \
+                                                                                               \
+  static VALUE _linalg_lapack_##fLapackFunc(int argc, VALUE* argv, VALUE self) {               \
+    VALUE a_vnary = Qnil;                                                                      \
+    VALUE ipiv_vnary = Qnil;                                                                   \
+    VALUE kw_args = Qnil;                                                                      \
+    rb_scan_args(argc, argv, "2:", &a_vnary, &ipiv_vnary, &kw_args);                           \
+    ID kw_table[1] = { rb_intern("order") };                                                   \
+    VALUE kw_values[1] = { Qundef };                                                           \
+    rb_get_kwargs(kw_args, kw_table, 0, 1, kw_values);                                         \
+    const int matrix_layout =                                                                  \
+      kw_values[0] != Qundef ? get_matrix_layout(kw_values[0]) : LAPACK_ROW_MAJOR;             \
+                                                                                               \
+    if (CLASS_OF(a_vnary) != tNAryClass) {                                                     \
+      a_vnary = rb_funcall(tNAryClass, rb_intern("cast"), 1, a_vnary);                         \
+    }                                                                                          \
+    if (!RTEST(nary_check_contiguous(a_vnary))) {                                              \
+      a_vnary = nary_dup(a_vnary);                                                             \
+    }                                                                                          \
+    if (CLASS_OF(ipiv_vnary) != numo_cInt32) {                                                 \
+      ipiv_vnary = rb_funcall(numo_cInt32, rb_intern("cast"), 1, ipiv_vnary);                  \
+    }                                                                                          \
+    if (!RTEST(nary_check_contiguous(ipiv_vnary))) {                                           \
+      ipiv_vnary = nary_dup(ipiv_vnary);                                                       \
+    }                                                                                          \
+                                                                                               \
+    narray_t* a_nary = NULL;                                                                   \
+    GetNArray(a_vnary, a_nary);                                                                \
+    if (NA_NDIM(a_nary) != 2) {                                                                \
+      rb_raise(rb_eArgError, "input array a must be 2-dimensional");                           \
+      return Qnil;                                                                             \
+    }                                                                                          \
+    if (NA_SHAPE(a_nary)[0] != NA_SHAPE(a_nary)[1]) {                                          \
+      rb_raise(rb_eArgError, "input array a must be square");                                  \
+      return Qnil;                                                                             \
+    }                                                                                          \
+    narray_t* ipiv_nary = NULL;                                                                \
+    GetNArray(ipiv_vnary, ipiv_nary);                                                          \
+    if (NA_NDIM(ipiv_nary) != 1) {                                                             \
+      rb_raise(rb_eArgError, "input array ipiv must be 1-dimensional");                        \
+      return Qnil;                                                                             \
+    }                                                                                          \
+                                                                                               \
+    ndfunc_arg_in_t ain[2] = { { OVERWRITE, 2 }, { numo_cInt32, 1 } };                         \
+    ndfunc_arg_out_t aout[1] = { { numo_cInt32, 0 } };                                         \
+    ndfunc_t ndf = { _iter_##fLapackFunc, NO_LOOP | NDF_EXTRACT, 2, 1, ain, aout };            \
+    struct _getri_option opt = { matrix_layout };                                              \
+    VALUE res = na_ndloop3(&ndf, &opt, 2, a_vnary, ipiv_vnary);                                \
+                                                                                               \
+    VALUE ret = rb_ary_new3(2, a_vnary, res);                                                  \
+                                                                                               \
+    RB_GC_GUARD(a_vnary);                                                                      \
+    RB_GC_GUARD(ipiv_vnary);                                                                   \
+    return ret;                                                                                \
   }
 DEF_LINALG_FUNC(double, numo_cDFloat, dgetri)