PyPI - pymmeans - Versions diffs - 0.1.0__tar.gz - Mend

pymmeans 0.1.0__tar.gz

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (186) hide show

pymmeans-0.1.0/.gitignore +62 -0
pymmeans-0.1.0/CHANGELOG.md +53 -0
pymmeans-0.1.0/CITATION.cff +62 -0
pymmeans-0.1.0/LICENSE +681 -0
pymmeans-0.1.0/PKG-INFO +294 -0
pymmeans-0.1.0/README.md +244 -0
pymmeans-0.1.0/benchmarks/bench_performance.py +597 -0
pymmeans-0.1.0/benchmarks/r_benchmark.R +85 -0
pymmeans-0.1.0/benchmarks/run_comparison.py +183 -0
pymmeans-0.1.0/docs/PERFORMANCE_REPORT.md +21 -0
pymmeans-0.1.0/docs/api/adapters.md +8 -0
pymmeans-0.1.0/docs/api/adjustments.md +3 -0
pymmeans-0.1.0/docs/api/cld.md +3 -0
pymmeans-0.1.0/docs/api/contrasts.md +3 -0
pymmeans-0.1.0/docs/api/diagnostics.md +3 -0
pymmeans-0.1.0/docs/api/emmeans.md +3 -0
pymmeans-0.1.0/docs/api/emtrends.md +3 -0
pymmeans-0.1.0/docs/api/joint.md +3 -0
pymmeans-0.1.0/docs/api/ml.md +3 -0
pymmeans-0.1.0/docs/api/multinom.md +3 -0
pymmeans-0.1.0/docs/api/options.md +3 -0
pymmeans-0.1.0/docs/api/ordinal.md +3 -0
pymmeans-0.1.0/docs/api/pbktest.md +3 -0
pymmeans-0.1.0/docs/api/pbmodcomp.md +3 -0
pymmeans-0.1.0/docs/api/plotting.md +3 -0
pymmeans-0.1.0/docs/api/posterior.md +3 -0
pymmeans-0.1.0/docs/api/pwpm.md +3 -0
pymmeans-0.1.0/docs/api/qdrg.md +3 -0
pymmeans-0.1.0/docs/api/ref_grid.md +3 -0
pymmeans-0.1.0/docs/api/satterthwaite.md +3 -0
pymmeans-0.1.0/docs/api/summary.md +3 -0
pymmeans-0.1.0/docs/api/summary_layer.md +10 -0
pymmeans-0.1.0/docs/api/survey.md +3 -0
pymmeans-0.1.0/docs/api/transforms.md +3 -0
pymmeans-0.1.0/docs/api/utils.md +3 -0
pymmeans-0.1.0/docs/example_interaction_plot.png +0 -0
pymmeans-0.1.0/docs/getting-started.md +149 -0
pymmeans-0.1.0/docs/index.md +42 -0
pymmeans-0.1.0/docs/r_parity_matrix.md +256 -0
pymmeans-0.1.0/docs/v0_2_roadmap.md +118 -0
pymmeans-0.1.0/docs/vs-r.md +122 -0
pymmeans-0.1.0/examples/basic_ols.py +52 -0
pymmeans-0.1.0/examples/glm_logistic.py +63 -0
pymmeans-0.1.0/examples/make_plot_artifact.py +56 -0
pymmeans-0.1.0/examples/pymmeans_showcase.html +9162 -0
pymmeans-0.1.0/examples/pymmeans_showcase.ipynb +1533 -0
pymmeans-0.1.0/mkdocs.yml +94 -0
pymmeans-0.1.0/pyproject.toml +136 -0
pymmeans-0.1.0/src/pymmeans/__init__.py +195 -0
pymmeans-0.1.0/src/pymmeans/adapters.py +212 -0
pymmeans-0.1.0/src/pymmeans/adjustments.py +668 -0
pymmeans-0.1.0/src/pymmeans/analytic.py +379 -0
pymmeans-0.1.0/src/pymmeans/cld.py +387 -0
pymmeans-0.1.0/src/pymmeans/contrasts.py +2148 -0
pymmeans-0.1.0/src/pymmeans/diagnostics.py +422 -0
pymmeans-0.1.0/src/pymmeans/emmeans.py +1358 -0
pymmeans-0.1.0/src/pymmeans/estimability.py +144 -0
pymmeans-0.1.0/src/pymmeans/joint.py +672 -0
pymmeans-0.1.0/src/pymmeans/ml.py +657 -0
pymmeans-0.1.0/src/pymmeans/multinom.py +376 -0
pymmeans-0.1.0/src/pymmeans/options.py +131 -0
pymmeans-0.1.0/src/pymmeans/ordinal.py +464 -0
pymmeans-0.1.0/src/pymmeans/pbktest.py +849 -0
pymmeans-0.1.0/src/pymmeans/pbmodcomp.py +663 -0
pymmeans-0.1.0/src/pymmeans/plotting.py +630 -0
pymmeans-0.1.0/src/pymmeans/posterior.py +564 -0
pymmeans-0.1.0/src/pymmeans/pwpm.py +261 -0
pymmeans-0.1.0/src/pymmeans/qdrg.py +270 -0
pymmeans-0.1.0/src/pymmeans/quantile.py +276 -0
pymmeans-0.1.0/src/pymmeans/ref_grid.py +324 -0
pymmeans-0.1.0/src/pymmeans/satterthwaite.py +1144 -0
pymmeans-0.1.0/src/pymmeans/summary.py +1527 -0
pymmeans-0.1.0/src/pymmeans/summary_layer.py +2212 -0
pymmeans-0.1.0/src/pymmeans/survey.py +458 -0
pymmeans-0.1.0/src/pymmeans/transforms.py +1538 -0
pymmeans-0.1.0/src/pymmeans/trends.py +272 -0
pymmeans-0.1.0/src/pymmeans/utils.py +972 -0
pymmeans-0.1.0/tests/conftest.py +11 -0
pymmeans-0.1.0/tests/r_reference/README.md +38 -0
pymmeans-0.1.0/tests/r_reference/afex_data.csv +121 -0
pymmeans-0.1.0/tests/r_reference/afex_emm_A_by_B.csv +7 -0
pymmeans-0.1.0/tests/r_reference/afex_joint_tests.csv +4 -0
pymmeans-0.1.0/tests/r_reference/afex_pairs_A_by_B.csv +4 -0
pymmeans-0.1.0/tests/r_reference/auto_noise_data.csv +37 -0
pymmeans-0.1.0/tests/r_reference/auto_noise_pairs_size_by_type.csv +7 -0
pymmeans-0.1.0/tests/r_reference/bias_adjust_data.csv +121 -0
pymmeans-0.1.0/tests/r_reference/bias_adjust_emm.csv +3 -0
pymmeans-0.1.0/tests/r_reference/cross_validation.R +188 -0
pymmeans-0.1.0/tests/r_reference/exposure_data.csv +21 -0
pymmeans-0.1.0/tests/r_reference/exposure_emm_response.csv +3 -0
pymmeans-0.1.0/tests/r_reference/generate_cv_data.py +230 -0
pymmeans-0.1.0/tests/r_reference/generate_r_reference.R +47 -0
pymmeans-0.1.0/tests/r_reference/kr_emm_df.csv +4 -0
pymmeans-0.1.0/tests/r_reference/kr_reference.R +90 -0
pymmeans-0.1.0/tests/r_reference/kr_reference.csv +4 -0
pymmeans-0.1.0/tests/r_reference/kr_reference_data.csv +161 -0
pymmeans-0.1.0/tests/r_reference/kr_reference_rs.csv +3 -0
pymmeans-0.1.0/tests/r_reference/kr_reference_rs_data.csv +181 -0
pymmeans-0.1.0/tests/r_reference/lme4_ri_data.csv +121 -0
pymmeans-0.1.0/tests/r_reference/lme4_ri_emm_kr.csv +3 -0
pymmeans-0.1.0/tests/r_reference/lme4_ri_emm_satt.csv +3 -0
pymmeans-0.1.0/tests/r_reference/lme4_ri_pairs_satt.csv +2 -0
pymmeans-0.1.0/tests/r_reference/lme4_ri_vcov_kr.csv +4 -0
pymmeans-0.1.0/tests/r_reference/lme4_rs_data.csv +241 -0
pymmeans-0.1.0/tests/r_reference/lme4_rs_emm_satt.csv +3 -0
pymmeans-0.1.0/tests/r_reference/marginal_data.csv +301 -0
pymmeans-0.1.0/tests/r_reference/marginal_emm_a.csv +4 -0
pymmeans-0.1.0/tests/r_reference/marginal_pairs_a.csv +4 -0
pymmeans-0.1.0/tests/r_reference/multinom_data.csv +501 -0
pymmeans-0.1.0/tests/r_reference/multinom_emm_latent.csv +10 -0
pymmeans-0.1.0/tests/r_reference/multinom_emm_prob.csv +10 -0
pymmeans-0.1.0/tests/r_reference/multinom_reference.R +34 -0
pymmeans-0.1.0/tests/r_reference/neuralgia_data.csv +61 -0
pymmeans-0.1.0/tests/r_reference/neuralgia_emm_treatment_response.csv +4 -0
pymmeans-0.1.0/tests/r_reference/oats_data.csv +73 -0
pymmeans-0.1.0/tests/r_reference/oats_emm_nitro.csv +5 -0
pymmeans-0.1.0/tests/r_reference/ordinal_data.csv +501 -0
pymmeans-0.1.0/tests/r_reference/ordinal_emm_cumprob.csv +7 -0
pymmeans-0.1.0/tests/r_reference/ordinal_emm_latent.csv +4 -0
pymmeans-0.1.0/tests/r_reference/ordinal_emm_meanclass.csv +4 -0
pymmeans-0.1.0/tests/r_reference/ordinal_emm_prob.csv +10 -0
pymmeans-0.1.0/tests/r_reference/ordinal_reference.R +63 -0
pymmeans-0.1.0/tests/r_reference/pbkrtest_ftests.R +112 -0
pymmeans-0.1.0/tests/r_reference/pbkrtest_ftests.csv +5 -0
pymmeans-0.1.0/tests/r_reference/pbkrtest_ftests_data.csv +181 -0
pymmeans-0.1.0/tests/r_reference/pbmodcomp_data.csv +181 -0
pymmeans-0.1.0/tests/r_reference/pbmodcomp_lrt_dist.csv +5001 -0
pymmeans-0.1.0/tests/r_reference/pbmodcomp_reference.R +61 -0
pymmeans-0.1.0/tests/r_reference/pbmodcomp_summary.csv +6 -0
pymmeans-0.1.0/tests/r_reference/pigs_data.csv +30 -0
pymmeans-0.1.0/tests/r_reference/pigs_emm_source.csv +4 -0
pymmeans-0.1.0/tests/r_reference/pigs_pairs_source.csv +4 -0
pymmeans-0.1.0/tests/r_reference/splines_data.csv +101 -0
pymmeans-0.1.0/tests/r_reference/splines_emm_bs_g.csv +4 -0
pymmeans-0.1.0/tests/r_reference/splines_emm_bs_gx.csv +10 -0
pymmeans-0.1.0/tests/r_reference/splines_emm_bs_interact.csv +10 -0
pymmeans-0.1.0/tests/r_reference/splines_reference.R +48 -0
pymmeans-0.1.0/tests/r_reference/spray_emm.csv +7 -0
pymmeans-0.1.0/tests/r_reference/spray_pairs.csv +16 -0
pymmeans-0.1.0/tests/r_reference/survey_binomial_coef.csv +4 -0
pymmeans-0.1.0/tests/r_reference/survey_binomial_data.csv +251 -0
pymmeans-0.1.0/tests/r_reference/survey_binomial_emm.csv +3 -0
pymmeans-0.1.0/tests/r_reference/survey_gamma_coef.csv +5 -0
pymmeans-0.1.0/tests/r_reference/survey_gamma_data.csv +251 -0
pymmeans-0.1.0/tests/r_reference/survey_gamma_emm.csv +4 -0
pymmeans-0.1.0/tests/r_reference/survey_poisson_coef.csv +5 -0
pymmeans-0.1.0/tests/r_reference/survey_poisson_data.csv +301 -0
pymmeans-0.1.0/tests/r_reference/survey_poisson_emm.csv +4 -0
pymmeans-0.1.0/tests/r_reference/survey_srs_coef.csv +5 -0
pymmeans-0.1.0/tests/r_reference/survey_srs_data.csv +201 -0
pymmeans-0.1.0/tests/r_reference/survey_srs_emm.csv +4 -0
pymmeans-0.1.0/tests/r_reference/tooth_emm_supp_by_dose.csv +7 -0
pymmeans-0.1.0/tests/r_reference/ucla_mouse.csv +1201 -0
pymmeans-0.1.0/tests/r_reference/warp_emm_tension_by_wool.csv +7 -0
pymmeans-0.1.0/tests/r_reference/warp_pairs_tension_by_wool.csv +7 -0
pymmeans-0.1.0/tests/test_adapters.py +155 -0
pymmeans-0.1.0/tests/test_adjustments.py +167 -0
pymmeans-0.1.0/tests/test_analytic.py +139 -0
pymmeans-0.1.0/tests/test_contrasts.py +304 -0
pymmeans-0.1.0/tests/test_diagnostics.py +163 -0
pymmeans-0.1.0/tests/test_emmeans.py +302 -0
pymmeans-0.1.0/tests/test_estimability.py +77 -0
pymmeans-0.1.0/tests/test_formula_expressions.py +132 -0
pymmeans-0.1.0/tests/test_joint.py +93 -0
pymmeans-0.1.0/tests/test_linearmodels.py +71 -0
pymmeans-0.1.0/tests/test_mixedlm.py +67 -0
pymmeans-0.1.0/tests/test_multinom.py +180 -0
pymmeans-0.1.0/tests/test_ordinal.py +234 -0
pymmeans-0.1.0/tests/test_pbktest.py +412 -0
pymmeans-0.1.0/tests/test_pbmodcomp.py +555 -0
pymmeans-0.1.0/tests/test_plotting.py +110 -0
pymmeans-0.1.0/tests/test_posterior.py +194 -0
pymmeans-0.1.0/tests/test_qdrg.py +151 -0
pymmeans-0.1.0/tests/test_quantile.py +153 -0
pymmeans-0.1.0/tests/test_r_benchmark.py +440 -0
pymmeans-0.1.0/tests/test_r_parity.py +151 -0
pymmeans-0.1.0/tests/test_ref_grid.py +138 -0
pymmeans-0.1.0/tests/test_satterthwaite.py +195 -0
pymmeans-0.1.0/tests/test_splines.py +273 -0
pymmeans-0.1.0/tests/test_summary.py +101 -0
pymmeans-0.1.0/tests/test_survey.py +180 -0
pymmeans-0.1.0/tests/test_transforms.py +188 -0
pymmeans-0.1.0/tests/test_trends.py +104 -0
pymmeans-0.1.0/tests/test_utils.py +118 -0
pymmeans-0.1.0/tests/test_vs_r.py +212 -0
pymmeans-0.1.0/tests/test_weights.py +148 -0

pymmeans-0.1.0/.gitignore ADDED Viewed

@@ -0,0 +1,62 @@
+# Python
+__pycache__/
+*.py[cod]
+*$py.class
+*.so
+.Python
+build/
+dist/
+*.egg-info/
+*.egg
+.eggs/
+# Virtual envs
+.venv/
+venv/
+env/
+# Test / coverage
+.pytest_cache/
+.coverage
+.coverage.*
+htmlcov/
+.tox/
+.mypy_cache/
+.ruff_cache/
+# Editors / OS
+.idea/
+.vscode/
+.DS_Store
+*.swp
+*~
+.Trash-*
+# Jupyter checkpoint dirs
+.ipynb_checkpoints/
+*/.ipynb_checkpoints/
+# Docs build (mkdocs writes to ./site, sphinx to docs/_build)
+docs/_build/
+site/
+.mkdocs_cache/
+# Benchmarks output
+benchmarks/r_results.csv
+benchmarks/PERFORMANCE_REPORT.md
+# Internal dev docs (kept locally; not published)
+docs/pymmeans_project_plan.md
+docs/v0_1_limits.md
+# JSS manuscript (separate publication track)
+paper/
+# Internal-only test file (regression guards from a long iterative
+# development cycle; kept locally for the maintainer, omitted from
+# the public surface)
+tests/test_audit_regressions.py
+# Package-manager lockfile (this is a library, not an application;
+# end-users install via pip with their own resolver)
+uv.lock

pymmeans-0.1.0/CHANGELOG.md ADDED Viewed

@@ -0,0 +1,53 @@
+# Changelog
+All notable changes to `pymmeans` will be documented in this file.
+The format follows [Keep a Changelog](https://keepachangelog.com/en/1.1.0/);
+this project adheres to [Semantic Versioning](https://semver.org/spec/v2.0.0.html).
+## [0.1.0] — 2026-05-25
+Initial release.
+### Added
+- Reference-grid construction (`ref_grid`) and estimated marginal means
+  extraction (`emmeans`, `lsmeans`) for fitted `statsmodels` models,
+  `linearmodels` panel / IV results, and any user-supplied
+  `predict_fn(data) -> ndarray` callable.
+- Pairwise contrasts (`pairs`), generic linear contrasts (`contrast`),
+  compact letter displays (`cld`), and pairwise p-value matrices
+  (`pwpm`).
+- Multiplicity adjustments: Tukey HSD (exact studentised-range
+  integral), Dunnett (exact via the multivariate-_t_ CDF), Šidák,
+  Bonferroni, Holm, Benjamini–Hochberg FDR, and the generic `mvt`
+  integral.
+- Small-sample mixed-model inference: `apply_satterthwaite`,
+  `apply_kenward_roger`, plus the six headline `pbkrtest`
+  equivalents (`kenward_roger_vcov`, `get_kr`, `ddf_lb`, `krmodcomp`,
+  `satmodcomp`, `pbmodcomp`).
+- Response-scale back-transformation (`type="response"`) for
+  GLM-style links, including bias-adjusted estimates for log links.
+- Bootstrap (`bootstrap_ci`, both parametric and case-resampling)
+  and permutation tests (`permutation_test`).
+- Bayesian-posterior EMMs via `from_pymc` / `posterior_emmeans` /
+  `posterior_emm_summary` (optional `arviz` / `PyMC` integration).
+- Survey-weighted EMMs via `from_survey` (Lumley-style designs).
+- ML adapter (`from_predict`, `ml_emmeans`, `ml_pairs`,
+  `ml_contrast`) for tree ensembles, gradient-boosted models, neural
+  networks, and any other `.predict()`-capable estimator.
+- `emtrends` for derivatives of the regression surface at focal points.
+- `OrderedModel` (cumulative-link ordinal) and `MNLogit` (multinomial
+  logit) support.
+### Tested
+- 858 unit tests against `statsmodels`, `linearmodels`,
+  `scikit-learn`, `xgboost`, `lightgbm`, `PyTorch`, `survey`, and
+  R-side reference values from `emmeans`, `lme4` + `lmerTest`,
+  `pbkrtest`, `marginaleffects`, and `survey`.
+- R parity tolerances range from `atol < 1e-7` (survey-weighted
+  Gaussian) to `atol < 1e-3` (finite-difference Satterthwaite df);
+  the six `pbkrtest` equivalents match the R reference at
+  `atol < 1e-5` on identical $\hat\theta$ inputs.

pymmeans-0.1.0/CITATION.cff ADDED Viewed

@@ -0,0 +1,62 @@
+cff-version: 1.2.0
+message: "If you use pymmeans in your research, please cite it as below."
+title: "pymmeans: Estimated marginal means for Python"
+abstract: >
+  pymmeans is a native-Python implementation of R's emmeans package
+  (Lenth 2024) for estimated marginal means (EMMs), pairwise and
+  custom contrasts, and multiplicity adjustments on fitted statistical
+  models. It supports statsmodels OLS / GLM / MixedLM / GEE / Cox /
+  BetaModel, the linearmodels panel and IV result classes, and any
+  prediction-only model with a ``.predict()`` method via a
+  beyond-R-parity ML adapter (g-computation / prediction-surface
+  averaging). The implementation uses an analytic Kronecker-product
+  marginalisation (no grid materialisation) so EMMs on designs with
+  500K-row to 46M-row reference grids run in milliseconds where R
+  emmeans refuses or runs out of memory. Inference paths include
+  Wald, Satterthwaite, Kenward-Roger (Kackar-Harville), parametric
+  bootstrap, non-parametric case bootstrap with refit, permutation
+  testing with Phipson-Smyth correction, and Bayesian / posterior
+  draws.
+authors:
+  - family-names: Turner
+    given-names: Jason
+    email: jason.s.turner@gmail.com
+version: 0.1.0
+date-released: 2026-05-25
+license: GPL-3.0-or-later
+repository-code: "https://github.com/jturner-uofl/pymmeans"
+url: "https://github.com/jturner-uofl/pymmeans"
+type: software
+keywords:
+  - estimated marginal means
+  - emmeans
+  - least-squares means
+  - lsmeans
+  - linear models
+  - mixed-effects models
+  - generalized linear models
+  - multiplicity adjustment
+  - Satterthwaite degrees of freedom
+  - Kenward-Roger correction
+  - bootstrap inference
+  - g-computation
+  - statsmodels
+  - Python
+references:
+  - type: article
+    title: "Least-squares means: the R package lsmeans"
+    authors:
+      - family-names: Lenth
+        given-names: Russell V.
+    year: 2016
+    journal: "Journal of Statistical Software"
+    volume: 69
+    issue: 1
+    doi: 10.18637/jss.v069.i01
+  - type: software
+    title: "emmeans: Estimated marginal means, aka least-squares means"
+    authors:
+      - family-names: Lenth
+        given-names: Russell V.
+    year: 2024
+    url: "https://cran.r-project.org/package=emmeans"