npm - @synsci/cli-darwin-x64 - Versions diffs - 1.1.49 - Mend

@synsci/cli-darwin-x64 1.1.49

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (373) hide show

package/bin/skills/accelerate/SKILL.md +332 -0
package/bin/skills/accelerate/references/custom-plugins.md +453 -0
package/bin/skills/accelerate/references/megatron-integration.md +489 -0
package/bin/skills/accelerate/references/performance.md +525 -0
package/bin/skills/audiocraft/SKILL.md +564 -0
package/bin/skills/audiocraft/references/advanced-usage.md +666 -0
package/bin/skills/audiocraft/references/troubleshooting.md +504 -0
package/bin/skills/autogpt/SKILL.md +403 -0
package/bin/skills/autogpt/references/advanced-usage.md +535 -0
package/bin/skills/autogpt/references/troubleshooting.md +420 -0
package/bin/skills/awq/SKILL.md +310 -0
package/bin/skills/awq/references/advanced-usage.md +324 -0
package/bin/skills/awq/references/troubleshooting.md +344 -0
package/bin/skills/axolotl/SKILL.md +158 -0
package/bin/skills/axolotl/references/api.md +5548 -0
package/bin/skills/axolotl/references/dataset-formats.md +1029 -0
package/bin/skills/axolotl/references/index.md +15 -0
package/bin/skills/axolotl/references/other.md +3563 -0
package/bin/skills/bigcode-evaluation-harness/SKILL.md +405 -0
package/bin/skills/bigcode-evaluation-harness/references/benchmarks.md +393 -0
package/bin/skills/bigcode-evaluation-harness/references/custom-tasks.md +424 -0
package/bin/skills/bigcode-evaluation-harness/references/issues.md +394 -0
package/bin/skills/bitsandbytes/SKILL.md +411 -0
package/bin/skills/bitsandbytes/references/memory-optimization.md +521 -0
package/bin/skills/bitsandbytes/references/qlora-training.md +521 -0
package/bin/skills/bitsandbytes/references/quantization-formats.md +447 -0
package/bin/skills/blip-2/SKILL.md +564 -0
package/bin/skills/blip-2/references/advanced-usage.md +680 -0
package/bin/skills/blip-2/references/troubleshooting.md +526 -0
package/bin/skills/chroma/SKILL.md +406 -0
package/bin/skills/chroma/references/integration.md +38 -0
package/bin/skills/clip/SKILL.md +253 -0
package/bin/skills/clip/references/applications.md +207 -0
package/bin/skills/constitutional-ai/SKILL.md +290 -0
package/bin/skills/crewai/SKILL.md +498 -0
package/bin/skills/crewai/references/flows.md +438 -0
package/bin/skills/crewai/references/tools.md +429 -0
package/bin/skills/crewai/references/troubleshooting.md +480 -0
package/bin/skills/deepspeed/SKILL.md +141 -0
package/bin/skills/deepspeed/references/08.md +17 -0
package/bin/skills/deepspeed/references/09.md +173 -0
package/bin/skills/deepspeed/references/2020.md +378 -0
package/bin/skills/deepspeed/references/2023.md +279 -0
package/bin/skills/deepspeed/references/assets.md +179 -0
package/bin/skills/deepspeed/references/index.md +35 -0
package/bin/skills/deepspeed/references/mii.md +118 -0
package/bin/skills/deepspeed/references/other.md +1191 -0
package/bin/skills/deepspeed/references/tutorials.md +6554 -0
package/bin/skills/dspy/SKILL.md +590 -0
package/bin/skills/dspy/references/examples.md +663 -0
package/bin/skills/dspy/references/modules.md +475 -0
package/bin/skills/dspy/references/optimizers.md +566 -0
package/bin/skills/faiss/SKILL.md +221 -0
package/bin/skills/faiss/references/index_types.md +280 -0
package/bin/skills/flash-attention/SKILL.md +367 -0
package/bin/skills/flash-attention/references/benchmarks.md +215 -0
package/bin/skills/flash-attention/references/transformers-integration.md +293 -0
package/bin/skills/gguf/SKILL.md +427 -0
package/bin/skills/gguf/references/advanced-usage.md +504 -0
package/bin/skills/gguf/references/troubleshooting.md +442 -0
package/bin/skills/gptq/SKILL.md +450 -0
package/bin/skills/gptq/references/calibration.md +337 -0
package/bin/skills/gptq/references/integration.md +129 -0
package/bin/skills/gptq/references/troubleshooting.md +95 -0
package/bin/skills/grpo-rl-training/README.md +97 -0
package/bin/skills/grpo-rl-training/SKILL.md +572 -0
package/bin/skills/grpo-rl-training/examples/reward_functions_library.py +393 -0
package/bin/skills/grpo-rl-training/templates/basic_grpo_training.py +228 -0
package/bin/skills/guidance/SKILL.md +572 -0
package/bin/skills/guidance/references/backends.md +554 -0
package/bin/skills/guidance/references/constraints.md +674 -0
package/bin/skills/guidance/references/examples.md +767 -0
package/bin/skills/hqq/SKILL.md +445 -0
package/bin/skills/hqq/references/advanced-usage.md +528 -0
package/bin/skills/hqq/references/troubleshooting.md +503 -0
package/bin/skills/hugging-face-cli/SKILL.md +191 -0
package/bin/skills/hugging-face-cli/references/commands.md +954 -0
package/bin/skills/hugging-face-cli/references/examples.md +374 -0
package/bin/skills/hugging-face-datasets/SKILL.md +547 -0
package/bin/skills/hugging-face-datasets/examples/diverse_training_examples.json +239 -0
package/bin/skills/hugging-face-datasets/examples/system_prompt_template.txt +196 -0
package/bin/skills/hugging-face-datasets/examples/training_examples.json +176 -0
package/bin/skills/hugging-face-datasets/scripts/dataset_manager.py +522 -0
package/bin/skills/hugging-face-datasets/scripts/sql_manager.py +844 -0
package/bin/skills/hugging-face-datasets/templates/chat.json +55 -0
package/bin/skills/hugging-face-datasets/templates/classification.json +62 -0
package/bin/skills/hugging-face-datasets/templates/completion.json +51 -0
package/bin/skills/hugging-face-datasets/templates/custom.json +75 -0
package/bin/skills/hugging-face-datasets/templates/qa.json +54 -0
package/bin/skills/hugging-face-datasets/templates/tabular.json +81 -0
package/bin/skills/hugging-face-evaluation/SKILL.md +656 -0
package/bin/skills/hugging-face-evaluation/examples/USAGE_EXAMPLES.md +382 -0
package/bin/skills/hugging-face-evaluation/examples/artificial_analysis_to_hub.py +141 -0
package/bin/skills/hugging-face-evaluation/examples/example_readme_tables.md +135 -0
package/bin/skills/hugging-face-evaluation/examples/metric_mapping.json +50 -0
package/bin/skills/hugging-face-evaluation/requirements.txt +20 -0
package/bin/skills/hugging-face-evaluation/scripts/evaluation_manager.py +1374 -0
package/bin/skills/hugging-face-evaluation/scripts/inspect_eval_uv.py +104 -0
package/bin/skills/hugging-face-evaluation/scripts/inspect_vllm_uv.py +317 -0
package/bin/skills/hugging-face-evaluation/scripts/lighteval_vllm_uv.py +303 -0
package/bin/skills/hugging-face-evaluation/scripts/run_eval_job.py +98 -0
package/bin/skills/hugging-face-evaluation/scripts/run_vllm_eval_job.py +331 -0
package/bin/skills/hugging-face-evaluation/scripts/test_extraction.py +206 -0
package/bin/skills/hugging-face-jobs/SKILL.md +1041 -0
package/bin/skills/hugging-face-jobs/index.html +216 -0
package/bin/skills/hugging-face-jobs/references/hardware_guide.md +336 -0
package/bin/skills/hugging-face-jobs/references/hub_saving.md +352 -0
package/bin/skills/hugging-face-jobs/references/token_usage.md +546 -0
package/bin/skills/hugging-face-jobs/references/troubleshooting.md +475 -0
package/bin/skills/hugging-face-jobs/scripts/cot-self-instruct.py +718 -0
package/bin/skills/hugging-face-jobs/scripts/finepdfs-stats.py +546 -0
package/bin/skills/hugging-face-jobs/scripts/generate-responses.py +587 -0
package/bin/skills/hugging-face-model-trainer/SKILL.md +711 -0
package/bin/skills/hugging-face-model-trainer/references/gguf_conversion.md +296 -0
package/bin/skills/hugging-face-model-trainer/references/hardware_guide.md +283 -0
package/bin/skills/hugging-face-model-trainer/references/hub_saving.md +364 -0
package/bin/skills/hugging-face-model-trainer/references/reliability_principles.md +371 -0
package/bin/skills/hugging-face-model-trainer/references/trackio_guide.md +189 -0
package/bin/skills/hugging-face-model-trainer/references/training_methods.md +150 -0
package/bin/skills/hugging-face-model-trainer/references/training_patterns.md +203 -0
package/bin/skills/hugging-face-model-trainer/references/troubleshooting.md +282 -0
package/bin/skills/hugging-face-model-trainer/scripts/convert_to_gguf.py +424 -0
package/bin/skills/hugging-face-model-trainer/scripts/dataset_inspector.py +417 -0
package/bin/skills/hugging-face-model-trainer/scripts/estimate_cost.py +150 -0
package/bin/skills/hugging-face-model-trainer/scripts/train_dpo_example.py +106 -0
package/bin/skills/hugging-face-model-trainer/scripts/train_grpo_example.py +89 -0
package/bin/skills/hugging-face-model-trainer/scripts/train_sft_example.py +122 -0
package/bin/skills/hugging-face-paper-publisher/SKILL.md +627 -0
package/bin/skills/hugging-face-paper-publisher/examples/example_usage.md +327 -0
package/bin/skills/hugging-face-paper-publisher/references/quick_reference.md +216 -0
package/bin/skills/hugging-face-paper-publisher/scripts/paper_manager.py +508 -0
package/bin/skills/hugging-face-paper-publisher/templates/arxiv.md +299 -0
package/bin/skills/hugging-face-paper-publisher/templates/ml-report.md +358 -0
package/bin/skills/hugging-face-paper-publisher/templates/modern.md +319 -0
package/bin/skills/hugging-face-paper-publisher/templates/standard.md +201 -0
package/bin/skills/hugging-face-tool-builder/SKILL.md +115 -0
package/bin/skills/hugging-face-tool-builder/references/baseline_hf_api.py +57 -0
package/bin/skills/hugging-face-tool-builder/references/baseline_hf_api.sh +40 -0
package/bin/skills/hugging-face-tool-builder/references/baseline_hf_api.tsx +57 -0
package/bin/skills/hugging-face-tool-builder/references/find_models_by_paper.sh +230 -0
package/bin/skills/hugging-face-tool-builder/references/hf_enrich_models.sh +96 -0
package/bin/skills/hugging-face-tool-builder/references/hf_model_card_frontmatter.sh +188 -0
package/bin/skills/hugging-face-tool-builder/references/hf_model_papers_auth.sh +171 -0
package/bin/skills/hugging-face-trackio/SKILL.md +65 -0
package/bin/skills/hugging-face-trackio/references/logging_metrics.md +206 -0
package/bin/skills/hugging-face-trackio/references/retrieving_metrics.md +223 -0
package/bin/skills/huggingface-tokenizers/SKILL.md +516 -0
package/bin/skills/huggingface-tokenizers/references/algorithms.md +653 -0
package/bin/skills/huggingface-tokenizers/references/integration.md +637 -0
package/bin/skills/huggingface-tokenizers/references/pipeline.md +723 -0
package/bin/skills/huggingface-tokenizers/references/training.md +565 -0
package/bin/skills/instructor/SKILL.md +740 -0
package/bin/skills/instructor/references/examples.md +107 -0
package/bin/skills/instructor/references/providers.md +70 -0
package/bin/skills/instructor/references/validation.md +606 -0
package/bin/skills/knowledge-distillation/SKILL.md +458 -0
package/bin/skills/knowledge-distillation/references/minillm.md +334 -0
package/bin/skills/lambda-labs/SKILL.md +545 -0
package/bin/skills/lambda-labs/references/advanced-usage.md +611 -0
package/bin/skills/lambda-labs/references/troubleshooting.md +530 -0
package/bin/skills/langchain/SKILL.md +480 -0
package/bin/skills/langchain/references/agents.md +499 -0
package/bin/skills/langchain/references/integration.md +562 -0
package/bin/skills/langchain/references/rag.md +600 -0
package/bin/skills/langsmith/SKILL.md +422 -0
package/bin/skills/langsmith/references/advanced-usage.md +548 -0
package/bin/skills/langsmith/references/troubleshooting.md +537 -0
package/bin/skills/litgpt/SKILL.md +469 -0
package/bin/skills/litgpt/references/custom-models.md +568 -0
package/bin/skills/litgpt/references/distributed-training.md +451 -0
package/bin/skills/litgpt/references/supported-models.md +336 -0
package/bin/skills/litgpt/references/training-recipes.md +619 -0
package/bin/skills/llama-cpp/SKILL.md +258 -0
package/bin/skills/llama-cpp/references/optimization.md +89 -0
package/bin/skills/llama-cpp/references/quantization.md +213 -0
package/bin/skills/llama-cpp/references/server.md +125 -0
package/bin/skills/llama-factory/SKILL.md +80 -0
package/bin/skills/llama-factory/references/_images.md +23 -0
package/bin/skills/llama-factory/references/advanced.md +1055 -0
package/bin/skills/llama-factory/references/getting_started.md +349 -0
package/bin/skills/llama-factory/references/index.md +19 -0
package/bin/skills/llama-factory/references/other.md +31 -0
package/bin/skills/llamaguard/SKILL.md +337 -0
package/bin/skills/llamaindex/SKILL.md +569 -0
package/bin/skills/llamaindex/references/agents.md +83 -0
package/bin/skills/llamaindex/references/data_connectors.md +108 -0
package/bin/skills/llamaindex/references/query_engines.md +406 -0
package/bin/skills/llava/SKILL.md +304 -0
package/bin/skills/llava/references/training.md +197 -0
package/bin/skills/lm-evaluation-harness/SKILL.md +490 -0
package/bin/skills/lm-evaluation-harness/references/api-evaluation.md +490 -0
package/bin/skills/lm-evaluation-harness/references/benchmark-guide.md +488 -0
package/bin/skills/lm-evaluation-harness/references/custom-tasks.md +602 -0
package/bin/skills/lm-evaluation-harness/references/distributed-eval.md +519 -0
package/bin/skills/long-context/SKILL.md +536 -0
package/bin/skills/long-context/references/extension_methods.md +468 -0
package/bin/skills/long-context/references/fine_tuning.md +611 -0
package/bin/skills/long-context/references/rope.md +402 -0
package/bin/skills/mamba/SKILL.md +260 -0
package/bin/skills/mamba/references/architecture-details.md +206 -0
package/bin/skills/mamba/references/benchmarks.md +255 -0
package/bin/skills/mamba/references/training-guide.md +388 -0
package/bin/skills/megatron-core/SKILL.md +366 -0
package/bin/skills/megatron-core/references/benchmarks.md +249 -0
package/bin/skills/megatron-core/references/parallelism-guide.md +404 -0
package/bin/skills/megatron-core/references/production-examples.md +473 -0
package/bin/skills/megatron-core/references/training-recipes.md +547 -0
package/bin/skills/miles/SKILL.md +315 -0
package/bin/skills/miles/references/api-reference.md +141 -0
package/bin/skills/miles/references/troubleshooting.md +352 -0
package/bin/skills/mlflow/SKILL.md +704 -0
package/bin/skills/mlflow/references/deployment.md +744 -0
package/bin/skills/mlflow/references/model-registry.md +770 -0
package/bin/skills/mlflow/references/tracking.md +680 -0
package/bin/skills/modal/SKILL.md +341 -0
package/bin/skills/modal/references/advanced-usage.md +503 -0
package/bin/skills/modal/references/troubleshooting.md +494 -0
package/bin/skills/model-merging/SKILL.md +539 -0
package/bin/skills/model-merging/references/evaluation.md +462 -0
package/bin/skills/model-merging/references/examples.md +428 -0
package/bin/skills/model-merging/references/methods.md +352 -0
package/bin/skills/model-pruning/SKILL.md +495 -0
package/bin/skills/model-pruning/references/wanda.md +347 -0
package/bin/skills/moe-training/SKILL.md +526 -0
package/bin/skills/moe-training/references/architectures.md +432 -0
package/bin/skills/moe-training/references/inference.md +348 -0
package/bin/skills/moe-training/references/training.md +425 -0
package/bin/skills/nanogpt/SKILL.md +290 -0
package/bin/skills/nanogpt/references/architecture.md +382 -0
package/bin/skills/nanogpt/references/data.md +476 -0
package/bin/skills/nanogpt/references/training.md +564 -0
package/bin/skills/nemo-curator/SKILL.md +383 -0
package/bin/skills/nemo-curator/references/deduplication.md +87 -0
package/bin/skills/nemo-curator/references/filtering.md +102 -0
package/bin/skills/nemo-evaluator/SKILL.md +494 -0
package/bin/skills/nemo-evaluator/references/adapter-system.md +340 -0
package/bin/skills/nemo-evaluator/references/configuration.md +447 -0
package/bin/skills/nemo-evaluator/references/custom-benchmarks.md +315 -0
package/bin/skills/nemo-evaluator/references/execution-backends.md +361 -0
package/bin/skills/nemo-guardrails/SKILL.md +297 -0
package/bin/skills/nnsight/SKILL.md +436 -0
package/bin/skills/nnsight/references/README.md +78 -0
package/bin/skills/nnsight/references/api.md +344 -0
package/bin/skills/nnsight/references/tutorials.md +300 -0
package/bin/skills/openrlhf/SKILL.md +249 -0
package/bin/skills/openrlhf/references/algorithm-comparison.md +404 -0
package/bin/skills/openrlhf/references/custom-rewards.md +530 -0
package/bin/skills/openrlhf/references/hybrid-engine.md +287 -0
package/bin/skills/openrlhf/references/multi-node-training.md +454 -0
package/bin/skills/outlines/SKILL.md +652 -0
package/bin/skills/outlines/references/backends.md +615 -0
package/bin/skills/outlines/references/examples.md +773 -0
package/bin/skills/outlines/references/json_generation.md +652 -0
package/bin/skills/peft/SKILL.md +431 -0
package/bin/skills/peft/references/advanced-usage.md +514 -0
package/bin/skills/peft/references/troubleshooting.md +480 -0
package/bin/skills/phoenix/SKILL.md +475 -0
package/bin/skills/phoenix/references/advanced-usage.md +619 -0
package/bin/skills/phoenix/references/troubleshooting.md +538 -0
package/bin/skills/pinecone/SKILL.md +358 -0
package/bin/skills/pinecone/references/deployment.md +181 -0
package/bin/skills/pytorch-fsdp/SKILL.md +126 -0
package/bin/skills/pytorch-fsdp/references/index.md +7 -0
package/bin/skills/pytorch-fsdp/references/other.md +4249 -0
package/bin/skills/pytorch-lightning/SKILL.md +346 -0
package/bin/skills/pytorch-lightning/references/callbacks.md +436 -0
package/bin/skills/pytorch-lightning/references/distributed.md +490 -0
package/bin/skills/pytorch-lightning/references/hyperparameter-tuning.md +556 -0
package/bin/skills/pyvene/SKILL.md +473 -0
package/bin/skills/pyvene/references/README.md +73 -0
package/bin/skills/pyvene/references/api.md +383 -0
package/bin/skills/pyvene/references/tutorials.md +376 -0
package/bin/skills/qdrant/SKILL.md +493 -0
package/bin/skills/qdrant/references/advanced-usage.md +648 -0
package/bin/skills/qdrant/references/troubleshooting.md +631 -0
package/bin/skills/ray-data/SKILL.md +326 -0
package/bin/skills/ray-data/references/integration.md +82 -0
package/bin/skills/ray-data/references/transformations.md +83 -0
package/bin/skills/ray-train/SKILL.md +406 -0
package/bin/skills/ray-train/references/multi-node.md +628 -0
package/bin/skills/rwkv/SKILL.md +260 -0
package/bin/skills/rwkv/references/architecture-details.md +344 -0
package/bin/skills/rwkv/references/rwkv7.md +386 -0
package/bin/skills/rwkv/references/state-management.md +369 -0
package/bin/skills/saelens/SKILL.md +386 -0
package/bin/skills/saelens/references/README.md +70 -0
package/bin/skills/saelens/references/api.md +333 -0
package/bin/skills/saelens/references/tutorials.md +318 -0
package/bin/skills/segment-anything/SKILL.md +500 -0
package/bin/skills/segment-anything/references/advanced-usage.md +589 -0
package/bin/skills/segment-anything/references/troubleshooting.md +484 -0
package/bin/skills/sentence-transformers/SKILL.md +255 -0
package/bin/skills/sentence-transformers/references/models.md +123 -0
package/bin/skills/sentencepiece/SKILL.md +235 -0
package/bin/skills/sentencepiece/references/algorithms.md +200 -0
package/bin/skills/sentencepiece/references/training.md +304 -0
package/bin/skills/sglang/SKILL.md +442 -0
package/bin/skills/sglang/references/deployment.md +490 -0
package/bin/skills/sglang/references/radix-attention.md +413 -0
package/bin/skills/sglang/references/structured-generation.md +541 -0
package/bin/skills/simpo/SKILL.md +219 -0
package/bin/skills/simpo/references/datasets.md +478 -0
package/bin/skills/simpo/references/hyperparameters.md +452 -0
package/bin/skills/simpo/references/loss-functions.md +350 -0
package/bin/skills/skypilot/SKILL.md +509 -0
package/bin/skills/skypilot/references/advanced-usage.md +491 -0
package/bin/skills/skypilot/references/troubleshooting.md +570 -0
package/bin/skills/slime/SKILL.md +464 -0
package/bin/skills/slime/references/api-reference.md +392 -0
package/bin/skills/slime/references/troubleshooting.md +386 -0
package/bin/skills/speculative-decoding/SKILL.md +467 -0
package/bin/skills/speculative-decoding/references/lookahead.md +309 -0
package/bin/skills/speculative-decoding/references/medusa.md +350 -0
package/bin/skills/stable-diffusion/SKILL.md +519 -0
package/bin/skills/stable-diffusion/references/advanced-usage.md +716 -0
package/bin/skills/stable-diffusion/references/troubleshooting.md +555 -0
package/bin/skills/tensorboard/SKILL.md +629 -0
package/bin/skills/tensorboard/references/integrations.md +638 -0
package/bin/skills/tensorboard/references/profiling.md +545 -0
package/bin/skills/tensorboard/references/visualization.md +620 -0
package/bin/skills/tensorrt-llm/SKILL.md +187 -0
package/bin/skills/tensorrt-llm/references/multi-gpu.md +298 -0
package/bin/skills/tensorrt-llm/references/optimization.md +242 -0
package/bin/skills/tensorrt-llm/references/serving.md +470 -0
package/bin/skills/tinker/SKILL.md +362 -0
package/bin/skills/tinker/references/api-reference.md +168 -0
package/bin/skills/tinker/references/getting-started.md +157 -0
package/bin/skills/tinker/references/loss-functions.md +163 -0
package/bin/skills/tinker/references/models-and-lora.md +139 -0
package/bin/skills/tinker/references/recipes.md +280 -0
package/bin/skills/tinker/references/reinforcement-learning.md +212 -0
package/bin/skills/tinker/references/rendering.md +243 -0
package/bin/skills/tinker/references/supervised-learning.md +232 -0
package/bin/skills/tinker-training-cost/SKILL.md +187 -0
package/bin/skills/tinker-training-cost/scripts/calculate_cost.py +123 -0
package/bin/skills/torchforge/SKILL.md +433 -0
package/bin/skills/torchforge/references/api-reference.md +327 -0
package/bin/skills/torchforge/references/troubleshooting.md +409 -0
package/bin/skills/torchtitan/SKILL.md +358 -0
package/bin/skills/torchtitan/references/checkpoint.md +181 -0
package/bin/skills/torchtitan/references/custom-models.md +258 -0
package/bin/skills/torchtitan/references/float8.md +133 -0
package/bin/skills/torchtitan/references/fsdp.md +126 -0
package/bin/skills/transformer-lens/SKILL.md +346 -0
package/bin/skills/transformer-lens/references/README.md +54 -0
package/bin/skills/transformer-lens/references/api.md +362 -0
package/bin/skills/transformer-lens/references/tutorials.md +339 -0
package/bin/skills/trl-fine-tuning/SKILL.md +455 -0
package/bin/skills/trl-fine-tuning/references/dpo-variants.md +227 -0
package/bin/skills/trl-fine-tuning/references/online-rl.md +82 -0
package/bin/skills/trl-fine-tuning/references/reward-modeling.md +122 -0
package/bin/skills/trl-fine-tuning/references/sft-training.md +168 -0
package/bin/skills/unsloth/SKILL.md +80 -0
package/bin/skills/unsloth/references/index.md +7 -0
package/bin/skills/unsloth/references/llms-full.md +16799 -0
package/bin/skills/unsloth/references/llms-txt.md +12044 -0
package/bin/skills/unsloth/references/llms.md +82 -0
package/bin/skills/verl/SKILL.md +391 -0
package/bin/skills/verl/references/api-reference.md +301 -0
package/bin/skills/verl/references/troubleshooting.md +391 -0
package/bin/skills/vllm/SKILL.md +364 -0
package/bin/skills/vllm/references/optimization.md +226 -0
package/bin/skills/vllm/references/quantization.md +284 -0
package/bin/skills/vllm/references/server-deployment.md +255 -0
package/bin/skills/vllm/references/troubleshooting.md +447 -0
package/bin/skills/weights-and-biases/SKILL.md +590 -0
package/bin/skills/weights-and-biases/references/artifacts.md +584 -0
package/bin/skills/weights-and-biases/references/integrations.md +700 -0
package/bin/skills/weights-and-biases/references/sweeps.md +847 -0
package/bin/skills/whisper/SKILL.md +317 -0
package/bin/skills/whisper/references/languages.md +189 -0
package/bin/synsc +0 -0
package/package.json +10 -0

package/bin/skills/model-merging/references/evaluation.md ADDED Viewed

@@ -0,0 +1,462 @@
+# Model Merging Evaluation
+Complete guide to benchmarking and testing merged models based on research best practices.
+## Table of Contents
+- Benchmark Suites
+- Evaluation Metrics
+- Testing Methodology
+- Comparison Framework
+- Quality Assurance
+## Benchmark Suites
+### Open LLM Leaderboard
+**URL**: https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard
+**Tasks** (6 benchmarks):
+1. **ARC** (AI2 Reasoning Challenge): 25-shot, science questions
+2. **HellaSwag**: 10-shot, commonsense reasoning
+3. **MMLU** (Massive Multitask Language Understanding): 5-shot, 57 subjects
+4. **TruthfulQA**: 0-shot, factual accuracy
+5. **Winogrande**: 5-shot, commonsense reasoning
+6. **GSM8K**: 5-shot, grade-school math
+**Running Evaluation**:
+```python
+from lm_eval import evaluator
+model = "path/to/merged/model"
+results = evaluator.simple_evaluate(
+    model="hf",
+    model_args=f"pretrained={model},dtype=float16",
+    tasks=[
+        "arc_challenge",
+        "hellaswag",
+        "hendrycksTest-*",  # MMLU
+        "truthfulqa_mc",
+        "winogrande",
+        "gsm8k"
+    ],
+    num_fewshot=5,
+    batch_size=8
+)
+# Average score
+avg_score = sum(results['results'].values()) / len(results['results'])
+print(f"Average: {avg_score:.2f}")
+```
+### MT-Bench
+**Focus**: Multi-turn conversation quality
+**Installation**:
+```bash
+git clone https://github.com/lm-sys/FastChat
+cd FastChat
+pip install -e .
+```
+**Running**:
+```bash
+# Generate responses
+python gen_model_answer.py \
+  --model-path path/to/merged/model \
+  --model-id merged_model
+# Judge with GPT-4
+python gen_judgment.py \
+  --model-list merged_model \
+  --judge-model gpt-4
+# View scores
+python show_result.py
+```
+**Metrics**:
+- Turn 1 score (1-10)
+- Turn 2 score (1-10)
+- Average score
+### MMLU (Detailed)
+**Subjects** (57 total):
+- STEM: Math, Physics, Chemistry, Biology, Computer Science
+- Humanities: History, Philosophy, Law
+- Social Sciences: Economics, Psychology, Sociology
+- Other: Professional subjects (Medicine, Accounting, etc.)
+```python
+from lm_eval import evaluator
+# Run all MMLU subjects
+results = evaluator.simple_evaluate(
+    model="hf",
+    model_args=f"pretrained={model}",
+    tasks="hendrycksTest-*",  # All MMLU tasks
+    num_fewshot=5
+)
+# Subject breakdown
+for task, score in results['results'].items():
+    subject = task.replace('hendrycksTest-', '')
+    print(f"{subject}: {score['acc']:.2%}")
+```
+### HumanEval (Code)
+**Focus**: Python code generation
+```python
+from human_eval.data import write_jsonl, read_problems
+from human_eval.evaluation import evaluate_functional_correctness
+# Generate completions
+problems = read_problems()
+samples = []
+for task_id, problem in problems.items():
+    prompt = problem['prompt']
+    completion = model.generate(prompt)
+    samples.append({
+        'task_id': task_id,
+        'completion': completion
+    })
+write_jsonl("samples.jsonl", samples)
+# Evaluate
+results = evaluate_functional_correctness("samples.jsonl")
+print(f"Pass@1: {results['pass@1']:.2%}")
+```
+## Evaluation Metrics
+### Performance Metrics
+**Accuracy**: Correct predictions / total predictions
+```python
+def accuracy(predictions, labels):
+    correct = sum(p == l for p, l in zip(predictions, labels))
+    return correct / len(predictions)
+```
+**Perplexity**: Language modeling quality (lower is better)
+```python
+import torch
+def perplexity(model, text):
+    tokens = tokenizer(text, return_tensors='pt')
+    with torch.no_grad():
+        loss = model(**tokens).loss
+    return torch.exp(loss).item()
+```
+**BLEU Score**: Translation/generation quality
+```python
+from nltk.translate.bleu_score import sentence_bleu
+reference = [["the", "cat", "sat", "on", "the", "mat"]]
+candidate = ["the", "cat", "is", "on", "the", "mat"]
+score = sentence_bleu(reference, candidate)
+```
+### Capability Retention
+**Test**: Does merged model retain parent capabilities?
+```python
+def test_capability_retention(merged_model, parent_models, test_suite):
+    """Check if merged model maintains parent capabilities."""
+    results = {}
+    # Baseline: Test parent models
+    for i, parent in enumerate(parent_models):
+        parent_score = evaluate(parent, test_suite)
+        results[f'parent_{i}'] = parent_score
+    # Test merged model
+    merged_score = evaluate(merged_model, test_suite)
+    results['merged'] = merged_score
+    # Retention percentage
+    avg_parent_score = sum(s for k, s in results.items() if k.startswith('parent')) / len(parent_models)
+    retention = merged_score / avg_parent_score
+    print(f"Capability Retention: {retention:.1%}")
+    return retention >= 0.95  # 95% retention threshold
+```
+### Conflict Detection
+**Test**: Does model show conflicting behaviors?
+```python
+def test_conflicts(model, test_pairs):
+    """Test for contradictory outputs."""
+    conflicts = []
+    for question_a, question_b, expected_consistency in test_pairs:
+        answer_a = model.generate(question_a)
+        answer_b = model.generate(question_b)
+        # Check consistency
+        is_consistent = check_semantic_similarity(answer_a, answer_b)
+        if is_consistent != expected_consistency:
+            conflicts.append((question_a, question_b, answer_a, answer_b))
+    conflict_rate = len(conflicts) / len(test_pairs)
+    print(f"Conflict Rate: {conflict_rate:.1%}")
+    return conflict_rate < 0.05  # <5% conflicts acceptable
+```
+## Testing Methodology
+### Pre-Merge Testing
+**Before merging**, establish baselines:
+```python
+# Test parent models
+parent_1_scores = evaluate(parent_1, benchmark_suite)
+parent_2_scores = evaluate(parent_2, benchmark_suite)
+# Expected range for merged model
+min_expected = min(parent_1_scores, parent_2_scores)
+max_expected = max(parent_1_scores, parent_2_scores)
+print(f"Expected merged score: {min_expected:.2f} - {max_expected:.2f}")
+```
+### Post-Merge Testing
+**Comprehensive evaluation**:
+```python
+def comprehensive_eval(merged_model):
+    """Full evaluation suite."""
+    results = {}
+    # 1. General capabilities
+    results['open_llm'] = evaluate_open_llm(merged_model)
+    # 2. Conversation
+    results['mt_bench'] = evaluate_mt_bench(merged_model)
+    # 3. Domain-specific
+    results['math'] = evaluate_math(merged_model)  # GSM8K, MATH
+    results['code'] = evaluate_code(merged_model)  # HumanEval
+    results['reasoning'] = evaluate_reasoning(merged_model)  # ARC, HellaSwag
+    # 4. Safety
+    results['safety'] = evaluate_safety(merged_model)  # TruthfulQA
+    return results
+```
+### A/B Testing
+**Compare merged model vs parents**:
+```python
+def ab_test(model_a, model_b, test_prompts, n_users=100):
+    """User preference testing."""
+    preferences = {'a': 0, 'b': 0, 'tie': 0}
+    for prompt in test_prompts:
+        response_a = model_a.generate(prompt)
+        response_b = model_b.generate(prompt)
+        # Simulated user preference (or use GPT-4 as judge)
+        preference = judge_responses(prompt, response_a, response_b)
+        preferences[preference] += 1
+    a_win_rate = preferences['a'] / (preferences['a'] + preferences['b'] + preferences['tie'])
+    print(f"Model A Win Rate: {a_win_rate:.1%}")
+    print(f"Tie Rate: {preferences['tie'] / len(test_prompts):.1%}")
+    return a_win_rate
+```
+## Comparison Framework
+### Score Comparison Table
+```python
+import pandas as pd
+def compare_models(models, benchmarks):
+    """Create comparison table."""
+    results = {}
+    for model_name, model_path in models.items():
+        results[model_name] = {}
+        for benchmark_name, benchmark_fn in benchmarks.items():
+            score = benchmark_fn(model_path)
+            results[model_name][benchmark_name] = score
+    # Create DataFrame
+    df = pd.DataFrame(results).T
+    # Add average column
+    df['Average'] = df.mean(axis=1)
+    # Highlight best
+    print(df.to_markdown())
+    return df
+# Usage
+models = {
+    'Parent 1': 'path/to/parent1',
+    'Parent 2': 'path/to/parent2',
+    'Merged (SLERP t=0.5)': 'path/to/merged_0.5',
+    'Merged (TIES)': 'path/to/merged_ties'
+}
+benchmarks = {
+    'MMLU': evaluate_mmlu,
+    'ARC': evaluate_arc,
+    'GSM8K': evaluate_gsm8k
+}
+df = compare_models(models, benchmarks)
+```
+### Statistical Significance
+```python
+from scipy import stats
+def is_improvement_significant(scores_a, scores_b, alpha=0.05):
+    """Test if improvement is statistically significant."""
+    # Paired t-test
+    t_stat, p_value = stats.ttest_rel(scores_a, scores_b)
+    is_significant = p_value < alpha
+    improvement = (sum(scores_b) - sum(scores_a)) / len(scores_a)
+    print(f"Mean improvement: {improvement:.2f}")
+    print(f"P-value: {p_value:.4f}")
+    print(f"Significant: {is_significant}")
+    return is_significant
+```
+## Quality Assurance
+### Regression Testing
+**Ensure no capability loss**:
+```python
+def regression_test(merged_model, parent_models, critical_tests):
+    """Check for performance regressions."""
+    regressions = []
+    for test_name, test_fn in critical_tests.items():
+        # Parent scores
+        parent_scores = [test_fn(p) for p in parent_models]
+        min_parent_score = min(parent_scores)
+        # Merged score
+        merged_score = test_fn(merged_model)
+        # Regression if merged < min parent
+        if merged_score < min_parent_score * 0.95:  # 5% tolerance
+            regressions.append({
+                'test': test_name,
+                'parents': parent_scores,
+                'merged': merged_score,
+                'delta': merged_score - min_parent_score
+            })
+    if regressions:
+        print(f"⚠️  {len(regressions)} regressions detected:")
+        for r in regressions:
+            print(f"  - {r['test']}: {r['delta']:.2%} drop")
+    return len(regressions) == 0
+```
+### Sanity Checks
+```python
+def sanity_checks(model):
+    """Basic functionality tests."""
+    tests = {
+        'generates': lambda: model.generate("Hello") != "",
+        'coherent': lambda: len(model.generate("The capital of France is")) > 5,
+        'follows_instruction': lambda: "paris" in model.generate("What is the capital of France?").lower(),
+        'no_repetition': lambda: not has_repetition(model.generate("Tell me about AI", max_length=100))
+    }
+    results = {name: test() for name, test in tests.items()}
+    passed = sum(results.values())
+    total = len(results)
+    print(f"Sanity Checks: {passed}/{total} passed")
+    for name, result in results.items():
+        status = "✓" if result else "✗"
+        print(f"  {status} {name}")
+    return passed == total
+```
+### Deployment Checklist
+Before deploying merged model:
+- [ ] Open LLM Leaderboard score >= min(parent scores)
+- [ ] MT-Bench score >= avg(parent scores)
+- [ ] Domain-specific benchmarks pass
+- [ ] No regressions in critical tests
+- [ ] Sanity checks all pass
+- [ ] A/B test win rate >= 45%
+- [ ] Safety checks pass (TruthfulQA)
+- [ ] Manual testing with diverse prompts
+- [ ] Model size acceptable for deployment
+- [ ] Inference speed acceptable
+## Benchmark Interpretation
+### Open LLM Leaderboard Ranges
+| Score | Quality |
+|-------|---------|
+| <60 | Poor - likely broken |
+| 60-65 | Below average |
+| 65-70 | Average |
+| 70-75 | Good |
+| 75-80 | Excellent |
+| >80 | State-of-art |
+### MT-Bench Ranges
+| Score | Quality |
+|-------|---------|
+| <6.0 | Poor conversation |
+| 6.0-7.0 | Acceptable |
+| 7.0-8.0 | Good |
+| 8.0-9.0 | Excellent |
+| >9.0 | Near human-level |
+## Resources
+- **lm-evaluation-harness**: https://github.com/EleutherAI/lm-evaluation-harness
+- **MT-Bench**: https://github.com/lm-sys/FastChat
+- **HumanEval**: https://github.com/openai/human-eval
+- **Open LLM Leaderboard**: https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard