PyPI - keras-hub-nightly - Versions diffs - 0.16.1.dev202409250340__py3-none-any.whl → 0.16.1.dev202409270338__py3-none-any.whl - Mend

keras-hub-nightly 0.16.1.dev202409250340py3-none-any.whl → 0.16.1.dev202409270338py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (357) hide show

keras_hub/__init__.py +0 -13
keras_hub/api/__init__.py +0 -13
keras_hub/api/bounding_box/__init__.py +0 -13
keras_hub/api/layers/__init__.py +3 -13
keras_hub/api/metrics/__init__.py +0 -13
keras_hub/api/models/__init__.py +16 -13
keras_hub/api/samplers/__init__.py +0 -13
keras_hub/api/tokenizers/__init__.py +1 -13
keras_hub/api/utils/__init__.py +0 -13
keras_hub/src/__init__.py +0 -13
keras_hub/src/api_export.py +0 -14
keras_hub/src/bounding_box/__init__.py +0 -13
keras_hub/src/bounding_box/converters.py +0 -13
keras_hub/src/bounding_box/formats.py +0 -13
keras_hub/src/bounding_box/iou.py +1 -13
keras_hub/src/bounding_box/to_dense.py +0 -14
keras_hub/src/bounding_box/to_ragged.py +0 -13
keras_hub/src/bounding_box/utils.py +0 -13
keras_hub/src/bounding_box/validate_format.py +0 -14
keras_hub/src/layers/__init__.py +0 -13
keras_hub/src/layers/modeling/__init__.py +0 -13
keras_hub/src/layers/modeling/alibi_bias.py +0 -13
keras_hub/src/layers/modeling/cached_multi_head_attention.py +0 -14
keras_hub/src/layers/modeling/f_net_encoder.py +0 -14
keras_hub/src/layers/modeling/masked_lm_head.py +0 -14
keras_hub/src/layers/modeling/position_embedding.py +0 -14
keras_hub/src/layers/modeling/reversible_embedding.py +0 -14
keras_hub/src/layers/modeling/rotary_embedding.py +0 -14
keras_hub/src/layers/modeling/sine_position_encoding.py +0 -14
keras_hub/src/layers/modeling/token_and_position_embedding.py +0 -14
keras_hub/src/layers/modeling/transformer_decoder.py +0 -14
keras_hub/src/layers/modeling/transformer_encoder.py +0 -14
keras_hub/src/layers/modeling/transformer_layer_utils.py +0 -14
keras_hub/src/layers/preprocessing/__init__.py +0 -13
keras_hub/src/layers/preprocessing/audio_converter.py +0 -13
keras_hub/src/layers/preprocessing/image_converter.py +0 -13
keras_hub/src/layers/preprocessing/masked_lm_mask_generator.py +0 -15
keras_hub/src/layers/preprocessing/multi_segment_packer.py +0 -14
keras_hub/src/layers/preprocessing/preprocessing_layer.py +0 -14
keras_hub/src/layers/preprocessing/random_deletion.py +0 -14
keras_hub/src/layers/preprocessing/random_swap.py +0 -14
keras_hub/src/layers/preprocessing/resizing_image_converter.py +0 -13
keras_hub/src/layers/preprocessing/start_end_packer.py +0 -15
keras_hub/src/metrics/__init__.py +0 -13
keras_hub/src/metrics/bleu.py +0 -14
keras_hub/src/metrics/edit_distance.py +0 -14
keras_hub/src/metrics/perplexity.py +0 -14
keras_hub/src/metrics/rouge_base.py +0 -14
keras_hub/src/metrics/rouge_l.py +0 -14
keras_hub/src/metrics/rouge_n.py +0 -14
keras_hub/src/models/__init__.py +0 -13
keras_hub/src/models/albert/__init__.py +0 -14
keras_hub/src/models/albert/albert_backbone.py +0 -14
keras_hub/src/models/albert/albert_masked_lm.py +0 -14
keras_hub/src/models/albert/albert_masked_lm_preprocessor.py +0 -14
keras_hub/src/models/albert/albert_presets.py +0 -14
keras_hub/src/models/albert/albert_text_classifier.py +0 -14
keras_hub/src/models/albert/albert_text_classifier_preprocessor.py +0 -14
keras_hub/src/models/albert/albert_tokenizer.py +0 -14
keras_hub/src/models/backbone.py +0 -14
keras_hub/src/models/bart/__init__.py +0 -14
keras_hub/src/models/bart/bart_backbone.py +0 -14
keras_hub/src/models/bart/bart_presets.py +0 -13
keras_hub/src/models/bart/bart_seq_2_seq_lm.py +0 -15
keras_hub/src/models/bart/bart_seq_2_seq_lm_preprocessor.py +0 -15
keras_hub/src/models/bart/bart_tokenizer.py +0 -15
keras_hub/src/models/bert/__init__.py +0 -14
keras_hub/src/models/bert/bert_backbone.py +0 -14
keras_hub/src/models/bert/bert_masked_lm.py +0 -14
keras_hub/src/models/bert/bert_masked_lm_preprocessor.py +0 -14
keras_hub/src/models/bert/bert_presets.py +0 -13
keras_hub/src/models/bert/bert_text_classifier.py +0 -14
keras_hub/src/models/bert/bert_text_classifier_preprocessor.py +0 -14
keras_hub/src/models/bert/bert_tokenizer.py +0 -14
keras_hub/src/models/bloom/__init__.py +0 -14
keras_hub/src/models/bloom/bloom_attention.py +0 -13
keras_hub/src/models/bloom/bloom_backbone.py +0 -14
keras_hub/src/models/bloom/bloom_causal_lm.py +0 -15
keras_hub/src/models/bloom/bloom_causal_lm_preprocessor.py +0 -15
keras_hub/src/models/bloom/bloom_decoder.py +0 -13
keras_hub/src/models/bloom/bloom_presets.py +0 -13
keras_hub/src/models/bloom/bloom_tokenizer.py +0 -15
keras_hub/src/models/causal_lm.py +0 -14
keras_hub/src/models/causal_lm_preprocessor.py +0 -13
keras_hub/src/models/clip/__init__.py +0 -0
keras_hub/src/models/{stable_diffusion_v3 → clip}/clip_encoder_block.py +8 -15
keras_hub/src/models/clip/clip_preprocessor.py +134 -0
keras_hub/src/models/clip/clip_text_encoder.py +139 -0
keras_hub/src/models/{stable_diffusion_v3 → clip}/clip_tokenizer.py +65 -41
keras_hub/src/models/csp_darknet/__init__.py +0 -13
keras_hub/src/models/csp_darknet/csp_darknet_backbone.py +0 -13
keras_hub/src/models/csp_darknet/csp_darknet_image_classifier.py +0 -13
keras_hub/src/models/deberta_v3/__init__.py +0 -14
keras_hub/src/models/deberta_v3/deberta_v3_backbone.py +0 -15
keras_hub/src/models/deberta_v3/deberta_v3_masked_lm.py +0 -15
keras_hub/src/models/deberta_v3/deberta_v3_masked_lm_preprocessor.py +0 -14
keras_hub/src/models/deberta_v3/deberta_v3_presets.py +0 -13
keras_hub/src/models/deberta_v3/deberta_v3_text_classifier.py +0 -15
keras_hub/src/models/deberta_v3/deberta_v3_text_classifier_preprocessor.py +0 -14
keras_hub/src/models/deberta_v3/deberta_v3_tokenizer.py +0 -15
keras_hub/src/models/deberta_v3/disentangled_attention_encoder.py +0 -14
keras_hub/src/models/deberta_v3/disentangled_self_attention.py +0 -14
keras_hub/src/models/deberta_v3/relative_embedding.py +0 -14
keras_hub/src/models/densenet/__init__.py +5 -13
keras_hub/src/models/densenet/densenet_backbone.py +11 -21
keras_hub/src/models/densenet/densenet_image_classifier.py +27 -17
keras_hub/src/models/densenet/densenet_image_classifier_preprocessor.py +27 -0
keras_hub/src/models/{stable_diffusion_v3/__init__.py → densenet/densenet_image_converter.py} +10 -0
keras_hub/src/models/densenet/densenet_presets.py +56 -0
keras_hub/src/models/distil_bert/__init__.py +0 -14
keras_hub/src/models/distil_bert/distil_bert_backbone.py +0 -15
keras_hub/src/models/distil_bert/distil_bert_masked_lm.py +0 -15
keras_hub/src/models/distil_bert/distil_bert_masked_lm_preprocessor.py +0 -14
keras_hub/src/models/distil_bert/distil_bert_presets.py +0 -13
keras_hub/src/models/distil_bert/distil_bert_text_classifier.py +0 -15
keras_hub/src/models/distil_bert/distil_bert_text_classifier_preprocessor.py +0 -15
keras_hub/src/models/distil_bert/distil_bert_tokenizer.py +0 -15
keras_hub/src/models/efficientnet/__init__.py +0 -13
keras_hub/src/models/efficientnet/efficientnet_backbone.py +0 -13
keras_hub/src/models/efficientnet/fusedmbconv.py +0 -14
keras_hub/src/models/efficientnet/mbconv.py +0 -14
keras_hub/src/models/electra/__init__.py +0 -14
keras_hub/src/models/electra/electra_backbone.py +0 -14
keras_hub/src/models/electra/electra_presets.py +0 -13
keras_hub/src/models/electra/electra_tokenizer.py +0 -14
keras_hub/src/models/f_net/__init__.py +0 -14
keras_hub/src/models/f_net/f_net_backbone.py +0 -15
keras_hub/src/models/f_net/f_net_masked_lm.py +0 -15
keras_hub/src/models/f_net/f_net_masked_lm_preprocessor.py +0 -14
keras_hub/src/models/f_net/f_net_presets.py +0 -13
keras_hub/src/models/f_net/f_net_text_classifier.py +0 -15
keras_hub/src/models/f_net/f_net_text_classifier_preprocessor.py +0 -15
keras_hub/src/models/f_net/f_net_tokenizer.py +0 -15
keras_hub/src/models/falcon/__init__.py +0 -14
keras_hub/src/models/falcon/falcon_attention.py +0 -13
keras_hub/src/models/falcon/falcon_backbone.py +0 -13
keras_hub/src/models/falcon/falcon_causal_lm.py +0 -14
keras_hub/src/models/falcon/falcon_causal_lm_preprocessor.py +0 -14
keras_hub/src/models/falcon/falcon_presets.py +0 -13
keras_hub/src/models/falcon/falcon_tokenizer.py +0 -15
keras_hub/src/models/falcon/falcon_transformer_decoder.py +0 -13
keras_hub/src/models/feature_pyramid_backbone.py +0 -13
keras_hub/src/models/gemma/__init__.py +0 -14
keras_hub/src/models/gemma/gemma_attention.py +0 -13
keras_hub/src/models/gemma/gemma_backbone.py +0 -15
keras_hub/src/models/gemma/gemma_causal_lm.py +0 -15
keras_hub/src/models/gemma/gemma_causal_lm_preprocessor.py +0 -14
keras_hub/src/models/gemma/gemma_decoder_block.py +0 -13
keras_hub/src/models/gemma/gemma_presets.py +0 -13
keras_hub/src/models/gemma/gemma_tokenizer.py +0 -14
keras_hub/src/models/gemma/rms_normalization.py +0 -14
keras_hub/src/models/gpt2/__init__.py +0 -14
keras_hub/src/models/gpt2/gpt2_backbone.py +0 -15
keras_hub/src/models/gpt2/gpt2_causal_lm.py +0 -15
keras_hub/src/models/gpt2/gpt2_causal_lm_preprocessor.py +0 -14
keras_hub/src/models/gpt2/gpt2_preprocessor.py +0 -15
keras_hub/src/models/gpt2/gpt2_presets.py +0 -13
keras_hub/src/models/gpt2/gpt2_tokenizer.py +0 -15
keras_hub/src/models/gpt_neo_x/__init__.py +0 -13
keras_hub/src/models/gpt_neo_x/gpt_neo_x_attention.py +0 -14
keras_hub/src/models/gpt_neo_x/gpt_neo_x_backbone.py +0 -14
keras_hub/src/models/gpt_neo_x/gpt_neo_x_causal_lm.py +0 -14
keras_hub/src/models/gpt_neo_x/gpt_neo_x_causal_lm_preprocessor.py +0 -14
keras_hub/src/models/gpt_neo_x/gpt_neo_x_decoder.py +0 -14
keras_hub/src/models/gpt_neo_x/gpt_neo_x_tokenizer.py +0 -14
keras_hub/src/models/image_classifier.py +0 -13
keras_hub/src/models/image_classifier_preprocessor.py +0 -13
keras_hub/src/models/image_segmenter.py +0 -13
keras_hub/src/models/llama/__init__.py +0 -14
keras_hub/src/models/llama/llama_attention.py +0 -13
keras_hub/src/models/llama/llama_backbone.py +0 -13
keras_hub/src/models/llama/llama_causal_lm.py +0 -13
keras_hub/src/models/llama/llama_causal_lm_preprocessor.py +0 -15
keras_hub/src/models/llama/llama_decoder.py +0 -13
keras_hub/src/models/llama/llama_layernorm.py +0 -13
keras_hub/src/models/llama/llama_presets.py +0 -13
keras_hub/src/models/llama/llama_tokenizer.py +0 -14
keras_hub/src/models/llama3/__init__.py +0 -14
keras_hub/src/models/llama3/llama3_backbone.py +0 -14
keras_hub/src/models/llama3/llama3_causal_lm.py +0 -13
keras_hub/src/models/llama3/llama3_causal_lm_preprocessor.py +0 -14
keras_hub/src/models/llama3/llama3_presets.py +0 -13
keras_hub/src/models/llama3/llama3_tokenizer.py +0 -14
keras_hub/src/models/masked_lm.py +0 -13
keras_hub/src/models/masked_lm_preprocessor.py +0 -13
keras_hub/src/models/mistral/__init__.py +0 -14
keras_hub/src/models/mistral/mistral_attention.py +0 -13
keras_hub/src/models/mistral/mistral_backbone.py +0 -14
keras_hub/src/models/mistral/mistral_causal_lm.py +0 -14
keras_hub/src/models/mistral/mistral_causal_lm_preprocessor.py +0 -14
keras_hub/src/models/mistral/mistral_layer_norm.py +0 -13
keras_hub/src/models/mistral/mistral_presets.py +0 -13
keras_hub/src/models/mistral/mistral_tokenizer.py +0 -14
keras_hub/src/models/mistral/mistral_transformer_decoder.py +0 -13
keras_hub/src/models/mix_transformer/__init__.py +0 -13
keras_hub/src/models/mix_transformer/mix_transformer_backbone.py +0 -13
keras_hub/src/models/mix_transformer/mix_transformer_classifier.py +0 -13
keras_hub/src/models/mix_transformer/mix_transformer_layers.py +0 -13
keras_hub/src/models/mobilenet/__init__.py +0 -13
keras_hub/src/models/mobilenet/mobilenet_backbone.py +0 -13
keras_hub/src/models/mobilenet/mobilenet_image_classifier.py +0 -13
keras_hub/src/models/opt/__init__.py +0 -14
keras_hub/src/models/opt/opt_backbone.py +0 -15
keras_hub/src/models/opt/opt_causal_lm.py +0 -15
keras_hub/src/models/opt/opt_causal_lm_preprocessor.py +0 -13
keras_hub/src/models/opt/opt_presets.py +0 -13
keras_hub/src/models/opt/opt_tokenizer.py +0 -15
keras_hub/src/models/pali_gemma/__init__.py +0 -13
keras_hub/src/models/pali_gemma/pali_gemma_backbone.py +0 -13
keras_hub/src/models/pali_gemma/pali_gemma_causal_lm.py +0 -13
keras_hub/src/models/pali_gemma/pali_gemma_causal_lm_preprocessor.py +0 -13
keras_hub/src/models/pali_gemma/pali_gemma_decoder_block.py +0 -14
keras_hub/src/models/pali_gemma/pali_gemma_image_converter.py +0 -13
keras_hub/src/models/pali_gemma/pali_gemma_presets.py +0 -13
keras_hub/src/models/pali_gemma/pali_gemma_tokenizer.py +0 -13
keras_hub/src/models/pali_gemma/pali_gemma_vit.py +0 -13
keras_hub/src/models/phi3/__init__.py +0 -14
keras_hub/src/models/phi3/phi3_attention.py +0 -13
keras_hub/src/models/phi3/phi3_backbone.py +0 -13
keras_hub/src/models/phi3/phi3_causal_lm.py +0 -13
keras_hub/src/models/phi3/phi3_causal_lm_preprocessor.py +0 -14
keras_hub/src/models/phi3/phi3_decoder.py +0 -13
keras_hub/src/models/phi3/phi3_layernorm.py +0 -13
keras_hub/src/models/phi3/phi3_presets.py +0 -13
keras_hub/src/models/phi3/phi3_rotary_embedding.py +0 -13
keras_hub/src/models/phi3/phi3_tokenizer.py +0 -13
keras_hub/src/models/preprocessor.py +51 -32
keras_hub/src/models/resnet/__init__.py +0 -14
keras_hub/src/models/resnet/resnet_backbone.py +0 -13
keras_hub/src/models/resnet/resnet_image_classifier.py +0 -13
keras_hub/src/models/resnet/resnet_image_classifier_preprocessor.py +0 -14
keras_hub/src/models/resnet/resnet_image_converter.py +0 -13
keras_hub/src/models/resnet/resnet_presets.py +0 -13
keras_hub/src/models/retinanet/__init__.py +0 -13
keras_hub/src/models/retinanet/anchor_generator.py +0 -14
keras_hub/src/models/retinanet/box_matcher.py +0 -14
keras_hub/src/models/retinanet/non_max_supression.py +0 -14
keras_hub/src/models/roberta/__init__.py +0 -14
keras_hub/src/models/roberta/roberta_backbone.py +0 -15
keras_hub/src/models/roberta/roberta_masked_lm.py +0 -15
keras_hub/src/models/roberta/roberta_masked_lm_preprocessor.py +0 -14
keras_hub/src/models/roberta/roberta_presets.py +0 -13
keras_hub/src/models/roberta/roberta_text_classifier.py +0 -15
keras_hub/src/models/roberta/roberta_text_classifier_preprocessor.py +0 -14
keras_hub/src/models/roberta/roberta_tokenizer.py +0 -15
keras_hub/src/models/sam/__init__.py +0 -13
keras_hub/src/models/sam/sam_backbone.py +0 -14
keras_hub/src/models/sam/sam_image_segmenter.py +0 -14
keras_hub/src/models/sam/sam_layers.py +0 -14
keras_hub/src/models/sam/sam_mask_decoder.py +0 -14
keras_hub/src/models/sam/sam_prompt_encoder.py +0 -14
keras_hub/src/models/sam/sam_transformer.py +0 -14
keras_hub/src/models/seq_2_seq_lm.py +0 -13
keras_hub/src/models/seq_2_seq_lm_preprocessor.py +0 -13
keras_hub/src/models/stable_diffusion_3/__init__.py +9 -0
keras_hub/src/models/stable_diffusion_3/flow_match_euler_discrete_scheduler.py +80 -0
keras_hub/src/models/{stable_diffusion_v3 → stable_diffusion_3}/mmdit.py +351 -39
keras_hub/src/models/stable_diffusion_3/stable_diffusion_3_backbone.py +631 -0
keras_hub/src/models/stable_diffusion_3/stable_diffusion_3_presets.py +31 -0
keras_hub/src/models/stable_diffusion_3/stable_diffusion_3_text_to_image.py +138 -0
keras_hub/src/models/stable_diffusion_3/stable_diffusion_3_text_to_image_preprocessor.py +83 -0
keras_hub/src/models/{stable_diffusion_v3/t5_xxl_text_encoder.py → stable_diffusion_3/t5_encoder.py} +7 -20
keras_hub/src/models/stable_diffusion_3/vae_image_decoder.py +320 -0
keras_hub/src/models/t5/__init__.py +0 -14
keras_hub/src/models/t5/t5_backbone.py +0 -14
keras_hub/src/models/t5/t5_layer_norm.py +0 -14
keras_hub/src/models/t5/t5_multi_head_attention.py +0 -14
keras_hub/src/models/{stable_diffusion_v3/t5_xxl_preprocessor.py → t5/t5_preprocessor.py} +12 -16
keras_hub/src/models/t5/t5_presets.py +0 -13
keras_hub/src/models/t5/t5_tokenizer.py +0 -14
keras_hub/src/models/t5/t5_transformer_layer.py +0 -14
keras_hub/src/models/task.py +0 -14
keras_hub/src/models/text_classifier.py +0 -13
keras_hub/src/models/text_classifier_preprocessor.py +0 -13
keras_hub/src/models/text_to_image.py +282 -0
keras_hub/src/models/vgg/__init__.py +0 -13
keras_hub/src/models/vgg/vgg_backbone.py +0 -13
keras_hub/src/models/vgg/vgg_image_classifier.py +0 -13
keras_hub/src/models/vit_det/__init__.py +0 -13
keras_hub/src/models/vit_det/vit_det_backbone.py +0 -14
keras_hub/src/models/vit_det/vit_layers.py +0 -15
keras_hub/src/models/whisper/__init__.py +0 -14
keras_hub/src/models/whisper/whisper_audio_converter.py +0 -15
keras_hub/src/models/whisper/whisper_backbone.py +0 -15
keras_hub/src/models/whisper/whisper_cached_multi_head_attention.py +0 -13
keras_hub/src/models/whisper/whisper_decoder.py +0 -14
keras_hub/src/models/whisper/whisper_encoder.py +0 -14
keras_hub/src/models/whisper/whisper_presets.py +0 -14
keras_hub/src/models/whisper/whisper_tokenizer.py +0 -14
keras_hub/src/models/xlm_roberta/__init__.py +0 -14
keras_hub/src/models/xlm_roberta/xlm_roberta_backbone.py +0 -15
keras_hub/src/models/xlm_roberta/xlm_roberta_masked_lm.py +0 -15
keras_hub/src/models/xlm_roberta/xlm_roberta_masked_lm_preprocessor.py +0 -14
keras_hub/src/models/xlm_roberta/xlm_roberta_presets.py +0 -13
keras_hub/src/models/xlm_roberta/xlm_roberta_text_classifier.py +0 -15
keras_hub/src/models/xlm_roberta/xlm_roberta_text_classifier_preprocessor.py +0 -15
keras_hub/src/models/xlm_roberta/xlm_roberta_tokenizer.py +0 -15
keras_hub/src/models/xlnet/__init__.py +0 -13
keras_hub/src/models/xlnet/relative_attention.py +0 -14
keras_hub/src/models/xlnet/xlnet_backbone.py +0 -14
keras_hub/src/models/xlnet/xlnet_content_and_query_embedding.py +0 -14
keras_hub/src/models/xlnet/xlnet_encoder.py +0 -14
keras_hub/src/samplers/__init__.py +0 -13
keras_hub/src/samplers/beam_sampler.py +0 -14
keras_hub/src/samplers/contrastive_sampler.py +0 -14
keras_hub/src/samplers/greedy_sampler.py +0 -14
keras_hub/src/samplers/random_sampler.py +0 -14
keras_hub/src/samplers/sampler.py +0 -14
keras_hub/src/samplers/serialization.py +0 -14
keras_hub/src/samplers/top_k_sampler.py +0 -14
keras_hub/src/samplers/top_p_sampler.py +0 -14
keras_hub/src/tests/__init__.py +0 -13
keras_hub/src/tests/test_case.py +0 -14
keras_hub/src/tokenizers/__init__.py +0 -13
keras_hub/src/tokenizers/byte_pair_tokenizer.py +0 -14
keras_hub/src/tokenizers/byte_tokenizer.py +0 -14
keras_hub/src/tokenizers/sentence_piece_tokenizer.py +0 -14
keras_hub/src/tokenizers/sentence_piece_tokenizer_trainer.py +0 -14
keras_hub/src/tokenizers/tokenizer.py +23 -27
keras_hub/src/tokenizers/unicode_codepoint_tokenizer.py +0 -15
keras_hub/src/tokenizers/word_piece_tokenizer.py +0 -14
keras_hub/src/tokenizers/word_piece_tokenizer_trainer.py +0 -15
keras_hub/src/utils/__init__.py +0 -13
keras_hub/src/utils/imagenet/__init__.py +0 -13
keras_hub/src/utils/imagenet/imagenet_utils.py +0 -13
keras_hub/src/utils/keras_utils.py +0 -14
keras_hub/src/utils/pipeline_model.py +0 -14
keras_hub/src/utils/preset_utils.py +32 -76
keras_hub/src/utils/python_utils.py +0 -13
keras_hub/src/utils/tensor_utils.py +0 -14
keras_hub/src/utils/timm/__init__.py +0 -13
keras_hub/src/utils/timm/convert_densenet.py +107 -0
keras_hub/src/utils/timm/convert_resnet.py +0 -13
keras_hub/src/utils/timm/preset_loader.py +3 -13
keras_hub/src/utils/transformers/__init__.py +0 -13
keras_hub/src/utils/transformers/convert_albert.py +0 -13
keras_hub/src/utils/transformers/convert_bart.py +0 -13
keras_hub/src/utils/transformers/convert_bert.py +0 -13
keras_hub/src/utils/transformers/convert_distilbert.py +0 -13
keras_hub/src/utils/transformers/convert_gemma.py +0 -13
keras_hub/src/utils/transformers/convert_gpt2.py +0 -13
keras_hub/src/utils/transformers/convert_llama3.py +0 -13
keras_hub/src/utils/transformers/convert_mistral.py +0 -13
keras_hub/src/utils/transformers/convert_pali_gemma.py +0 -13
keras_hub/src/utils/transformers/preset_loader.py +1 -15
keras_hub/src/utils/transformers/safetensor_utils.py +9 -15
keras_hub/src/version_utils.py +1 -15
{keras_hub_nightly-0.16.1.dev202409250340.dist-info → keras_hub_nightly-0.16.1.dev202409270338.dist-info}/METADATA +30 -27
keras_hub_nightly-0.16.1.dev202409270338.dist-info/RECORD +351 -0
keras_hub/src/models/stable_diffusion_v3/clip_preprocessor.py +0 -93
keras_hub/src/models/stable_diffusion_v3/clip_text_encoder.py +0 -149
keras_hub/src/models/stable_diffusion_v3/mmdit_block.py +0 -317
keras_hub/src/models/stable_diffusion_v3/vae_attention.py +0 -126
keras_hub/src/models/stable_diffusion_v3/vae_image_decoder.py +0 -186
keras_hub_nightly-0.16.1.dev202409250340.dist-info/RECORD +0 -342
{keras_hub_nightly-0.16.1.dev202409250340.dist-info → keras_hub_nightly-0.16.1.dev202409270338.dist-info}/WHEEL +0 -0
{keras_hub_nightly-0.16.1.dev202409250340.dist-info → keras_hub_nightly-0.16.1.dev202409270338.dist-info}/top_level.txt +0 -0

keras_hub/src/models/{stable_diffusion_v3 → stable_diffusion_3}/mmdit.py RENAMED Viewed

@@ -1,16 +1,3 @@
-# Copyright 2024 The KerasHub Authors
-#
-# Licensed under the Apache License, Version 2.0 (the "License");
-# you may not use this file except in compliance with the License.
-# You may obtain a copy of the License at
-#
-#     https://www.apache.org/licenses/LICENSE-2.0
-#
-# Unless required by applicable law or agreed to in writing, software
-# distributed under the License is distributed on an "AS IS" BASIS,
-# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
-# See the License for the specific language governing permissions and
-# limitations under the License.
 import math
 import keras
@@ -19,7 +6,8 @@ from keras import models
 from keras import ops
 from keras_hub.src.layers.modeling.position_embedding import PositionEmbedding
-from keras_hub.src.models.stable_diffusion_v3.mmdit_block import MMDiTBlock
+from keras_hub.src.models.backbone import Backbone
+from keras_hub.src.utils.keras_utils import gelu_approximate
 from keras_hub.src.utils.keras_utils import standardize_data_format
@@ -79,8 +67,8 @@ class AdjustablePositionEmbedding(PositionEmbedding):
         width = width or self.width
         shape = ops.shape(inputs)
         feature_length = shape[-1]
-        top = ops.floor_divide(self.height - height, 2)
-        left = ops.floor_divide(self.width - width, 2)
+        top = ops.cast(ops.floor_divide(self.height - height, 2), "int32")
+        left = ops.cast(ops.floor_divide(self.width - width, 2), "int32")
         position_embedding = ops.convert_to_tensor(self.position_embeddings)
         position_embedding = ops.reshape(
             position_embedding, (self.height, self.width, feature_length)
@@ -166,6 +154,305 @@ class TimestepEmbedding(layers.Layer):
         return output_shape
+class DismantledBlock(layers.Layer):
+    def __init__(
+        self,
+        num_heads,
+        hidden_dim,
+        mlp_ratio=4.0,
+        use_projection=True,
+        **kwargs,
+    ):
+        super().__init__(**kwargs)
+        self.num_heads = num_heads
+        self.hidden_dim = hidden_dim
+        self.mlp_ratio = mlp_ratio
+        self.use_projection = use_projection
+        head_dim = hidden_dim // num_heads
+        self.head_dim = head_dim
+        mlp_hidden_dim = int(hidden_dim * mlp_ratio)
+        self.mlp_hidden_dim = mlp_hidden_dim
+        num_modulations = 6 if use_projection else 2
+        self.num_modulations = num_modulations
+        self.adaptive_norm_modulation = models.Sequential(
+            [
+                layers.Activation("silu", dtype=self.dtype_policy),
+                layers.Dense(
+                    num_modulations * hidden_dim, dtype=self.dtype_policy
+                ),
+            ],
+            name="adaptive_norm_modulation",
+        )
+        self.norm1 = layers.LayerNormalization(
+            epsilon=1e-6,
+            center=False,
+            scale=False,
+            dtype="float32",
+            name="norm1",
+        )
+        self.attention_qkv = layers.Dense(
+            hidden_dim * 3, dtype=self.dtype_policy, name="attention_qkv"
+        )
+        if use_projection:
+            self.attention_proj = layers.Dense(
+                hidden_dim, dtype=self.dtype_policy, name="attention_proj"
+            )
+            self.norm2 = layers.LayerNormalization(
+                epsilon=1e-6,
+                center=False,
+                scale=False,
+                dtype="float32",
+                name="norm2",
+            )
+            self.mlp = models.Sequential(
+                [
+                    layers.Dense(
+                        mlp_hidden_dim,
+                        activation=gelu_approximate,
+                        dtype=self.dtype_policy,
+                    ),
+                    layers.Dense(
+                        hidden_dim,
+                        dtype=self.dtype_policy,
+                    ),
+                ],
+                name="mlp",
+            )
+    def build(self, inputs_shape, timestep_embedding):
+        self.adaptive_norm_modulation.build(timestep_embedding)
+        self.attention_qkv.build(inputs_shape)
+        self.norm1.build(inputs_shape)
+        if self.use_projection:
+            self.attention_proj.build(inputs_shape)
+            self.norm2.build(inputs_shape)
+            self.mlp.build(inputs_shape)
+    def _modulate(self, inputs, shift, scale):
+        shift = ops.expand_dims(shift, axis=1)
+        scale = ops.expand_dims(scale, axis=1)
+        return ops.add(ops.multiply(inputs, ops.add(scale, 1.0)), shift)
+    def _compute_pre_attention(self, inputs, timestep_embedding, training=None):
+        batch_size = ops.shape(inputs)[0]
+        if self.use_projection:
+            modulation = self.adaptive_norm_modulation(
+                timestep_embedding, training=training
+            )
+            modulation = ops.reshape(
+                modulation, (batch_size, 6, self.hidden_dim)
+            )
+            (
+                shift_msa,
+                scale_msa,
+                gate_msa,
+                shift_mlp,
+                scale_mlp,
+                gate_mlp,
+            ) = ops.unstack(modulation, 6, axis=1)
+            qkv = self.attention_qkv(
+                self._modulate(self.norm1(inputs), shift_msa, scale_msa),
+                training=training,
+            )
+            qkv = ops.reshape(
+                qkv, (batch_size, -1, 3, self.num_heads, self.head_dim)
+            )
+            q, k, v = ops.unstack(qkv, 3, axis=2)
+            return (q, k, v), (inputs, gate_msa, shift_mlp, scale_mlp, gate_mlp)
+        else:
+            modulation = self.adaptive_norm_modulation(
+                timestep_embedding, training=training
+            )
+            modulation = ops.reshape(
+                modulation, (batch_size, 2, self.hidden_dim)
+            )
+            shift_msa, scale_msa = ops.unstack(modulation, 2, axis=1)
+            qkv = self.attention_qkv(
+                self._modulate(self.norm1(inputs), shift_msa, scale_msa),
+                training=training,
+            )
+            qkv = ops.reshape(
+                qkv, (batch_size, -1, 3, self.num_heads, self.head_dim)
+            )
+            q, k, v = ops.unstack(qkv, 3, axis=2)
+            return (q, k, v)
+    def _compute_post_attention(
+        self, inputs, inputs_intermediates, training=None
+    ):
+        x, gate_msa, shift_mlp, scale_mlp, gate_mlp = inputs_intermediates
+        attn = self.attention_proj(inputs, training=training)
+        x = ops.add(x, ops.multiply(ops.expand_dims(gate_msa, axis=1), attn))
+        x = ops.add(
+            x,
+            ops.multiply(
+                ops.expand_dims(gate_mlp, axis=1),
+                self.mlp(
+                    self._modulate(self.norm2(x), shift_mlp, scale_mlp),
+                    training=training,
+                ),
+            ),
+        )
+        return x
+    def call(
+        self,
+        inputs,
+        timestep_embedding=None,
+        inputs_intermediates=None,
+        pre_attention=True,
+        training=None,
+    ):
+        if pre_attention:
+            return self._compute_pre_attention(
+                inputs, timestep_embedding, training=training
+            )
+        else:
+            return self._compute_post_attention(
+                inputs, inputs_intermediates, training=training
+            )
+    def get_config(self):
+        config = super().get_config()
+        config.update(
+            {
+                "num_heads": self.num_heads,
+                "hidden_dim": self.hidden_dim,
+                "mlp_ratio": self.mlp_ratio,
+                "use_projection": self.use_projection,
+            }
+        )
+        return config
+class MMDiTBlock(layers.Layer):
+    def __init__(
+        self,
+        num_heads,
+        hidden_dim,
+        mlp_ratio=4.0,
+        use_context_projection=True,
+        **kwargs,
+    ):
+        super().__init__(**kwargs)
+        self.num_heads = num_heads
+        self.hidden_dim = hidden_dim
+        self.mlp_ratio = mlp_ratio
+        self.use_context_projection = use_context_projection
+        head_dim = hidden_dim // num_heads
+        self.head_dim = head_dim
+        self._inverse_sqrt_key_dim = 1.0 / math.sqrt(head_dim)
+        self._dot_product_equation = "aecd,abcd->acbe"
+        self._combine_equation = "acbe,aecd->abcd"
+        self.x_block = DismantledBlock(
+            num_heads=num_heads,
+            hidden_dim=hidden_dim,
+            mlp_ratio=mlp_ratio,
+            use_projection=True,
+            dtype=self.dtype_policy,
+            name="x_block",
+        )
+        self.context_block = DismantledBlock(
+            num_heads=num_heads,
+            hidden_dim=hidden_dim,
+            mlp_ratio=mlp_ratio,
+            use_projection=use_context_projection,
+            dtype=self.dtype_policy,
+            name="context_block",
+        )
+        self.softmax = layers.Softmax(dtype="float32")
+    def build(self, inputs_shape, context_shape, timestep_embedding_shape):
+        self.x_block.build(inputs_shape, timestep_embedding_shape)
+        self.context_block.build(context_shape, timestep_embedding_shape)
+    def _compute_attention(self, query, key, value):
+        query = ops.multiply(
+            query, ops.cast(self._inverse_sqrt_key_dim, query.dtype)
+        )
+        attention_scores = ops.einsum(self._dot_product_equation, key, query)
+        attention_scores = self.softmax(attention_scores)
+        attention_scores = ops.cast(attention_scores, self.compute_dtype)
+        attention_output = ops.einsum(
+            self._combine_equation, attention_scores, value
+        )
+        batch_size = ops.shape(attention_output)[0]
+        attention_output = ops.reshape(
+            attention_output, (batch_size, -1, self.num_heads * self.head_dim)
+        )
+        return attention_output
+    def call(self, inputs, context, timestep_embedding, training=None):
+        # Compute pre-attention.
+        x = inputs
+        if self.use_context_projection:
+            context_qkv, context_intermediates = self.context_block(
+                context,
+                timestep_embedding=timestep_embedding,
+                training=training,
+            )
+        else:
+            context_qkv = self.context_block(
+                context,
+                timestep_embedding=timestep_embedding,
+                training=training,
+            )
+        context_len = ops.shape(context_qkv[0])[1]
+        x_qkv, x_intermediates = self.x_block(
+            x, timestep_embedding=timestep_embedding, training=training
+        )
+        q = ops.concatenate([context_qkv[0], x_qkv[0]], axis=1)
+        k = ops.concatenate([context_qkv[1], x_qkv[1]], axis=1)
+        v = ops.concatenate([context_qkv[2], x_qkv[2]], axis=1)
+        # Compute attention.
+        attention = self._compute_attention(q, k, v)
+        context_attention = attention[:, :context_len]
+        x_attention = attention[:, context_len:]
+        # Compute post-attention.
+        x = self.x_block(
+            x_attention,
+            inputs_intermediates=x_intermediates,
+            pre_attention=False,
+            training=training,
+        )
+        if self.use_context_projection:
+            context = self.context_block(
+                context_attention,
+                inputs_intermediates=context_intermediates,
+                pre_attention=False,
+                training=training,
+            )
+            return x, context
+        else:
+            return x
+    def get_config(self):
+        config = super().get_config()
+        config.update(
+            {
+                "num_heads": self.num_heads,
+                "hidden_dim": self.hidden_dim,
+                "mlp_ratio": self.mlp_ratio,
+                "use_context_projection": self.use_context_projection,
+            }
+        )
+        return config
+    def compute_output_shape(
+        self, inputs_shape, context_shape, timestep_embedding_shape
+    ):
+        if self.use_context_projection:
+            return inputs_shape, context_shape
+        else:
+            return inputs_shape
 class OutputLayer(layers.Layer):
     def __init__(self, hidden_dim, output_dim, **kwargs):
         super().__init__(**kwargs)
@@ -186,11 +473,11 @@ class OutputLayer(layers.Layer):
             epsilon=1e-6,
             center=False,
             scale=False,
-            dtype=self.dtype_policy,
+            dtype="float32",
             name="norm",
         )
         self.output_dense = layers.Dense(
-            output_dim,  # patch_size ** 2 * input_channels
+            output_dim,
             use_bias=True,
             dtype=self.dtype_policy,
             name="output_dense",
@@ -227,6 +514,11 @@ class OutputLayer(layers.Layer):
         )
         return config
+    def compute_output_shape(self, inputs_shape):
+        outputs_shape = list(inputs_shape)
+        outputs_shape[-1] = self.output_dim
+        return outputs_shape
 class Unpatch(layers.Layer):
     def __init__(self, patch_size, output_dim, **kwargs):
@@ -263,18 +555,48 @@ class Unpatch(layers.Layer):
         return [inputs_shape[0], None, None, self.output_dim]
-class MMDiT(keras.Model):
+class MMDiT(Backbone):
+    """Multimodal Diffusion Transformer (MMDiT) model for Stable Diffusion 3.
+    MMDiT is introduced in [
+    Scaling Rectified Flow Transformers for High-Resolution Image Synthesis](
+    https://arxiv.org/abs/2403.03206).
+    Args:
+        patch_size: int. The size of each square patch in the input image.
+        hidden_dim: int. The size of the transformer hidden state at the end
+            of each transformer layer.
+        num_layers: int. The number of transformer layers.
+        num_heads: int. The number of attention heads for each transformer.
+        position_size: int. The size of the height and width for the position
+            embedding.
+        mlp_ratio: float. The ratio of the mlp hidden dim to the transformer
+        latent_shape: tuple. The shape of the latent image.
+        context_shape: tuple. The shape of the context.
+        pooled_projection_shape: tuple. The shape of the pooled projection.
+        data_format: `None` or str. If specified, either `"channels_last"` or
+            `"channels_first"`. The ordering of the dimensions in the
+            inputs. `"channels_last"` corresponds to inputs with shape
+            `(batch_size, height, width, channels)`
+            while `"channels_first"` corresponds to inputs with shape
+            `(batch_size, channels, height, width)`. It defaults to the
+            `image_data_format` value found in your Keras config file at
+            `~/.keras/keras.json`. If you never set it, then it will be
+            `"channels_last"`.
+        dtype: `None` or str or `keras.mixed_precision.DTypePolicy`. The dtype
+            to use for the model's computations and weights.
+    """
     def __init__(
         self,
         patch_size,
-        num_heads,
         hidden_dim,
-        depth,
+        num_layers,
+        num_heads,
         position_size,
-        output_dim,
         mlp_ratio=4.0,
         latent_shape=(64, 64, 16),
-        context_shape=(1024, 4096),
+        context_shape=(None, 4096),
         pooled_projection_shape=(2048,),
         data_format=None,
         dtype=None,
@@ -287,6 +609,7 @@ class MMDiT(keras.Model):
             )
         image_height = latent_shape[0] // patch_size
         image_width = latent_shape[1] // patch_size
+        output_dim = latent_shape[-1]
         output_dim_in_final = patch_size**2 * output_dim
         data_format = standardize_data_format(data_format)
         if data_format != "channels_last":
@@ -331,11 +654,11 @@ class MMDiT(keras.Model):
                 num_heads,
                 hidden_dim,
                 mlp_ratio,
-                use_context_projection=not (i == depth - 1),
+                use_context_projection=not (i == num_layers - 1),
                 dtype=dtype,
                 name=f"joint_block_{i}",
             )
-            for i in range(depth)
+            for i in range(num_layers)
         ]
         self.output_layer = OutputLayer(
             hidden_dim, output_dim_in_final, dtype=dtype, name="output_layer"
@@ -391,33 +714,22 @@ class MMDiT(keras.Model):
         self.patch_size = patch_size
         self.num_heads = num_heads
         self.hidden_dim = hidden_dim
-        self.depth = depth
+        self.num_layers = num_layers
         self.position_size = position_size
-        self.output_dim = output_dim
         self.mlp_ratio = mlp_ratio
         self.latent_shape = latent_shape
         self.context_shape = context_shape
         self.pooled_projection_shape = pooled_projection_shape
-        if dtype is not None:
-            try:
-                self.dtype_policy = keras.dtype_policies.get(dtype)
-            # Before Keras 3.2, there is no `keras.dtype_policies.get`.
-            except AttributeError:
-                if isinstance(dtype, keras.DTypePolicy):
-                    dtype = dtype.name
-                self.dtype_policy = keras.DTypePolicy(dtype)
     def get_config(self):
         config = super().get_config()
         config.update(
             {
                 "patch_size": self.patch_size,
-                "num_heads": self.num_heads,
                 "hidden_dim": self.hidden_dim,
-                "depth": self.depth,
+                "num_layers": self.num_layers,
+                "num_heads": self.num_heads,
                 "position_size": self.position_size,
-                "output_dim": self.output_dim,
                 "mlp_ratio": self.mlp_ratio,
                 "latent_shape": self.latent_shape,
                 "context_shape": self.context_shape,

keras-hub-nightly 0.16.1.dev202409250340__py3-none-any.whl → 0.16.1.dev202409270338__py3-none-any.whl

keras-hub-nightly 0.16.1.dev202409250340py3-none-any.whl → 0.16.1.dev202409270338py3-none-any.whl