sunholo 0.138.1__tar.gz → 0.139.0__tar.gz

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
Files changed (189) hide show
  1. {sunholo-0.138.1/src/sunholo.egg-info → sunholo-0.139.0}/PKG-INFO +1 -1
  2. {sunholo-0.138.1 → sunholo-0.139.0}/pyproject.toml +1 -1
  3. sunholo-0.139.0/src/sunholo/gcs/download_gcs_text.py +132 -0
  4. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/utils/mime.py +50 -0
  5. {sunholo-0.138.1 → sunholo-0.139.0/src/sunholo.egg-info}/PKG-INFO +1 -1
  6. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo.egg-info/SOURCES.txt +1 -0
  7. {sunholo-0.138.1 → sunholo-0.139.0}/LICENSE.txt +0 -0
  8. {sunholo-0.138.1 → sunholo-0.139.0}/MANIFEST.in +0 -0
  9. {sunholo-0.138.1 → sunholo-0.139.0}/README.md +0 -0
  10. {sunholo-0.138.1 → sunholo-0.139.0}/setup.cfg +0 -0
  11. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/__init__.py +0 -0
  12. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/agents/__init__.py +0 -0
  13. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/agents/chat_history.py +0 -0
  14. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/agents/dispatch_to_qa.py +0 -0
  15. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/agents/fastapi/__init__.py +0 -0
  16. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/agents/fastapi/base.py +0 -0
  17. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/agents/fastapi/qna_routes.py +0 -0
  18. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/agents/flask/__init__.py +0 -0
  19. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/agents/flask/base.py +0 -0
  20. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/agents/flask/qna_routes.py +0 -0
  21. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/agents/flask/vac_routes.py +0 -0
  22. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/agents/langserve.py +0 -0
  23. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/agents/pubsub.py +0 -0
  24. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/agents/route.py +0 -0
  25. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/agents/special_commands.py +0 -0
  26. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/agents/swagger.py +0 -0
  27. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/archive/__init__.py +0 -0
  28. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/archive/archive.py +0 -0
  29. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/auth/__init__.py +0 -0
  30. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/auth/gcloud.py +0 -0
  31. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/auth/refresh.py +0 -0
  32. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/auth/run.py +0 -0
  33. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/azure/__init__.py +0 -0
  34. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/azure/auth.py +0 -0
  35. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/azure/blobs.py +0 -0
  36. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/azure/event_grid.py +0 -0
  37. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/bots/__init__.py +0 -0
  38. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/bots/discord.py +0 -0
  39. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/bots/github_webhook.py +0 -0
  40. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/bots/webapp.py +0 -0
  41. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/chunker/__init__.py +0 -0
  42. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/chunker/azure.py +0 -0
  43. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/chunker/doc_handling.py +0 -0
  44. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/chunker/encode_metadata.py +0 -0
  45. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/chunker/images.py +0 -0
  46. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/chunker/loaders.py +0 -0
  47. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/chunker/message_data.py +0 -0
  48. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/chunker/pdfs.py +0 -0
  49. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/chunker/process_chunker_data.py +0 -0
  50. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/chunker/publish.py +0 -0
  51. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/chunker/pubsub.py +0 -0
  52. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/chunker/splitter.py +0 -0
  53. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/cli/__init__.py +0 -0
  54. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/cli/chat_vac.py +0 -0
  55. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/cli/cli.py +0 -0
  56. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/cli/cli_init.py +0 -0
  57. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/cli/configs.py +0 -0
  58. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/cli/deploy.py +0 -0
  59. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/cli/embedder.py +0 -0
  60. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/cli/merge_texts.py +0 -0
  61. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/cli/run_proxy.py +0 -0
  62. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/cli/sun_rich.py +0 -0
  63. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/cli/swagger.py +0 -0
  64. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/cli/vertex.py +0 -0
  65. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/components/__init__.py +0 -0
  66. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/components/llm.py +0 -0
  67. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/components/retriever.py +0 -0
  68. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/components/vectorstore.py +0 -0
  69. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/custom_logging.py +0 -0
  70. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/database/__init__.py +0 -0
  71. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/database/alloydb.py +0 -0
  72. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/database/alloydb_client.py +0 -0
  73. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/database/database.py +0 -0
  74. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/database/lancedb.py +0 -0
  75. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/database/sql/sb/create_function.sql +0 -0
  76. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/database/sql/sb/create_function_time.sql +0 -0
  77. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/database/sql/sb/create_table.sql +0 -0
  78. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/database/sql/sb/delete_source_row.sql +0 -0
  79. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/database/sql/sb/return_sources.sql +0 -0
  80. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/database/sql/sb/setup.sql +0 -0
  81. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/database/static_dbs.py +0 -0
  82. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/database/uuid.py +0 -0
  83. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/discovery_engine/__init__.py +0 -0
  84. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/discovery_engine/chunker_handler.py +0 -0
  85. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/discovery_engine/cli.py +0 -0
  86. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/discovery_engine/create_new.py +0 -0
  87. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/discovery_engine/discovery_engine_client.py +0 -0
  88. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/discovery_engine/get_ai_search_chunks.py +0 -0
  89. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/embedder/__init__.py +0 -0
  90. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/embedder/embed_chunk.py +0 -0
  91. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/embedder/embed_metadata.py +0 -0
  92. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/excel/__init__.py +0 -0
  93. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/excel/plugin.py +0 -0
  94. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/gcs/__init__.py +0 -0
  95. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/gcs/add_file.py +0 -0
  96. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/gcs/download_folder.py +0 -0
  97. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/gcs/download_url.py +0 -0
  98. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/gcs/extract_and_sign.py +0 -0
  99. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/gcs/metadata.py +0 -0
  100. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/genai/__init__.py +0 -0
  101. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/genai/file_handling.py +0 -0
  102. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/genai/genaiv2.py +0 -0
  103. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/genai/images.py +0 -0
  104. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/genai/init.py +0 -0
  105. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/genai/process_funcs_cls.py +0 -0
  106. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/genai/safety.py +0 -0
  107. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/invoke/__init__.py +0 -0
  108. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/invoke/async_class.py +0 -0
  109. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/invoke/direct_vac_func.py +0 -0
  110. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/invoke/invoke_vac_utils.py +0 -0
  111. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/langchain_types.py +0 -0
  112. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/langfuse/__init__.py +0 -0
  113. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/langfuse/callback.py +0 -0
  114. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/langfuse/evals.py +0 -0
  115. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/langfuse/prompts.py +0 -0
  116. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/llamaindex/__init__.py +0 -0
  117. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/llamaindex/get_files.py +0 -0
  118. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/llamaindex/import_files.py +0 -0
  119. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/llamaindex/llamaindex_class.py +0 -0
  120. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/llamaindex/user_history.py +0 -0
  121. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/lookup/__init__.py +0 -0
  122. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/lookup/model_lookup.yaml +0 -0
  123. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/mcp/__init__.py +0 -0
  124. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/mcp/cli.py +0 -0
  125. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/ollama/__init__.py +0 -0
  126. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/ollama/ollama_images.py +0 -0
  127. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/pubsub/__init__.py +0 -0
  128. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/pubsub/process_pubsub.py +0 -0
  129. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/pubsub/pubsub_manager.py +0 -0
  130. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/qna/__init__.py +0 -0
  131. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/qna/parsers.py +0 -0
  132. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/qna/retry.py +0 -0
  133. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/senses/__init__.py +0 -0
  134. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/senses/stream_voice.py +0 -0
  135. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/streaming/__init__.py +0 -0
  136. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/streaming/content_buffer.py +0 -0
  137. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/streaming/langserve.py +0 -0
  138. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/streaming/stream_lookup.py +0 -0
  139. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/streaming/streaming.py +0 -0
  140. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/summarise/__init__.py +0 -0
  141. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/summarise/summarise.py +0 -0
  142. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/templates/agent/__init__.py +0 -0
  143. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/templates/agent/agent_service.py +0 -0
  144. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/templates/agent/app.py +0 -0
  145. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/templates/agent/my_log.py +0 -0
  146. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/templates/agent/tools/__init__.py +0 -0
  147. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/templates/agent/tools/your_agent.py +0 -0
  148. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/templates/agent/vac_service.py +0 -0
  149. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/templates/project/__init__.py +0 -0
  150. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/templates/project/app.py +0 -0
  151. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/templates/project/my_log.py +0 -0
  152. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/templates/project/vac_service.py +0 -0
  153. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/templates/system_services/__init__.py +0 -0
  154. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/templates/system_services/app.py +0 -0
  155. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/templates/system_services/my_log.py +0 -0
  156. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/terraform/__init__.py +0 -0
  157. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/terraform/tfvars_editor.py +0 -0
  158. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/tools/__init__.py +0 -0
  159. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/tools/web_browser.py +0 -0
  160. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/utils/__init__.py +0 -0
  161. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/utils/api_key.py +0 -0
  162. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/utils/big_context.py +0 -0
  163. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/utils/config.py +0 -0
  164. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/utils/config_class.py +0 -0
  165. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/utils/config_schema.py +0 -0
  166. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/utils/gcp.py +0 -0
  167. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/utils/gcp_project.py +0 -0
  168. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/utils/parsers.py +0 -0
  169. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/utils/timedelta.py +0 -0
  170. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/utils/user_ids.py +0 -0
  171. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/utils/version.py +0 -0
  172. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/vertex/__init__.py +0 -0
  173. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/vertex/extensions_call.py +0 -0
  174. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/vertex/extensions_class.py +0 -0
  175. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/vertex/genai_functions.py +0 -0
  176. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/vertex/init.py +0 -0
  177. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/vertex/memory_tools.py +0 -0
  178. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/vertex/safety.py +0 -0
  179. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo/vertex/type_dict_to_json.py +0 -0
  180. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo.egg-info/dependency_links.txt +0 -0
  181. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo.egg-info/entry_points.txt +0 -0
  182. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo.egg-info/requires.txt +0 -0
  183. {sunholo-0.138.1 → sunholo-0.139.0}/src/sunholo.egg-info/top_level.txt +0 -0
  184. {sunholo-0.138.1 → sunholo-0.139.0}/tests/test_async.py +0 -0
  185. {sunholo-0.138.1 → sunholo-0.139.0}/tests/test_async_genai2.py +0 -0
  186. {sunholo-0.138.1 → sunholo-0.139.0}/tests/test_chat_history.py +0 -0
  187. {sunholo-0.138.1 → sunholo-0.139.0}/tests/test_config.py +0 -0
  188. {sunholo-0.138.1 → sunholo-0.139.0}/tests/test_genai2.py +0 -0
  189. {sunholo-0.138.1 → sunholo-0.139.0}/tests/test_unstructured.py +0 -0
@@ -1,6 +1,6 @@
1
1
  Metadata-Version: 2.4
2
2
  Name: sunholo
3
- Version: 0.138.1
3
+ Version: 0.139.0
4
4
  Summary: AI DevOps - a package to help deploy GenAI to the Cloud.
5
5
  Author-email: Holosun ApS <multivac@sunholo.com>
6
6
  License: Apache License, Version 2.0
@@ -4,7 +4,7 @@ build-backend = "setuptools.build_meta"
4
4
 
5
5
  [project]
6
6
  name = "sunholo"
7
- version = "0.138.1"
7
+ version = "0.139.0"
8
8
  description = "AI DevOps - a package to help deploy GenAI to the Cloud."
9
9
  readme = "README.md"
10
10
  requires-python = ">=3.10"
@@ -0,0 +1,132 @@
1
+ import os
2
+ import json
3
+
4
+ from ..custom_logging import log
5
+ from ..utils.mime import get_mime_type_gemini
6
+ from .download_url import get_bytes_from_gcs
7
+
8
+ def download_gcs_source_to_string(source:str) -> str:
9
+ """
10
+ source: str The Google Cloud Storage URI of the file to download (e.g., 'gs://bucket_name/file_name').
11
+ """
12
+ mime_type = get_mime_type_gemini(source)
13
+ if mime_type == "":
14
+ log.warning(f"Can not download to string file source {source}")
15
+ return ""
16
+ """
17
+ mime_types = {
18
+
19
+ # Images
20
+ 'png': 'image/png',
21
+ 'jpg': 'image/jpeg',
22
+ 'jpeg': 'image/jpeg',
23
+ 'gif': 'image/gif',
24
+ 'webp': 'image/webp',
25
+
26
+ # Document formats
27
+ 'pdf': 'application/pdf',
28
+
29
+ # Programming languages
30
+ 'js': 'text/javascript',
31
+ 'py': 'text/x-python',
32
+
33
+ # Web formats
34
+ 'html': 'text/html',
35
+ 'htm': 'text/html',
36
+ 'css': 'text/css',
37
+
38
+ # Text formats
39
+ 'txt': 'text/plain',
40
+ 'md': 'text/md',
41
+ 'csv': 'text/csv',
42
+ 'xml': 'text/xml',
43
+ 'rtf': 'text/rtf',
44
+
45
+ # Special case: JSON files are treated as plain text
46
+ 'json': 'text/plain'
47
+ }
48
+ """
49
+ if mime_type.startswith("image/") or mime_type == "application/pdf":
50
+ log.warning(f"Can not download to string file source {source} of type {mime_type}")
51
+ return ""
52
+
53
+ try:
54
+ log.info(f"Extracting text for {source}")
55
+ bytes = get_bytes_from_gcs(source)
56
+ string = bytes.decode('utf-8', errors='replace')
57
+ log.info(f"Extracted {len(string)} characters from {source}: {string[:100]}")
58
+
59
+ except Exception as err:
60
+ log.error(f"Could not extract string text for {source}: {str(err)}")
61
+
62
+ return ""
63
+
64
+ if not string:
65
+ raise ValueError(f"No string text for {source}")
66
+
67
+ file_ext = os.path.splitext(source)[1].lower().lstrip('.')
68
+ if file_ext == "json":
69
+ try:
70
+ extracted_data = json.loads(string)
71
+ log.debug("Turning json text into markdown format so as not to confuse structured output", log_struct=extracted_data)
72
+ string = json_data_to_markdown(extracted_data)
73
+ except json.JSONDecodeError:
74
+ log.warning(f"Could not get valid json from .json file: {source}")
75
+
76
+ return string
77
+
78
+ def json_data_to_markdown(data, indent_level: int = 0) -> str:
79
+ """
80
+ Recursively converts a Python object (from parsed JSON) into a Markdown string.
81
+ """
82
+ indent = " " * indent_level # Use 2 spaces for indentation
83
+ markdown_parts = []
84
+
85
+ if isinstance(data, dict):
86
+ if not data:
87
+ return f"{indent}(empty object)"
88
+ for key, value in data.items():
89
+ # Process the value recursively
90
+ value_md = json_data_to_markdown(value, indent_level + 1)
91
+ # Determine if the rendered value is complex (multi-line or was list/dict)
92
+ is_complex_render = "\n" in value_md.strip() or (isinstance(value, (dict, list)) and value)
93
+
94
+ if is_complex_render:
95
+ markdown_parts.append(f"{indent}**{key}**:")
96
+ markdown_parts.append(value_md)
97
+ else:
98
+ # Simple value rendering, strip its own indent before adding key
99
+ markdown_parts.append(f"{indent}**{key}**: {value_md.strip()}")
100
+ return "\n".join(markdown_parts)
101
+
102
+ elif isinstance(data, list):
103
+ if not data:
104
+ return f"{indent}(empty list)"
105
+ for item in data:
106
+ # Process item recursively
107
+ item_md = json_data_to_markdown(item, indent_level + 1)
108
+ # Remove leading indent from the recursive call before processing lines
109
+ lines = item_md.lstrip(' ').split('\n')
110
+ # Add bullet point to the first line
111
+ first_line = f"{indent}- {lines[0]}"
112
+ # Ensure subsequent lines are indented correctly relative to the bullet
113
+ rest_lines = [f"{indent} {line}" for line in lines[1:]]
114
+ markdown_parts.append(first_line)
115
+ markdown_parts.extend(rest_lines)
116
+ return "\n".join(markdown_parts)
117
+
118
+ elif isinstance(data, str):
119
+ # Handle multi-line strings: indent subsequent lines
120
+ lines = data.split('\n')
121
+ if len(lines) <= 1:
122
+ return f"{indent}{data}" # Single line string
123
+ else:
124
+ indented_lines = [f"{indent}{lines[0]}"] + [f"{indent} {line}" for line in lines[1:]]
125
+ return "\n".join(indented_lines)
126
+
127
+ elif data is None:
128
+ return f"{indent}*null*" # Represent None distinctly
129
+ elif isinstance(data, bool):
130
+ return f"{indent}{str(data).lower()}" # true / false
131
+ else: # Numbers (int, float)
132
+ return f"{indent}{str(data)}"
@@ -66,3 +66,53 @@ def guess_mime_type(file_path: str) -> str:
66
66
 
67
67
  return mime
68
68
 
69
+
70
+ def get_mime_type_gemini(file_path:str) -> str:
71
+ """
72
+ Determine the MIME type based on file extension.
73
+ Only returns valid Gemini formats, or None if they are not supported.
74
+
75
+ Args:
76
+ file_path (str): Path to the file
77
+
78
+ Returns:
79
+ str: The appropriate MIME type for the file
80
+ """
81
+ # Extract the file extension (lowercase)
82
+ ext = os.path.splitext(file_path)[1].lower().lstrip('.')
83
+
84
+ # Define the mapping of extensions to MIME types
85
+ mime_types = {
86
+
87
+ # Images
88
+ 'png': 'image/png',
89
+ 'jpg': 'image/jpeg',
90
+ 'jpeg': 'image/jpeg',
91
+ 'gif': 'image/gif',
92
+ 'webp': 'image/webp',
93
+
94
+ # Document formats
95
+ 'pdf': 'application/pdf',
96
+
97
+ # Programming languages
98
+ 'js': 'text/javascript',
99
+ 'py': 'text/x-python',
100
+
101
+ # Web formats
102
+ 'html': 'text/html',
103
+ 'htm': 'text/html',
104
+ 'css': 'text/css',
105
+
106
+ # Text formats
107
+ 'txt': 'text/plain',
108
+ 'md': 'text/md',
109
+ 'csv': 'text/csv',
110
+ 'xml': 'text/xml',
111
+ 'rtf': 'text/rtf',
112
+
113
+ # Special case: JSON files are treated as plain text
114
+ 'json': 'text/plain'
115
+ }
116
+
117
+ # Return the appropriate MIME type, defaulting to None if unknown
118
+ return mime_types.get(ext, "")
@@ -1,6 +1,6 @@
1
1
  Metadata-Version: 2.4
2
2
  Name: sunholo
3
- Version: 0.138.1
3
+ Version: 0.139.0
4
4
  Summary: AI DevOps - a package to help deploy GenAI to the Cloud.
5
5
  Author-email: Holosun ApS <multivac@sunholo.com>
6
6
  License: Apache License, Version 2.0
@@ -95,6 +95,7 @@ src/sunholo/excel/plugin.py
95
95
  src/sunholo/gcs/__init__.py
96
96
  src/sunholo/gcs/add_file.py
97
97
  src/sunholo/gcs/download_folder.py
98
+ src/sunholo/gcs/download_gcs_text.py
98
99
  src/sunholo/gcs/download_url.py
99
100
  src/sunholo/gcs/extract_and_sign.py
100
101
  src/sunholo/gcs/metadata.py
File without changes
File without changes
File without changes
File without changes
File without changes