sunholo 0.119.3__tar.gz → 0.119.6__tar.gz

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.
Files changed (185) hide show
  1. {sunholo-0.119.3/src/sunholo.egg-info → sunholo-0.119.6}/PKG-INFO +1 -1
  2. {sunholo-0.119.3 → sunholo-0.119.6}/pyproject.toml +1 -1
  3. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/discovery_engine/chunker_handler.py +6 -2
  4. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/discovery_engine/discovery_engine_client.py +4 -0
  5. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/embedder/embed_chunk.py +2 -19
  6. sunholo-0.119.6/src/sunholo/embedder/embed_metadata.py +27 -0
  7. {sunholo-0.119.3 → sunholo-0.119.6/src/sunholo.egg-info}/PKG-INFO +1 -1
  8. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo.egg-info/SOURCES.txt +1 -0
  9. {sunholo-0.119.3 → sunholo-0.119.6}/LICENSE.txt +0 -0
  10. {sunholo-0.119.3 → sunholo-0.119.6}/MANIFEST.in +0 -0
  11. {sunholo-0.119.3 → sunholo-0.119.6}/README.md +0 -0
  12. {sunholo-0.119.3 → sunholo-0.119.6}/setup.cfg +0 -0
  13. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/__init__.py +0 -0
  14. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/agents/__init__.py +0 -0
  15. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/agents/chat_history.py +0 -0
  16. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/agents/dispatch_to_qa.py +0 -0
  17. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/agents/fastapi/__init__.py +0 -0
  18. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/agents/fastapi/base.py +0 -0
  19. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/agents/fastapi/qna_routes.py +0 -0
  20. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/agents/flask/__init__.py +0 -0
  21. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/agents/flask/base.py +0 -0
  22. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/agents/flask/qna_routes.py +0 -0
  23. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/agents/flask/vac_routes.py +0 -0
  24. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/agents/langserve.py +0 -0
  25. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/agents/pubsub.py +0 -0
  26. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/agents/route.py +0 -0
  27. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/agents/special_commands.py +0 -0
  28. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/agents/swagger.py +0 -0
  29. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/archive/__init__.py +0 -0
  30. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/archive/archive.py +0 -0
  31. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/auth/__init__.py +0 -0
  32. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/auth/gcloud.py +0 -0
  33. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/auth/refresh.py +0 -0
  34. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/auth/run.py +0 -0
  35. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/azure/__init__.py +0 -0
  36. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/azure/auth.py +0 -0
  37. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/azure/blobs.py +0 -0
  38. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/azure/event_grid.py +0 -0
  39. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/bots/__init__.py +0 -0
  40. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/bots/discord.py +0 -0
  41. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/bots/github_webhook.py +0 -0
  42. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/bots/webapp.py +0 -0
  43. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/chunker/__init__.py +0 -0
  44. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/chunker/azure.py +0 -0
  45. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/chunker/doc_handling.py +0 -0
  46. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/chunker/encode_metadata.py +0 -0
  47. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/chunker/images.py +0 -0
  48. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/chunker/loaders.py +0 -0
  49. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/chunker/message_data.py +0 -0
  50. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/chunker/pdfs.py +0 -0
  51. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/chunker/process_chunker_data.py +0 -0
  52. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/chunker/publish.py +0 -0
  53. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/chunker/pubsub.py +0 -0
  54. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/chunker/splitter.py +0 -0
  55. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/cli/__init__.py +0 -0
  56. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/cli/chat_vac.py +0 -0
  57. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/cli/cli.py +0 -0
  58. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/cli/cli_init.py +0 -0
  59. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/cli/configs.py +0 -0
  60. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/cli/deploy.py +0 -0
  61. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/cli/embedder.py +0 -0
  62. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/cli/merge_texts.py +0 -0
  63. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/cli/run_proxy.py +0 -0
  64. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/cli/sun_rich.py +0 -0
  65. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/cli/swagger.py +0 -0
  66. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/cli/vertex.py +0 -0
  67. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/components/__init__.py +0 -0
  68. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/components/llm.py +0 -0
  69. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/components/retriever.py +0 -0
  70. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/components/vectorstore.py +0 -0
  71. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/custom_logging.py +0 -0
  72. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/database/__init__.py +0 -0
  73. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/database/alloydb.py +0 -0
  74. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/database/alloydb_client.py +0 -0
  75. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/database/database.py +0 -0
  76. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/database/lancedb.py +0 -0
  77. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/database/sql/sb/create_function.sql +0 -0
  78. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/database/sql/sb/create_function_time.sql +0 -0
  79. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/database/sql/sb/create_table.sql +0 -0
  80. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/database/sql/sb/delete_source_row.sql +0 -0
  81. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/database/sql/sb/return_sources.sql +0 -0
  82. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/database/sql/sb/setup.sql +0 -0
  83. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/database/static_dbs.py +0 -0
  84. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/database/uuid.py +0 -0
  85. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/discovery_engine/__init__.py +0 -0
  86. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/discovery_engine/create_new.py +0 -0
  87. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/discovery_engine/get_ai_search_chunks.py +0 -0
  88. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/embedder/__init__.py +0 -0
  89. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/excel/__init__.py +0 -0
  90. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/excel/plugin.py +0 -0
  91. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/gcs/__init__.py +0 -0
  92. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/gcs/add_file.py +0 -0
  93. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/gcs/download_folder.py +0 -0
  94. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/gcs/download_url.py +0 -0
  95. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/gcs/extract_and_sign.py +0 -0
  96. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/gcs/metadata.py +0 -0
  97. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/genai/__init__.py +0 -0
  98. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/genai/file_handling.py +0 -0
  99. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/genai/genaiv2.py +0 -0
  100. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/genai/images.py +0 -0
  101. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/genai/init.py +0 -0
  102. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/genai/process_funcs_cls.py +0 -0
  103. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/genai/safety.py +0 -0
  104. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/invoke/__init__.py +0 -0
  105. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/invoke/async_class.py +0 -0
  106. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/invoke/direct_vac_func.py +0 -0
  107. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/invoke/invoke_vac_utils.py +0 -0
  108. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/langchain_types.py +0 -0
  109. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/langfuse/__init__.py +0 -0
  110. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/langfuse/callback.py +0 -0
  111. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/langfuse/evals.py +0 -0
  112. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/langfuse/prompts.py +0 -0
  113. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/llamaindex/__init__.py +0 -0
  114. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/llamaindex/get_files.py +0 -0
  115. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/llamaindex/import_files.py +0 -0
  116. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/llamaindex/llamaindex_class.py +0 -0
  117. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/llamaindex/user_history.py +0 -0
  118. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/lookup/__init__.py +0 -0
  119. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/lookup/model_lookup.yaml +0 -0
  120. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/mcp/__init__.py +0 -0
  121. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/mcp/cli.py +0 -0
  122. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/pubsub/__init__.py +0 -0
  123. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/pubsub/process_pubsub.py +0 -0
  124. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/pubsub/pubsub_manager.py +0 -0
  125. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/qna/__init__.py +0 -0
  126. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/qna/parsers.py +0 -0
  127. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/qna/retry.py +0 -0
  128. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/senses/__init__.py +0 -0
  129. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/senses/stream_voice.py +0 -0
  130. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/streaming/__init__.py +0 -0
  131. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/streaming/content_buffer.py +0 -0
  132. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/streaming/langserve.py +0 -0
  133. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/streaming/stream_lookup.py +0 -0
  134. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/streaming/streaming.py +0 -0
  135. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/summarise/__init__.py +0 -0
  136. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/summarise/summarise.py +0 -0
  137. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/templates/agent/__init__.py +0 -0
  138. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/templates/agent/agent_service.py +0 -0
  139. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/templates/agent/app.py +0 -0
  140. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/templates/agent/my_log.py +0 -0
  141. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/templates/agent/tools/__init__.py +0 -0
  142. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/templates/agent/tools/your_agent.py +0 -0
  143. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/templates/agent/vac_service.py +0 -0
  144. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/templates/project/__init__.py +0 -0
  145. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/templates/project/app.py +0 -0
  146. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/templates/project/my_log.py +0 -0
  147. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/templates/project/vac_service.py +0 -0
  148. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/templates/system_services/__init__.py +0 -0
  149. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/templates/system_services/app.py +0 -0
  150. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/templates/system_services/my_log.py +0 -0
  151. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/terraform/__init__.py +0 -0
  152. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/terraform/tfvars_editor.py +0 -0
  153. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/tools/__init__.py +0 -0
  154. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/tools/web_browser.py +0 -0
  155. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/utils/__init__.py +0 -0
  156. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/utils/api_key.py +0 -0
  157. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/utils/big_context.py +0 -0
  158. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/utils/config.py +0 -0
  159. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/utils/config_class.py +0 -0
  160. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/utils/config_schema.py +0 -0
  161. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/utils/gcp.py +0 -0
  162. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/utils/gcp_project.py +0 -0
  163. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/utils/mime.py +0 -0
  164. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/utils/parsers.py +0 -0
  165. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/utils/timedelta.py +0 -0
  166. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/utils/user_ids.py +0 -0
  167. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/utils/version.py +0 -0
  168. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/vertex/__init__.py +0 -0
  169. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/vertex/extensions_call.py +0 -0
  170. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/vertex/extensions_class.py +0 -0
  171. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/vertex/genai_functions.py +0 -0
  172. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/vertex/init.py +0 -0
  173. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/vertex/memory_tools.py +0 -0
  174. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/vertex/safety.py +0 -0
  175. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo/vertex/type_dict_to_json.py +0 -0
  176. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo.egg-info/dependency_links.txt +0 -0
  177. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo.egg-info/entry_points.txt +0 -0
  178. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo.egg-info/requires.txt +0 -0
  179. {sunholo-0.119.3 → sunholo-0.119.6}/src/sunholo.egg-info/top_level.txt +0 -0
  180. {sunholo-0.119.3 → sunholo-0.119.6}/tests/test_async.py +0 -0
  181. {sunholo-0.119.3 → sunholo-0.119.6}/tests/test_async_genai2.py +0 -0
  182. {sunholo-0.119.3 → sunholo-0.119.6}/tests/test_chat_history.py +0 -0
  183. {sunholo-0.119.3 → sunholo-0.119.6}/tests/test_config.py +0 -0
  184. {sunholo-0.119.3 → sunholo-0.119.6}/tests/test_genai2.py +0 -0
  185. {sunholo-0.119.3 → sunholo-0.119.6}/tests/test_unstructured.py +0 -0
@@ -1,6 +1,6 @@
1
1
  Metadata-Version: 2.2
2
2
  Name: sunholo
3
- Version: 0.119.3
3
+ Version: 0.119.6
4
4
  Summary: Large Language Model DevOps - a package to help deploy LLMs to the Cloud.
5
5
  Author-email: Holosun ApS <multivac@sunholo.com>
6
6
  License: Apache License, Version 2.0
@@ -4,7 +4,7 @@ build-backend = "setuptools.build_meta"
4
4
 
5
5
  [project]
6
6
  name = "sunholo"
7
- version = "0.119.3"
7
+ version = "0.119.6"
8
8
  description = "Large Language Model DevOps - a package to help deploy LLMs to the Cloud."
9
9
  readme = "README.md"
10
10
  requires-python = ">=3.10"
@@ -5,7 +5,7 @@ from ..components import load_memories
5
5
 
6
6
  from .discovery_engine_client import DiscoveryEngineClient
7
7
  from .create_new import create_new_discovery_engine
8
-
8
+ from ..embedder.embed_metadata import audit_metadata
9
9
 
10
10
  def do_discovery_engine(message_data:str, metadata:dict, config:ConfigManager=None):
11
11
  """
@@ -65,11 +65,15 @@ def do_discovery_engine(message_data:str, metadata:dict, config:ConfigManager=No
65
65
  return None
66
66
  for corp in corpuses:
67
67
  try:
68
+ metadata = audit_metadata(metadata, chunk_length=500)
68
69
  response = corp.import_document_with_metadata(
69
70
  gcs_uri=message_data,
70
71
  metadata=metadata
71
72
  )
72
- log.info(f"Imported file to corpus: {response} with metadata: {metadata}")
73
+ if response:
74
+ log.info(f"Imported file to corpus: {response} with metadata: {metadata}")
75
+ else:
76
+ log.warning(f"Could not import {message_data} got not response")
73
77
  except Exception as err:
74
78
  log.error(f"Error importing {message_data} - {corp=} - {str(err)}")
75
79
 
@@ -558,6 +558,9 @@ class DiscoveryEngineClient:
558
558
  except json.JSONDecodeError as e:
559
559
  log.error(f"Error decoding JSON in line: {line.strip()}. Error: {e}")
560
560
  continue # Skip to the next line if there's an error
561
+ except Exception as e:
562
+ log.error(f"Unknown error: {str(e)}")
563
+ raise e
561
564
 
562
565
  # 2. Use InlineSource to import:
563
566
  request = discoveryengine.ImportDocumentsRequest(
@@ -615,6 +618,7 @@ class DiscoveryEngineClient:
615
618
 
616
619
  except Exception as e:
617
620
  log.error(f"Error importing document with metadata: {e}")
621
+ raise e
618
622
 
619
623
  def get_mime_type(self, uri:str):
620
624
  return guess_mime_type(uri)
@@ -26,6 +26,7 @@ from ..components import get_embeddings, pick_vectorstore, load_memories, pick_e
26
26
  from ..custom_logging import log
27
27
  from ..database.uuid import generate_uuid_from_object_id
28
28
  from ..utils import ConfigManager
29
+ from .embed_metadata import audit_metadata
29
30
 
30
31
  def embed_pubsub_chunk(data: dict):
31
32
  """Triggered from a message on a Cloud Pub/Sub topic "embed_chunk" topic
@@ -75,25 +76,7 @@ def embed_pubsub_chunk(data: dict):
75
76
 
76
77
  log.info(f"Embedding: {vector_name} page_content: {page_content[:30]}...[{len(page_content)}] - {metadata}")
77
78
 
78
- if 'eventTime' not in metadata:
79
- metadata['eventTime'] = datetime.datetime.now().isoformat(timespec='microseconds') + "Z"
80
- metadata['eventtime'] = metadata['eventTime']
81
-
82
- if 'source' not in metadata:
83
- if 'objectId' in metadata:
84
- metadata['source'] = metadata['objectId']
85
- elif 'url' in metadata:
86
- metadata['source'] = metadata['url']
87
- else:
88
- log.warning(f"No source found in metadata: {metadata}")
89
-
90
- if 'original_source' not in metadata:
91
- metadata['original_source'] = metadata.get('source')
92
- else:
93
- metadata['source'] = metadata['original_source']
94
-
95
- if 'chunk_length' not in metadata:
96
- metadata['chunk_length'] = len(page_content)
79
+ metadata = audit_metadata(metadata, chunk_length=len(page_content))
97
80
 
98
81
  if 'doc_id' not in metadata:
99
82
  log.warning(f"No doc_id found in metadata for {metadata['source']}- creating one")
@@ -0,0 +1,27 @@
1
+
2
+ import datetime
3
+ from ..custom_logging import log
4
+
5
+ def audit_metadata(metadata, chunk_length=None):
6
+
7
+ if 'eventTime' not in metadata:
8
+ metadata['eventTime'] = datetime.datetime.now().isoformat(timespec='microseconds') + "Z"
9
+ metadata['eventtime'] = metadata['eventTime']
10
+
11
+ if 'source' not in metadata:
12
+ if 'objectId' in metadata:
13
+ metadata['source'] = metadata['objectId']
14
+ elif 'url' in metadata:
15
+ metadata['source'] = metadata['url']
16
+ else:
17
+ log.warning(f"No source found in metadata: {metadata}")
18
+
19
+ if 'original_source' not in metadata:
20
+ metadata['original_source'] = metadata.get('source')
21
+ else:
22
+ metadata['source'] = metadata['original_source']
23
+
24
+ if 'chunk_length' not in metadata:
25
+ metadata['chunk_length'] = chunk_length
26
+
27
+ return metadata
@@ -1,6 +1,6 @@
1
1
  Metadata-Version: 2.2
2
2
  Name: sunholo
3
- Version: 0.119.3
3
+ Version: 0.119.6
4
4
  Summary: Large Language Model DevOps - a package to help deploy LLMs to the Cloud.
5
5
  Author-email: Holosun ApS <multivac@sunholo.com>
6
6
  License: Apache License, Version 2.0
@@ -88,6 +88,7 @@ src/sunholo/discovery_engine/discovery_engine_client.py
88
88
  src/sunholo/discovery_engine/get_ai_search_chunks.py
89
89
  src/sunholo/embedder/__init__.py
90
90
  src/sunholo/embedder/embed_chunk.py
91
+ src/sunholo/embedder/embed_metadata.py
91
92
  src/sunholo/excel/__init__.py
92
93
  src/sunholo/excel/plugin.py
93
94
  src/sunholo/gcs/__init__.py
File without changes
File without changes
File without changes
File without changes
File without changes