RubyGems - langchainrb - Versions diffs - 0.6.17 → 0.6.19 - Mend

langchainrb 0.6.17 → 0.6.19

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (43) hide show

checksums.yaml +4 -4
data/CHANGELOG.md +15 -0
data/README.md +18 -3
data/lib/langchain/active_record/hooks.rb +14 -0
data/lib/langchain/agent/react_agent.rb +1 -1
data/lib/langchain/agent/sql_query_agent.rb +2 -2
data/lib/langchain/chunk.rb +16 -0
data/lib/langchain/chunker/base.rb +4 -0
data/lib/langchain/chunker/recursive_text.rb +5 -2
data/lib/langchain/chunker/semantic.rb +4 -1
data/lib/langchain/chunker/sentence.rb +4 -2
data/lib/langchain/chunker/text.rb +5 -2
data/lib/langchain/conversation.rb +1 -1
data/lib/langchain/llm/ai21.rb +4 -3
data/lib/langchain/llm/anthropic.rb +3 -3
data/lib/langchain/llm/cohere.rb +6 -5
data/lib/langchain/llm/google_palm.rb +14 -10
data/lib/langchain/llm/hugging_face.rb +4 -3
data/lib/langchain/llm/llama_cpp.rb +1 -1
data/lib/langchain/llm/ollama.rb +18 -6
data/lib/langchain/llm/openai.rb +7 -6
data/lib/langchain/llm/replicate.rb +6 -10
data/lib/langchain/llm/response/ai21_response.rb +13 -0
data/lib/langchain/llm/response/anthropic_response.rb +29 -0
data/lib/langchain/llm/response/base_response.rb +79 -0
data/lib/langchain/llm/response/cohere_response.rb +21 -0
data/lib/langchain/llm/response/google_palm_response.rb +36 -0
data/lib/langchain/llm/response/hugging_face_response.rb +13 -0
data/lib/langchain/llm/response/ollama_response.rb +26 -0
data/lib/langchain/llm/response/openai_response.rb +51 -0
data/lib/langchain/llm/response/replicate_response.rb +28 -0
data/lib/langchain/vectorsearch/base.rb +4 -7
data/lib/langchain/vectorsearch/chroma.rb +13 -12
data/lib/langchain/vectorsearch/elasticsearch.rb +147 -0
data/lib/langchain/vectorsearch/hnswlib.rb +5 -5
data/lib/langchain/vectorsearch/milvus.rb +5 -4
data/lib/langchain/vectorsearch/pgvector.rb +12 -6
data/lib/langchain/vectorsearch/pinecone.rb +14 -13
data/lib/langchain/vectorsearch/qdrant.rb +9 -8
data/lib/langchain/vectorsearch/weaviate.rb +9 -8
data/lib/langchain/version.rb +1 -1
data/lib/langchain.rb +5 -0
metadata +27 -2

data/lib/langchain/vectorsearch/pinecone.rb CHANGED Viewed

@@ -5,10 +5,11 @@ module Langchain::Vectorsearch
     #
     # Wrapper around Pinecone API.
     #
-    # Gem requirements: gem "pinecone", "~> 0.1.6"
+    # Gem requirements:
+    #     gem "pinecone", "~> 0.1.6"
     #
     # Usage:
-    # pinecone = Langchain::Vectorsearch::Pinecone.new(environment:, api_key:, index_name:, llm:, llm_api_key:)
+    #     pinecone = Langchain::Vectorsearch::Pinecone.new(environment:, api_key:, index_name:, llm:, llm_api_key:)
     #
     # Initialize the Pinecone client
@@ -31,7 +32,7 @@ module Langchain::Vectorsearch
     end
     # Find records by ids
-    # @param ids [Array] The ids to find
+    # @param ids [Array<Integer>] The ids to find
     # @param namespace String The namespace to search through
     # @return [Hash] The response from the server
     def find(ids: [], namespace: "")
@@ -44,8 +45,8 @@ module Langchain::Vectorsearch
     end
     # Add a list of texts to the index
-    # @param texts [Array] The list of texts to add
-    # @param ids [Array] The list of IDs to add
+    # @param texts [Array<String>] The list of texts to add
+    # @param ids [Array<Integer>] The list of IDs to add
     # @param namespace [String] The namespace to add the texts to
     # @param metadata [Hash] The metadata to use for the texts
     # @return [Hash] The response from the server
@@ -54,7 +55,7 @@ module Langchain::Vectorsearch
         {
           id: ids[i] ? ids[i].to_s : SecureRandom.uuid,
           metadata: metadata || {content: text},
-          values: llm.embed(text: text)
+          values: llm.embed(text: text).embedding
         }
       end
@@ -70,7 +71,7 @@ module Langchain::Vectorsearch
         .flatten
         .map do |path|
           data = Langchain::Loader.new(path)&.load&.chunks
-          data.map { |chunk| chunk[:text] }
+          data.map { |chunk| chunk.text }
         end
       texts.flatten!
@@ -79,8 +80,8 @@ module Langchain::Vectorsearch
     end
     # Update a list of texts in the index
-    # @param texts [Array] The list of texts to update
-    # @param ids [Array] The list of IDs to update
+    # @param texts [Array<String>] The list of texts to update
+    # @param ids [Array<Integer>] The list of IDs to update
     # @param namespace [String] The namespace to update the texts in
     # @param metadata [Hash] The metadata to use for the texts
     # @return [Array] The response from the server
@@ -90,7 +91,7 @@ module Langchain::Vectorsearch
         index.update(
           namespace: namespace,
           id: ids[i].to_s,
-          values: llm.embed(text: text),
+          values: llm.embed(text: text).embedding,
           set_metadata: metadata
         )
       end
@@ -102,7 +103,7 @@ module Langchain::Vectorsearch
       client.create_index(
         metric: DEFAULT_METRIC,
         name: index_name,
-        dimension: default_dimension
+        dimension: llm.default_dimension
       )
     end
@@ -130,7 +131,7 @@ module Langchain::Vectorsearch
       namespace: "",
       filter: nil
     )
-      embedding = llm.embed(text: query)
+      embedding = llm.embed(text: query).embedding
       similarity_search_by_vector(
         embedding: embedding,
@@ -141,7 +142,7 @@ module Langchain::Vectorsearch
     end
     # Search for similar texts by embedding
-    # @param embedding [Array] The embedding to search for
+    # @param embedding [Array<Float>] The embedding to search for
     # @param k [Integer] The number of results to return
     # @param namespace [String] The namespace to search in
     # @param filter [String] The filter to use

data/lib/langchain/vectorsearch/qdrant.rb CHANGED Viewed

@@ -5,10 +5,11 @@ module Langchain::Vectorsearch
     #
     # Wrapper around Qdrant
     #
-    # Gem requirements: gem "qdrant-ruby", "~> 0.9.3"
+    # Gem requirements:
+    #     gem "qdrant-ruby", "~> 0.9.3"
     #
     # Usage:
-    # qdrant = Langchain::Vectorsearch::Qdrant.new(url:, api_key:, index_name:, llm:, llm_api_key:)
+    #     qdrant = Langchain::Vectorsearch::Qdrant.new(url:, api_key:, index_name:, llm:, llm_api_key:)
     #
     # Initialize the Qdrant client
@@ -29,7 +30,7 @@ module Langchain::Vectorsearch
     end
     # Find records by ids
-    # @param ids [Array] The ids to find
+    # @param ids [Array<Integer>] The ids to find
     # @return [Hash] The response from the server
     def find(ids: [])
       client.points.get_all(
@@ -41,7 +42,7 @@ module Langchain::Vectorsearch
     end
     # Add a list of texts to the index
-    # @param texts [Array] The list of texts to add
+    # @param texts [Array<String>] The list of texts to add
     # @return [Hash] The response from the server
     def add_texts(texts:, ids: [])
       batch = {ids: [], vectors: [], payloads: []}
@@ -49,7 +50,7 @@ module Langchain::Vectorsearch
       Array(texts).each_with_index do |text, i|
         id = ids[i] || SecureRandom.uuid
         batch[:ids].push(id)
-        batch[:vectors].push(llm.embed(text: text))
+        batch[:vectors].push(llm.embed(text: text).embedding)
         batch[:payloads].push({content: text})
       end
@@ -82,7 +83,7 @@ module Langchain::Vectorsearch
         collection_name: index_name,
         vectors: {
           distance: DEFAULT_METRIC.capitalize,
-          size: default_dimension
+          size: llm.default_dimension
         }
       )
     end
@@ -95,7 +96,7 @@ module Langchain::Vectorsearch
       query:,
       k: 4
     )
-      embedding = llm.embed(text: query)
+      embedding = llm.embed(text: query).embedding
       similarity_search_by_vector(
         embedding: embedding,
@@ -104,7 +105,7 @@ module Langchain::Vectorsearch
     end
     # Search for similar texts by embedding
-    # @param embedding [Array] The embedding to search for
+    # @param embedding [Array<Float>] The embedding to search for
     # @param k [Integer] The number of results to return
     # @return [Hash] The response from the server
     def similarity_search_by_vector(

data/lib/langchain/vectorsearch/weaviate.rb CHANGED Viewed

@@ -5,10 +5,11 @@ module Langchain::Vectorsearch
     #
     # Wrapper around Weaviate
     #
-    # Gem requirements: gem "weaviate-ruby", "~> 0.8.3"
+    # Gem requirements:
+    #     gem "weaviate-ruby", "~> 0.8.3"
     #
     # Usage:
-    # weaviate = Langchain::Vectorsearch::Weaviate.new(url:, api_key:, index_name:, llm:, llm_api_key:)
+    #     weaviate = Langchain::Vectorsearch::Weaviate.new(url:, api_key:, index_name:, llm:, llm_api_key:)
     #
     # Initialize the Weaviate adapter
@@ -32,7 +33,7 @@ module Langchain::Vectorsearch
     end
     # Add a list of texts to the index
-    # @param texts [Array] The list of texts to add
+    # @param texts [Array<String>] The list of texts to add
     # @return [Hash] The response from the server
     def add_texts(texts:, ids: [])
       client.objects.batch_create(
@@ -41,7 +42,7 @@ module Langchain::Vectorsearch
     end
     # Update a list of texts in the index
-    # @param texts [Array] The list of texts to update
+    # @param texts [Array<String>] The list of texts to update
     # @return [Hash] The response from the server
     def update_texts(texts:, ids:)
       uuids = []
@@ -65,7 +66,7 @@ module Langchain::Vectorsearch
             __id: ids[i].to_s,
             content: text
           },
-          vector: llm.embed(text: text)
+          vector: llm.embed(text: text).embedding
         )
       end
     end
@@ -101,13 +102,13 @@ module Langchain::Vectorsearch
     # @param k [Integer|String] The number of results to return
     # @return [Hash] The search results
     def similarity_search(query:, k: 4)
-      embedding = llm.embed(text: query)
+      embedding = llm.embed(text: query).embedding
       similarity_search_by_vector(embedding: embedding, k: k)
     end
     # Return documents similar to the vector
-    # @param embedding [Array] The vector to search for
+    # @param embedding [Array<Float>] The vector to search for
     # @param k [Integer|String] The number of results to return
     # @return [Hash] The search results
     def similarity_search_by_vector(embedding:, k: 4)
@@ -154,7 +155,7 @@ module Langchain::Vectorsearch
           __id: id.to_s,
           content: text
         },
-        vector: llm.embed(text: text)
+        vector: llm.embed(text: text).embedding
       }
     end
   end

data/lib/langchain/version.rb CHANGED Viewed

@@ -1,5 +1,5 @@
 # frozen_string_literal: true
 module Langchain
-  VERSION = "0.6.17"
+  VERSION = "0.6.19"
 end

data/lib/langchain.rb CHANGED Viewed

@@ -8,6 +8,7 @@ loader = Zeitwerk::Loader.for_gem
 loader.ignore("#{__dir__}/langchainrb.rb")
 loader.inflector.inflect(
   "ai21" => "AI21",
+  "ai21_response" => "AI21Response",
   "ai21_validator" => "AI21Validator",
   "csv" => "CSV",
   "html" => "HTML",
@@ -16,10 +17,12 @@ loader.inflector.inflect(
   "llm" => "LLM",
   "openai" => "OpenAI",
   "openai_validator" => "OpenAIValidator",
+  "openai_response" => "OpenAIResponse",
   "pdf" => "PDF",
   "react_agent" => "ReActAgent",
   "sql_query_agent" => "SQLQueryAgent"
 )
+loader.collapse("#{__dir__}/langchain/llm/response")
 loader.setup
 # Langchain.rb a is library for building LLM-backed Ruby applications. It is an abstraction layer that sits on top of the emerging AI-related tools that makes it easy for developers to consume and string those services together.
@@ -86,3 +89,5 @@ module Langchain
     class BaseError < StandardError; end
   end
 end
+require "langchain/railtie" if defined?(Rails)

metadata CHANGED Viewed

@@ -1,14 +1,14 @@
 --- !ruby/object:Gem::Specification
 name: langchainrb
 version: !ruby/object:Gem::Version
-  version: 0.6.17
+  version: 0.6.19
 platform: ruby
 authors:
 - Andrei Bondarev
 autorequire:
 bindir: exe
 cert_chain: []
-date: 2023-10-10 00:00:00.000000000 Z
+date: 2023-10-18 00:00:00.000000000 Z
 dependencies:
 - !ruby/object:Gem::Dependency
   name: baran
@@ -220,6 +220,20 @@ dependencies:
     - - "~>"
       - !ruby/object:Gem::Version
         version: 0.8.0
+- !ruby/object:Gem::Dependency
+  name: elasticsearch
+  requirement: !ruby/object:Gem::Requirement
+    requirements:
+    - - "~>"
+      - !ruby/object:Gem::Version
+        version: 8.2.0
+  type: :development
+  prerelease: false
+  version_requirements: !ruby/object:Gem::Requirement
+    requirements:
+    - - "~>"
+      - !ruby/object:Gem::Version
+        version: 8.2.0
 - !ruby/object:Gem::Dependency
   name: eqn
   requirement: !ruby/object:Gem::Requirement
@@ -532,6 +546,7 @@ files:
 - lib/langchain/agent/sql_query_agent.rb
 - lib/langchain/agent/sql_query_agent/sql_query_agent_answer_prompt.yaml
 - lib/langchain/agent/sql_query_agent/sql_query_agent_sql_prompt.yaml
+- lib/langchain/chunk.rb
 - lib/langchain/chunker/base.rb
 - lib/langchain/chunker/prompts/semantic_prompt_template.yml
 - lib/langchain/chunker/recursive_text.rb
@@ -558,6 +573,15 @@ files:
 - lib/langchain/llm/openai.rb
 - lib/langchain/llm/prompts/summarize_template.yaml
 - lib/langchain/llm/replicate.rb
+- lib/langchain/llm/response/ai21_response.rb
+- lib/langchain/llm/response/anthropic_response.rb
+- lib/langchain/llm/response/base_response.rb
+- lib/langchain/llm/response/cohere_response.rb
+- lib/langchain/llm/response/google_palm_response.rb
+- lib/langchain/llm/response/hugging_face_response.rb
+- lib/langchain/llm/response/ollama_response.rb
+- lib/langchain/llm/response/openai_response.rb
+- lib/langchain/llm/response/replicate_response.rb
 - lib/langchain/loader.rb
 - lib/langchain/output_parsers/base.rb
 - lib/langchain/output_parsers/output_fixing_parser.rb
@@ -593,6 +617,7 @@ files:
 - lib/langchain/utils/token_length/token_limit_exceeded.rb
 - lib/langchain/vectorsearch/base.rb
 - lib/langchain/vectorsearch/chroma.rb
+- lib/langchain/vectorsearch/elasticsearch.rb
 - lib/langchain/vectorsearch/hnswlib.rb
 - lib/langchain/vectorsearch/milvus.rb
 - lib/langchain/vectorsearch/pgvector.rb