PyPI - langfun - Versions diffs - 0.1.2.dev202410100804__py3-none-any.whl → 0.1.2.dev202410120803__py3-none-any.whl - Mend

langfun 0.1.2.dev202410100804py3-none-any.whl → 0.1.2.dev202410120803py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (42) hide show

langfun/core/__init__.py +1 -0
langfun/core/eval/base_test.py +1 -0
langfun/core/langfunc_test.py +2 -2
langfun/core/language_model.py +140 -24
langfun/core/language_model_test.py +166 -36
langfun/core/llms/__init__.py +8 -1
langfun/core/llms/anthropic.py +72 -7
langfun/core/llms/cache/in_memory_test.py +3 -2
langfun/core/llms/fake_test.py +7 -0
langfun/core/llms/groq.py +154 -6
langfun/core/llms/openai.py +300 -42
langfun/core/llms/openai_test.py +35 -8
langfun/core/llms/vertexai.py +121 -16
langfun/core/logging.py +150 -43
langfun/core/logging_test.py +33 -0
langfun/core/message.py +249 -70
langfun/core/message_test.py +70 -45
langfun/core/modalities/audio.py +1 -1
langfun/core/modalities/audio_test.py +1 -1
langfun/core/modalities/image.py +1 -1
langfun/core/modalities/image_test.py +9 -3
langfun/core/modalities/mime.py +39 -3
langfun/core/modalities/mime_test.py +39 -0
langfun/core/modalities/ms_office.py +2 -5
langfun/core/modalities/ms_office_test.py +1 -1
langfun/core/modalities/pdf_test.py +1 -1
langfun/core/modalities/video.py +1 -1
langfun/core/modalities/video_test.py +2 -2
langfun/core/structured/completion_test.py +1 -0
langfun/core/structured/mapping.py +38 -0
langfun/core/structured/mapping_test.py +55 -0
langfun/core/structured/parsing_test.py +2 -1
langfun/core/structured/prompting_test.py +1 -0
langfun/core/structured/schema.py +34 -0
langfun/core/template.py +110 -1
langfun/core/template_test.py +37 -0
langfun/core/templates/selfplay_test.py +4 -2
{langfun-0.1.2.dev202410100804.dist-info → langfun-0.1.2.dev202410120803.dist-info}/METADATA +1 -1
{langfun-0.1.2.dev202410100804.dist-info → langfun-0.1.2.dev202410120803.dist-info}/RECORD +42 -42
{langfun-0.1.2.dev202410100804.dist-info → langfun-0.1.2.dev202410120803.dist-info}/LICENSE +0 -0
{langfun-0.1.2.dev202410100804.dist-info → langfun-0.1.2.dev202410120803.dist-info}/WHEEL +0 -0
{langfun-0.1.2.dev202410100804.dist-info → langfun-0.1.2.dev202410120803.dist-info}/top_level.txt +0 -0

langfun/core/llms/openai.py CHANGED Viewed

@@ -50,57 +50,285 @@ SUPPORTED_MODELS_AND_SETTINGS = {
     # Models from https://platform.openai.com/docs/models
     # RPM is from https://platform.openai.com/docs/guides/rate-limits
     # o1 (preview) models.
-    'o1-preview': pg.Dict(rpm=10000, tpm=5000000),
-    'o1-preview-2024-09-12': pg.Dict(rpm=10000, tpm=5000000),
-    'o1-mini': pg.Dict(rpm=10000, tpm=5000000),
-    'o1-mini-2024-09-12': pg.Dict(rpm=10000, tpm=5000000),
+    # Pricing in US dollars, from https://openai.com/api/pricing/
+    # as of 2024-10-10.
+    'o1-preview': pg.Dict(
+        in_service=True,
+        rpm=10000,
+        tpm=5000000,
+        cost_per_1k_input_tokens=0.015,
+        cost_per_1k_output_tokens=0.06,
+    ),
+    'o1-preview-2024-09-12': pg.Dict(
+        in_service=True,
+        rpm=10000,
+        tpm=5000000,
+        cost_per_1k_input_tokens=0.015,
+        cost_per_1k_output_tokens=0.06,
+    ),
+    'o1-mini': pg.Dict(
+        in_service=True,
+        rpm=10000,
+        tpm=5000000,
+        cost_per_1k_input_tokens=0.003,
+        cost_per_1k_output_tokens=0.012,
+    ),
+    'o1-mini-2024-09-12': pg.Dict(
+        in_service=True,
+        rpm=10000,
+        tpm=5000000,
+        cost_per_1k_input_tokens=0.003,
+        cost_per_1k_output_tokens=0.012,
+    ),
     # GPT-4o models
-    'gpt-4o-mini': pg.Dict(rpm=10000, tpm=5000000),
-    'gpt-4o-mini-2024-07-18': pg.Dict(rpm=10000, tpm=5000000),
-    'gpt-4o': pg.Dict(rpm=10000, tpm=5000000),
-    'gpt-4o-2024-08-06': pg.Dict(rpm=10000, tpm=5000000),
-    'gpt-4o-2024-05-13': pg.Dict(rpm=10000, tpm=5000000),
+    'gpt-4o-mini': pg.Dict(
+        in_service=True,
+        rpm=10000,
+        tpm=5000000,
+        cost_per_1k_input_tokens=0.00015,
+        cost_per_1k_output_tokens=0.0006,
+    ),
+    'gpt-4o-mini-2024-07-18': pg.Dict(
+        in_service=True,
+        rpm=10000,
+        tpm=5000000,
+        cost_per_1k_input_tokens=0.00015,
+        cost_per_1k_output_tokens=0.0006,
+    ),
+    'gpt-4o': pg.Dict(
+        in_service=True,
+        rpm=10000,
+        tpm=5000000,
+        cost_per_1k_input_tokens=0.0025,
+        cost_per_1k_output_tokens=0.01,
+    ),
+    'gpt-4o-2024-08-06': pg.Dict(
+        in_service=True,
+        rpm=10000,
+        tpm=5000000,
+        cost_per_1k_input_tokens=0.0025,
+        cost_per_1k_output_tokens=0.01,
+    ),
+    'gpt-4o-2024-05-13': pg.Dict(
+        in_service=True,
+        rpm=10000,
+        tpm=5000000,
+        cost_per_1k_input_tokens=0.005,
+        cost_per_1k_output_tokens=0.015,
+    ),
     # GPT-4-Turbo models
-    'gpt-4-turbo': pg.Dict(rpm=10000, tpm=2000000),
-    'gpt-4-turbo-2024-04-09': pg.Dict(rpm=10000, tpm=2000000),
-    'gpt-4-turbo-preview': pg.Dict(rpm=10000, tpm=2000000),
-    'gpt-4-0125-preview': pg.Dict(rpm=10000, tpm=2000000),
-    'gpt-4-1106-preview': pg.Dict(rpm=10000, tpm=2000000),
-    'gpt-4-vision-preview': pg.Dict(rpm=10000, tpm=2000000),
+    'gpt-4-turbo': pg.Dict(
+        in_service=True,
+        rpm=10000,
+        tpm=2000000,
+        cost_per_1k_input_tokens=0.01,
+        cost_per_1k_output_tokens=0.03,
+    ),
+    'gpt-4-turbo-2024-04-09': pg.Dict(
+        in_service=True,
+        rpm=10000,
+        tpm=2000000,
+        cost_per_1k_input_tokens=0.01,
+        cost_per_1k_output_tokens=0.03,
+    ),
+    'gpt-4-turbo-preview': pg.Dict(
+        in_service=True,
+        rpm=10000,
+        tpm=2000000,
+        cost_per_1k_input_tokens=0.01,
+        cost_per_1k_output_tokens=0.03,
+    ),
+    'gpt-4-0125-preview': pg.Dict(
+        in_service=True,
+        rpm=10000,
+        tpm=2000000,
+        cost_per_1k_input_tokens=0.01,
+        cost_per_1k_output_tokens=0.03,
+    ),
+    'gpt-4-1106-preview': pg.Dict(
+        in_service=True,
+        rpm=10000,
+        tpm=2000000,
+        cost_per_1k_input_tokens=0.01,
+        cost_per_1k_output_tokens=0.03,
+    ),
+    'gpt-4-vision-preview': pg.Dict(
+        in_service=True,
+        rpm=10000,
+        tpm=2000000,
+        cost_per_1k_input_tokens=0.01,
+        cost_per_1k_output_tokens=0.03,
+    ),
     'gpt-4-1106-vision-preview': pg.Dict(
-        rpm=10000, tpm=2000000
+        in_service=True,
+        rpm=10000,
+        tpm=2000000,
+        cost_per_1k_input_tokens=0.01,
+        cost_per_1k_output_tokens=0.03,
     ),
     # GPT-4 models
-    'gpt-4': pg.Dict(rpm=10000, tpm=300000),
-    'gpt-4-0613': pg.Dict(rpm=10000, tpm=300000),
-    'gpt-4-0314': pg.Dict(rpm=10000, tpm=300000),
-    'gpt-4-32k': pg.Dict(rpm=10000, tpm=300000),
-    'gpt-4-32k-0613': pg.Dict(rpm=10000, tpm=300000),
-    'gpt-4-32k-0314': pg.Dict(rpm=10000, tpm=300000),
+    'gpt-4': pg.Dict(
+        in_service=True,
+        rpm=10000,
+        tpm=300000,
+        cost_per_1k_input_tokens=0.03,
+        cost_per_1k_output_tokens=0.06,
+    ),
+    'gpt-4-0613': pg.Dict(
+        in_service=False,
+        rpm=10000,
+        tpm=300000,
+        cost_per_1k_input_tokens=0.03,
+        cost_per_1k_output_tokens=0.06,
+    ),
+    'gpt-4-0314': pg.Dict(
+        in_service=False,
+        rpm=10000,
+        tpm=300000,
+        cost_per_1k_input_tokens=0.03,
+        cost_per_1k_output_tokens=0.06,
+    ),
+    'gpt-4-32k': pg.Dict(
+        in_service=True,
+        rpm=10000,
+        tpm=300000,
+        cost_per_1k_input_tokens=0.06,
+        cost_per_1k_output_tokens=0.12,
+    ),
+    'gpt-4-32k-0613': pg.Dict(
+        in_service=False,
+        rpm=10000,
+        tpm=300000,
+        cost_per_1k_input_tokens=0.06,
+        cost_per_1k_output_tokens=0.12,
+    ),
+    'gpt-4-32k-0314': pg.Dict(
+        in_service=False,
+        rpm=10000,
+        tpm=300000,
+        cost_per_1k_input_tokens=0.06,
+        cost_per_1k_output_tokens=0.12,
+    ),
     # GPT-3.5-Turbo models
-    'gpt-3.5-turbo': pg.Dict(rpm=10000, tpm=2000000),
-    'gpt-3.5-turbo-0125': pg.Dict(rpm=10000, tpm=2000000),
-    'gpt-3.5-turbo-1106': pg.Dict(rpm=10000, tpm=2000000),
-    'gpt-3.5-turbo-0613': pg.Dict(rpm=10000, tpm=2000000),
-    'gpt-3.5-turbo-0301': pg.Dict(rpm=10000, tpm=2000000),
-    'gpt-3.5-turbo-16k': pg.Dict(rpm=10000, tpm=2000000),
-    'gpt-3.5-turbo-16k-0613': pg.Dict(rpm=10000, tpm=2000000),
-    'gpt-3.5-turbo-16k-0301': pg.Dict(rpm=10000, tpm=2000000),
+    'gpt-3.5-turbo': pg.Dict(
+        in_service=True,
+        rpm=10000,
+        tpm=2000000,
+        cost_per_1k_input_tokens=0.0005,
+        cost_per_1k_output_tokens=0.0015,
+    ),
+    'gpt-3.5-turbo-0125': pg.Dict(
+        in_service=True,
+        rpm=10000,
+        tpm=2000000,
+        cost_per_1k_input_tokens=0.0005,
+        cost_per_1k_output_tokens=0.0015,
+    ),
+    'gpt-3.5-turbo-1106': pg.Dict(
+        in_service=True,
+        rpm=10000,
+        tpm=2000000,
+        cost_per_1k_input_tokens=0.001,
+        cost_per_1k_output_tokens=0.002,
+    ),
+    'gpt-3.5-turbo-0613': pg.Dict(
+        in_service=True,
+        rpm=10000,
+        tpm=2000000,
+        cost_per_1k_input_tokens=0.0015,
+        cost_per_1k_output_tokens=0.002,
+    ),
+    'gpt-3.5-turbo-0301': pg.Dict(
+        in_service=True,
+        rpm=10000,
+        tpm=2000000,
+        cost_per_1k_input_tokens=0.0015,
+        cost_per_1k_output_tokens=0.002,
+    ),
+    'gpt-3.5-turbo-16k': pg.Dict(
+        in_service=True,
+        rpm=10000,
+        tpm=2000000,
+        cost_per_1k_input_tokens=0.003,
+        cost_per_1k_output_tokens=0.004,
+    ),
+    'gpt-3.5-turbo-16k-0613': pg.Dict(
+        in_service=True,
+        rpm=10000,
+        tpm=2000000,
+        cost_per_1k_input_tokens=0.003,
+        cost_per_1k_output_tokens=0.004,
+    ),
+    'gpt-3.5-turbo-16k-0301': pg.Dict(
+        in_service=False,
+        rpm=10000,
+        tpm=2000000,
+        cost_per_1k_input_tokens=0.003,
+        cost_per_1k_output_tokens=0.004,
+    ),
     # GPT-3.5 models
-    'text-davinci-003': pg.Dict(rpm=_DEFAULT_RPM, tpm=_DEFAULT_TPM),
-    'text-davinci-002': pg.Dict(rpm=_DEFAULT_RPM, tpm=_DEFAULT_TPM),
-    'code-davinci-002': pg.Dict(rpm=_DEFAULT_RPM, tpm=_DEFAULT_TPM),
+    'text-davinci-003': pg.Dict(
+        in_service=False,
+        rpm=_DEFAULT_RPM,
+        tpm=_DEFAULT_TPM
+    ),
+    'text-davinci-002': pg.Dict(
+        in_service=False,
+        rpm=_DEFAULT_RPM,
+        tpm=_DEFAULT_TPM
+    ),
+    'code-davinci-002': pg.Dict(
+        in_service=False,
+        rpm=_DEFAULT_RPM,
+        tpm=_DEFAULT_TPM
+    ),
     # GPT-3 instruction-tuned models
-    'text-curie-001': pg.Dict(rpm=_DEFAULT_RPM, tpm=_DEFAULT_TPM),
-    'text-babbage-001': pg.Dict(rpm=_DEFAULT_RPM, tpm=_DEFAULT_TPM),
-    'text-ada-001': pg.Dict(rpm=_DEFAULT_RPM, tpm=_DEFAULT_TPM),
-    'davinci': pg.Dict(rpm=_DEFAULT_RPM, tpm=_DEFAULT_TPM),
-    'curie': pg.Dict(rpm=_DEFAULT_RPM, tpm=_DEFAULT_TPM),
-    'babbage': pg.Dict(rpm=_DEFAULT_RPM, tpm=_DEFAULT_TPM),
-    'ada': pg.Dict(rpm=_DEFAULT_RPM, tpm=_DEFAULT_TPM),
+    'text-curie-001': pg.Dict(
+        in_service=False,
+        rpm=_DEFAULT_RPM,
+        tpm=_DEFAULT_TPM
+    ),
+    'text-babbage-001': pg.Dict(
+        in_service=False,
+        rpm=_DEFAULT_RPM,
+        tpm=_DEFAULT_TPM,
+    ),
+    'text-ada-001': pg.Dict(
+        in_service=False,
+        rpm=_DEFAULT_RPM,
+        tpm=_DEFAULT_TPM,
+    ),
+    'davinci': pg.Dict(
+        in_service=False,
+        rpm=_DEFAULT_RPM,
+        tpm=_DEFAULT_TPM,
+    ),
+    'curie': pg.Dict(
+        in_service=False,
+        rpm=_DEFAULT_RPM,
+        tpm=_DEFAULT_TPM
+    ),
+    'babbage': pg.Dict(
+        in_service=False,
+        rpm=_DEFAULT_RPM,
+        tpm=_DEFAULT_TPM
+    ),
+    'ada': pg.Dict(
+        in_service=False,
+        rpm=_DEFAULT_RPM,
+        tpm=_DEFAULT_TPM
+    ),
     # GPT-3 base models
-    'babbage-002': pg.Dict(rpm=_DEFAULT_RPM, tpm=_DEFAULT_TPM),
-    'davinci-002': pg.Dict(rpm=_DEFAULT_RPM, tpm=_DEFAULT_TPM),
+    'babbage-002': pg.Dict(
+        in_service=False,
+        rpm=_DEFAULT_RPM,
+        tpm=_DEFAULT_TPM
+    ),
+    'davinci-002': pg.Dict(
+        in_service=True,
+        rpm=_DEFAULT_RPM,
+        tpm=_DEFAULT_TPM
+    ),
 }
@@ -172,6 +400,25 @@ class OpenAI(lf.LanguageModel):
         requests_per_min=rpm, tokens_per_min=tpm
     )
+  def estimate_cost(
+      self,
+      num_input_tokens: int,
+      num_output_tokens: int
+  ) -> float | None:
+    """Estimate the cost based on usage."""
+    cost_per_1k_input_tokens = SUPPORTED_MODELS_AND_SETTINGS[self.model].get(
+        'cost_per_1k_input_tokens', None
+    )
+    cost_per_1k_output_tokens = SUPPORTED_MODELS_AND_SETTINGS[self.model].get(
+        'cost_per_1k_output_tokens', None
+    )
+    if cost_per_1k_output_tokens is None or cost_per_1k_input_tokens is None:
+      return None
+    return (
+        cost_per_1k_input_tokens * num_input_tokens
+        + cost_per_1k_output_tokens * num_output_tokens
+    ) / 1000
   @classmethod
   def dir(cls):
     assert openai is not None
@@ -239,10 +486,17 @@ class OpenAI(lf.LanguageModel):
         )
       n = len(samples_by_index)
+      estimated_cost = self.estimate_cost(
+          num_input_tokens=response.usage.prompt_tokens,
+          num_output_tokens=response.usage.completion_tokens,
+      )
       usage = lf.LMSamplingUsage(
           prompt_tokens=response.usage.prompt_tokens // n,
           completion_tokens=response.usage.completion_tokens // n,
           total_tokens=response.usage.total_tokens // n,
+          estimated_cost=(
+              None if estimated_cost is None else (estimated_cost // n)
+          )
       )
       return [
           lf.LMSamplingResult(samples_by_index[index], usage=usage)
@@ -350,6 +604,10 @@ class OpenAI(lf.LanguageModel):
               prompt_tokens=response.usage.prompt_tokens,
               completion_tokens=response.usage.completion_tokens,
               total_tokens=response.usage.total_tokens,
+              estimated_cost=self.estimate_cost(
+                  num_input_tokens=response.usage.prompt_tokens,
+                  num_output_tokens=response.usage.completion_tokens,
+              )
           ),
       )

langfun/core/llms/openai_test.py CHANGED Viewed

@@ -210,6 +210,7 @@ class OpenAITest(unittest.TestCase):
                         'Sample 0 for prompt 0.',
                         score=0.0,
                         logprobs=None,
+                        is_cached=False,
                         usage=lf.LMSamplingUsage(
                             prompt_tokens=16,
                             completion_tokens=16,
@@ -225,6 +226,7 @@ class OpenAITest(unittest.TestCase):
                         'Sample 1 for prompt 0.',
                         score=0.1,
                         logprobs=None,
+                        is_cached=False,
                         usage=lf.LMSamplingUsage(
                             prompt_tokens=16,
                             completion_tokens=16,
@@ -240,6 +242,7 @@ class OpenAITest(unittest.TestCase):
                         'Sample 2 for prompt 0.',
                         score=0.2,
                         logprobs=None,
+                        is_cached=False,
                         usage=lf.LMSamplingUsage(
                             prompt_tokens=16,
                             completion_tokens=16,
@@ -265,6 +268,7 @@ class OpenAITest(unittest.TestCase):
                         'Sample 0 for prompt 1.',
                         score=0.0,
                         logprobs=None,
+                        is_cached=False,
                         usage=lf.LMSamplingUsage(
                             prompt_tokens=16,
                             completion_tokens=16,
@@ -280,6 +284,7 @@ class OpenAITest(unittest.TestCase):
                         'Sample 1 for prompt 1.',
                         score=0.1,
                         logprobs=None,
+                        is_cached=False,
                         usage=lf.LMSamplingUsage(
                             prompt_tokens=16,
                             completion_tokens=16,
@@ -295,6 +300,7 @@ class OpenAITest(unittest.TestCase):
                         'Sample 2 for prompt 1.',
                         score=0.2,
                         logprobs=None,
+                        is_cached=False,
                         usage=lf.LMSamplingUsage(
                             prompt_tokens=16,
                             completion_tokens=16,
@@ -315,12 +321,17 @@ class OpenAITest(unittest.TestCase):
   def test_sample_chat_completion(self):
     with mock.patch('openai.ChatCompletion.create') as mock_chat_completion:
       mock_chat_completion.side_effect = mock_chat_completion_query
+      openai.SUPPORTED_MODELS_AND_SETTINGS['gpt-4'].update({
+          'cost_per_1k_input_tokens': 1.0,
+          'cost_per_1k_output_tokens': 1.0,
+      })
       lm = openai.OpenAI(api_key='test_key', model='gpt-4')
       results = lm.sample(
           ['hello', 'bye'], sampling_options=lf.LMSamplingOptions(n=3)
       )
     self.assertEqual(len(results), 2)
+    print(results[0])
     self.assertEqual(
         results[0],
         lf.LMSamplingResult(
@@ -330,10 +341,12 @@ class OpenAITest(unittest.TestCase):
                         'Sample 0 for message.',
                         score=0.0,
                         logprobs=None,
+                        is_cached=False,
                         usage=lf.LMSamplingUsage(
                             prompt_tokens=33,
                             completion_tokens=33,
-                            total_tokens=66
+                            total_tokens=66,
+                            estimated_cost=0.2 / 3,
                         ),
                         tags=[lf.Message.TAG_LM_RESPONSE],
                     ),
@@ -345,10 +358,12 @@ class OpenAITest(unittest.TestCase):
                         'Sample 1 for message.',
                         score=0.0,
                         logprobs=None,
+                        is_cached=False,
                         usage=lf.LMSamplingUsage(
                             prompt_tokens=33,
                             completion_tokens=33,
-                            total_tokens=66
+                            total_tokens=66,
+                            estimated_cost=0.2 / 3,
                         ),
                         tags=[lf.Message.TAG_LM_RESPONSE],
                     ),
@@ -360,10 +375,12 @@ class OpenAITest(unittest.TestCase):
                         'Sample 2 for message.',
                         score=0.0,
                         logprobs=None,
+                        is_cached=False,
                         usage=lf.LMSamplingUsage(
                             prompt_tokens=33,
                             completion_tokens=33,
-                            total_tokens=66
+                            total_tokens=66,
+                            estimated_cost=0.2 / 3,
                         ),
                         tags=[lf.Message.TAG_LM_RESPONSE],
                     ),
@@ -372,7 +389,8 @@ class OpenAITest(unittest.TestCase):
                 ),
             ],
             usage=lf.LMSamplingUsage(
-                prompt_tokens=100, completion_tokens=100, total_tokens=200
+                prompt_tokens=100, completion_tokens=100, total_tokens=200,
+                estimated_cost=0.2,
             ),
         ),
     )
@@ -385,10 +403,12 @@ class OpenAITest(unittest.TestCase):
                         'Sample 0 for message.',
                         score=0.0,
                         logprobs=None,
+                        is_cached=False,
                         usage=lf.LMSamplingUsage(
                             prompt_tokens=33,
                             completion_tokens=33,
-                            total_tokens=66
+                            total_tokens=66,
+                            estimated_cost=0.2 / 3,
                         ),
                         tags=[lf.Message.TAG_LM_RESPONSE],
                     ),
@@ -400,10 +420,12 @@ class OpenAITest(unittest.TestCase):
                         'Sample 1 for message.',
                         score=0.0,
                         logprobs=None,
+                        is_cached=False,
                         usage=lf.LMSamplingUsage(
                             prompt_tokens=33,
                             completion_tokens=33,
-                            total_tokens=66
+                            total_tokens=66,
+                            estimated_cost=0.2 / 3,
                         ),
                         tags=[lf.Message.TAG_LM_RESPONSE],
                     ),
@@ -415,10 +437,12 @@ class OpenAITest(unittest.TestCase):
                         'Sample 2 for message.',
                         score=0.0,
                         logprobs=None,
+                        is_cached=False,
                         usage=lf.LMSamplingUsage(
                             prompt_tokens=33,
                             completion_tokens=33,
-                            total_tokens=66
+                            total_tokens=66,
+                            estimated_cost=0.2 / 3,
                         ),
                         tags=[lf.Message.TAG_LM_RESPONSE],
                     ),
@@ -427,7 +451,8 @@ class OpenAITest(unittest.TestCase):
                 ),
             ],
             usage=lf.LMSamplingUsage(
-                prompt_tokens=100, completion_tokens=100, total_tokens=200
+                prompt_tokens=100, completion_tokens=100, total_tokens=200,
+                estimated_cost=0.2,
             ),
         ),
     )
@@ -449,6 +474,7 @@ class OpenAITest(unittest.TestCase):
                         'Sample 0 for prompt 0.',
                         score=0.0,
                         logprobs=None,
+                        is_cached=False,
                         usage=lf.LMSamplingUsage(
                             prompt_tokens=50,
                             completion_tokens=50,
@@ -464,6 +490,7 @@ class OpenAITest(unittest.TestCase):
                         'Sample 1 for prompt 0.',
                         score=0.1,
                         logprobs=None,
+                        is_cached=False,
                         usage=lf.LMSamplingUsage(
                             prompt_tokens=50,
                             completion_tokens=50,

langfun 0.1.2.dev202410100804__py3-none-any.whl → 0.1.2.dev202410120803__py3-none-any.whl

langfun 0.1.2.dev202410100804py3-none-any.whl → 0.1.2.dev202410120803py3-none-any.whl