PyPI - GameSentenceMiner - Versions diffs - 2.13.15__py3-none-any.whl → 2.14.0__py3-none-any.whl - Mend

GameSentenceMiner 2.13.15py3-none-any.whl → 2.14.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (30) hide show

GameSentenceMiner/ai/ai_prompting.py +77 -132
GameSentenceMiner/anki.py +48 -6
GameSentenceMiner/config_gui.py +196 -30
GameSentenceMiner/gametext.py +8 -19
GameSentenceMiner/gsm.py +5 -4
GameSentenceMiner/locales/en_us.json +21 -11
GameSentenceMiner/locales/ja_jp.json +21 -11
GameSentenceMiner/locales/zh_cn.json +9 -11
GameSentenceMiner/obs.py +6 -5
GameSentenceMiner/owocr/owocr/ocr.py +28 -25
GameSentenceMiner/tools/__init__.py +0 -0
GameSentenceMiner/util/configuration.py +241 -105
GameSentenceMiner/util/db.py +408 -0
GameSentenceMiner/util/ffmpeg.py +2 -10
GameSentenceMiner/util/get_overlay_coords.py +331 -0
GameSentenceMiner/util/model.py +8 -2
GameSentenceMiner/util/text_log.py +1 -1
GameSentenceMiner/web/texthooking_page.py +1 -1
GameSentenceMiner/wip/__init___.py +0 -0
{gamesentenceminer-2.13.15.dist-info → gamesentenceminer-2.14.0.dist-info}/METADATA +5 -1
{gamesentenceminer-2.13.15.dist-info → gamesentenceminer-2.14.0.dist-info}/RECORD +28 -26
GameSentenceMiner/util/package.py +0 -37
GameSentenceMiner/wip/get_overlay_coords.py +0 -535
/GameSentenceMiner/{util → tools}/audio_offset_selector.py +0 -0
/GameSentenceMiner/{util → tools}/ss_selector.py +0 -0
/GameSentenceMiner/{util → tools}/window_transparency.py +0 -0
{gamesentenceminer-2.13.15.dist-info → gamesentenceminer-2.14.0.dist-info}/WHEEL +0 -0
{gamesentenceminer-2.13.15.dist-info → gamesentenceminer-2.14.0.dist-info}/entry_points.txt +0 -0
{gamesentenceminer-2.13.15.dist-info → gamesentenceminer-2.14.0.dist-info}/licenses/LICENSE +0 -0
{gamesentenceminer-2.13.15.dist-info → gamesentenceminer-2.14.0.dist-info}/top_level.txt +0 -0

GameSentenceMiner/owocr/owocr/ocr.py CHANGED Viewed

@@ -280,7 +280,10 @@ class GoogleLens:
             logger.info('Google Lens ready')
     def __call__(self, img, furigana_filter_sensitivity=0, return_coords=False):
-        furigana_filter_sensitivity = get_furigana_filter_sensitivity()
+        if furigana_filter_sensitivity != None:
+            furigana_filter_sensitivity = get_furigana_filter_sensitivity()
+        else:
+            furigana_filter_sensitivity = 0
         lang = get_ocr_language()
         img, is_path = input_to_pil_image(img)
         if lang != self.initial_lang:
@@ -900,9 +903,12 @@ class OneOCR:
             self.regex = re.compile(
             r'[a-zA-Z\u00C0-\u00FF\u0100-\u017F\u0180-\u024F\u0250-\u02AF\u1D00-\u1D7F\u1D80-\u1DBF\u1E00-\u1EFF\u2C60-\u2C7F\uA720-\uA7FF\uAB30-\uAB6F]')
-    def __call__(self, img, furigana_filter_sensitivity=0, return_coords=False, multiple_crop_coords=False):
+    def __call__(self, img, furigana_filter_sensitivity=0, return_coords=False, multiple_crop_coords=False, return_one_box=True):
         lang = get_ocr_language()
-        furigana_filter_sensitivity = get_furigana_filter_sensitivity()
+        if furigana_filter_sensitivity != None:
+            furigana_filter_sensitivity = get_furigana_filter_sensitivity()
+        else:
+            furigana_filter_sensitivity = 0
         if lang != self.initial_lang:
             self.initial_lang = lang
             self.regex = get_regex(lang)
@@ -983,23 +989,15 @@ class OneOCR:
                     #         else:
                     #             continue
                     #     res += '\n'
-                elif return_coords:
-                    for line in filtered_lines:
-                        for word in line['words']:
-                            box = {
-                                "text": word['text'],
-                                "bounding_rect": word['bounding_rect']
-                            }
-                            boxes.append(box)
+                else:
                     res = ocr_resp['text']
-                elif multiple_crop_coords:
+                if multiple_crop_coords:
+                    logger.info(f"Getting multiple crop coords for {len(filtered_lines)} lines")
                     for line in filtered_lines:
                         crop_coords_list.append(
                             (line['bounding_rect']['x1'] - 5, line['bounding_rect']['y1'] - 5,
                              line['bounding_rect']['x3'] + 5, line['bounding_rect']['y3'] + 5))
-                    res = ocr_resp['text']
-                else:
-                    res = ocr_resp['text']
             except RuntimeError as e:
                 return (False, e)
@@ -1015,12 +1013,14 @@ class OneOCR:
                 return (False, 'Unknown error!')
             res = res.json()['text']
+        x = [True, res]
         if return_coords:
-            x = (True, res, filtered_lines)
-        elif multiple_crop_coords:
-            x = (True, res, crop_coords_list)
-        else:
-            x = (True, res, crop_coords)
+            x.append(filtered_lines)
+        if multiple_crop_coords:
+            x.append(crop_coords_list)
+        if return_one_box:
+            x.append(crop_coords)
         if is_path:
             img.close()
         return x
@@ -1410,9 +1410,12 @@ class localLLMOCR:
                     base_url=self.api_url.replace('/v1/chat/completions', '/v1'),
                     api_key=self.api_key
                 )
-            logger.info('Local LLM OCR (OpenAI-compatible) ready')
-            self.keep_llm_hot_thread = threading.Thread(target=self.keep_llm_warm, daemon=True)
-            self.keep_llm_hot_thread.start()
+            if self.client.models.retrieve(self.model):
+                self.model = self.model
+            logger.info(f'Local LLM OCR (OpenAI-compatible) ready with model {self.model}')
+            if self.keep_warm:
+                self.keep_llm_hot_thread = threading.Thread(target=self.keep_llm_warm, daemon=True)
+                self.keep_llm_hot_thread.start()
         except Exception as e:
             logger.warning(f'Error initializing Local LLM OCR, Local LLM OCR will not work!')
@@ -1441,7 +1444,7 @@ class localLLMOCR:
                 prompt = self.custom_prompt.strip()
             else:
                 prompt = f"""
-                Extract all {CommonLanguages.from_code(get_ocr_language())} Text from Image. Ignore all Furigana. Do not return any commentary, just the text in the image. If there is no text in the image, return "" (Empty String).
+                Extract all {CommonLanguages.from_code(get_ocr_language()).name} Text from Image. Ignore all Furigana. Do not return any commentary, just the text in the image. If there is no text in the image, return "" (Empty String).
                 """
             response = self.client.chat.completions.create(
@@ -1455,7 +1458,7 @@ class localLLMOCR:
                         ],
                     }
                 ],
-                max_tokens=512,
+                max_tokens=4096,
                 temperature=0.1
             )
             self.last_ocr_time = time.time()

GameSentenceMiner/tools/__init__.py ADDED Viewed

File without changes

GameSentenceMiner 2.13.15__py3-none-any.whl → 2.14.0__py3-none-any.whl

GameSentenceMiner 2.13.15py3-none-any.whl → 2.14.0py3-none-any.whl