PyPI - webscout - Versions diffs - 8.2.7__py3-none-any.whl → 8.2.8__py3-none-any.whl - Mend

webscout 8.2.7py3-none-any.whl → 8.2.8py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of webscout might be problematic. Click here for more details.

Files changed (323) hide show

webscout/AIauto.py +1 -1
webscout/AIutel.py +298 -249
webscout/Extra/Act.md +309 -0
webscout/Extra/GitToolkit/__init__.py +10 -0
webscout/Extra/GitToolkit/gitapi/README.md +110 -0
webscout/Extra/GitToolkit/gitapi/__init__.py +12 -0
webscout/Extra/GitToolkit/gitapi/repository.py +195 -0
webscout/Extra/GitToolkit/gitapi/user.py +96 -0
webscout/Extra/GitToolkit/gitapi/utils.py +62 -0
webscout/Extra/YTToolkit/README.md +375 -0
webscout/Extra/YTToolkit/YTdownloader.py +957 -0
webscout/Extra/YTToolkit/__init__.py +3 -0
webscout/Extra/YTToolkit/transcriber.py +476 -0
webscout/Extra/YTToolkit/ytapi/README.md +44 -0
webscout/Extra/YTToolkit/ytapi/__init__.py +6 -0
webscout/Extra/YTToolkit/ytapi/channel.py +307 -0
webscout/Extra/YTToolkit/ytapi/errors.py +13 -0
webscout/Extra/YTToolkit/ytapi/extras.py +118 -0
webscout/Extra/YTToolkit/ytapi/https.py +88 -0
webscout/Extra/YTToolkit/ytapi/patterns.py +61 -0
webscout/Extra/YTToolkit/ytapi/playlist.py +59 -0
webscout/Extra/YTToolkit/ytapi/pool.py +8 -0
webscout/Extra/YTToolkit/ytapi/query.py +40 -0
webscout/Extra/YTToolkit/ytapi/stream.py +63 -0
webscout/Extra/YTToolkit/ytapi/utils.py +62 -0
webscout/Extra/YTToolkit/ytapi/video.py +232 -0
webscout/Extra/__init__.py +7 -0
webscout/Extra/autocoder/__init__.py +9 -0
webscout/Extra/autocoder/autocoder.py +1105 -0
webscout/Extra/autocoder/autocoder_utiles.py +332 -0
webscout/Extra/gguf.md +430 -0
webscout/Extra/gguf.py +684 -0
webscout/Extra/tempmail/README.md +488 -0
webscout/Extra/tempmail/__init__.py +28 -0
webscout/Extra/tempmail/async_utils.py +141 -0
webscout/Extra/tempmail/base.py +161 -0
webscout/Extra/tempmail/cli.py +187 -0
webscout/Extra/tempmail/emailnator.py +84 -0
webscout/Extra/tempmail/mail_tm.py +361 -0
webscout/Extra/tempmail/temp_mail_io.py +292 -0
webscout/Extra/weather.md +281 -0
webscout/Extra/weather.py +194 -0
webscout/Extra/weather_ascii.py +76 -0
webscout/Litlogger/Readme.md +175 -0
webscout/Litlogger/__init__.py +67 -0
webscout/Litlogger/core/__init__.py +6 -0
webscout/Litlogger/core/level.py +23 -0
webscout/Litlogger/core/logger.py +165 -0
webscout/Litlogger/handlers/__init__.py +12 -0
webscout/Litlogger/handlers/console.py +33 -0
webscout/Litlogger/handlers/file.py +143 -0
webscout/Litlogger/handlers/network.py +173 -0
webscout/Litlogger/styles/__init__.py +7 -0
webscout/Litlogger/styles/colors.py +249 -0
webscout/Litlogger/styles/formats.py +458 -0
webscout/Litlogger/styles/text.py +87 -0
webscout/Litlogger/utils/__init__.py +6 -0
webscout/Litlogger/utils/detectors.py +153 -0
webscout/Litlogger/utils/formatters.py +200 -0
webscout/Provider/AI21.py +177 -0
webscout/Provider/AISEARCH/DeepFind.py +254 -0
webscout/Provider/AISEARCH/Perplexity.py +359 -0
webscout/Provider/AISEARCH/README.md +279 -0
webscout/Provider/AISEARCH/__init__.py +9 -0
webscout/Provider/AISEARCH/felo_search.py +228 -0
webscout/Provider/AISEARCH/genspark_search.py +350 -0
webscout/Provider/AISEARCH/hika_search.py +198 -0
webscout/Provider/AISEARCH/iask_search.py +436 -0
webscout/Provider/AISEARCH/monica_search.py +246 -0
webscout/Provider/AISEARCH/scira_search.py +324 -0
webscout/Provider/AISEARCH/webpilotai_search.py +281 -0
webscout/Provider/Aitopia.py +316 -0
webscout/Provider/AllenAI.py +440 -0
webscout/Provider/Andi.py +228 -0
webscout/Provider/Blackboxai.py +673 -0
webscout/Provider/ChatGPTClone.py +237 -0
webscout/Provider/ChatGPTGratis.py +194 -0
webscout/Provider/ChatSandbox.py +342 -0
webscout/Provider/Cloudflare.py +324 -0
webscout/Provider/Cohere.py +208 -0
webscout/Provider/Deepinfra.py +340 -0
webscout/Provider/ExaAI.py +261 -0
webscout/Provider/ExaChat.py +358 -0
webscout/Provider/Flowith.py +217 -0
webscout/Provider/FreeGemini.py +250 -0
webscout/Provider/Gemini.py +169 -0
webscout/Provider/GithubChat.py +370 -0
webscout/Provider/GizAI.py +295 -0
webscout/Provider/Glider.py +225 -0
webscout/Provider/Groq.py +801 -0
webscout/Provider/HF_space/__init__.py +0 -0
webscout/Provider/HF_space/qwen_qwen2.py +206 -0
webscout/Provider/HeckAI.py +285 -0
webscout/Provider/HuggingFaceChat.py +469 -0
webscout/Provider/Hunyuan.py +283 -0
webscout/Provider/Jadve.py +291 -0
webscout/Provider/Koboldai.py +384 -0
webscout/Provider/LambdaChat.py +411 -0
webscout/Provider/Llama3.py +259 -0
webscout/Provider/MCPCore.py +315 -0
webscout/Provider/Marcus.py +198 -0
webscout/Provider/Nemotron.py +218 -0
webscout/Provider/Netwrck.py +270 -0
webscout/Provider/OLLAMA.py +396 -0
webscout/Provider/OPENAI/BLACKBOXAI.py +735 -0
webscout/Provider/OPENAI/Cloudflare.py +378 -0
webscout/Provider/OPENAI/FreeGemini.py +282 -0
webscout/Provider/OPENAI/NEMOTRON.py +244 -0
webscout/Provider/OPENAI/README.md +1253 -0
webscout/Provider/OPENAI/__init__.py +36 -0
webscout/Provider/OPENAI/ai4chat.py +293 -0
webscout/Provider/OPENAI/api.py +810 -0
webscout/Provider/OPENAI/base.py +249 -0
webscout/Provider/OPENAI/c4ai.py +373 -0
webscout/Provider/OPENAI/chatgpt.py +556 -0
webscout/Provider/OPENAI/chatgptclone.py +488 -0
webscout/Provider/OPENAI/chatsandbox.py +172 -0
webscout/Provider/OPENAI/deepinfra.py +319 -0
webscout/Provider/OPENAI/e2b.py +1356 -0
webscout/Provider/OPENAI/exaai.py +411 -0
webscout/Provider/OPENAI/exachat.py +443 -0
webscout/Provider/OPENAI/flowith.py +162 -0
webscout/Provider/OPENAI/freeaichat.py +359 -0
webscout/Provider/OPENAI/glider.py +323 -0
webscout/Provider/OPENAI/groq.py +361 -0
webscout/Provider/OPENAI/heckai.py +307 -0
webscout/Provider/OPENAI/llmchatco.py +335 -0
webscout/Provider/OPENAI/mcpcore.py +383 -0
webscout/Provider/OPENAI/multichat.py +376 -0
webscout/Provider/OPENAI/netwrck.py +356 -0
webscout/Provider/OPENAI/opkfc.py +496 -0
webscout/Provider/OPENAI/scirachat.py +471 -0
webscout/Provider/OPENAI/sonus.py +303 -0
webscout/Provider/OPENAI/standardinput.py +433 -0
webscout/Provider/OPENAI/textpollinations.py +339 -0
webscout/Provider/OPENAI/toolbaz.py +413 -0
webscout/Provider/OPENAI/typefully.py +355 -0
webscout/Provider/OPENAI/typegpt.py +358 -0
webscout/Provider/OPENAI/uncovrAI.py +462 -0
webscout/Provider/OPENAI/utils.py +307 -0
webscout/Provider/OPENAI/venice.py +425 -0
webscout/Provider/OPENAI/wisecat.py +381 -0
webscout/Provider/OPENAI/writecream.py +163 -0
webscout/Provider/OPENAI/x0gpt.py +378 -0
webscout/Provider/OPENAI/yep.py +356 -0
webscout/Provider/OpenGPT.py +209 -0
webscout/Provider/Openai.py +496 -0
webscout/Provider/PI.py +429 -0
webscout/Provider/Perplexitylabs.py +415 -0
webscout/Provider/QwenLM.py +254 -0
webscout/Provider/Reka.py +214 -0
webscout/Provider/StandardInput.py +290 -0
webscout/Provider/TTI/AiForce/README.md +159 -0
webscout/Provider/TTI/AiForce/__init__.py +22 -0
webscout/Provider/TTI/AiForce/async_aiforce.py +224 -0
webscout/Provider/TTI/AiForce/sync_aiforce.py +245 -0
webscout/Provider/TTI/FreeAIPlayground/README.md +99 -0
webscout/Provider/TTI/FreeAIPlayground/__init__.py +9 -0
webscout/Provider/TTI/FreeAIPlayground/async_freeaiplayground.py +181 -0
webscout/Provider/TTI/FreeAIPlayground/sync_freeaiplayground.py +180 -0
webscout/Provider/TTI/ImgSys/README.md +174 -0
webscout/Provider/TTI/ImgSys/__init__.py +23 -0
webscout/Provider/TTI/ImgSys/async_imgsys.py +202 -0
webscout/Provider/TTI/ImgSys/sync_imgsys.py +195 -0
webscout/Provider/TTI/MagicStudio/README.md +101 -0
webscout/Provider/TTI/MagicStudio/__init__.py +2 -0
webscout/Provider/TTI/MagicStudio/async_magicstudio.py +111 -0
webscout/Provider/TTI/MagicStudio/sync_magicstudio.py +109 -0
webscout/Provider/TTI/Nexra/README.md +155 -0
webscout/Provider/TTI/Nexra/__init__.py +22 -0
webscout/Provider/TTI/Nexra/async_nexra.py +286 -0
webscout/Provider/TTI/Nexra/sync_nexra.py +258 -0
webscout/Provider/TTI/PollinationsAI/README.md +146 -0
webscout/Provider/TTI/PollinationsAI/__init__.py +23 -0
webscout/Provider/TTI/PollinationsAI/async_pollinations.py +311 -0
webscout/Provider/TTI/PollinationsAI/sync_pollinations.py +265 -0
webscout/Provider/TTI/README.md +128 -0
webscout/Provider/TTI/__init__.py +12 -0
webscout/Provider/TTI/aiarta/README.md +134 -0
webscout/Provider/TTI/aiarta/__init__.py +2 -0
webscout/Provider/TTI/aiarta/async_aiarta.py +482 -0
webscout/Provider/TTI/aiarta/sync_aiarta.py +440 -0
webscout/Provider/TTI/artbit/README.md +100 -0
webscout/Provider/TTI/artbit/__init__.py +22 -0
webscout/Provider/TTI/artbit/async_artbit.py +155 -0
webscout/Provider/TTI/artbit/sync_artbit.py +148 -0
webscout/Provider/TTI/fastflux/README.md +129 -0
webscout/Provider/TTI/fastflux/__init__.py +22 -0
webscout/Provider/TTI/fastflux/async_fastflux.py +261 -0
webscout/Provider/TTI/fastflux/sync_fastflux.py +252 -0
webscout/Provider/TTI/huggingface/README.md +114 -0
webscout/Provider/TTI/huggingface/__init__.py +22 -0
webscout/Provider/TTI/huggingface/async_huggingface.py +199 -0
webscout/Provider/TTI/huggingface/sync_huggingface.py +195 -0
webscout/Provider/TTI/piclumen/README.md +161 -0
webscout/Provider/TTI/piclumen/__init__.py +23 -0
webscout/Provider/TTI/piclumen/async_piclumen.py +268 -0
webscout/Provider/TTI/piclumen/sync_piclumen.py +233 -0
webscout/Provider/TTI/pixelmuse/README.md +79 -0
webscout/Provider/TTI/pixelmuse/__init__.py +4 -0
webscout/Provider/TTI/pixelmuse/async_pixelmuse.py +249 -0
webscout/Provider/TTI/pixelmuse/sync_pixelmuse.py +182 -0
webscout/Provider/TTI/talkai/README.md +139 -0
webscout/Provider/TTI/talkai/__init__.py +4 -0
webscout/Provider/TTI/talkai/async_talkai.py +229 -0
webscout/Provider/TTI/talkai/sync_talkai.py +207 -0
webscout/Provider/TTS/README.md +192 -0
webscout/Provider/TTS/__init__.py +9 -0
webscout/Provider/TTS/base.py +159 -0
webscout/Provider/TTS/deepgram.py +156 -0
webscout/Provider/TTS/elevenlabs.py +111 -0
webscout/Provider/TTS/gesserit.py +128 -0
webscout/Provider/TTS/murfai.py +113 -0
webscout/Provider/TTS/parler.py +111 -0
webscout/Provider/TTS/speechma.py +580 -0
webscout/Provider/TTS/sthir.py +94 -0
webscout/Provider/TTS/streamElements.py +333 -0
webscout/Provider/TTS/utils.py +280 -0
webscout/Provider/TeachAnything.py +229 -0
webscout/Provider/TextPollinationsAI.py +308 -0
webscout/Provider/TwoAI.py +280 -0
webscout/Provider/TypliAI.py +305 -0
webscout/Provider/UNFINISHED/ChatHub.py +209 -0
webscout/Provider/UNFINISHED/Youchat.py +330 -0
webscout/Provider/UNFINISHED/liner_api_request.py +263 -0
webscout/Provider/UNFINISHED/oivscode.py +351 -0
webscout/Provider/UNFINISHED/test_lmarena.py +119 -0
webscout/Provider/Venice.py +258 -0
webscout/Provider/VercelAI.py +253 -0
webscout/Provider/WiseCat.py +233 -0
webscout/Provider/WrDoChat.py +370 -0
webscout/Provider/Writecream.py +246 -0
webscout/Provider/WritingMate.py +269 -0
webscout/Provider/__init__.py +172 -0
webscout/Provider/ai4chat.py +149 -0
webscout/Provider/akashgpt.py +335 -0
webscout/Provider/asksteve.py +220 -0
webscout/Provider/cerebras.py +290 -0
webscout/Provider/chatglm.py +215 -0
webscout/Provider/cleeai.py +213 -0
webscout/Provider/copilot.py +425 -0
webscout/Provider/elmo.py +283 -0
webscout/Provider/freeaichat.py +285 -0
webscout/Provider/geminiapi.py +208 -0
webscout/Provider/granite.py +235 -0
webscout/Provider/hermes.py +266 -0
webscout/Provider/julius.py +223 -0
webscout/Provider/koala.py +170 -0
webscout/Provider/learnfastai.py +325 -0
webscout/Provider/llama3mitril.py +215 -0
webscout/Provider/llmchat.py +258 -0
webscout/Provider/llmchatco.py +306 -0
webscout/Provider/lmarena.py +198 -0
webscout/Provider/meta.py +801 -0
webscout/Provider/multichat.py +364 -0
webscout/Provider/samurai.py +223 -0
webscout/Provider/scira_chat.py +299 -0
webscout/Provider/scnet.py +243 -0
webscout/Provider/searchchat.py +292 -0
webscout/Provider/sonus.py +258 -0
webscout/Provider/talkai.py +194 -0
webscout/Provider/toolbaz.py +353 -0
webscout/Provider/turboseek.py +266 -0
webscout/Provider/typefully.py +202 -0
webscout/Provider/typegpt.py +289 -0
webscout/Provider/uncovr.py +368 -0
webscout/Provider/x0gpt.py +299 -0
webscout/Provider/yep.py +389 -0
webscout/__init__.py +4 -2
webscout/cli.py +3 -28
webscout/conversation.py +35 -35
webscout/litagent/Readme.md +276 -0
webscout/litagent/__init__.py +29 -0
webscout/litagent/agent.py +455 -0
webscout/litagent/constants.py +60 -0
webscout/litprinter/__init__.py +59 -0
webscout/scout/README.md +402 -0
webscout/scout/__init__.py +8 -0
webscout/scout/core/__init__.py +7 -0
webscout/scout/core/crawler.py +140 -0
webscout/scout/core/scout.py +568 -0
webscout/scout/core/search_result.py +96 -0
webscout/scout/core/text_analyzer.py +63 -0
webscout/scout/core/text_utils.py +277 -0
webscout/scout/core/web_analyzer.py +52 -0
webscout/scout/element.py +460 -0
webscout/scout/parsers/__init__.py +69 -0
webscout/scout/parsers/html5lib_parser.py +172 -0
webscout/scout/parsers/html_parser.py +236 -0
webscout/scout/parsers/lxml_parser.py +178 -0
webscout/scout/utils.py +37 -0
webscout/swiftcli/Readme.md +323 -0
webscout/swiftcli/__init__.py +95 -0
webscout/swiftcli/core/__init__.py +7 -0
webscout/swiftcli/core/cli.py +297 -0
webscout/swiftcli/core/context.py +104 -0
webscout/swiftcli/core/group.py +241 -0
webscout/swiftcli/decorators/__init__.py +28 -0
webscout/swiftcli/decorators/command.py +221 -0
webscout/swiftcli/decorators/options.py +220 -0
webscout/swiftcli/decorators/output.py +252 -0
webscout/swiftcli/exceptions.py +21 -0
webscout/swiftcli/plugins/__init__.py +9 -0
webscout/swiftcli/plugins/base.py +135 -0
webscout/swiftcli/plugins/manager.py +262 -0
webscout/swiftcli/utils/__init__.py +59 -0
webscout/swiftcli/utils/formatting.py +252 -0
webscout/swiftcli/utils/parsing.py +267 -0
webscout/version.py +1 -1
webscout/webscout_search.py +2 -182
webscout/webscout_search_async.py +1 -179
webscout/zeroart/README.md +89 -0
webscout/zeroart/__init__.py +135 -0
webscout/zeroart/base.py +66 -0
webscout/zeroart/effects.py +101 -0
webscout/zeroart/fonts.py +1239 -0
{webscout-8.2.7.dist-info → webscout-8.2.8.dist-info}/METADATA +115 -60
webscout-8.2.8.dist-info/RECORD +334 -0
{webscout-8.2.7.dist-info → webscout-8.2.8.dist-info}/WHEEL +1 -1
webscout-8.2.7.dist-info/RECORD +0 -26
{webscout-8.2.7.dist-info → webscout-8.2.8.dist-info}/entry_points.txt +0 -0
{webscout-8.2.7.dist-info → webscout-8.2.8.dist-info}/licenses/LICENSE.md +0 -0
{webscout-8.2.7.dist-info → webscout-8.2.8.dist-info}/top_level.txt +0 -0

webscout/AIauto.py CHANGED Viewed

@@ -1,7 +1,7 @@
 """
 This module provides the AUTO provider, which automatically selects and uses
 an available LLM provider from the webscout library that doesn't require
-API keys or cookies.
+API keys or cookies.
 """
 from webscout.AIbase import Provider

webscout/AIutel.py CHANGED Viewed

@@ -1,250 +1,299 @@
-import json
-from typing import Union, Optional, Dict, Any, Iterable, Generator, List, Callable, Literal
-import codecs
-# Expanded encoding types
-EncodingType = Literal['utf-8', 'utf-16', 'utf-32', 'ascii', 'latin1', 'cp1252', 'iso-8859-1',
-                        'iso-8859-2', 'windows-1250', 'windows-1251', 'windows-1252', 'gbk', 'big5',
-                        'shift_jis', 'euc-jp', 'euc-kr']
-def _process_chunk(
-    chunk: str,
-    intro_value: str,
-    to_json: bool,
-    skip_markers: List[str],
-    strip_chars: Optional[str],
-    yield_raw_on_error: bool,
-) -> Union[str, Dict[str, Any], None]:
-    """Internal helper to sanitize and potentially parse a single chunk."""
-    if not isinstance(chunk, str):
-        return None
-    # Fast path for empty chunks
-    if not chunk:
-        return None
-    # Use slicing for prefix removal (faster than startswith+slicing)
-    sanitized_chunk = chunk
-    if intro_value and len(chunk) >= len(intro_value) and chunk[:len(intro_value)] == intro_value:
-        sanitized_chunk = chunk[len(intro_value):]
-    # Optimize string stripping operations
-    if strip_chars is not None:
-        sanitized_chunk = sanitized_chunk.strip(strip_chars)
-    else:
-        # lstrip() is faster than strip() when we only need leading whitespace removed
-        sanitized_chunk = sanitized_chunk.lstrip()
-    # Skip empty chunks and markers
-    if not sanitized_chunk or any(marker == sanitized_chunk for marker in skip_markers):
-        return None
-    # JSON parsing with optimized error handling
-    if to_json:
-        try:
-            # Only strip before JSON parsing if needed
-            if sanitized_chunk[0] not in '{[' or sanitized_chunk[-1] not in '}]':
-                sanitized_chunk = sanitized_chunk.strip()
-            return json.loads(sanitized_chunk)
-        except (json.JSONDecodeError, Exception):
-            return sanitized_chunk if yield_raw_on_error else None
-    return sanitized_chunk
-def _decode_byte_stream(
-    byte_iterator: Iterable[bytes],
-    encoding: EncodingType = 'utf-8',
-    errors: str = 'replace',
-    buffer_size: int = 8192
-) -> Generator[str, None, None]:
-    """
-    Realtime byte stream decoder with flexible encoding support.
-    Args:
-        byte_iterator: Iterator yielding bytes
-        encoding: Character encoding to use
-        errors: How to handle encoding errors ('strict', 'ignore', 'replace')
-        buffer_size: Size of internal buffer for performance tuning
-    """
-    # Initialize decoder with the specified encoding
-    try:
-        decoder = codecs.getincrementaldecoder(encoding)(errors=errors)
-    except LookupError:
-        # Fallback to utf-8 if the encoding is not supported
-        decoder = codecs.getincrementaldecoder('utf-8')(errors=errors)
-    # Process byte stream in realtime
-    buffer = bytearray(buffer_size)
-    buffer_view = memoryview(buffer)
-    for chunk_bytes in byte_iterator:
-        if not chunk_bytes:
-            continue
-        try:
-            # Use buffer for processing if chunk size is appropriate
-            if len(chunk_bytes) <= buffer_size:
-                buffer[:len(chunk_bytes)] = chunk_bytes
-                text = decoder.decode(buffer_view[:len(chunk_bytes)], final=False)
-            else:
-                text = decoder.decode(chunk_bytes, final=False)
-            if text:
-                yield text
-        except UnicodeDecodeError:
-            yield f"[Encoding Error: Could not decode bytes with {encoding}]\n"
-    # Final flush
-    try:
-        final_text = decoder.decode(b'', final=True)
-        if final_text:
-            yield final_text
-    except UnicodeDecodeError:
-        yield f"[Encoding Error: Could not decode final bytes with {encoding}]\n"
-def sanitize_stream(
-    data: Union[str, Iterable[str], Iterable[bytes]],
-    intro_value: str = "data:",
-    to_json: bool = True,
-    skip_markers: Optional[List[str]] = None,
-    strip_chars: Optional[str] = None,
-    start_marker: Optional[str] = None,
-    end_marker: Optional[str] = None,
-    content_extractor: Optional[Callable[[Union[str, Dict[str, Any]]], Optional[Any]]] = None,
-    yield_raw_on_error: bool = True,
-    encoding: EncodingType = 'utf-8',
-    encoding_errors: str = 'replace',
-    buffer_size: int = 8192,
-) -> Generator[Any, None, None]:
-    """
-    Optimized realtime stream processor that handles string/byte streams with minimal latency.
-    Features:
-    - Direct realtime processing of byte streams
-    - Optimized string handling and JSON parsing
-    - Robust error handling and validation
-    - Flexible encoding support with memory-efficient buffering
-    - High performance for large streams
-    Args:
-        data: Input data (string, string iterator, or bytes iterator)
-        intro_value: Prefix to remove from each chunk
-        to_json: Whether to parse chunks as JSON
-        skip_markers: Markers to skip
-        strip_chars: Characters to strip
-        start_marker: Processing start marker
-        end_marker: Processing end marker
-        content_extractor: Function to extract content
-        yield_raw_on_error: Yield raw content on JSON errors
-        encoding: Character encoding for byte streams
-        encoding_errors: How to handle encoding errors
-        buffer_size: Size of internal processing buffer
-    Yields:
-        Processed chunks (string or dictionary)
-    """
-    effective_skip_markers = skip_markers or []
-    processing_active = start_marker is None
-    # Fast path for single string processing
-    if isinstance(data, str):
-        processed_item = None
-        if processing_active:
-            # Optimize JSON parsing for large strings
-            if to_json:
-                try:
-                    # Use faster JSON parser for large strings
-                    data = data.strip()
-                    if data:
-                        processed_item = json.loads(data)
-                except json.JSONDecodeError:
-                    processed_item = data if yield_raw_on_error else None
-            else:
-                processed_item = _process_chunk(
-                    data, intro_value, False, effective_skip_markers,
-                    strip_chars, yield_raw_on_error
-                )
-            if processed_item is not None:
-                if content_extractor:
-                    try:
-                        final_content = content_extractor(processed_item)
-                        if final_content is not None:
-                            yield final_content
-                    except Exception:
-                        pass
-                else:
-                    yield processed_item
-        return
-    # Stream processing path
-    if not hasattr(data, '__iter__'):
-        raise TypeError(f"Input must be a string or an iterable, not {type(data).__name__}")
-    try:
-        iterator = iter(data)
-        first_item = next(iterator, None)
-        if first_item is None:
-            return
-        # Efficient streaming with itertools
-        from itertools import chain
-        stream = chain([first_item], iterator)
-        # Determine if we're dealing with bytes or strings
-        if isinstance(first_item, bytes):
-            line_iterator = _decode_byte_stream(
-                stream,
-                encoding=encoding,
-                errors=encoding_errors,
-                buffer_size=buffer_size
-            )
-        elif isinstance(first_item, str):
-            line_iterator = stream
-        else:
-            raise TypeError(f"Stream must yield strings or bytes, not {type(first_item).__name__}")
-        # Process stream with minimal allocations
-        for line in line_iterator:
-            if not line:
-                continue
-            # Handle markers efficiently
-            if not processing_active and start_marker is not None:
-                if line.strip() == start_marker:
-                    processing_active = True
-                continue
-            if processing_active and end_marker is not None and line.strip() == end_marker:
-                processing_active = False
-                continue
-            if processing_active:
-                # Process chunk with optimized function
-                processed = _process_chunk(
-                    line, intro_value, to_json, effective_skip_markers,
-                    strip_chars, yield_raw_on_error
-                )
-                if processed is not None:
-                    if content_extractor:
-                        try:
-                            final_content = content_extractor(processed)
-                            if final_content is not None:
-                                yield final_content
-                        except Exception:
-                            # Continue on extraction errors
-                            pass
-                    else:
-                        yield processed
-    except Exception as e:
-        # Log error but don't crash on stream processing exceptions
-        import sys
-        print(f"Stream processing error: {str(e)}", file=sys.stderr)
-from .conversation import Conversation
-from .optimizers import Optimizers
-from .Extra.autocoder import AutoCoder
+import json
+from typing import Union, Optional, Dict, Any, Iterable, Generator, List, Callable, Literal
+import codecs
+# Expanded encoding types
+EncodingType = Literal['utf-8', 'utf-16', 'utf-32', 'ascii', 'latin1', 'cp1252', 'iso-8859-1',
+                        'iso-8859-2', 'windows-1250', 'windows-1251', 'windows-1252', 'gbk', 'big5',
+                        'shift_jis', 'euc-jp', 'euc-kr']
+def _process_chunk(
+    chunk: str,
+    intro_value: str,
+    to_json: bool,
+    skip_markers: List[str],
+    strip_chars: Optional[str],
+    yield_raw_on_error: bool,
+) -> Union[str, Dict[str, Any], None]:
+    """Internal helper to sanitize and potentially parse a single chunk."""
+    if not isinstance(chunk, str):
+        return None
+    # Fast path for empty chunks
+    if not chunk:
+        return None
+    # Use slicing for prefix removal (faster than startswith+slicing)
+    sanitized_chunk = chunk
+    if intro_value and len(chunk) >= len(intro_value) and chunk[:len(intro_value)] == intro_value:
+        sanitized_chunk = chunk[len(intro_value):]
+    # Optimize string stripping operations
+    if strip_chars is not None:
+        sanitized_chunk = sanitized_chunk.strip(strip_chars)
+    else:
+        # lstrip() is faster than strip() when we only need leading whitespace removed
+        sanitized_chunk = sanitized_chunk.lstrip()
+    # Skip empty chunks and markers
+    if not sanitized_chunk or any(marker == sanitized_chunk for marker in skip_markers):
+        return None
+    # JSON parsing with optimized error handling
+    if to_json:
+        try:
+            # Only strip before JSON parsing if needed
+            if sanitized_chunk[0] not in '{[' or sanitized_chunk[-1] not in '}]':
+                sanitized_chunk = sanitized_chunk.strip()
+            return json.loads(sanitized_chunk)
+        except (json.JSONDecodeError, Exception):
+            return sanitized_chunk if yield_raw_on_error else None
+    return sanitized_chunk
+def _decode_byte_stream(
+    byte_iterator: Iterable[bytes],
+    encoding: EncodingType = 'utf-8',
+    errors: str = 'replace',
+    buffer_size: int = 8192
+) -> Generator[str, None, None]:
+    """
+    Realtime byte stream decoder with flexible encoding support.
+    Args:
+        byte_iterator: Iterator yielding bytes
+        encoding: Character encoding to use
+        errors: How to handle encoding errors ('strict', 'ignore', 'replace')
+        buffer_size: Size of internal buffer for performance tuning
+    """
+    # Initialize decoder with the specified encoding
+    try:
+        decoder = codecs.getincrementaldecoder(encoding)(errors=errors)
+    except LookupError:
+        # Fallback to utf-8 if the encoding is not supported
+        decoder = codecs.getincrementaldecoder('utf-8')(errors=errors)
+    # Process byte stream in realtime
+    buffer = bytearray(buffer_size)
+    buffer_view = memoryview(buffer)
+    for chunk_bytes in byte_iterator:
+        if not chunk_bytes:
+            continue
+        try:
+            # Use buffer for processing if chunk size is appropriate
+            if len(chunk_bytes) <= buffer_size:
+                buffer[:len(chunk_bytes)] = chunk_bytes
+                text = decoder.decode(buffer_view[:len(chunk_bytes)], final=False)
+            else:
+                text = decoder.decode(chunk_bytes, final=False)
+            if text:
+                yield text
+        except UnicodeDecodeError:
+            yield f"[Encoding Error: Could not decode bytes with {encoding}]\n"
+    # Final flush
+    try:
+        final_text = decoder.decode(b'', final=True)
+        if final_text:
+            yield final_text
+    except UnicodeDecodeError:
+        yield f"[Encoding Error: Could not decode final bytes with {encoding}]\n"
+def sanitize_stream(
+    data: Union[str, Iterable[str], Iterable[bytes]],
+    intro_value: str = "data:",
+    to_json: bool = True,
+    skip_markers: Optional[List[str]] = None,
+    strip_chars: Optional[str] = None,
+    start_marker: Optional[str] = None,
+    end_marker: Optional[str] = None,
+    content_extractor: Optional[Callable[[Union[str, Dict[str, Any]]], Optional[Any]]] = None,
+    yield_raw_on_error: bool = True,
+    encoding: EncodingType = 'utf-8',
+    encoding_errors: str = 'replace',
+    buffer_size: int = 8192,
+) -> Generator[Any, None, None]:
+    """
+    Robust realtime stream processor that handles string/byte streams with correct marker extraction/skipping.
+    Now handles split markers, partial chunks, and skips lines containing (not just equal to) skip markers.
+    """
+    effective_skip_markers = skip_markers or []
+    processing_active = start_marker is None
+    buffer = ""
+    found_start = False if start_marker else True
+    # Fast path for single string processing
+    if isinstance(data, str):
+        processed_item = None
+        if processing_active:
+            if to_json:
+                try:
+                    data = data.strip()
+                    if data:
+                        processed_item = json.loads(data)
+                except json.JSONDecodeError:
+                    processed_item = data if yield_raw_on_error else None
+            else:
+                processed_item = _process_chunk(
+                    data, intro_value, False, effective_skip_markers,
+                    strip_chars, yield_raw_on_error
+                )
+            if processed_item is not None:
+                if content_extractor:
+                    try:
+                        final_content = content_extractor(processed_item)
+                        if final_content is not None:
+                            yield final_content
+                    except Exception:
+                        pass
+                else:
+                    yield processed_item
+        return
+    # Stream processing path
+    if not hasattr(data, '__iter__'):
+        raise TypeError(f"Input must be a string or an iterable, not {type(data).__name__}")
+    try:
+        iterator = iter(data)
+        first_item = next(iterator, None)
+        if first_item is None:
+            return
+        from itertools import chain
+        stream = chain([first_item], iterator)
+        # Determine if we're dealing with bytes or strings
+        if isinstance(first_item, bytes):
+            line_iterator = _decode_byte_stream(
+                stream,
+                encoding=encoding,
+                errors=encoding_errors,
+                buffer_size=buffer_size
+            )
+        elif isinstance(first_item, str):
+            line_iterator = stream
+        else:
+            raise TypeError(f"Stream must yield strings or bytes, not {type(first_item).__name__}")
+        for line in line_iterator:
+            if not line:
+                continue
+            buffer += line
+            while True:
+                # Look for start marker if needed
+                if not found_start and start_marker:
+                    idx = buffer.find(start_marker)
+                    if idx != -1:
+                        found_start = True
+                        buffer = buffer[idx + len(start_marker):]
+                    else:
+                        # Not found, keep buffering
+                        buffer = buffer[-max(len(start_marker), 256):]  # avoid unbounded growth
+                        break
+                # Look for end marker if needed
+                if found_start and end_marker:
+                    idx = buffer.find(end_marker)
+                    if idx != -1:
+                        chunk = buffer[:idx]
+                        buffer = buffer[idx + len(end_marker):]
+                        processing_active = False
+                    else:
+                        chunk = buffer
+                        buffer = ""
+                        processing_active = True
+                    # Process chunk if we are in active region
+                    if chunk and processing_active:
+                        # Split into lines for skip marker logic
+                        for subline in chunk.splitlines():
+                            # Remove intro_value prefix if present
+                            if intro_value and subline.startswith(intro_value):
+                                subline = subline[len(intro_value):]
+                            # Strip chars if needed
+                            if strip_chars is not None:
+                                subline = subline.strip(strip_chars)
+                            else:
+                                subline = subline.lstrip()
+                            # Skip if matches any skip marker (using 'in')
+                            if any(marker in subline for marker in effective_skip_markers):
+                                continue
+                            # Skip empty
+                            if not subline:
+                                continue
+                            # JSON parse if needed
+                            if to_json:
+                                try:
+                                    if subline and (subline[0] in '{[' and subline[-1] in '}]'):
+                                        parsed = json.loads(subline)
+                                        result = parsed
+                                    else:
+                                        result = subline
+                                except Exception:
+                                    result = subline if yield_raw_on_error else None
+                            else:
+                                result = subline
+                            if result is not None:
+                                if content_extractor:
+                                    try:
+                                        final_content = content_extractor(result)
+                                        if final_content is not None:
+                                            yield final_content
+                                    except Exception:
+                                        pass
+                                else:
+                                    yield result
+                    if not processing_active:
+                        found_start = False
+                    if idx == -1:
+                        break
+                elif found_start:
+                    # No end marker, process all buffered content
+                    chunk = buffer
+                    buffer = ""
+                    if chunk:
+                        for subline in chunk.splitlines():
+                            if intro_value and subline.startswith(intro_value):
+                                subline = subline[len(intro_value):]
+                            if strip_chars is not None:
+                                subline = subline.strip(strip_chars)
+                            else:
+                                subline = subline.lstrip()
+                            if any(marker in subline for marker in effective_skip_markers):
+                                continue
+                            if not subline:
+                                continue
+                            if to_json:
+                                try:
+                                    if subline and (subline[0] in '{[' and subline[-1] in '}]'):
+                                        parsed = json.loads(subline)
+                                        result = parsed
+                                    else:
+                                        result = subline
+                                except Exception:
+                                    result = subline if yield_raw_on_error else None
+                            else:
+                                result = subline
+                            if result is not None:
+                                if content_extractor:
+                                    try:
+                                        final_content = content_extractor(result)
+                                        if final_content is not None:
+                                            yield final_content
+                                    except Exception:
+                                        pass
+                                else:
+                                    yield result
+                    break
+                else:
+                    break
+    except Exception as e:
+        import sys
+        print(f"Stream processing error: {str(e)}", file=sys.stderr)
+from .conversation import Conversation
+from .optimizers import Optimizers
+from .Extra.autocoder import AutoCoder
 from .prompt_manager import AwesomePrompts

webscout 8.2.7__py3-none-any.whl → 8.2.8__py3-none-any.whl

Potentially problematic release.

webscout 8.2.7py3-none-any.whl → 8.2.8py3-none-any.whl