PyPI - warp-beacon - Versions diffs - 2.8.12__py3-none-any.whl → 2.8.14__py3-none-any.whl - Mend

warp-beacon 2.8.12py3-none-any.whl → 2.8.14py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (17) hide show

warp_beacon/__version__.py +1 -1
warp_beacon/jobs/abstract.py +7 -0
warp_beacon/jobs/types.py +2 -1
warp_beacon/scraper/X/X.py +156 -182
warp_beacon/scraper/X/types.py +6 -5
warp_beacon/scraper/__init__.py +3 -0
warp_beacon/storage/__init__.py +5 -6
warp_beacon/telegram/bot.py +34 -11
warp_beacon/telegram/edit_message.py +30 -19
warp_beacon/telegram/handlers.py +22 -12
warp_beacon/uploader/__init__.py +5 -2
{warp_beacon-2.8.12.dist-info → warp_beacon-2.8.14.dist-info}/METADATA +1 -1
{warp_beacon-2.8.12.dist-info → warp_beacon-2.8.14.dist-info}/RECORD +17 -17
{warp_beacon-2.8.12.dist-info → warp_beacon-2.8.14.dist-info}/WHEEL +0 -0
{warp_beacon-2.8.12.dist-info → warp_beacon-2.8.14.dist-info}/entry_points.txt +0 -0
{warp_beacon-2.8.12.dist-info → warp_beacon-2.8.14.dist-info}/licenses/LICENSE +0 -0
{warp_beacon-2.8.12.dist-info → warp_beacon-2.8.14.dist-info}/top_level.txt +0 -0

warp_beacon/__version__.py CHANGED Viewed

@@ -1,2 +1,2 @@
-__version__ = "2.8.12"
+__version__ = "2.8.14"

warp_beacon/jobs/abstract.py CHANGED Viewed

@@ -109,6 +109,9 @@ class AbstractJob(ABC):
 		if self.media_type == JobType.COLLECTION:
 			if not self.media_collection:
 				return True
+		elif self.media_type == JobType.TEXT:
+			if not self.message_text:
+				return True
 		elif not self.local_media_path:
 			return True
 		return False
@@ -129,9 +132,13 @@ class AbstractJob(ABC):
 				for j in i:
 					if os.path.exists(j.local_media_path):
 						os.unlink(j.local_media_path)
+		elif self.media_type == JobType.TEXT:
+			pass
 		else:
 			if os.path.exists(self.local_media_path):
 				os.unlink(self.local_media_path)
 			if self.local_compressed_media_path:
 				if os.path.exists(self.local_compressed_media_path):
 					os.unlink(self.local_compressed_media_path)
+		return True

warp_beacon/jobs/types.py CHANGED Viewed

@@ -6,4 +6,5 @@ class JobType(str, Enum):
 	IMAGE = "image",
 	AUDIO = "audio",
 	COLLECTION = "collection"
-	ANIMATION = "animation"
+	ANIMATION = "animation"
+	TEXT = "text"

warp_beacon/scraper/X/X.py CHANGED Viewed

@@ -1,7 +1,7 @@
 import os
 import time
 import logging
-from mimetypes import guess_extension
+from mimetypes import guess_extension, guess_type
 from urllib.parse import urlparse
 import requests
 import yt_dlp
@@ -9,10 +9,11 @@ from playwright.sync_api import sync_playwright, Page
 from warp_beacon.telegram.utils import Utils
 from warp_beacon.scraper.utils import ScraperUtils
-from warp_beacon.scraper.X.types import XMediaType
 from warp_beacon.jobs.types import JobType
 from warp_beacon.scraper.X.abstract import XAbstract
+from warp_beacon.scraper.exceptions import Unavailable
 class XScraper(XAbstract):
 	DOWNLOAD_DIR = "/tmp"
@@ -29,107 +30,134 @@ class XScraper(XAbstract):
 		return ret
-	def get_media_type(self, media_info: dict) -> XMediaType:
-		media_type = XMediaType.UNKNOWN
-		#logging.info("[X] post info: '%s'", media_info)
-		if 'ext' in media_info:
-			logging.info("[X] Format: '%s'", media_info['ext'])
-		if 'formats' in media_info:
-			logging.info("[X] Contains video.")
-			media_type = XMediaType.VIDEO
-		elif 'thumbnails' in media_info:
-			logging.info("[X] contains images.")
-			media_type = XMediaType.IMAGE
-		else:
-			logging.info("[X] No media found.")
-		return media_type
+	def generate_result(self, local_files: list, job_type: JobType, canonical_name: str = "", performer: str = "") -> list:
+		res = []
+		if local_files:
+			if job_type == JobType.COLLECTION:
+				chunks = []
+				for media_chunk in Utils.chunker(local_files, 10):
+					chunk = []
+					for media in media_chunk:
+						mime_type, _ = guess_type(media)
+						chunk.append({
+							"local_media_path": self.rename_local_file(media),
+							"canonical_name": canonical_name,
+							"media_type": JobType.VIDEO if "video" in mime_type else JobType.IMAGE,
+							"media_info": {}
+						})
+					chunks.append(chunk)
+					res.append({
+						"media_type": JobType.COLLECTION,
+						"canonical_name": canonical_name,
+						"items": chunks
+					})
+			else:
+				for local_file in local_files:
+					res.append({
+						"local_media_path": self.rename_local_file(local_file),
+						"performer": performer,
+						"canonical_name": canonical_name,
+						"media_type": job_type
+					})
+		logging.debug(res)
+		return res
 	def _download(self, url: str, timeout: int = 60) -> list:
 		res = []
-		job_type = JobType.UNKNOWN
+		post_text = ""
+		pw_proxy = None
+		if self.proxy:
+			dsn = self.proxy.get("dsn", "")
+			if dsn:
+				parsed = urlparse(dsn)
+				pw_proxy = {
+					"server": f"{parsed.scheme}://{parsed.hostname}:{parsed.port}",
+					"username": parsed.username,
+					"password": parsed.password
+				}
+				logging.info("[X] build proxy: %s", pw_proxy)
+		contains_images, contains_videos = False, False
+		images, videos = [], []
+		with sync_playwright() as p:
+			with p.chromium.launch(headless=True) as browser:
+				with browser.new_context(proxy=pw_proxy, ignore_https_errors=True) as context:
+					page = context.new_page()
+					page.goto(url, wait_until="networkidle", timeout=(timeout*1000))
+					page.wait_for_selector("article[role='article']", timeout=(timeout*1000))
+					contains_videos = self.tweet_contains_video(page)
+					contains_images = self.tweet_contains_images(page)
+					if contains_images:
+						post_text, images = self.download_images(page, timeout)
+					if not contains_images and not contains_videos:
+						post_text = self.extract_post_text(page)
+		if contains_videos:
+			media_info, videos = self.download_videos(url, timeout)
+			if media_info:
+				post_text = self.extract_canonical_name(media_info)
+		if not images and not videos:
+			if not post_text:
+				raise Unavailable("Content unvailable")
+			logging.info("[X]: Sending text message")
+			res.append({
+				"message_text": post_text,
+				"media_type": JobType.TEXT
+			})
+			return res
+		if len(images) > 1 or len(videos) > 1:
+			logging.info("[X]: uploading collection")
+			content = images + videos
+			res.extend(self.generate_result(content, JobType.COLLECTION, canonical_name=post_text))
+		else:
+			logging.info("[X]: uploading media")
+			for job_type, content in {JobType.IMAGE: images, JobType.VIDEO: videos}.items():
+				if content:
+					res.extend(self.generate_result(content, job_type, canonical_name=post_text))
+		return res
+	def download_videos(self, url: str, timeout: int = 60) -> tuple[dict, list[str]]:
+		local_files = []
+		media_info = {}
 		time_name = str(time.time()).replace('.', '_')
 		ydl_opts = {
 			'socket_timeout': timeout,
-			'outtmpl': f'{self.DOWNLOAD_DIR}/x_download_{time_name}.%(ext)s',
+			'outtmpl': f'{self.DOWNLOAD_DIR}/x_download_{time_name}_%(id)s.%(ext)s',
 			'quiet': False,
 			'force_generic_extractor': False,
-			'noplaylist': True,
+			#'noplaylist': True,
 			'merge_output_format': 'mp4',
-			'dump_single_json': True,
+			'dump_single_json': False,
 			'nocheckcertificate': True,
 			'progress_hooks': [self.dlp_on_progress],
 		}
 		if self.proxy:
 			proxy_dsn = self.proxy.get("dsn", "")
 			logging.info("[X] Using proxy DSN '%s'", proxy_dsn)
 			if proxy_dsn:
 				ydl_opts["proxy"] = proxy_dsn
-		local_file, media_info, media_type, post_text = "", {}, XMediaType.UNKNOWN, ""
-		#tweet_contains_video, tweet_contains_images = False, False
-		#with sync_playwright() as p:
-		#	with p.chromium.launch(headless=True) as browser:
-		#		with browser.new_context(proxy=proxy, ignore_https_errors=True) as context:
-		#			page = context.new_page()
-		#			page.goto(url, wait_until="networkidle", timeout=(timeout*1000))
-		#			tweet_contains_video = self.tweet_contains_video(page)
-		#			tweet_contains_images = self.tweet_contains_images(page)
 		with yt_dlp.YoutubeDL(ydl_opts) as ydl:
-			try:
-				media_info = ydl.extract_info(url, download=False)
-				media_type = self.get_media_type(media_info)
-				if media_type == XMediaType.VIDEO:
-					local_file = self.download_video(url, ydl, media_info)
-					post_text = self.extract_canonical_name(media_info)
-					job_type = JobType.VIDEO
-			except yt_dlp.utils.DownloadError as e:
-				msg = str(e).lower()
-				if "no video could be found in this tweet" in msg:
-					logging.warning("[X] yt_dlp failed to extract info. Falling back to image scraping.")
-					media_type = XMediaType.IMAGE
-				else:
-					raise
-		images = []
-		if media_type == XMediaType.IMAGE:
-			job_type = JobType.IMAGE
-			images, post_text = self.download_images(url, timeout)
-			if images:
-				if len(images) > 1:
-					job_type = JobType.COLLECTION
-				else:
-					local_file = images[0]
-		if job_type == JobType.COLLECTION:
-			chunks = []
-			for media_chunk in Utils.chunker(images, 10):
-				chunk = []
-				for media in media_chunk:
-					chunk.append({
-						"local_media_path": self.rename_local_file(media),
-						"canonical_name": post_text,
-						"media_type": JobType.IMAGE
-					})
-				chunks.append(chunk)
-			res.append({
-				"media_type": JobType.COLLECTION,
-				"items": chunks
-			})
-		else:
-			if local_file:
-				res.append({
-					"local_media_path": self.rename_local_file(local_file),
-					"performer": media_info.get("uploader", "Unknown"),
-					"canonical_name": post_text,
-					"media_type": job_type
-				})
+			info = ydl.extract_info(url, download=False)
+			media_info = info
+			entries = info.get("entries", [info])
+			for entry in entries:
+				ret = ydl.download([entry['webpage_url']])
+				if ret == 0:
+					file_path = ydl.prepare_filename(entry)
+					if isinstance(file_path, str):
+						local_files.append(file_path)
+					else:
+						local_files.extend(file_path)
-		return res
+		return media_info, local_files
 	def adaptive_chunk_size(self, content_length: int) -> int:
 		if content_length < 100_000:
@@ -141,20 +169,11 @@ class XScraper(XAbstract):
 		else:
 			return 65536
-	def download_video(self, url: str, ydl: yt_dlp.YoutubeDL, media_info: dict) -> str:
-		local_file = ""
-		ydl.download([url])
-		local_file = ydl.prepare_filename(media_info)
-		logging.debug("Temp filename: '%s'", local_file)
-		if local_file:
-			local_file = self.rename_local_file(local_file)
-		return local_file
 	def get_extension_from_headers(self, response: requests.Response) -> str:
 		content_type = response.headers.get("Content-Type", "")
 		return guess_extension(content_type) or ".jpg"
-	def download_images(self, url: str, timeout: int = 60) -> tuple[list[str], str]:
+	def download_images(self, page: Page, timeout: int) -> tuple[str, list[str]]:
 		downloaded_imgs = []
 		headers = {
 			"User-Agent": ScraperUtils.get_ua(),
@@ -166,7 +185,7 @@ class XScraper(XAbstract):
 		if self.proxy:
 			proxies = {"https": self.proxy.get("dsn", ""), "http": self.proxy.get("dsn", "")}
-		image_urls, post_text = self.extract_image_urls_from_x_post(url, timeout=timeout)
+		image_urls, post_text = self.extract_image_urls_from_x_post(page, timeout)
 		if not image_urls:
 			logging.error("[X] Content images are not found!")
@@ -210,101 +229,25 @@ class XScraper(XAbstract):
 							)
 				downloaded_imgs.append(filepath)
-		return downloaded_imgs, post_text
+		return post_text, downloaded_imgs
-	def extract_post_text(self, page: Page) -> str:
-		try:
-			tweet_texts = []
-			# collecting text blocks from post
-			containers = page.query_selector_all('div[data-testid="tweetText"]')
-			for container in containers:
-				try:
-					spans = container.query_selector_all("span")
-					if spans:
-						for span in spans:
-							text = span.inner_text().strip()
-							if text:
-								tweet_texts.append(text)
-					else:
-						# to span's try container itself
-						text = container.inner_text().strip()
-						if text:
-							tweet_texts.append(text)
-				except Exception:
-					continue
-			return " ".join(tweet_texts).strip()
-		except Exception as e:
-			logging.warning("Failed to extract tweet text.", exc_info=e)
-		return ""
-	def extract_image_urls_from_x_post(self, url: str, timeout: int = 60) -> tuple[list[str], str]:
+	def extract_image_urls_from_x_post(self, page: Page, timeout: int) -> tuple[list[str], str]:
 		img_urls, post_text = [], ''
-		proxy = None
-		if self.proxy:
-			dsn = self.proxy.get("dsn", "")
-			if dsn:
-				parsed = urlparse(dsn)
-				proxy = {
-					"server": f"{parsed.scheme}://{parsed.hostname}:{parsed.port}",
-					"username": parsed.username,
-					"password": parsed.password
-				}
-				logging.info("[X] build proxy: %s", proxy)
-		with sync_playwright() as p:
-			with p.chromium.launch(headless=True) as browser:
-				with browser.new_context(proxy=proxy, ignore_https_errors=True) as context:
-					page = context.new_page()
-					page.goto(url, wait_until="networkidle", timeout=(timeout*1000))
-					#page.wait_for_timeout(3000)
-					page.wait_for_selector("img[src*='pbs.twimg.com/media']", timeout=(timeout*1000))
-					post_text = self.extract_post_text(page)
+		page.wait_for_selector("img[src*='pbs.twimg.com/media']", timeout=(timeout*1000))
+		post_text = self.extract_post_text(page)
-					image_elements = page.query_selector_all("img")
-					image_urls = []
+		image_elements = page.query_selector_all("img")
+		image_urls = []
-					for img in image_elements:
-						src = img.get_attribute("src")
-						if src and "pbs.twimg.com/media" in src:
-							image_urls.append(src)
+		for img in image_elements:
+			src = img.get_attribute("src")
+			if src and "pbs.twimg.com/media" in src:
+				image_urls.append(src)
-					img_urls = list(set(image_urls))
+		img_urls = list(set(image_urls))
 		return img_urls, post_text
-	def get_media_type_from_info_and_dom(self, media_info: dict, page: Page) -> XMediaType:
-		is_video = (
-			media_info.get("vcodec") != "none" or
-			media_info.get("ext") in {"mp4", "mov", "mkv"} or
-			any(
-				f.get("vcodec") not in (None, "none")
-				for f in media_info.get("formats", [])
-			)
-		)
-		try:
-			image_elements = page.query_selector_all("img")
-			image_urls = [
-				img.get_attribute("src")
-				for img in image_elements
-				if img.get_attribute("src") and "pbs.twimg.com/media" in img.get_attribute("src")
-			]
-			has_images = bool(image_urls)
-		except Exception:
-			has_images = False
-		if is_video and has_images:
-			return XMediaType.MIXED
-		elif is_video:
-			return XMediaType.VIDEO
-		elif has_images:
-			return XMediaType.IMAGE
-		return XMediaType.UNKNOWN
 	def tweet_contains_video(self, page: Page) -> bool:
 		try:
 			return bool(
@@ -327,4 +270,35 @@ class XScraper(XAbstract):
 			return bool(image_urls)
 		except Exception:
 			pass
-		return False
+		return False
+	def extract_post_text(self, page: Page) -> str:
+		try:
+			text_fragments = []
+			# find tweetText containers (in main and quoted)
+			containers = page.query_selector_all('div[data-testid="tweetText"]')
+			for container in containers:
+				fragments = []
+				# find <span> and <img alt=...> inside text
+				for node in container.query_selector_all("span, img"):
+					tag = node.evaluate("node => node.tagName.toLowerCase()")
+					if tag == "span":
+						value = node.inner_text().strip()
+						if value:
+							fragments.append(value)
+					elif tag == "img":
+						# emoji as image
+						alt = node.get_attribute("alt")
+						if alt:
+							fragments.append(alt)
+				if fragments:
+					text_fragments.append("".join(fragments))
+			return "\n\n".join(text_fragments).strip()
+		except Exception as e:
+			logging.warning("X: [extract_post_text] error", exc_info=e)
+		return ""

warp_beacon/scraper/X/types.py CHANGED Viewed

@@ -1,7 +1,8 @@
-import enum
+from enum import Flag, auto
-class XMediaType(enum.Enum):
+class XMediaType(Flag):
 	UNKNOWN = 0
-	VIDEO = 1
-	IMAGE = 2
-	MIXED = 3
+	VIDEO = auto()
+	IMAGE = auto()
+	MIXED = auto()
+	PLAYLIST = auto()

warp_beacon/scraper/__init__.py CHANGED Viewed

@@ -319,6 +319,7 @@ class AsyncDownloader(object):
 								# success
 								for job in fail_handler.get_failed_jobs():
 									self.queue_task(job)
+								# media info processing
 								for item in items:
 									media_info = {"filesize": 0}
 									if item["media_type"] == JobType.VIDEO:
@@ -372,6 +373,8 @@ class AsyncDownloader(object):
 										job_args["media_collection"] = item["items"]
 										if item.get("save_items", None) is not None:
 											job_args["save_items"] = item.get("save_items", False)
+									elif item["media_type"] == JobType.TEXT:
+										job_args["message_text"] = item.get("message_text", "")
 									else:
 										job_args["local_media_path"] = item["local_media_path"]
 										if item.get("local_compressed_media_path", None):

warp_beacon/storage/__init__.py CHANGED Viewed

@@ -67,7 +67,8 @@ class Storage(object):
 					"uniq_id": document["uniq_id"],
 					"tg_file_id": document["tg_file_id"],
 					"media_type": document["media_type"],
-					"canonical_name": document.get("canonical_name")
+					"canonical_name": document.get("canonical_name"),
+					"message_text": document.get("message_text")
 				})
 		except Exception as e:
 			logging.error("Error occurred while trying to read from the database!")
@@ -82,13 +83,10 @@ class Storage(object):
 	def db_lookup_id(self, uniq_id: str) -> list[dict]:
 		return self.db_find(uniq_id)
-	def add_media(self, tg_file_ids: list[str], media_url: str, media_type: str, origin: str, canonical_name: str = "") -> list[int]:
+	def add_media(self, tg_file_ids: list[str], media_url: str, media_type: str, origin: str, canonical_name: str = "", message_text: str = "") -> list[int]:
 		uniq_id = self.compute_uniq(media_url)
 		media_ids = []
 		for tg_file_id in tg_file_ids:
-			if not tg_file_id:
-				logging.warning("Passed empty `tg_file_id`! Skipping.")
-				continue
 			if self.db_lookup_id(uniq_id):
 				logging.info("Detected existing uniq_id, skipping storage write operation")
 				continue
@@ -98,7 +96,8 @@ class Storage(object):
 				"media_type": media_type,
 				"tg_file_id": tg_file_id,
 				"origin": origin,
-				"canonical_name": canonical_name
+				"canonical_name": canonical_name,
+				"message_text": message_text
 			}).inserted_id)
 		return media_ids

warp_beacon/telegram/bot.py CHANGED Viewed

@@ -11,7 +11,7 @@ from pyrogram import Client, filters
 from pyrogram.enums import ParseMode, ChatType
 from pyrogram.handlers import MessageHandler, CallbackQueryHandler
 from pyrogram.types import InputMediaAudio, InputMediaPhoto, InputMediaVideo, InputMediaAnimation, InlineKeyboardButton, InlineKeyboardMarkup
-from pyrogram.errors import NetworkMigrate, BadRequest, MultiMediaTooLong, MessageIdInvalid
+from pyrogram.errors import NetworkMigrate, BadRequest, MultiMediaTooLong, MessageIdInvalid, FloodWait
 import warp_beacon
 from warp_beacon.__version__ import __version__
@@ -393,6 +393,9 @@ class Bot(object):
 							tg_chunk.append(anim)
 					mediafs.append(tg_chunk)
 				args["media"] = mediafs
+		elif job.media_type == JobType.TEXT:
+			args["text"] = f"<b>Post text:</b><pre>{job.message_text}</pre>\n\n{self.build_signature_caption(job)}"
+			args["parse_mode"] = ParseMode.HTML
 		args["chat_id"] = job.chat_id
@@ -412,7 +415,7 @@ class Bot(object):
 			if render_donates:
 				keyboard_buttons[0].append(InlineKeyboardButton("❤ Donate", url=os.environ.get("DONATE_LINK", "https://pay.cryptocloud.plus/pos/W5BMtNQt5bJFoW2E")))
-			if keyboard_buttons[0]:  #job.short_text or render_donates:
+			if keyboard_buttons[0]:
 				args["reply_markup"] = InlineKeyboardMarkup(keyboard_buttons)
 		return args
@@ -425,9 +428,14 @@ class Bot(object):
 			while not retry_amount >= max_retries:
 				try:
 					reply_message = None
-					if job.media_type in (JobType.VIDEO, JobType.IMAGE, JobType.AUDIO, JobType.ANIMATION):
-						if job.media_type in (JobType.VIDEO, JobType.AUDIO):
-							await Utils.ensure_me_loaded(self.client)
+					if job.media_type in (JobType.VIDEO, JobType.IMAGE, JobType.AUDIO, JobType.ANIMATION, JobType.TEXT):
+						#if job.media_type in (JobType.VIDEO, JobType.AUDIO):
+						#	await Utils.ensure_me_loaded(self.client)
+						if job.media_type == JobType.TEXT:
+							if job.placeholder_message_id:
+								await self.placeholder.remove(job.chat_id, job.placeholder_message_id)
+								job.placeholder_message_id = None
 						if job.placeholder_message_id:
 							try:
 								reply_message = await self.editor.edit(**self.build_tg_args(job))
@@ -440,10 +448,17 @@ class Bot(object):
 								JobType.VIDEO: self.client.send_video,
 								JobType.IMAGE: self.client.send_photo,
 								JobType.AUDIO: self.client.send_audio,
-								JobType.ANIMATION: self.client.send_animation
+								JobType.ANIMATION: self.client.send_animation,
+								JobType.TEXT: self.client.send_message
 							}
 							try:
-								reply_message = await send_funcs[job.media_type](**self.build_tg_args(job))
+								while True:
+									try:
+										reply_message = await send_funcs[job.media_type](**self.build_tg_args(job))
+										break
+									except FloodWait as e:
+										logging.warning("FloodWait occurred, waiting '%d' seconds before retry", int(e.value))
+										asyncio.sleep(e.value)
 							except ValueError as e:
 								err_text = str(e)
 								if "Expected" in err_text:
@@ -454,9 +469,10 @@ class Bot(object):
 									job_args[reality.value.lower()] = job_args.pop(expectation.value.lower())
 									reply_message = await send_funcs[reality](**job_args)
-						tg_file_id = Utils.extract_file_id(reply_message)
-						tg_file_ids.append(tg_file_id)
-						job.tg_file_id = tg_file_id
+						if reply_message:
+							tg_file_id = Utils.extract_file_id(reply_message)
+							tg_file_ids.append(tg_file_id)
+							job.tg_file_id = tg_file_id
 						logging.info("Uploaded media file with type '%s' tg_file_id is '%s'", job.media_type.value, job.tg_file_id)
 					elif job.media_type == JobType.COLLECTION:
 						col_job_args = self.build_tg_args(job)
@@ -464,7 +480,14 @@ class Bot(object):
 						snd_grp_options = {"chat_id": job.chat_id, "reply_to_message_id": job.message_id}
 						for i, media_chunk in enumerate(col_job_args["media"]):
 							snd_grp_options["media"] = media_chunk
-							messages = await self.client.send_media_group(**snd_grp_options)
+							messages = []
+							while True:
+								try:
+									messages = await self.client.send_media_group(**snd_grp_options)
+									break
+								except FloodWait as e:
+									logging.warning("FloodWait occurred, waiting '%d' seconds before retry", int(e.value))
+									asyncio.sleep(e.value)
 							sent_messages += messages
 							if job.media_collection:
 								for j, _ in enumerate(media_chunk):

warp_beacon/telegram/edit_message.py CHANGED Viewed

@@ -1,9 +1,13 @@
+import asyncio
 import re
+import logging
 from pyrogram.client import Client
 from pyrogram.types import InputMedia, InputMediaAudio, InputMediaPhoto, InputMediaVideo, InputMediaAnimation, InlineKeyboardMarkup
 from pyrogram import raw
 from pyrogram import types
+from pyrogram.errors import FloodWait
 from warp_beacon.telegram.progress_bar import ProgressBar
 from warp_beacon.telegram.types import ReportType
@@ -124,23 +128,30 @@ class EditMessage(object):
 				raw_file_thumb = await self.client.save_file(path=media.thumb)
 			raw_media = self.get_wrapped_animation(raw_file=raw_file, raw_thumb=raw_file_thumb, media=media, file_name=file_name)
-		peer = await self.client.resolve_peer(chat_id)
-		r = await self.client.invoke(
-			raw.functions.messages.EditMessage(
-				peer=peer,
-				id=message_id,
-				media=raw_media,
-				reply_markup=await reply_markup.write(self.client) if reply_markup else None,
-				message=message,
-				entities=entities
-			)
-		)
+		peer, r = None, None
+		while True:
+			try:
+				peer = await self.client.resolve_peer(chat_id)
+				r = await self.client.invoke(
+					raw.functions.messages.EditMessage(
+						peer=peer,
+						id=message_id,
+						media=raw_media,
+						reply_markup=await reply_markup.write(self.client) if reply_markup else None,
+						message=message,
+						entities=entities
+					)
+				)
+				break
+			except FloodWait as e:
+				logging.warning("FloodWait occurred, waiting '%d' seconds before retry", int(e.value))
+				asyncio.sleep(e.value)
-		for i in r.updates:
-			if isinstance(i, (raw.types.UpdateEditMessage, raw.types.UpdateEditChannelMessage)):
-				return await types.Message._parse(
-					self.client, i.message,
-					{i.id: i for i in r.users},
-					{i.id: i for i in r.chats}
-				)
+		if r:
+			for i in r.updates:
+				if isinstance(i, (raw.types.UpdateEditMessage, raw.types.UpdateEditChannelMessage)):
+					return await types.Message._parse(
+						self.client, i.message,
+						{i.id: i for i in r.users},
+						{i.id: i for i in r.chats}
+					)

warp_beacon/telegram/handlers.py CHANGED Viewed

@@ -111,6 +111,14 @@ class Handlers(object):
 						origin=job.job_origin.value,
 						canonical_name=common_canonical_name
 					)
+				elif job.media_type == JobType.TEXT:
+					self.storage.add_media(
+						tg_file_ids=[None],
+						media_url=job.url,
+						media_type=job.media_type.value,
+						origin=job.job_origin.value,
+						message_text=job.message_text
+					)
 				else:
 					self.storage.add_media(
 						tg_file_ids=[','.join(tg_file_ids)],
@@ -215,6 +223,7 @@ class Handlers(object):
 					elif ent_len:
 						media_type = JobType[entities[0]["media_type"].upper()]
 						canonical_name = entities[0]["canonical_name"]
+						message_text = entities[0]["message_text"]
 						await self.bot.upload_job(
 							UploadJob(
 								url=url,
@@ -228,22 +237,23 @@ class Handlers(object):
 								chat_type=message.chat.type,
 								source_username=Utils.extract_message_author(message),
 								canonical_name=canonical_name,
-								message_leftover=msg_leftover
+								message_leftover=msg_leftover,
+								message_text=message_text
 							)
 						)
 				else:
 					if await self.queue_job(DownloadJob.build(
-							url=url,
-							message_id=effective_message_id,
-							chat_id=chat.id,
-							user_id=message.from_user.id,
-							in_process=self.bot.uploader.is_inprocess(uniq_id),
-							uniq_id=uniq_id,
-							job_origin=origin,
-							source_username=Utils.extract_message_author(message),
-							chat_type=chat.type,
-							message_leftover=msg_leftover
-						)):
+						url=url,
+						message_id=effective_message_id,
+						chat_id=chat.id,
+						user_id=message.from_user.id,
+						in_process=self.bot.uploader.is_inprocess(uniq_id),
+						uniq_id=uniq_id,
+						job_origin=origin,
+						source_username=Utils.extract_message_author(message),
+						chat_type=chat.type,
+						message_leftover=msg_leftover
+					)):
 						self.bot.uploader.set_inprocess(uniq_id)
 		if chat.type not in (ChatType.GROUP, ChatType.SUPERGROUP) and not urls:

warp_beacon/uploader/__init__.py CHANGED Viewed

@@ -89,7 +89,7 @@ class AsyncUploader(object):
 		while self.allow_loop:
 			try:
 				try:
-					job = self.job_queue.get()
+					job: UploadJob = self.job_queue.get()
 					if job is self.__JOE_BIDEN_WAKEUP:
 						break
 					if job.is_message_to_admin and job.message_text and self.admin_message_callback:
@@ -118,7 +118,10 @@ class AsyncUploader(object):
 					message_id = job.placeholder_message_id
 					if not in_process and not job.job_failed and not job.job_warning and not job.replay:
-						logging.info("Accepted upload job, file(s): '%s'", path)
+						if job.media_type == JobType.TEXT:
+							logging.info("Uploading job text: '%s'", job.message_text)
+						else:
+							logging.info("Accepted upload job, file(s): '%s'", path)
 					try:
 						if message_id in self.callbacks:

{warp_beacon-2.8.12.dist-info → warp_beacon-2.8.14.dist-info}/METADATA RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.4
 Name: warp_beacon
-Version: 2.8.12
+Version: 2.8.14
 Summary: Telegram bot for expanding external media links
 Home-page: https://github.com/sb0y/warp_beacon
 Author: Andrey Bagrintsev

{warp_beacon-2.8.12.dist-info → warp_beacon-2.8.14.dist-info}/RECORD RENAMED Viewed

@@ -4,15 +4,15 @@ var/warp_beacon/accounts.json,sha256=OsXdncs6h88xrF_AP6_WDCK1waGBn9SR-uYdIeK37GM
 var/warp_beacon/placeholder.gif,sha256=cE5CGJVaop4Sx21zx6j4AyoHU0ncmvQuS2o6hJfEH88,6064
 var/warp_beacon/proxies.json,sha256=VnjlQDXumOEq72ZFjbh6IqHS1TEHqn8HPYAZqWCeSIA,95
 warp_beacon/__init__.py,sha256=_rThNODmz0nDp_n4mWo_HKaNFE5jk1_7cRhHyYaencI,163
-warp_beacon/__version__.py,sha256=ioCIkmzTwVXvR1lLWlgUjehGwiXaxB8kTGnfQ-3C1FA,24
+warp_beacon/__version__.py,sha256=TZgBJIjZg_hpyHZh7yBDpvAmjXgQy0i383jyxYXsn9A,24
 warp_beacon/warp_beacon.py,sha256=ADCR30uGXIsDrt9WoiI9Ghu2QtWs0qZIK6x3pQKM_B4,1109
 warp_beacon/yt_auth.py,sha256=GUTKqYr_tzDC-07Lx_ahWXSag8EyLxXBUnQbDBIkEmk,6022
 warp_beacon/compress/__init__.py,sha256=47DEQpj8HBSa-_TImW-5JCeuQeRkm5NMpJWZG3hSuFU,0
 warp_beacon/compress/video.py,sha256=_PDMVYCyzLYxHv1uZmmzGcG_8rjaZr7BTXsXTTy_oS4,2846
 warp_beacon/jobs/__init__.py,sha256=vW5T4jJUla97TNRapX_Y6eJCiPMEbySSlD0SJQKfAXs,189
-warp_beacon/jobs/abstract.py,sha256=x8shgG1So1g-Yqu_uzij7yuqherJTIhVhdslOrq69Z4,3263
+warp_beacon/jobs/abstract.py,sha256=dDGWFJL474_u_Musk-nZ6NfKH6CYdAEQlpX8thl-hPg,3411
 warp_beacon/jobs/download_job.py,sha256=pfSEZpWVzya0hddU5794p2uQYfm4lHrtM1Ck0T-UrLk,844
-warp_beacon/jobs/types.py,sha256=Ae8zINgbs7cOcYkYoOCOACA7duyhnIGMQAJ_SJB1QRQ,176
+warp_beacon/jobs/types.py,sha256=bb73jHm12ahq3BPDwdsWzHB69KmElSpgbj-A0lA3VNk,191
 warp_beacon/jobs/upload_job.py,sha256=_ul4psPej1jLEs-BMcMR80GbXDSmm38jE9yoZtecclY,741
 warp_beacon/mediainfo/__init__.py,sha256=47DEQpj8HBSa-_TImW-5JCeuQeRkm5NMpJWZG3hSuFU,0
 warp_beacon/mediainfo/abstract.py,sha256=ZR2JMuRpoh7nDNov9a8YkAfr6BI2HXnXzQtVrLgDxjs,1185
@@ -22,17 +22,17 @@ warp_beacon/mediainfo/video.py,sha256=UBZrhTN5IDI-aYu6tsJEILo9nFkjHhkldGVFmvV7tE
 warp_beacon/scheduler/__init__.py,sha256=47DEQpj8HBSa-_TImW-5JCeuQeRkm5NMpJWZG3hSuFU,0
 warp_beacon/scheduler/instagram_human.py,sha256=lOytnonvqtB_8z6TVzrVJ1prqqgE4fktZZl-xpn7SOA,12951
 warp_beacon/scheduler/scheduler.py,sha256=0u9AIr9fTBmjU1GpOwKlPuNLskeJ4A-S2uAUzb-qO6w,4997
-warp_beacon/scraper/__init__.py,sha256=o9-HQEf4yQVNtWuJN4NcLUovejiHhP_KkQ1Xf5EaQvU,20670
+warp_beacon/scraper/__init__.py,sha256=EBS7k8vmn3ya_Ud0tPHtBo7xUMUP9tabmYk5Ase_zyw,20818
 warp_beacon/scraper/abstract.py,sha256=pWbaTu-gDZgi-iFjqMR_uGzPl5KLv-4gTdJ9w6cD4sk,3802
 warp_beacon/scraper/account_selector.py,sha256=n-466AiTXZ8o5cgcNkNwNiWLoi-EkLC7bHh6El1eIF8,10274
 warp_beacon/scraper/exceptions.py,sha256=hicAe6_0xN7Ry2gcFX4UvqPWMtF_lX2ihH1njQAaqCA,1496
 warp_beacon/scraper/fail_handler.py,sha256=5ODu4b8ndZWAcHIXrcUufsWFihetzNUoAi8IgAkreyQ,998
 warp_beacon/scraper/link_resolver.py,sha256=Rc9ZuMyOo3iPywDHwjngy-WRQ2SXhJwxcg-5ripx7tM,2447
 warp_beacon/scraper/utils.py,sha256=AOZmDki2Pbr84IG-j_wN2UghKCiWFVDYdx6HJl0JTBs,1258
-warp_beacon/scraper/X/X.py,sha256=3-GBXHcSmGIiDLucJWLpiuaA8EDfP0-B7ws4MiCelkE,9883
+warp_beacon/scraper/X/X.py,sha256=lKxNe70iIasLnyN8QA_1rLa70Bd3Y9fL6J4AEdUgNJs,9200
 warp_beacon/scraper/X/__init__.py,sha256=47DEQpj8HBSa-_TImW-5JCeuQeRkm5NMpJWZG3hSuFU,0
 warp_beacon/scraper/X/abstract.py,sha256=pCzZPTCtn8pRbBx2SeuBUpMkEHqnOLtwLBAHYceL12Q,5475
-warp_beacon/scraper/X/types.py,sha256=9Y0PJo3vZ1DMQcyfqoE4y2-AQRAetVmIxQwFDZkZy30,87
+warp_beacon/scraper/X/types.py,sha256=RrAyODNA8WA0YzznOSK2wr-hstXf3BnEisy06uL-bdA,132
 warp_beacon/scraper/instagram/__init__.py,sha256=47DEQpj8HBSa-_TImW-5JCeuQeRkm5NMpJWZG3hSuFU,0
 warp_beacon/scraper/instagram/captcha.py,sha256=9UYziuqB3Tsat_ET6ex-cnZDbi6yCnsXHSpmE8MuUHk,4651
 warp_beacon/scraper/instagram/instagram.py,sha256=uzqUCVniRa3d9uavoMAz9-9MHvYOh7n_G7UyfgzHgAk,19154
@@ -42,23 +42,23 @@ warp_beacon/scraper/youtube/abstract.py,sha256=7CVR2fW6bpWYYKcveRddd6XlgDsfV_Pp3
 warp_beacon/scraper/youtube/music.py,sha256=5AeSBQyUgVCJT2hoBCV2WvlyuV9US09SYJhmBG_P9F8,2755
 warp_beacon/scraper/youtube/shorts.py,sha256=y0591kpWU35rt5OoWamkcHIstNZ98SXUlUKvYmUsyEY,4030
 warp_beacon/scraper/youtube/youtube.py,sha256=uYR7XpfP6ZnSvw1Gc4qG_M8jkCyv3maEytFdNWlYPwU,6732
-warp_beacon/storage/__init__.py,sha256=NaKKPXjwa8LvWsqnVJVz0riXj765lGswG9piKgI2lkY,3389
+warp_beacon/storage/__init__.py,sha256=xg3quvc-Lkc-hCZ2lkrTsGqLyMybTN14mwrSuDJMfD4,3403
 warp_beacon/storage/mongo.py,sha256=qC4ZiO8XXvPnP0rJwz4CJx42pqFsyAjCiW10W5QdT6E,527
 warp_beacon/telegram/__init__.py,sha256=47DEQpj8HBSa-_TImW-5JCeuQeRkm5NMpJWZG3hSuFU,0
-warp_beacon/telegram/bot.py,sha256=N4Gswpw-U8Z6yPAKMe7zVfDQSRAgvm6Sx6k5_Y7WWoI,19780
+warp_beacon/telegram/bot.py,sha256=xeSzUxNZf8zjU5K_UkwtzBzB6nIml1UPI0g1ITQdoEQ,20675
 warp_beacon/telegram/caption_shortener.py,sha256=EnguNCF52ne7y4P-iJAbI6K3sqoJqJbND_dX5Fhwkv0,1549
 warp_beacon/telegram/download_status.py,sha256=N-Qg13LVcPskyQNKG1lw50K1lhFtXu003muCRzZ7wiE,1561
-warp_beacon/telegram/edit_message.py,sha256=6DX8eJV70MG_b79WbuJG55qLBs66boElzYdCr8zpMeI,5380
-warp_beacon/telegram/handlers.py,sha256=32kJtlfSZyG4JbEj9W8tH6us7sZg2ziMmnxpEX_qGXw,10482
+warp_beacon/telegram/edit_message.py,sha256=vzSrtlt-QxBU-X9uRSKo7gJftOrvB5Qo3iNsVNptCoE,5684
+warp_beacon/telegram/handlers.py,sha256=2XJ3v9sVsWa3V3cji9FegO7l5JNqXqXxQrxIOzI2fyE,10793
 warp_beacon/telegram/placeholder_message.py,sha256=wN9-BRiyrtHG-EvXtZkGJHt2CX71munQ57ITttjt0mw,6400
 warp_beacon/telegram/progress_bar.py,sha256=IP4xtvLtdJtqdr2C-0YaU428iQGrKurbP4Npr31iW74,5014
 warp_beacon/telegram/progress_file_reader.py,sha256=e3equyNKlKs764AD-iE9QRsh3YDHTzP78Mx5tdvPPWs,969
 warp_beacon/telegram/types.py,sha256=Kvdng6uCF1HRoqQgGW1ZYYPJoVuYkFb-LDvMBbW5Hjk,89
 warp_beacon/telegram/utils.py,sha256=zTF8VQfAWetBSjAPbmNe_Zi_LN5fAcWptJKjLaFNHaE,5073
-warp_beacon/uploader/__init__.py,sha256=1enK6qMWaTZEaK456JwaKOfvCvznHA8cjgceOsrF6Po,5732
-warp_beacon-2.8.12.dist-info/licenses/LICENSE,sha256=xx0jnfkXJvxRnG63LTGOxlggYnIysveWIZ6H3PNdCrQ,11357
-warp_beacon-2.8.12.dist-info/METADATA,sha256=W7U_kzv74XYVaeNArKB7Gw7UmwGBe2T4Ow6WYmUSl6Y,23236
-warp_beacon-2.8.12.dist-info/WHEEL,sha256=_zCd3N1l69ArxyTb8rzEoP9TpbYXkqRFSNOD5OuxnTs,91
-warp_beacon-2.8.12.dist-info/entry_points.txt,sha256=eSB61Rb89d56WY0O-vEIQwkn18J-4CMrJcLA_R_8h3g,119
-warp_beacon-2.8.12.dist-info/top_level.txt,sha256=RraB0PWGvRK2zPYkuICKNgStLG1C5s7rPHHJEHJbkgA,1510
-warp_beacon-2.8.12.dist-info/RECORD,,
+warp_beacon/uploader/__init__.py,sha256=dR0VjIGSr859TTdorA2tKnjH7EpQOXnG71aXhZFaMl0,5863
+warp_beacon-2.8.14.dist-info/licenses/LICENSE,sha256=xx0jnfkXJvxRnG63LTGOxlggYnIysveWIZ6H3PNdCrQ,11357
+warp_beacon-2.8.14.dist-info/METADATA,sha256=8eP6Ho7mF0Uq7jz0-MLzRb8niSFPPh3ewdFrmN3BH0I,23236
+warp_beacon-2.8.14.dist-info/WHEEL,sha256=_zCd3N1l69ArxyTb8rzEoP9TpbYXkqRFSNOD5OuxnTs,91
+warp_beacon-2.8.14.dist-info/entry_points.txt,sha256=eSB61Rb89d56WY0O-vEIQwkn18J-4CMrJcLA_R_8h3g,119
+warp_beacon-2.8.14.dist-info/top_level.txt,sha256=RraB0PWGvRK2zPYkuICKNgStLG1C5s7rPHHJEHJbkgA,1510
+warp_beacon-2.8.14.dist-info/RECORD,,

{warp_beacon-2.8.12.dist-info → warp_beacon-2.8.14.dist-info}/WHEEL RENAMED Viewed

File without changes

{warp_beacon-2.8.12.dist-info → warp_beacon-2.8.14.dist-info}/entry_points.txt RENAMED Viewed

File without changes

{warp_beacon-2.8.12.dist-info → warp_beacon-2.8.14.dist-info}/licenses/LICENSE RENAMED Viewed

File without changes

{warp_beacon-2.8.12.dist-info → warp_beacon-2.8.14.dist-info}/top_level.txt RENAMED Viewed

File without changes

warp-beacon 2.8.12__py3-none-any.whl → 2.8.14__py3-none-any.whl

warp-beacon 2.8.12py3-none-any.whl → 2.8.14py3-none-any.whl