PyPI - ailia-speech - Versions diffs - 1.3.0.0__py3-none-any.whl - Mend

ailia-speech 1.3.0.0__py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of ailia-speech might be problematic. Click here for more details.

Files changed (12) hide show

ailia_speech/LICENSE_AILIA_EN.pdf +0 -0
ailia_speech/LICENSE_AILIA_JA.pdf +0 -0
ailia_speech/__init__.py +493 -0
ailia_speech/linux/arm64-v8a/libailia_speech.so +0 -0
ailia_speech/linux/x64/libailia_speech.so +0 -0
ailia_speech/mac/libailia_speech.dylib +0 -0
ailia_speech/windows/x64/ailia_speech.dll +0 -0
ailia_speech-1.3.0.0.data/scripts/__init__.py +493 -0
ailia_speech-1.3.0.0.dist-info/METADATA +71 -0
ailia_speech-1.3.0.0.dist-info/RECORD +12 -0
ailia_speech-1.3.0.0.dist-info/WHEEL +5 -0
ailia_speech-1.3.0.0.dist-info/top_level.txt +1 -0

ailia_speech/LICENSE_AILIA_EN.pdf ADDED Viewed

Binary file

ailia_speech/LICENSE_AILIA_JA.pdf ADDED Viewed

Binary file

ailia_speech/__init__.py ADDED Viewed

@@ -0,0 +1,493 @@
+import ctypes
+import os
+import sys
+import numpy
+import ailia
+import ailia.audio
+import ailia_tokenizer
+import urllib.request
+import ssl
+import shutil
+import platform
+#### dependency check
+if sys.platform == "win32":
+    import ctypes
+    try:
+        for library in ["vcruntime140.dll", "vcruntime140_1.dll", "msvcp140.dll"]:
+            ctypes.windll.LoadLibrary(library)
+    except:
+        print("  WARNING Please install MSVC 2015-2019 runtime from https://docs.microsoft.com/ja-jp/cpp/windows/latest-supported-vc-redist")
+#### loading DLL / DYLIB / SO  ####
+if sys.platform == "win32":
+    dll_platform = "windows/x64"
+    dll_name = "ailia_speech.dll"
+    load_fn = ctypes.WinDLL
+elif sys.platform == "darwin":
+    dll_platform = "mac"
+    dll_name = "libailia_speech.dylib"
+    load_fn = ctypes.CDLL
+else:
+    is_arm = "arm" in platform.machine() or platform.machine() == "aarch64"
+    if is_arm:
+        if platform.architecture()[0] == "32bit":
+            dll_platform = "linux/armeabi-v7a"
+        else:
+            dll_platform = "linux/arm64-v8a"
+    else:
+        dll_platform = "linux/x64"
+    dll_name = "libailia_speech.so"
+    load_fn = ctypes.CDLL
+dll_found = False
+candidate = ["", str(os.path.dirname(os.path.abspath(__file__))) + str(os.sep), str(os.path.dirname(os.path.abspath(__file__))) + str(os.sep) + dll_platform + str(os.sep)]
+for dir in candidate:
+    try:
+        dll = load_fn(dir + dll_name)
+        dll_found = True
+    except:
+        pass
+if not dll_found:
+    msg = "DLL load failed : \'" + dll_name + "\' is not found"
+    raise ImportError(msg)
+# ==============================================================================
+from ctypes import *
+AILIA_SPEECH_STATUS_SUCCESS = ( 0 )
+AILIA_SPEECH_MODEL_TYPE_WHISPER_MULTILINGUAL_TINY = (0)
+AILIA_SPEECH_MODEL_TYPE_WHISPER_MULTILINGUAL_BASE = (1)
+AILIA_SPEECH_MODEL_TYPE_WHISPER_MULTILINGUAL_SMALL = (2)
+AILIA_SPEECH_MODEL_TYPE_WHISPER_MULTILINGUAL_MEDIUM = (3)
+AILIA_SPEECH_MODEL_TYPE_WHISPER_MULTILINGUAL_LARGE = (4)
+AILIA_SPEECH_MODEL_TYPE_WHISPER_MULTILINGUAL_LARGE_V3 = (5)
+AILIA_SPEECH_TASK_TRANSCRIBE = (0)
+AILIA_SPEECH_TASK_TRANSLATE = (1)
+AILIA_SPEECH_FLAG_NONE = (0)
+AILIA_SPEECH_FLAG_LIVE = (1)
+AILIA_SPEECH_VAD_TYPE_SILERO = (0)
+AILIA_SPEECH_API_CALLBACK_VERSION = (6)
+AILIA_SPEECH_TEXT_VERSION = (2)
+AILIA_SPEECH_USER_API_AILIA_AUDIO_GET_FRAME_LEN = CFUNCTYPE(POINTER(c_int), c_int, c_int, c_int, c_int)
+AILIA_SPEECH_USER_API_AILIA_AUDIO_GET_MEL_SPECTROGRAM = CFUNCTYPE((c_int), c_void_p, c_void_p, c_int, c_int, c_int, c_int, c_int, c_int, c_int, c_int, c_float, c_int, c_float, c_float, c_int, c_int, c_int)
+AILIA_SPEECH_USER_API_AILIA_TOKENIZER_CREATE = CFUNCTYPE((c_int), POINTER(c_void_p) , c_int, c_int)
+AILIA_SPEECH_USER_API_AILIA_TOKENIZER_OPEN_MODEL_FILE_A = CFUNCTYPE((c_int), c_void_p , c_char_p)
+AILIA_SPEECH_USER_API_AILIA_TOKENIZER_OPEN_MODEL_FILE_W = CFUNCTYPE((c_int), c_void_p , c_wchar)
+AILIA_SPEECH_USER_API_AILIA_TOKENIZER_ENCODE = CFUNCTYPE((c_int), c_void_p , c_char_p)
+AILIA_SPEECH_USER_API_AILIA_TOKENIZER_GET_TOKEN_COUNT = CFUNCTYPE((c_int), c_void_p , POINTER(c_uint))
+AILIA_SPEECH_USER_API_AILIA_TOKENIZER_GET_TOKENS = CFUNCTYPE((c_int), c_void_p , POINTER(c_int) , c_uint)
+AILIA_SPEECH_USER_API_AILIA_TOKENIZER_DECODE = CFUNCTYPE((c_int), c_void_p , POINTER(c_int), c_uint)
+AILIA_SPEECH_USER_API_AILIA_TOKENIZER_GET_TEXT_LENGTH = CFUNCTYPE((c_int), c_void_p , POINTER(c_uint))
+AILIA_SPEECH_USER_API_AILIA_TOKENIZER_GET_TEXT = CFUNCTYPE((c_int), c_void_p , c_char_p , c_uint)
+AILIA_SPEECH_USER_API_AILIA_TOKENIZER_DESTROY = CFUNCTYPE((c_int), c_void_p)
+AILIA_SPEECH_USER_API_AILIA_TOKENIZER_UTF8_TO_UTF32 = CFUNCTYPE((c_int), POINTER(c_uint) , POINTER(c_uint) , c_char_p , c_uint)
+AILIA_SPEECH_USER_API_AILIA_TOKENIZER_UTF32_TO_UTF8 = CFUNCTYPE((c_int), c_char_p, POINTER(c_uint) , c_uint)
+AILIA_SPEECH_USER_API_AILIA_AUDIO_RESAMPLE = CFUNCTYPE((c_int), POINTER(c_float), POINTER(c_float), c_int, c_int, c_int, c_int)
+AILIA_SPEECH_USER_API_AILIA_AUDIO_GET_RESAMPLE_LEN = CFUNCTYPE((c_int), POINTER(c_int), c_int, c_int, c_int)
+AILIA_SPEECH_USER_API_AILIA_CREATE = CFUNCTYPE((c_int), POINTER(c_void_p), c_int, c_int)
+AILIA_SPEECH_USER_API_AILIA_OPEN_WEIGHT_FILE_A = CFUNCTYPE((c_int), c_void_p, c_char_p)
+AILIA_SPEECH_USER_API_AILIA_OPEN_WEIGHT_FILE_W = CFUNCTYPE((c_int), c_void_p, POINTER(c_wchar))
+AILIA_SPEECH_USER_API_AILIA_OPEN_WEIGHT_MEM = CFUNCTYPE((c_int), c_void_p, POINTER(c_byte), c_uint)
+AILIA_SPEECH_USER_API_AILIA_SET_MEMORY_MODE = CFUNCTYPE((c_int), c_void_p, c_uint)
+AILIA_SPEECH_USER_API_AILIA_DESTROY = CFUNCTYPE((None), c_void_p)
+AILIA_SPEECH_USER_API_AILIA_UPDATE = CFUNCTYPE((c_int), c_void_p)
+AILIA_SPEECH_USER_API_AILIA_GET_BLOB_INDEX_BY_INPUT_INDEX = CFUNCTYPE((c_int), c_void_p, POINTER(c_uint), c_uint)
+AILIA_SPEECH_USER_API_AILIA_GET_BLOB_INDEX_BY_OUTPUT_INDEX = CFUNCTYPE((c_int), c_void_p, POINTER(c_uint), c_uint)
+AILIA_SPEECH_USER_API_AILIA_GET_BLOB_DATA = CFUNCTYPE((c_int), c_void_p, POINTER(c_float), c_uint, c_uint)
+AILIA_SPEECH_USER_API_AILIA_SET_INPUT_BLOB_DATA = CFUNCTYPE((c_int), c_void_p, POINTER(c_float), c_uint, c_uint)
+AILIA_SPEECH_USER_API_AILIA_SET_INPUT_BLOB_SHAPE = CFUNCTYPE((c_int), c_void_p, c_void_p, c_uint, c_uint)
+AILIA_SPEECH_USER_API_AILIA_GET_BLOB_SHAPE = CFUNCTYPE((c_int), c_void_p, c_void_p, c_uint, c_uint)
+AILIA_SPEECH_USER_API_AILIA_GET_ERROR_DETAIL = CFUNCTYPE((c_char_p), c_void_p)
+AILIA_SPEECH_USER_API_AILIA_COPY_BLOB_DATA = CFUNCTYPE((c_int), c_void_p, c_uint, c_void_p, c_uint)
+AILIA_SPEECH_USER_API_AILIA_GET_ENVIRONMENT = CFUNCTYPE((c_int), POINTER(c_void_p), c_uint, c_uint)
+class struct__AILIASpeechApiCallback(Structure):
+    pass
+struct__AILIASpeechApiCallback.__slots__ = [
+    'ailiaAudioGetFrameLen',
+    'ailiaAudioGetMelSpectrogram',
+    'ailiaAudioResample',
+    'ailiaAudioGetResampleLen',
+    'ailiaTokenizerCreate',
+    'ailiaTokenizerOpenModelFileA',
+    'ailiaTokenizerOpenModelFileW',
+    'ailiaTokenizerEncode',
+    'ailiaTokenizerGetTokenCount',
+    'ailiaTokenizerGetTokens',
+    'ailiaTokenizerDecode',
+    'ailiaTokenizerGetTextLength',
+    'ailiaTokenizerGetText',
+    'ailiaTokenizerDestroy',
+    'ailiaTokenizerUtf8ToUtf32',
+    'ailiaTokenizerUtf32ToUtf8',
+    'ailiaCreate',
+    'ailiaOpenWeightFileA',
+    'ailiaOpenWeightFileW',
+    'ailiaOpenWeightMem',
+    'ailiaSetMemoryMode',
+    'ailiaDestroy',
+    'ailiaUpdate',
+    'ailiaGetBlobIndexByInputIndex',
+    'ailiaGetBlobIndexByOutputIndex',
+    'ailiaGetBlobData',
+    'ailiaSetInputBlobData',
+    'ailiaSetInputBlobShape',
+    'ailiaGetBlobShape',
+    'ailiaGetErrorDetail',
+    'ailiaCopyBlobData',
+    'ailiaGetEnvironment',
+]
+struct__AILIASpeechApiCallback._fields_ = [
+    ('ailiaAudioGetFrameLen', AILIA_SPEECH_USER_API_AILIA_AUDIO_GET_FRAME_LEN),
+    ('ailiaAudioGetMelSpectrogram', AILIA_SPEECH_USER_API_AILIA_AUDIO_GET_MEL_SPECTROGRAM),
+    ('ailiaAudioResample', AILIA_SPEECH_USER_API_AILIA_AUDIO_RESAMPLE),
+    ('ailiaAudioGetResampleLen', AILIA_SPEECH_USER_API_AILIA_AUDIO_GET_RESAMPLE_LEN),
+    ('ailiaTokenizerCreate', AILIA_SPEECH_USER_API_AILIA_TOKENIZER_CREATE),
+    ('ailiaTokenizerOpenModelFileA', AILIA_SPEECH_USER_API_AILIA_TOKENIZER_OPEN_MODEL_FILE_A),
+    ('ailiaTokenizerOpenModelFileW', AILIA_SPEECH_USER_API_AILIA_TOKENIZER_OPEN_MODEL_FILE_W),
+    ('ailiaTokenizerEncode', AILIA_SPEECH_USER_API_AILIA_TOKENIZER_ENCODE),
+    ('ailiaTokenizerGetTokenCount', AILIA_SPEECH_USER_API_AILIA_TOKENIZER_GET_TOKEN_COUNT),
+    ('ailiaTokenizerGetTokens', AILIA_SPEECH_USER_API_AILIA_TOKENIZER_GET_TOKENS),
+    ('ailiaTokenizerDecode', AILIA_SPEECH_USER_API_AILIA_TOKENIZER_DECODE),
+    ('ailiaTokenizerGetTextLength', AILIA_SPEECH_USER_API_AILIA_TOKENIZER_GET_TEXT_LENGTH),
+    ('ailiaTokenizerGetText', AILIA_SPEECH_USER_API_AILIA_TOKENIZER_GET_TEXT),
+    ('ailiaTokenizerDestroy', AILIA_SPEECH_USER_API_AILIA_TOKENIZER_DESTROY),
+    ('ailiaTokenizerUtf8ToUtf32', AILIA_SPEECH_USER_API_AILIA_TOKENIZER_UTF8_TO_UTF32),
+    ('ailiaTokenizerUtf32ToUtf8', AILIA_SPEECH_USER_API_AILIA_TOKENIZER_UTF32_TO_UTF8),
+    ('ailiaCreate', AILIA_SPEECH_USER_API_AILIA_CREATE),
+    ('ailiaOpenWeightFileA', AILIA_SPEECH_USER_API_AILIA_OPEN_WEIGHT_FILE_A),
+    ('ailiaOpenWeightFileW', AILIA_SPEECH_USER_API_AILIA_OPEN_WEIGHT_FILE_W),
+    ('ailiaOpenWeightMem', AILIA_SPEECH_USER_API_AILIA_OPEN_WEIGHT_MEM),
+    ('ailiaSetMemoryMode', AILIA_SPEECH_USER_API_AILIA_SET_MEMORY_MODE),
+    ('ailiaDestroy', AILIA_SPEECH_USER_API_AILIA_DESTROY),
+    ('ailiaUpdate', AILIA_SPEECH_USER_API_AILIA_UPDATE),
+    ('ailiaGetBlobIndexByInputIndex', AILIA_SPEECH_USER_API_AILIA_GET_BLOB_INDEX_BY_INPUT_INDEX),
+    ('ailiaGetBlobIndexByOutputIndex', AILIA_SPEECH_USER_API_AILIA_GET_BLOB_INDEX_BY_OUTPUT_INDEX),
+    ('ailiaGetBlobData', AILIA_SPEECH_USER_API_AILIA_GET_BLOB_DATA),
+    ('ailiaSetInputBlobData', AILIA_SPEECH_USER_API_AILIA_SET_INPUT_BLOB_DATA),
+    ('ailiaSetInputBlobShape', AILIA_SPEECH_USER_API_AILIA_SET_INPUT_BLOB_SHAPE),
+    ('ailiaGetBlobShape', AILIA_SPEECH_USER_API_AILIA_GET_BLOB_SHAPE),
+    ('ailiaGetErrorDetail', AILIA_SPEECH_USER_API_AILIA_GET_ERROR_DETAIL),
+    ('ailiaCopyBlobData', AILIA_SPEECH_USER_API_AILIA_COPY_BLOB_DATA),
+    ('ailiaGetEnvironment', AILIA_SPEECH_USER_API_AILIA_GET_ENVIRONMENT),
+]
+AILIASpeechApiCallback = struct__AILIASpeechApiCallback
+# ==============================================================================
+dll.ailiaSpeechCreate.restype = c_int
+dll.ailiaSpeechCreate.argtypes = (POINTER(c_void_p), c_int32, c_int32, c_int32, c_int32, c_int32, AILIASpeechApiCallback, c_int32)
+dll.ailiaSpeechDestroy.restype = None
+dll.ailiaSpeechDestroy.argtypes = (c_void_p, )
+dll.ailiaSpeechOpenModelFileA.restype = c_int
+dll.ailiaSpeechOpenModelFileA.argtypes = (c_void_p, c_char_p, c_char_p, c_int32)
+dll.ailiaSpeechOpenModelFileW.restype = c_int
+dll.ailiaSpeechOpenModelFileW.argtypes = (c_void_p, c_wchar_p, c_wchar_p, c_int32)
+dll.ailiaSpeechOpenVadFileA.restype = c_int
+dll.ailiaSpeechOpenVadFileA.argtypes = (c_void_p, c_char_p, c_int32)
+dll.ailiaSpeechOpenVadFileW.restype = c_int
+dll.ailiaSpeechOpenVadFileW.argtypes = (c_void_p, c_wchar_p, c_int32)
+dll.ailiaSpeechPushInputData.restype = c_int
+dll.ailiaSpeechPushInputData.argtypes = (c_void_p, numpy.ctypeslib.ndpointer(
+                dtype=numpy.float32, flags='CONTIGUOUS'
+            ),                               # src
+            ctypes.c_uint,
+            ctypes.c_uint,
+            ctypes.c_uint)
+dll.ailiaSpeechFinalizeInputData.restype = c_int
+dll.ailiaSpeechFinalizeInputData.argtypes = (c_void_p, )
+dll.ailiaSpeechBuffered.restype = c_int
+dll.ailiaSpeechBuffered.argtypes = (c_void_p, POINTER(ctypes.c_uint))
+dll.ailiaSpeechComplete.restype = c_int
+dll.ailiaSpeechComplete.argtypes = (c_void_p, POINTER(ctypes.c_uint))
+dll.ailiaSpeechTranscribe.restype = c_int
+dll.ailiaSpeechTranscribe.argtypes = (c_void_p, )
+dll.ailiaSpeechGetTextCount.restype = c_int
+dll.ailiaSpeechGetTextCount.argtypes = (c_void_p, POINTER(ctypes.c_uint))
+class AILIASpeechText(ctypes.Structure):
+    _fields_ = [
+        ("text", ctypes.c_char_p),
+        ("time_stamp_begin", ctypes.c_float),
+        ("time_stamp_end", ctypes.c_float),
+        ("person_id", ctypes.c_uint),
+        ("language", ctypes.c_char_p),
+        ("confidence", ctypes.c_float)]
+dll.ailiaSpeechGetText.restype = c_int
+dll.ailiaSpeechGetText.argtypes = (c_void_p, POINTER(AILIASpeechText), ctypes.c_uint, ctypes.c_uint)
+dll.ailiaSpeechResetTranscribeState.restype = c_int
+dll.ailiaSpeechResetTranscribeState.argtypes = (c_void_p, )
+AILIA_SPEECH_USER_API_INTERMEDIATE_CALLBACK = CFUNCTYPE((c_int), c_int64, c_char_p)
+dll.ailiaSpeechSetIntermediateCallback.restype = c_int
+dll.ailiaSpeechSetIntermediateCallback.argtypes = (c_void_p, AILIA_SPEECH_USER_API_INTERMEDIATE_CALLBACK, c_int64)
+dll.ailiaSpeechSetLanguage.restype = c_int
+dll.ailiaSpeechSetLanguage.argtypes = (c_void_p, c_char_p)
+# ==============================================================================
+# model download
+# ==============================================================================
+def progress_print(block_count, block_size, total_size):
+    percentage = 100.0 * block_count * block_size / total_size
+    if percentage > 100:
+        # Bigger than 100 does not look good, so...
+        percentage = 100
+    max_bar = 50
+    bar_num = int(percentage / (100 / max_bar))
+    progress_element = '=' * bar_num
+    if bar_num != max_bar:
+        progress_element += '>'
+    bar_fill = ' '  # fill the blanks
+    bar = progress_element.ljust(max_bar, bar_fill)
+    total_size_kb = total_size / 1024
+    print(f'[{bar} {percentage:.2f}% ( {total_size_kb:.0f}KB )]', end='\r')
+def urlretrieve(remote_path, weight_path, progress_print):
+    temp_path = weight_path + ".tmp"
+    try:
+        #raise ssl.SSLError # test
+        urllib.request.urlretrieve(
+            remote_path,
+            temp_path,
+            progress_print,
+        )
+    except ssl.SSLError as e:
+        print(f'SSLError detected, so try to download without ssl')
+        remote_path = remote_path.replace("https","http")
+        urllib.request.urlretrieve(
+            remote_path,
+            temp_path,
+            progress_print,
+        )
+    shutil.move(temp_path, weight_path)
+def check_and_download_file(file_path, remote_path):
+    if not os.path.exists(file_path):
+        print('Downloading %s...' % file_path)
+        urlretrieve(remote_path + os.path.basename(file_path), file_path, progress_print)
+# ==============================================================================
+# base model class
+# ==============================================================================
+class AiliaSpeechError(RuntimeError):
+    def __init__(self, message, code):
+        super().__init__(f"{message} code:{code}")
+        self.code = code
+class AiliaSpeechModel:
+    _api_callback = None
+    _instance = None
+    def _check(self, status):
+        if status != AILIA_SPEECH_STATUS_SUCCESS:
+            raise AiliaSpeechError(f"ailia speech error", status)
+    def _string_buffer(self, path):
+        if sys.platform == "win32":
+            return ctypes.create_unicode_buffer(path)
+        else:
+            return ctypes.create_string_buffer(path.encode("utf-8"))
+    def _create_callback(self):
+        callback = AILIASpeechApiCallback()
+        callback.ailiaAudioGetFrameLen = AILIA_SPEECH_USER_API_AILIA_AUDIO_GET_FRAME_LEN(("ailiaAudioGetFrameLen", ailia.audio.audio_core.dll))
+        callback.ailiaAudioGetMelSpectrogram = AILIA_SPEECH_USER_API_AILIA_AUDIO_GET_MEL_SPECTROGRAM(("ailiaAudioGetMelSpectrogram", ailia.audio.audio_core.dll))
+        callback.ailiaAudioResample = AILIA_SPEECH_USER_API_AILIA_AUDIO_RESAMPLE(("ailiaAudioResample", ailia.audio.audio_core.dll))
+        callback.ailiaAudioGetResampleLen = AILIA_SPEECH_USER_API_AILIA_AUDIO_GET_RESAMPLE_LEN(("ailiaAudioGetResampleLen", ailia.audio.audio_core.dll))
+        callback.ailiaTokenizerCreate = AILIA_SPEECH_USER_API_AILIA_TOKENIZER_CREATE(("ailiaTokenizerCreate", ailia_tokenizer.dll))
+        callback.ailiaTokenizerOpenModelFileA = AILIA_SPEECH_USER_API_AILIA_TOKENIZER_OPEN_MODEL_FILE_A(("ailiaTokenizerOpenModelFileA", ailia_tokenizer.dll))
+        callback.ailiaTokenizerOpenModelFileW = AILIA_SPEECH_USER_API_AILIA_TOKENIZER_OPEN_MODEL_FILE_W(("ailiaTokenizerOpenModelFileW", ailia_tokenizer.dll))
+        callback.ailiaTokenizerEncode = AILIA_SPEECH_USER_API_AILIA_TOKENIZER_ENCODE(("ailiaTokenizerEncode", ailia_tokenizer.dll))
+        callback.ailiaTokenizerGetTokenCount = AILIA_SPEECH_USER_API_AILIA_TOKENIZER_GET_TOKEN_COUNT(("ailiaTokenizerGetTokenCount", ailia_tokenizer.dll))
+        callback.ailiaTokenizerGetTokens = AILIA_SPEECH_USER_API_AILIA_TOKENIZER_GET_TOKENS(("ailiaTokenizerGetTokens", ailia_tokenizer.dll))
+        callback.ailiaTokenizerDecode = AILIA_SPEECH_USER_API_AILIA_TOKENIZER_DECODE(("ailiaTokenizerDecode", ailia_tokenizer.dll))
+        callback.ailiaTokenizerGetTextLength = AILIA_SPEECH_USER_API_AILIA_TOKENIZER_GET_TEXT_LENGTH(("ailiaTokenizerGetTextLength", ailia_tokenizer.dll))
+        callback.ailiaTokenizerGetText = AILIA_SPEECH_USER_API_AILIA_TOKENIZER_GET_TEXT(("ailiaTokenizerGetText", ailia_tokenizer.dll))
+        callback.ailiaTokenizerDestroy = AILIA_SPEECH_USER_API_AILIA_TOKENIZER_DESTROY(("ailiaTokenizerDestroy", ailia_tokenizer.dll))
+        callback.ailiaTokenizerUtf8ToUtf32 = AILIA_SPEECH_USER_API_AILIA_TOKENIZER_UTF8_TO_UTF32(("ailiaTokenizerUtf8ToUtf32", ailia_tokenizer.dll))
+        callback.ailiaTokenizerUtf32ToUtf8 = AILIA_SPEECH_USER_API_AILIA_TOKENIZER_UTF32_TO_UTF8(("ailiaTokenizerUtf32ToUtf8", ailia_tokenizer.dll))
+        callback.ailiaCreate = AILIA_SPEECH_USER_API_AILIA_CREATE(("ailiaCreate", ailia.core.dll))
+        callback.ailiaOpenWeightFileA = AILIA_SPEECH_USER_API_AILIA_OPEN_WEIGHT_FILE_A(("ailiaOpenWeightFileA", ailia.core.dll))
+        callback.ailiaOpenWeightFileW = AILIA_SPEECH_USER_API_AILIA_OPEN_WEIGHT_FILE_W(("ailiaOpenWeightFileW", ailia.core.dll))
+        callback.ailiaOpenWeightMem = AILIA_SPEECH_USER_API_AILIA_OPEN_WEIGHT_MEM(("ailiaOpenWeightMem", ailia.core.dll))
+        callback.ailiaSetMemoryMode = AILIA_SPEECH_USER_API_AILIA_SET_MEMORY_MODE(("ailiaSetMemoryMode", ailia.core.dll))
+        callback.ailiaDestroy = AILIA_SPEECH_USER_API_AILIA_DESTROY(("ailiaDestroy", ailia.core.dll))
+        callback.ailiaUpdate = AILIA_SPEECH_USER_API_AILIA_UPDATE(("ailiaUpdate", ailia.core.dll))
+        callback.ailiaGetBlobIndexByInputIndex = AILIA_SPEECH_USER_API_AILIA_GET_BLOB_INDEX_BY_INPUT_INDEX(("ailiaGetBlobIndexByInputIndex", ailia.core.dll))
+        callback.ailiaGetBlobIndexByOutputIndex = AILIA_SPEECH_USER_API_AILIA_GET_BLOB_INDEX_BY_OUTPUT_INDEX(("ailiaGetBlobIndexByOutputIndex", ailia.core.dll))
+        callback.ailiaGetBlobData = AILIA_SPEECH_USER_API_AILIA_GET_BLOB_DATA(("ailiaGetBlobData", ailia.core.dll))
+        callback.ailiaSetInputBlobData = AILIA_SPEECH_USER_API_AILIA_SET_INPUT_BLOB_DATA(("ailiaSetInputBlobData", ailia.core.dll))
+        callback.ailiaSetInputBlobShape = AILIA_SPEECH_USER_API_AILIA_SET_INPUT_BLOB_SHAPE(("ailiaSetInputBlobShape", ailia.core.dll))
+        callback.ailiaGetBlobShape = AILIA_SPEECH_USER_API_AILIA_GET_BLOB_SHAPE(("ailiaGetBlobShape", ailia.core.dll))
+        callback.ailiaGetErrorDetail = AILIA_SPEECH_USER_API_AILIA_GET_ERROR_DETAIL(("ailiaGetErrorDetail", ailia.core.dll))
+        callback.ailiaCopyBlobData = AILIA_SPEECH_USER_API_AILIA_COPY_BLOB_DATA(("ailiaCopyBlobData", ailia.core.dll))
+        callback.ailiaGetEnvironment = AILIA_SPEECH_USER_API_AILIA_GET_ENVIRONMENT(("ailiaGetEnvironment", ailia.core.dll))
+        self._api_callback = callback # prevent GC
+# ==============================================================================
+# Public class
+# ==============================================================================
+intermediate_callback_cnt = 0
+intermediate_callback_map = {}
+def intermediate_callback(handle, text):
+    intermediate_callback_map[handle](text.decode())
+    return 0
+class Whisper(AiliaSpeechModel):
+    _c_callback = None
+    def __init__(self, env_id = -1, num_thread = 0, memory_mode = 11, task = AILIA_SPEECH_TASK_TRANSCRIBE, flags = AILIA_SPEECH_FLAG_NONE, callback = None):
+        self._instance = ctypes.c_void_p(None)
+        self._create_callback()
+        self._check(dll.ailiaSpeechCreate(cast(pointer(self._instance), POINTER(c_void_p)), ctypes.c_int32(env_id), ctypes.c_int32(num_thread), ctypes.c_int32(memory_mode), ctypes.c_int32(task), ctypes.c_int32(flags), self._api_callback, ctypes.c_int32(AILIA_SPEECH_API_CALLBACK_VERSION)))
+        if callback is not None:
+            self._c_callback = AILIA_SPEECH_USER_API_INTERMEDIATE_CALLBACK(intermediate_callback)
+            global intermediate_callback_cnt
+            global intermediate_callback_map
+            intermediate_callback_map[intermediate_callback_cnt] = callback
+            self._check(dll.ailiaSpeechSetIntermediateCallback(self._instance, self._c_callback, intermediate_callback_cnt))
+            intermediate_callback_cnt = intermediate_callback_cnt + 1
+    def initialize_model(self, model_path = "./", model_type = AILIA_SPEECH_MODEL_TYPE_WHISPER_MULTILINGUAL_TINY):
+        if model_type == AILIA_SPEECH_MODEL_TYPE_WHISPER_MULTILINGUAL_TINY:
+            encoder_path = "encoder_tiny.opt.onnx"
+            decoder_path = "decoder_tiny_fix_kv_cache.opt2.onnx"
+            encoder_pb_path = None
+            decoder_pb_path = None
+        elif model_type == AILIA_SPEECH_MODEL_TYPE_WHISPER_MULTILINGUAL_BASE:
+            encoder_path = "encoder_base.opt.onnx"
+            decoder_path = "decoder_base_fix_kv_cache.opt2.onnx"
+            encoder_pb_path = None
+            decoder_pb_path = None
+        elif model_type == AILIA_SPEECH_MODEL_TYPE_WHISPER_MULTILINGUAL_SMALL:
+            encoder_path = "encoder_small.opt.onnx"
+            decoder_path = "decoder_small_fix_kv_cache.opt2.onnx"
+            encoder_pb_path = None
+            decoder_pb_path = None
+        elif model_type == AILIA_SPEECH_MODEL_TYPE_WHISPER_MULTILINGUAL_MEDIUM:
+            encoder_path = "encoder_medium.opt.onnx"
+            decoder_path = "decoder_medium_fix_kv_cache.opt2.onnx"
+            encoder_pb_path = None
+            decoder_pb_path = None
+        elif model_type == AILIA_SPEECH_MODEL_TYPE_WHISPER_MULTILINGUAL_LARGE:
+            encoder_path = "encoder_large.onnx"
+            decoder_path = "decoder_large_fix_kv_cache.onnx"
+            encoder_pb_path = "encoder_large_weights.pb"
+            decoder_pb_path = "decoder_large_fix_kv_cache_weights.pb"
+        elif model_type == AILIA_SPEECH_MODEL_TYPE_WHISPER_MULTILINGUAL_LARGE_V3:
+            encoder_path = "encoder_large_v3.onnx"
+            decoder_path = "decoder_large_v3_fix_kv_cache.onnx"
+            encoder_pb_path = "encoder_large_v3_weights.pb"
+            decoder_pb_path = "decoder_large_v3_fix_kv_cache_weights.pb"
+        self._download_model(model_path, encoder_path, decoder_path, encoder_pb_path, decoder_pb_path)
+        self._open_model(model_path + encoder_path, model_path + decoder_path, model_type)
+        self._open_vad(model_path + "silero_vad.onnx", AILIA_SPEECH_VAD_TYPE_SILERO)
+    def _download_model(self, model_path, encoder_path, decoder_path, encoder_pb_path, decoder_pb_path):
+        REMOTE_PATH = "https://storage.googleapis.com/ailia-models/whisper/"
+        os.makedirs(model_path, exist_ok = True)
+        check_and_download_file(model_path + encoder_path, REMOTE_PATH)
+        check_and_download_file(model_path + decoder_path, REMOTE_PATH)
+        if encoder_pb_path is not None:
+            check_and_download_file(model_path + encoder_pb_path, REMOTE_PATH)
+        if decoder_pb_path is not None:
+            check_and_download_file(model_path + decoder_pb_path, REMOTE_PATH)
+        REMOTE_PATH = "https://storage.googleapis.com/ailia-models/silero-vad/"
+        check_and_download_file(model_path + "silero_vad.onnx", REMOTE_PATH)
+    def _open_model(self, encoder, decoder, model_type):
+        p1 = self._string_buffer(encoder)
+        p2 = self._string_buffer(decoder)
+        if sys.platform == "win32":
+            self._check(dll.ailiaSpeechOpenModelFileW(self._instance, p1, p2, model_type))
+        else:
+            self._check(dll.ailiaSpeechOpenModelFileA(self._instance, p1, p2, model_type))
+    def _open_vad(self, vad, vad_type):
+        p1 = self._string_buffer(vad)
+        if sys.platform == "win32":
+            self._check(dll.ailiaSpeechOpenVadFileW(self._instance, p1, vad_type))
+        else:
+            self._check(dll.ailiaSpeechOpenVadFileA(self._instance, p1, vad_type))
+    def transcribe(self, audio_waveform, sampling_rate, lang = None):
+        if len(audio_waveform.shape) == 1:
+            channels = 1
+        elif len(audio_waveform.shape) == 2:
+            channels = audio_waveform.shape[0]
+            audio_waveform = numpy.transpose(audio_waveform, (1, 0)).flatten()
+        else:
+            raise AiliaSpeechError(f"audio_waveform must be 1 channel or 2 channel", -1)
+        audio_waveform = numpy.ascontiguousarray(audio_waveform.astype(numpy.float32))
+        if lang is not None:
+            self._check(dll.ailiaSpeechSetLanguage(self._instance, self._string_buffer(lang)))
+        self._check(dll.ailiaSpeechPushInputData(self._instance, audio_waveform, channels, audio_waveform.shape[0] // channels, sampling_rate))
+        self._check(dll.ailiaSpeechFinalizeInputData(self._instance))
+        self._check(dll.ailiaSpeechTranscribe(self._instance))
+        count = ctypes.c_uint(0)
+        self._check(dll.ailiaSpeechGetTextCount(self._instance, ctypes.byref(count)))
+        results = []
+        for i in range(count.value):
+            text = AILIASpeechText()
+            self._check(dll.ailiaSpeechGetText(self._instance, ctypes.byref(text), AILIA_SPEECH_TEXT_VERSION, i))
+            results.append({"text" : text.text.decode(), "time_stamp_begin" : text.time_stamp_begin, "time_stamp_end" : text.time_stamp_end, "person_id" : text.person_id, "language" : text.language.decode(), "confidence" : text.confidence})
+        self._check(dll.ailiaSpeechResetTranscribeState(self._instance))
+        return results
+    def __del__(self):
+        if self._instance:
+            dll.ailiaSpeechDestroy(cast(self._instance, c_void_p))

ailia_speech/linux/arm64-v8a/libailia_speech.so ADDED Viewed

Binary file

ailia_speech/linux/x64/libailia_speech.so ADDED Viewed

Binary file

ailia_speech/mac/libailia_speech.dylib ADDED Viewed

Binary file

ailia_speech/windows/x64/ailia_speech.dll ADDED Viewed

Binary file

ailia_speech-1.3.0.0.data/scripts/__init__.py ADDED Viewed

@@ -0,0 +1,493 @@
+import ctypes
+import os
+import sys
+import numpy
+import ailia
+import ailia.audio
+import ailia_tokenizer
+import urllib.request
+import ssl
+import shutil
+import platform
+#### dependency check
+if sys.platform == "win32":
+    import ctypes
+    try:
+        for library in ["vcruntime140.dll", "vcruntime140_1.dll", "msvcp140.dll"]:
+            ctypes.windll.LoadLibrary(library)
+    except:
+        print("  WARNING Please install MSVC 2015-2019 runtime from https://docs.microsoft.com/ja-jp/cpp/windows/latest-supported-vc-redist")
+#### loading DLL / DYLIB / SO  ####
+if sys.platform == "win32":
+    dll_platform = "windows/x64"
+    dll_name = "ailia_speech.dll"
+    load_fn = ctypes.WinDLL
+elif sys.platform == "darwin":
+    dll_platform = "mac"
+    dll_name = "libailia_speech.dylib"
+    load_fn = ctypes.CDLL
+else:
+    is_arm = "arm" in platform.machine() or platform.machine() == "aarch64"
+    if is_arm:
+        if platform.architecture()[0] == "32bit":
+            dll_platform = "linux/armeabi-v7a"
+        else:
+            dll_platform = "linux/arm64-v8a"
+    else:
+        dll_platform = "linux/x64"
+    dll_name = "libailia_speech.so"
+    load_fn = ctypes.CDLL
+dll_found = False
+candidate = ["", str(os.path.dirname(os.path.abspath(__file__))) + str(os.sep), str(os.path.dirname(os.path.abspath(__file__))) + str(os.sep) + dll_platform + str(os.sep)]
+for dir in candidate:
+    try:
+        dll = load_fn(dir + dll_name)
+        dll_found = True
+    except:
+        pass
+if not dll_found:
+    msg = "DLL load failed : \'" + dll_name + "\' is not found"
+    raise ImportError(msg)
+# ==============================================================================
+from ctypes import *
+AILIA_SPEECH_STATUS_SUCCESS = ( 0 )
+AILIA_SPEECH_MODEL_TYPE_WHISPER_MULTILINGUAL_TINY = (0)
+AILIA_SPEECH_MODEL_TYPE_WHISPER_MULTILINGUAL_BASE = (1)
+AILIA_SPEECH_MODEL_TYPE_WHISPER_MULTILINGUAL_SMALL = (2)
+AILIA_SPEECH_MODEL_TYPE_WHISPER_MULTILINGUAL_MEDIUM = (3)
+AILIA_SPEECH_MODEL_TYPE_WHISPER_MULTILINGUAL_LARGE = (4)
+AILIA_SPEECH_MODEL_TYPE_WHISPER_MULTILINGUAL_LARGE_V3 = (5)
+AILIA_SPEECH_TASK_TRANSCRIBE = (0)
+AILIA_SPEECH_TASK_TRANSLATE = (1)
+AILIA_SPEECH_FLAG_NONE = (0)
+AILIA_SPEECH_FLAG_LIVE = (1)
+AILIA_SPEECH_VAD_TYPE_SILERO = (0)
+AILIA_SPEECH_API_CALLBACK_VERSION = (6)
+AILIA_SPEECH_TEXT_VERSION = (2)
+AILIA_SPEECH_USER_API_AILIA_AUDIO_GET_FRAME_LEN = CFUNCTYPE(POINTER(c_int), c_int, c_int, c_int, c_int)
+AILIA_SPEECH_USER_API_AILIA_AUDIO_GET_MEL_SPECTROGRAM = CFUNCTYPE((c_int), c_void_p, c_void_p, c_int, c_int, c_int, c_int, c_int, c_int, c_int, c_int, c_float, c_int, c_float, c_float, c_int, c_int, c_int)
+AILIA_SPEECH_USER_API_AILIA_TOKENIZER_CREATE = CFUNCTYPE((c_int), POINTER(c_void_p) , c_int, c_int)
+AILIA_SPEECH_USER_API_AILIA_TOKENIZER_OPEN_MODEL_FILE_A = CFUNCTYPE((c_int), c_void_p , c_char_p)
+AILIA_SPEECH_USER_API_AILIA_TOKENIZER_OPEN_MODEL_FILE_W = CFUNCTYPE((c_int), c_void_p , c_wchar)
+AILIA_SPEECH_USER_API_AILIA_TOKENIZER_ENCODE = CFUNCTYPE((c_int), c_void_p , c_char_p)
+AILIA_SPEECH_USER_API_AILIA_TOKENIZER_GET_TOKEN_COUNT = CFUNCTYPE((c_int), c_void_p , POINTER(c_uint))
+AILIA_SPEECH_USER_API_AILIA_TOKENIZER_GET_TOKENS = CFUNCTYPE((c_int), c_void_p , POINTER(c_int) , c_uint)
+AILIA_SPEECH_USER_API_AILIA_TOKENIZER_DECODE = CFUNCTYPE((c_int), c_void_p , POINTER(c_int), c_uint)
+AILIA_SPEECH_USER_API_AILIA_TOKENIZER_GET_TEXT_LENGTH = CFUNCTYPE((c_int), c_void_p , POINTER(c_uint))
+AILIA_SPEECH_USER_API_AILIA_TOKENIZER_GET_TEXT = CFUNCTYPE((c_int), c_void_p , c_char_p , c_uint)
+AILIA_SPEECH_USER_API_AILIA_TOKENIZER_DESTROY = CFUNCTYPE((c_int), c_void_p)
+AILIA_SPEECH_USER_API_AILIA_TOKENIZER_UTF8_TO_UTF32 = CFUNCTYPE((c_int), POINTER(c_uint) , POINTER(c_uint) , c_char_p , c_uint)
+AILIA_SPEECH_USER_API_AILIA_TOKENIZER_UTF32_TO_UTF8 = CFUNCTYPE((c_int), c_char_p, POINTER(c_uint) , c_uint)
+AILIA_SPEECH_USER_API_AILIA_AUDIO_RESAMPLE = CFUNCTYPE((c_int), POINTER(c_float), POINTER(c_float), c_int, c_int, c_int, c_int)
+AILIA_SPEECH_USER_API_AILIA_AUDIO_GET_RESAMPLE_LEN = CFUNCTYPE((c_int), POINTER(c_int), c_int, c_int, c_int)
+AILIA_SPEECH_USER_API_AILIA_CREATE = CFUNCTYPE((c_int), POINTER(c_void_p), c_int, c_int)
+AILIA_SPEECH_USER_API_AILIA_OPEN_WEIGHT_FILE_A = CFUNCTYPE((c_int), c_void_p, c_char_p)
+AILIA_SPEECH_USER_API_AILIA_OPEN_WEIGHT_FILE_W = CFUNCTYPE((c_int), c_void_p, POINTER(c_wchar))
+AILIA_SPEECH_USER_API_AILIA_OPEN_WEIGHT_MEM = CFUNCTYPE((c_int), c_void_p, POINTER(c_byte), c_uint)
+AILIA_SPEECH_USER_API_AILIA_SET_MEMORY_MODE = CFUNCTYPE((c_int), c_void_p, c_uint)
+AILIA_SPEECH_USER_API_AILIA_DESTROY = CFUNCTYPE((None), c_void_p)
+AILIA_SPEECH_USER_API_AILIA_UPDATE = CFUNCTYPE((c_int), c_void_p)
+AILIA_SPEECH_USER_API_AILIA_GET_BLOB_INDEX_BY_INPUT_INDEX = CFUNCTYPE((c_int), c_void_p, POINTER(c_uint), c_uint)
+AILIA_SPEECH_USER_API_AILIA_GET_BLOB_INDEX_BY_OUTPUT_INDEX = CFUNCTYPE((c_int), c_void_p, POINTER(c_uint), c_uint)
+AILIA_SPEECH_USER_API_AILIA_GET_BLOB_DATA = CFUNCTYPE((c_int), c_void_p, POINTER(c_float), c_uint, c_uint)
+AILIA_SPEECH_USER_API_AILIA_SET_INPUT_BLOB_DATA = CFUNCTYPE((c_int), c_void_p, POINTER(c_float), c_uint, c_uint)
+AILIA_SPEECH_USER_API_AILIA_SET_INPUT_BLOB_SHAPE = CFUNCTYPE((c_int), c_void_p, c_void_p, c_uint, c_uint)
+AILIA_SPEECH_USER_API_AILIA_GET_BLOB_SHAPE = CFUNCTYPE((c_int), c_void_p, c_void_p, c_uint, c_uint)
+AILIA_SPEECH_USER_API_AILIA_GET_ERROR_DETAIL = CFUNCTYPE((c_char_p), c_void_p)
+AILIA_SPEECH_USER_API_AILIA_COPY_BLOB_DATA = CFUNCTYPE((c_int), c_void_p, c_uint, c_void_p, c_uint)
+AILIA_SPEECH_USER_API_AILIA_GET_ENVIRONMENT = CFUNCTYPE((c_int), POINTER(c_void_p), c_uint, c_uint)
+class struct__AILIASpeechApiCallback(Structure):
+    pass
+struct__AILIASpeechApiCallback.__slots__ = [
+    'ailiaAudioGetFrameLen',
+    'ailiaAudioGetMelSpectrogram',
+    'ailiaAudioResample',
+    'ailiaAudioGetResampleLen',
+    'ailiaTokenizerCreate',
+    'ailiaTokenizerOpenModelFileA',
+    'ailiaTokenizerOpenModelFileW',
+    'ailiaTokenizerEncode',
+    'ailiaTokenizerGetTokenCount',
+    'ailiaTokenizerGetTokens',
+    'ailiaTokenizerDecode',
+    'ailiaTokenizerGetTextLength',
+    'ailiaTokenizerGetText',
+    'ailiaTokenizerDestroy',
+    'ailiaTokenizerUtf8ToUtf32',
+    'ailiaTokenizerUtf32ToUtf8',
+    'ailiaCreate',
+    'ailiaOpenWeightFileA',
+    'ailiaOpenWeightFileW',
+    'ailiaOpenWeightMem',
+    'ailiaSetMemoryMode',
+    'ailiaDestroy',
+    'ailiaUpdate',
+    'ailiaGetBlobIndexByInputIndex',
+    'ailiaGetBlobIndexByOutputIndex',
+    'ailiaGetBlobData',
+    'ailiaSetInputBlobData',
+    'ailiaSetInputBlobShape',
+    'ailiaGetBlobShape',
+    'ailiaGetErrorDetail',
+    'ailiaCopyBlobData',
+    'ailiaGetEnvironment',
+]
+struct__AILIASpeechApiCallback._fields_ = [
+    ('ailiaAudioGetFrameLen', AILIA_SPEECH_USER_API_AILIA_AUDIO_GET_FRAME_LEN),
+    ('ailiaAudioGetMelSpectrogram', AILIA_SPEECH_USER_API_AILIA_AUDIO_GET_MEL_SPECTROGRAM),
+    ('ailiaAudioResample', AILIA_SPEECH_USER_API_AILIA_AUDIO_RESAMPLE),
+    ('ailiaAudioGetResampleLen', AILIA_SPEECH_USER_API_AILIA_AUDIO_GET_RESAMPLE_LEN),
+    ('ailiaTokenizerCreate', AILIA_SPEECH_USER_API_AILIA_TOKENIZER_CREATE),
+    ('ailiaTokenizerOpenModelFileA', AILIA_SPEECH_USER_API_AILIA_TOKENIZER_OPEN_MODEL_FILE_A),
+    ('ailiaTokenizerOpenModelFileW', AILIA_SPEECH_USER_API_AILIA_TOKENIZER_OPEN_MODEL_FILE_W),
+    ('ailiaTokenizerEncode', AILIA_SPEECH_USER_API_AILIA_TOKENIZER_ENCODE),
+    ('ailiaTokenizerGetTokenCount', AILIA_SPEECH_USER_API_AILIA_TOKENIZER_GET_TOKEN_COUNT),
+    ('ailiaTokenizerGetTokens', AILIA_SPEECH_USER_API_AILIA_TOKENIZER_GET_TOKENS),
+    ('ailiaTokenizerDecode', AILIA_SPEECH_USER_API_AILIA_TOKENIZER_DECODE),
+    ('ailiaTokenizerGetTextLength', AILIA_SPEECH_USER_API_AILIA_TOKENIZER_GET_TEXT_LENGTH),
+    ('ailiaTokenizerGetText', AILIA_SPEECH_USER_API_AILIA_TOKENIZER_GET_TEXT),
+    ('ailiaTokenizerDestroy', AILIA_SPEECH_USER_API_AILIA_TOKENIZER_DESTROY),
+    ('ailiaTokenizerUtf8ToUtf32', AILIA_SPEECH_USER_API_AILIA_TOKENIZER_UTF8_TO_UTF32),
+    ('ailiaTokenizerUtf32ToUtf8', AILIA_SPEECH_USER_API_AILIA_TOKENIZER_UTF32_TO_UTF8),
+    ('ailiaCreate', AILIA_SPEECH_USER_API_AILIA_CREATE),
+    ('ailiaOpenWeightFileA', AILIA_SPEECH_USER_API_AILIA_OPEN_WEIGHT_FILE_A),
+    ('ailiaOpenWeightFileW', AILIA_SPEECH_USER_API_AILIA_OPEN_WEIGHT_FILE_W),
+    ('ailiaOpenWeightMem', AILIA_SPEECH_USER_API_AILIA_OPEN_WEIGHT_MEM),
+    ('ailiaSetMemoryMode', AILIA_SPEECH_USER_API_AILIA_SET_MEMORY_MODE),
+    ('ailiaDestroy', AILIA_SPEECH_USER_API_AILIA_DESTROY),
+    ('ailiaUpdate', AILIA_SPEECH_USER_API_AILIA_UPDATE),
+    ('ailiaGetBlobIndexByInputIndex', AILIA_SPEECH_USER_API_AILIA_GET_BLOB_INDEX_BY_INPUT_INDEX),
+    ('ailiaGetBlobIndexByOutputIndex', AILIA_SPEECH_USER_API_AILIA_GET_BLOB_INDEX_BY_OUTPUT_INDEX),
+    ('ailiaGetBlobData', AILIA_SPEECH_USER_API_AILIA_GET_BLOB_DATA),
+    ('ailiaSetInputBlobData', AILIA_SPEECH_USER_API_AILIA_SET_INPUT_BLOB_DATA),
+    ('ailiaSetInputBlobShape', AILIA_SPEECH_USER_API_AILIA_SET_INPUT_BLOB_SHAPE),
+    ('ailiaGetBlobShape', AILIA_SPEECH_USER_API_AILIA_GET_BLOB_SHAPE),
+    ('ailiaGetErrorDetail', AILIA_SPEECH_USER_API_AILIA_GET_ERROR_DETAIL),
+    ('ailiaCopyBlobData', AILIA_SPEECH_USER_API_AILIA_COPY_BLOB_DATA),
+    ('ailiaGetEnvironment', AILIA_SPEECH_USER_API_AILIA_GET_ENVIRONMENT),
+]
+AILIASpeechApiCallback = struct__AILIASpeechApiCallback
+# ==============================================================================
+dll.ailiaSpeechCreate.restype = c_int
+dll.ailiaSpeechCreate.argtypes = (POINTER(c_void_p), c_int32, c_int32, c_int32, c_int32, c_int32, AILIASpeechApiCallback, c_int32)
+dll.ailiaSpeechDestroy.restype = None
+dll.ailiaSpeechDestroy.argtypes = (c_void_p, )
+dll.ailiaSpeechOpenModelFileA.restype = c_int
+dll.ailiaSpeechOpenModelFileA.argtypes = (c_void_p, c_char_p, c_char_p, c_int32)
+dll.ailiaSpeechOpenModelFileW.restype = c_int
+dll.ailiaSpeechOpenModelFileW.argtypes = (c_void_p, c_wchar_p, c_wchar_p, c_int32)
+dll.ailiaSpeechOpenVadFileA.restype = c_int
+dll.ailiaSpeechOpenVadFileA.argtypes = (c_void_p, c_char_p, c_int32)
+dll.ailiaSpeechOpenVadFileW.restype = c_int
+dll.ailiaSpeechOpenVadFileW.argtypes = (c_void_p, c_wchar_p, c_int32)
+dll.ailiaSpeechPushInputData.restype = c_int
+dll.ailiaSpeechPushInputData.argtypes = (c_void_p, numpy.ctypeslib.ndpointer(
+                dtype=numpy.float32, flags='CONTIGUOUS'
+            ),                               # src
+            ctypes.c_uint,
+            ctypes.c_uint,
+            ctypes.c_uint)
+dll.ailiaSpeechFinalizeInputData.restype = c_int
+dll.ailiaSpeechFinalizeInputData.argtypes = (c_void_p, )
+dll.ailiaSpeechBuffered.restype = c_int
+dll.ailiaSpeechBuffered.argtypes = (c_void_p, POINTER(ctypes.c_uint))
+dll.ailiaSpeechComplete.restype = c_int
+dll.ailiaSpeechComplete.argtypes = (c_void_p, POINTER(ctypes.c_uint))
+dll.ailiaSpeechTranscribe.restype = c_int
+dll.ailiaSpeechTranscribe.argtypes = (c_void_p, )
+dll.ailiaSpeechGetTextCount.restype = c_int
+dll.ailiaSpeechGetTextCount.argtypes = (c_void_p, POINTER(ctypes.c_uint))
+class AILIASpeechText(ctypes.Structure):
+    _fields_ = [
+        ("text", ctypes.c_char_p),
+        ("time_stamp_begin", ctypes.c_float),
+        ("time_stamp_end", ctypes.c_float),
+        ("person_id", ctypes.c_uint),
+        ("language", ctypes.c_char_p),
+        ("confidence", ctypes.c_float)]
+dll.ailiaSpeechGetText.restype = c_int
+dll.ailiaSpeechGetText.argtypes = (c_void_p, POINTER(AILIASpeechText), ctypes.c_uint, ctypes.c_uint)
+dll.ailiaSpeechResetTranscribeState.restype = c_int
+dll.ailiaSpeechResetTranscribeState.argtypes = (c_void_p, )
+AILIA_SPEECH_USER_API_INTERMEDIATE_CALLBACK = CFUNCTYPE((c_int), c_int64, c_char_p)
+dll.ailiaSpeechSetIntermediateCallback.restype = c_int
+dll.ailiaSpeechSetIntermediateCallback.argtypes = (c_void_p, AILIA_SPEECH_USER_API_INTERMEDIATE_CALLBACK, c_int64)
+dll.ailiaSpeechSetLanguage.restype = c_int
+dll.ailiaSpeechSetLanguage.argtypes = (c_void_p, c_char_p)
+# ==============================================================================
+# model download
+# ==============================================================================
+def progress_print(block_count, block_size, total_size):
+    percentage = 100.0 * block_count * block_size / total_size
+    if percentage > 100:
+        # Bigger than 100 does not look good, so...
+        percentage = 100
+    max_bar = 50
+    bar_num = int(percentage / (100 / max_bar))
+    progress_element = '=' * bar_num
+    if bar_num != max_bar:
+        progress_element += '>'
+    bar_fill = ' '  # fill the blanks
+    bar = progress_element.ljust(max_bar, bar_fill)
+    total_size_kb = total_size / 1024
+    print(f'[{bar} {percentage:.2f}% ( {total_size_kb:.0f}KB )]', end='\r')
+def urlretrieve(remote_path, weight_path, progress_print):
+    temp_path = weight_path + ".tmp"
+    try:
+        #raise ssl.SSLError # test
+        urllib.request.urlretrieve(
+            remote_path,
+            temp_path,
+            progress_print,
+        )
+    except ssl.SSLError as e:
+        print(f'SSLError detected, so try to download without ssl')
+        remote_path = remote_path.replace("https","http")
+        urllib.request.urlretrieve(
+            remote_path,
+            temp_path,
+            progress_print,
+        )
+    shutil.move(temp_path, weight_path)
+def check_and_download_file(file_path, remote_path):
+    if not os.path.exists(file_path):
+        print('Downloading %s...' % file_path)
+        urlretrieve(remote_path + os.path.basename(file_path), file_path, progress_print)
+# ==============================================================================
+# base model class
+# ==============================================================================
+class AiliaSpeechError(RuntimeError):
+    def __init__(self, message, code):
+        super().__init__(f"{message} code:{code}")
+        self.code = code
+class AiliaSpeechModel:
+    _api_callback = None
+    _instance = None
+    def _check(self, status):
+        if status != AILIA_SPEECH_STATUS_SUCCESS:
+            raise AiliaSpeechError(f"ailia speech error", status)
+    def _string_buffer(self, path):
+        if sys.platform == "win32":
+            return ctypes.create_unicode_buffer(path)
+        else:
+            return ctypes.create_string_buffer(path.encode("utf-8"))
+    def _create_callback(self):
+        callback = AILIASpeechApiCallback()
+        callback.ailiaAudioGetFrameLen = AILIA_SPEECH_USER_API_AILIA_AUDIO_GET_FRAME_LEN(("ailiaAudioGetFrameLen", ailia.audio.audio_core.dll))
+        callback.ailiaAudioGetMelSpectrogram = AILIA_SPEECH_USER_API_AILIA_AUDIO_GET_MEL_SPECTROGRAM(("ailiaAudioGetMelSpectrogram", ailia.audio.audio_core.dll))
+        callback.ailiaAudioResample = AILIA_SPEECH_USER_API_AILIA_AUDIO_RESAMPLE(("ailiaAudioResample", ailia.audio.audio_core.dll))
+        callback.ailiaAudioGetResampleLen = AILIA_SPEECH_USER_API_AILIA_AUDIO_GET_RESAMPLE_LEN(("ailiaAudioGetResampleLen", ailia.audio.audio_core.dll))
+        callback.ailiaTokenizerCreate = AILIA_SPEECH_USER_API_AILIA_TOKENIZER_CREATE(("ailiaTokenizerCreate", ailia_tokenizer.dll))
+        callback.ailiaTokenizerOpenModelFileA = AILIA_SPEECH_USER_API_AILIA_TOKENIZER_OPEN_MODEL_FILE_A(("ailiaTokenizerOpenModelFileA", ailia_tokenizer.dll))
+        callback.ailiaTokenizerOpenModelFileW = AILIA_SPEECH_USER_API_AILIA_TOKENIZER_OPEN_MODEL_FILE_W(("ailiaTokenizerOpenModelFileW", ailia_tokenizer.dll))
+        callback.ailiaTokenizerEncode = AILIA_SPEECH_USER_API_AILIA_TOKENIZER_ENCODE(("ailiaTokenizerEncode", ailia_tokenizer.dll))
+        callback.ailiaTokenizerGetTokenCount = AILIA_SPEECH_USER_API_AILIA_TOKENIZER_GET_TOKEN_COUNT(("ailiaTokenizerGetTokenCount", ailia_tokenizer.dll))
+        callback.ailiaTokenizerGetTokens = AILIA_SPEECH_USER_API_AILIA_TOKENIZER_GET_TOKENS(("ailiaTokenizerGetTokens", ailia_tokenizer.dll))
+        callback.ailiaTokenizerDecode = AILIA_SPEECH_USER_API_AILIA_TOKENIZER_DECODE(("ailiaTokenizerDecode", ailia_tokenizer.dll))
+        callback.ailiaTokenizerGetTextLength = AILIA_SPEECH_USER_API_AILIA_TOKENIZER_GET_TEXT_LENGTH(("ailiaTokenizerGetTextLength", ailia_tokenizer.dll))
+        callback.ailiaTokenizerGetText = AILIA_SPEECH_USER_API_AILIA_TOKENIZER_GET_TEXT(("ailiaTokenizerGetText", ailia_tokenizer.dll))
+        callback.ailiaTokenizerDestroy = AILIA_SPEECH_USER_API_AILIA_TOKENIZER_DESTROY(("ailiaTokenizerDestroy", ailia_tokenizer.dll))
+        callback.ailiaTokenizerUtf8ToUtf32 = AILIA_SPEECH_USER_API_AILIA_TOKENIZER_UTF8_TO_UTF32(("ailiaTokenizerUtf8ToUtf32", ailia_tokenizer.dll))
+        callback.ailiaTokenizerUtf32ToUtf8 = AILIA_SPEECH_USER_API_AILIA_TOKENIZER_UTF32_TO_UTF8(("ailiaTokenizerUtf32ToUtf8", ailia_tokenizer.dll))
+        callback.ailiaCreate = AILIA_SPEECH_USER_API_AILIA_CREATE(("ailiaCreate", ailia.core.dll))
+        callback.ailiaOpenWeightFileA = AILIA_SPEECH_USER_API_AILIA_OPEN_WEIGHT_FILE_A(("ailiaOpenWeightFileA", ailia.core.dll))
+        callback.ailiaOpenWeightFileW = AILIA_SPEECH_USER_API_AILIA_OPEN_WEIGHT_FILE_W(("ailiaOpenWeightFileW", ailia.core.dll))
+        callback.ailiaOpenWeightMem = AILIA_SPEECH_USER_API_AILIA_OPEN_WEIGHT_MEM(("ailiaOpenWeightMem", ailia.core.dll))
+        callback.ailiaSetMemoryMode = AILIA_SPEECH_USER_API_AILIA_SET_MEMORY_MODE(("ailiaSetMemoryMode", ailia.core.dll))
+        callback.ailiaDestroy = AILIA_SPEECH_USER_API_AILIA_DESTROY(("ailiaDestroy", ailia.core.dll))
+        callback.ailiaUpdate = AILIA_SPEECH_USER_API_AILIA_UPDATE(("ailiaUpdate", ailia.core.dll))
+        callback.ailiaGetBlobIndexByInputIndex = AILIA_SPEECH_USER_API_AILIA_GET_BLOB_INDEX_BY_INPUT_INDEX(("ailiaGetBlobIndexByInputIndex", ailia.core.dll))
+        callback.ailiaGetBlobIndexByOutputIndex = AILIA_SPEECH_USER_API_AILIA_GET_BLOB_INDEX_BY_OUTPUT_INDEX(("ailiaGetBlobIndexByOutputIndex", ailia.core.dll))
+        callback.ailiaGetBlobData = AILIA_SPEECH_USER_API_AILIA_GET_BLOB_DATA(("ailiaGetBlobData", ailia.core.dll))
+        callback.ailiaSetInputBlobData = AILIA_SPEECH_USER_API_AILIA_SET_INPUT_BLOB_DATA(("ailiaSetInputBlobData", ailia.core.dll))
+        callback.ailiaSetInputBlobShape = AILIA_SPEECH_USER_API_AILIA_SET_INPUT_BLOB_SHAPE(("ailiaSetInputBlobShape", ailia.core.dll))
+        callback.ailiaGetBlobShape = AILIA_SPEECH_USER_API_AILIA_GET_BLOB_SHAPE(("ailiaGetBlobShape", ailia.core.dll))
+        callback.ailiaGetErrorDetail = AILIA_SPEECH_USER_API_AILIA_GET_ERROR_DETAIL(("ailiaGetErrorDetail", ailia.core.dll))
+        callback.ailiaCopyBlobData = AILIA_SPEECH_USER_API_AILIA_COPY_BLOB_DATA(("ailiaCopyBlobData", ailia.core.dll))
+        callback.ailiaGetEnvironment = AILIA_SPEECH_USER_API_AILIA_GET_ENVIRONMENT(("ailiaGetEnvironment", ailia.core.dll))
+        self._api_callback = callback # prevent GC
+# ==============================================================================
+# Public class
+# ==============================================================================
+intermediate_callback_cnt = 0
+intermediate_callback_map = {}
+def intermediate_callback(handle, text):
+    intermediate_callback_map[handle](text.decode())
+    return 0
+class Whisper(AiliaSpeechModel):
+    _c_callback = None
+    def __init__(self, env_id = -1, num_thread = 0, memory_mode = 11, task = AILIA_SPEECH_TASK_TRANSCRIBE, flags = AILIA_SPEECH_FLAG_NONE, callback = None):
+        self._instance = ctypes.c_void_p(None)
+        self._create_callback()
+        self._check(dll.ailiaSpeechCreate(cast(pointer(self._instance), POINTER(c_void_p)), ctypes.c_int32(env_id), ctypes.c_int32(num_thread), ctypes.c_int32(memory_mode), ctypes.c_int32(task), ctypes.c_int32(flags), self._api_callback, ctypes.c_int32(AILIA_SPEECH_API_CALLBACK_VERSION)))
+        if callback is not None:
+            self._c_callback = AILIA_SPEECH_USER_API_INTERMEDIATE_CALLBACK(intermediate_callback)
+            global intermediate_callback_cnt
+            global intermediate_callback_map
+            intermediate_callback_map[intermediate_callback_cnt] = callback
+            self._check(dll.ailiaSpeechSetIntermediateCallback(self._instance, self._c_callback, intermediate_callback_cnt))
+            intermediate_callback_cnt = intermediate_callback_cnt + 1
+    def initialize_model(self, model_path = "./", model_type = AILIA_SPEECH_MODEL_TYPE_WHISPER_MULTILINGUAL_TINY):
+        if model_type == AILIA_SPEECH_MODEL_TYPE_WHISPER_MULTILINGUAL_TINY:
+            encoder_path = "encoder_tiny.opt.onnx"
+            decoder_path = "decoder_tiny_fix_kv_cache.opt2.onnx"
+            encoder_pb_path = None
+            decoder_pb_path = None
+        elif model_type == AILIA_SPEECH_MODEL_TYPE_WHISPER_MULTILINGUAL_BASE:
+            encoder_path = "encoder_base.opt.onnx"
+            decoder_path = "decoder_base_fix_kv_cache.opt2.onnx"
+            encoder_pb_path = None
+            decoder_pb_path = None
+        elif model_type == AILIA_SPEECH_MODEL_TYPE_WHISPER_MULTILINGUAL_SMALL:
+            encoder_path = "encoder_small.opt.onnx"
+            decoder_path = "decoder_small_fix_kv_cache.opt2.onnx"
+            encoder_pb_path = None
+            decoder_pb_path = None
+        elif model_type == AILIA_SPEECH_MODEL_TYPE_WHISPER_MULTILINGUAL_MEDIUM:
+            encoder_path = "encoder_medium.opt.onnx"
+            decoder_path = "decoder_medium_fix_kv_cache.opt2.onnx"
+            encoder_pb_path = None
+            decoder_pb_path = None
+        elif model_type == AILIA_SPEECH_MODEL_TYPE_WHISPER_MULTILINGUAL_LARGE:
+            encoder_path = "encoder_large.onnx"
+            decoder_path = "decoder_large_fix_kv_cache.onnx"
+            encoder_pb_path = "encoder_large_weights.pb"
+            decoder_pb_path = "decoder_large_fix_kv_cache_weights.pb"
+        elif model_type == AILIA_SPEECH_MODEL_TYPE_WHISPER_MULTILINGUAL_LARGE_V3:
+            encoder_path = "encoder_large_v3.onnx"
+            decoder_path = "decoder_large_v3_fix_kv_cache.onnx"
+            encoder_pb_path = "encoder_large_v3_weights.pb"
+            decoder_pb_path = "decoder_large_v3_fix_kv_cache_weights.pb"
+        self._download_model(model_path, encoder_path, decoder_path, encoder_pb_path, decoder_pb_path)
+        self._open_model(model_path + encoder_path, model_path + decoder_path, model_type)
+        self._open_vad(model_path + "silero_vad.onnx", AILIA_SPEECH_VAD_TYPE_SILERO)
+    def _download_model(self, model_path, encoder_path, decoder_path, encoder_pb_path, decoder_pb_path):
+        REMOTE_PATH = "https://storage.googleapis.com/ailia-models/whisper/"
+        os.makedirs(model_path, exist_ok = True)
+        check_and_download_file(model_path + encoder_path, REMOTE_PATH)
+        check_and_download_file(model_path + decoder_path, REMOTE_PATH)
+        if encoder_pb_path is not None:
+            check_and_download_file(model_path + encoder_pb_path, REMOTE_PATH)
+        if decoder_pb_path is not None:
+            check_and_download_file(model_path + decoder_pb_path, REMOTE_PATH)
+        REMOTE_PATH = "https://storage.googleapis.com/ailia-models/silero-vad/"
+        check_and_download_file(model_path + "silero_vad.onnx", REMOTE_PATH)
+    def _open_model(self, encoder, decoder, model_type):
+        p1 = self._string_buffer(encoder)
+        p2 = self._string_buffer(decoder)
+        if sys.platform == "win32":
+            self._check(dll.ailiaSpeechOpenModelFileW(self._instance, p1, p2, model_type))
+        else:
+            self._check(dll.ailiaSpeechOpenModelFileA(self._instance, p1, p2, model_type))
+    def _open_vad(self, vad, vad_type):
+        p1 = self._string_buffer(vad)
+        if sys.platform == "win32":
+            self._check(dll.ailiaSpeechOpenVadFileW(self._instance, p1, vad_type))
+        else:
+            self._check(dll.ailiaSpeechOpenVadFileA(self._instance, p1, vad_type))
+    def transcribe(self, audio_waveform, sampling_rate, lang = None):
+        if len(audio_waveform.shape) == 1:
+            channels = 1
+        elif len(audio_waveform.shape) == 2:
+            channels = audio_waveform.shape[0]
+            audio_waveform = numpy.transpose(audio_waveform, (1, 0)).flatten()
+        else:
+            raise AiliaSpeechError(f"audio_waveform must be 1 channel or 2 channel", -1)
+        audio_waveform = numpy.ascontiguousarray(audio_waveform.astype(numpy.float32))
+        if lang is not None:
+            self._check(dll.ailiaSpeechSetLanguage(self._instance, self._string_buffer(lang)))
+        self._check(dll.ailiaSpeechPushInputData(self._instance, audio_waveform, channels, audio_waveform.shape[0] // channels, sampling_rate))
+        self._check(dll.ailiaSpeechFinalizeInputData(self._instance))
+        self._check(dll.ailiaSpeechTranscribe(self._instance))
+        count = ctypes.c_uint(0)
+        self._check(dll.ailiaSpeechGetTextCount(self._instance, ctypes.byref(count)))
+        results = []
+        for i in range(count.value):
+            text = AILIASpeechText()
+            self._check(dll.ailiaSpeechGetText(self._instance, ctypes.byref(text), AILIA_SPEECH_TEXT_VERSION, i))
+            results.append({"text" : text.text.decode(), "time_stamp_begin" : text.time_stamp_begin, "time_stamp_end" : text.time_stamp_end, "person_id" : text.person_id, "language" : text.language.decode(), "confidence" : text.confidence})
+        self._check(dll.ailiaSpeechResetTranscribeState(self._instance))
+        return results
+    def __del__(self):
+        if self._instance:
+            dll.ailiaSpeechDestroy(cast(self._instance, c_void_p))

ailia_speech-1.3.0.0.dist-info/METADATA ADDED Viewed

@@ -0,0 +1,71 @@
+Metadata-Version: 2.1
+Name: ailia_speech
+Version: 1.3.0.0
+Summary: ailia AI Speech
+Home-page: https://ailia.jp/
+Author: ax Inc.
+Author-email: contact@axinc.jp
+License: https://ailia.ai/en/license/
+Requires-Python: >3.6
+Description-Content-Type: text/markdown
+Requires-Dist: ailia
+Requires-Dist: ailia-tokenizer
+# ailia AI Speech Python API
+!! CAUTION !!
+“ailia” IS NOT OPEN SOURCE SOFTWARE (OSS).
+As long as user complies with the conditions stated in [License Document](https://ailia.ai/license/), user may use the Software for free of charge, but the Software is basically paid software.
+## About ailia AI Speech
+ailia Speech is a library to perform speech recognition using AI. It provides a C API for native applications, as well as a C# API well suited for Unity applications. Using ailia Speech, you can easily integrate AI powered speech recognition into your applications.
+## Install from pip
+You can install the ailia SDK free evaluation package with the following command.
+```
+pip3 install ailia_speech
+```
+## Install from package
+You can install the ailia SDK from Package with the following command.
+```
+python3 bootstrap.py
+pip3 install ./
+```
+## Usage
+```python
+import ailia
+import ailia_speech
+import librosa
+import os
+import urllib.request
+# Load target audio
+ref_file_path = "demo.wav"
+if not os.path.exists(ref_file_path):
+	urllib.request.urlretrieve(
+		"https://github.com/axinc-ai/ailia-models/raw/refs/heads/master/audio_processing/whisper/demo.wa",
+		"demo.wav"
+	)
+audio_waveform, sampling_rate = librosa.load(ref_file_path, mono=True)
+# Infer
+speech = ailia_speech.Whisper()
+speech.initialize_model(model_path = "./models/", model_type = ailia_speech.AILIA_SPEECH_MODEL_TYPE_WHISPER_MULTILINGUAL_SMALL)
+recognized_text = speech.transcribe(audio_waveform, sampling_rate)
+print(recognized_text)
+```
+## API specification
+https://github.com/axinc-ai/ailia-sdk

ailia_speech-1.3.0.0.dist-info/RECORD ADDED Viewed

@@ -0,0 +1,12 @@
+ailia_speech/LICENSE_AILIA_EN.pdf,sha256=1DzVViPnw1uAS8gJ5a8uN3iZNNR5I1ItIXmezHfUpeM,70149
+ailia_speech/LICENSE_AILIA_JA.pdf,sha256=s628QN47S2bNqIfuSjm2LBf0vIluv2df6MSemn6Ksmw,174134
+ailia_speech/__init__.py,sha256=7XiloklOFiXHRHs_wDWyDW0HHD6obPDklxY327Lmwmc,25333
+ailia_speech/linux/arm64-v8a/libailia_speech.so,sha256=JAOwnBr7lbiMZmPCM99pd4vJQ08ZuXDPpq-FurrXSnE,166096
+ailia_speech/linux/x64/libailia_speech.so,sha256=WbFvA5wKTgS_Zx8ErT7WBKJbzOUexavr4nP4EkLNawQ,171360
+ailia_speech/mac/libailia_speech.dylib,sha256=-JAC40yLslAVMvfh6LhDvP3Zyt3hIT3WZc7wa9-07zU,317112
+ailia_speech/windows/x64/ailia_speech.dll,sha256=WJCOHi0Na4tdMG1RT7dA7yAoWumiGSWeW1vxUtiXDS8,126464
+ailia_speech-1.3.0.0.data/scripts/__init__.py,sha256=7XiloklOFiXHRHs_wDWyDW0HHD6obPDklxY327Lmwmc,25333
+ailia_speech-1.3.0.0.dist-info/METADATA,sha256=xj7S7gD2gsqVQbXiBDaHh1s_Cron4mr5SN80GcPTBFc,1902
+ailia_speech-1.3.0.0.dist-info/WHEEL,sha256=GV9aMThwP_4oNCtvEC2ec3qUYutgWeAzklro_0m4WJQ,91
+ailia_speech-1.3.0.0.dist-info/top_level.txt,sha256=Ou9XeJ9AvdK8eutw07oosCthftD1tRYzAgNY2BrYhDc,13
+ailia_speech-1.3.0.0.dist-info/RECORD,,

ailia_speech-1.3.0.0.dist-info/WHEEL ADDED Viewed

@@ -0,0 +1,5 @@
+Wheel-Version: 1.0
+Generator: setuptools (75.1.0)
+Root-Is-Purelib: true
+Tag: py3-none-any

ailia_speech-1.3.0.0.dist-info/top_level.txt ADDED Viewed

	@@ -0,0 +1 @@
1	+ ailia_speech