PyPI - Anchor-annotator - Versions diffs - 0.3.3__py3-none-any.whl → 0.5.0__py3-none-any.whl - Mend

Anchor-annotator 0.3.3py3-none-any.whl → 0.5.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (18) hide show

{Anchor_annotator-0.3.3.dist-info → Anchor_annotator-0.5.0.dist-info}/METADATA +1 -1
Anchor_annotator-0.5.0.dist-info/RECORD +22 -0
anchor/_version.py +2 -2
anchor/main.py +178 -62
anchor/models.py +88 -54
anchor/plot.py +316 -115
anchor/resources_rc.py +6475 -4801
anchor/settings.py +195 -95
anchor/ui_error_dialog.py +15 -16
anchor/ui_main_window.py +40 -612
anchor/ui_preferences.py +75 -44
anchor/undo.py +15 -5
anchor/widgets.py +98 -132
anchor/workers.py +29 -1
Anchor_annotator-0.3.3.dist-info/RECORD +0 -22
{Anchor_annotator-0.3.3.dist-info → Anchor_annotator-0.5.0.dist-info}/LICENSE +0 -0
{Anchor_annotator-0.3.3.dist-info → Anchor_annotator-0.5.0.dist-info}/WHEEL +0 -0
{Anchor_annotator-0.3.3.dist-info → Anchor_annotator-0.5.0.dist-info}/top_level.txt +0 -0

anchor/models.py CHANGED Viewed

@@ -24,6 +24,12 @@ from montreal_forced_aligner.corpus.acoustic_corpus import (
 )
 from montreal_forced_aligner.data import PhoneType, WordType
 from montreal_forced_aligner.db import File, Phone, Speaker, Utterance
+from montreal_forced_aligner.dictionary.mixins import (
+    DEFAULT_CLITIC_MARKERS,
+    DEFAULT_COMPOUND_MARKERS,
+    DEFAULT_PUNCTUATION,
+    DEFAULT_WORD_BREAK_MARKERS,
+)
 from montreal_forced_aligner.g2p.generator import PyniniValidator
 from montreal_forced_aligner.models import (
     AcousticModel,
@@ -45,6 +51,23 @@ if typing.TYPE_CHECKING:
 logger = logging.getLogger("anchor")
+WORD_BREAK_SET = "".join(
+    sorted(
+        set(
+            DEFAULT_WORD_BREAK_MARKERS
+            + DEFAULT_PUNCTUATION
+            + DEFAULT_CLITIC_MARKERS
+            + DEFAULT_COMPOUND_MARKERS
+        )
+    )
+)
+if "-" in WORD_BREAK_SET:
+    WORD_BREAK_SET = "" + WORD_BREAK_SET.replace("-", "")
+WORD_BREAK_REGEX_SET = rf"[\s{WORD_BREAK_SET}]"
 # noinspection PyUnresolvedReferences
 @dataclass(slots=True)
 class TextFilterQuery:
@@ -76,9 +99,9 @@ class TextFilterQuery:
         if posix:
             text = text.replace(r"\b", word_break_set)
             if text.startswith(r"\b"):
-                text = r"((?<=\s)|(?<=^))" + text[2:]
+                text = rf"((?<={WORD_BREAK_REGEX_SET})|(?<=^))" + text[2:]
             if text.endswith(r"\b"):
-                text = text[:-2] + r"((?=\s)|(?=$))"
+                text = text[:-2] + rf"((?={WORD_BREAK_REGEX_SET})|(?=$))"
         if self.regex or self.word:
             if not self.case_sensitive:
                 text = "(?i)" + text
@@ -482,7 +505,13 @@ class FileUtterancesModel(QtCore.QAbstractListModel):
         normalized_text = ""
         speaker_id = None
         channel = None
+        prev_index = None
         for old_utt in sorted(utterances, key=lambda x: x.begin):
+            index = self.reversed_indices[old_utt.id]
+            if prev_index is not None:
+                if index - prev_index != 1:
+                    return
+            prev_index = index
             if speaker_id is None:
                 speaker_id = old_utt.speaker_id
             if channel is None:
@@ -544,8 +573,7 @@ class FileSelectionModel(QtCore.QItemSelectionModel):
     channelChanged = QtCore.Signal()
     resetView = QtCore.Signal()
     viewChanged = QtCore.Signal(object, object)
-    selectionAudioChanged = QtCore.Signal()
-    currentTimeChanged = QtCore.Signal(object)
+    selectionAudioChanged = QtCore.Signal(object)
     currentUtteranceChanged = QtCore.Signal()
     speakerRequested = QtCore.Signal(object)
@@ -584,6 +612,9 @@ class FileSelectionModel(QtCore.QItemSelectionModel):
         self.model().utterancesReady.connect(self.finalize_set_new_file)
         self.viewChanged.connect(self.load_audio_selection)
         self.model().selectionRequested.connect(self.update_selected_utterances)
+        self.view_change_timer = QtCore.QTimer()
+        self.view_change_timer.setInterval(50)
+        self.view_change_timer.timeout.connect(self.send_selection_update)
     def selected_utterances(self):
         utts = []
@@ -706,20 +737,21 @@ class FileSelectionModel(QtCore.QItemSelectionModel):
         self.waveformReady.emit()
     def select_audio(self, begin, end):
-        if end is not None and end - begin < 0.025:
+        if end is not None and end - begin < 0.05:
             end = None
         self.selected_min_time = begin
         self.selected_max_time = end
-        self.selectionAudioChanged.emit()
+        if self.selected_min_time != self.min_time:
+            self.selectionAudioChanged.emit(False)
-    def request_start_time(self, start_time):
+    def request_start_time(self, start_time, update=False):
         if start_time >= self.max_time:
             return
         if start_time < self.min_time:
             return
         self.selected_min_time = start_time
         self.selected_max_time = None
-        self.selectionAudioChanged.emit()
+        self.selectionAudioChanged.emit(update)
     def set_current_channel(self, channel):
         if channel == self.selected_channel:
@@ -789,7 +821,21 @@ class FileSelectionModel(QtCore.QItemSelectionModel):
     def zoom_to_selection(self):
         if self.selected_min_time is not None and self.selected_max_time is not None:
-            self.set_view_times(self.selected_min_time, self.selected_max_time)
+            begin = self.selected_min_time
+            end = self.selected_max_time
+        elif len(self.selectedRows(0)) > 0:
+            m = self.model()
+            begin = 100000
+            end = 0
+            for index in self.selectedRows(0):
+                u = m.utterances[index.row()]
+                if u.begin < begin:
+                    begin = u.begin
+                if u.end > end:
+                    end = u.end
+        else:
+            return
+        self.set_view_times(begin, end)
     def update_from_slider(self, value):
         if not self.max_time:
@@ -797,15 +843,6 @@ class FileSelectionModel(QtCore.QItemSelectionModel):
         cur_window = self.max_time - self.min_time
         self.set_view_times(value, value + cur_window)
-    def update_selection_audio(self, begin, end):
-        if begin < self.min_time:
-            begin = self.min_time
-        if end > self.max_time:
-            end = self.max_time
-        self.selected_min_time = begin
-        self.selected_max_time = end
-        self.selectionAudioChanged.emit()
     def visible_utterances(self) -> typing.List[Utterance]:
         file_utts = []
         if not self.model().file:
@@ -841,10 +878,13 @@ class FileSelectionModel(QtCore.QItemSelectionModel):
             and not self.min_time <= self.selected_max_time <= self.max_time
         ):
             self.selected_max_time = None
+        self.view_change_timer.start()
+    def send_selection_update(self):
+        self.view_change_timer.stop()
         self.viewChanged.emit(self.min_time, self.max_time)
-    def set_current_file(self, info, force_update=False):
-        file_id, begin, end, utterance_id, speaker_id = info
+    def set_current_file(self, file_id, begin, end, utterance_id, speaker_id, force_update=False):
         try:
             new_file = self.model().file is None or self.model().file.id != file_id
         except sqlalchemy.orm.exc.DetachedInstanceError:
@@ -926,7 +966,7 @@ class CorpusSelectionModel(QtCore.QItemSelectionModel):
     channelChanged = QtCore.Signal()
     resetView = QtCore.Signal()
     fileAboutToChange = QtCore.Signal()
-    fileViewRequested = QtCore.Signal(object)
+    fileViewRequested = QtCore.Signal(object, object, object, object, object)
     selectionAudioChanged = QtCore.Signal()
     currentTimeChanged = QtCore.Signal(object)
     currentUtteranceChanged = QtCore.Signal()
@@ -947,7 +987,7 @@ class CorpusSelectionModel(QtCore.QItemSelectionModel):
         self.currentRowChanged.connect(self.switch_utterance)
         # self.selectionChanged.connect(self.update_selection_audio)
         # self.selectionChanged.connect(self.update_selection_audio)
-        self.model().newResults.connect(self.check_selection)
+        # self.model().newResults.connect(self.check_selection)
         self.model().unlockCorpus.connect(self.fileChanged.emit)
     def set_current_utterance(self, utterance_id):
@@ -1023,7 +1063,7 @@ class CorpusSelectionModel(QtCore.QItemSelectionModel):
         if focus:
             flags |= QtCore.QItemSelectionModel.SelectionFlag.Current
             if row == self.currentIndex().row():
-                self.fileViewRequested.emit(self.model().audio_info_for_utterance(row))
+                self.fileViewRequested.emit(*self.model().audio_info_for_utterance(row))
         index = self.model().index(row, 0)
         if not index.isValid():
@@ -1082,7 +1122,7 @@ class CorpusSelectionModel(QtCore.QItemSelectionModel):
             return
         self.current_utterance_id = utt
         self.currentUtteranceChanged.emit()
-        self.fileViewRequested.emit(self.model().audio_info_for_utterance(row))
+        self.fileViewRequested.emit(*self.model().audio_info_for_utterance(row))
     def model(self) -> CorpusModel:
         return super().model()
@@ -1099,7 +1139,7 @@ class CorpusSelectionModel(QtCore.QItemSelectionModel):
             return
         self.current_utterance_id = utt_id
         self.currentUtteranceChanged.emit()
-        self.fileViewRequested.emit(self.model().audio_info_for_utterance(row))
+        self.fileViewRequested.emit(*self.model().audio_info_for_utterance(row))
 class OovModel(TableModel):
@@ -1266,7 +1306,7 @@ class DictionaryTableModel(TableModel):
             return True
         return False
-    def add_word(self, word, word_id):
+    def add_word(self, word, word_id=None):
         self.requestLookup.emit(word)
         self.add_pronunciation(word, word_id)
@@ -1697,10 +1737,10 @@ class DiarizationModel(TableModel):
         super().__init__(columns, parent=parent)
         self.settings = AnchorSettings()
         self.speaker_count = None
-        self._utterance_ids = []
-        self._file_ids = []
-        self._speaker_indices = []
-        self._suggested_indices = []
+        self.utterance_ids = []
+        self.file_ids = []
+        self.speaker_indices = []
+        self.suggested_indices = []
         self.corpus_model: Optional[CorpusModel] = None
         self.set_limit(self.settings.value(self.settings.RESULTS_PER_PAGE))
         self.speaker_filter = None
@@ -1728,11 +1768,6 @@ class DiarizationModel(TableModel):
             return self._data[index.row()][index.column()]
         return super().data(index, role)
-    def utterance_id_at(self, row: int):
-        if row is None:
-            return None
-        return self._utterance_ids[row]
     def set_threshold(self, threshold: float):
         if threshold != self.threshold:
             self.current_offset = 0
@@ -1792,32 +1827,32 @@ class DiarizationModel(TableModel):
                 self.alternate_speaker_filter = current_speaker.id
     def reassign_utterance(self, row: int):
-        utterance_id = self.utterance_id_at(row)
+        utterance_id = self.utterance_ids[row]
         if utterance_id is None:
             return
-        self.changeUtteranceSpeakerRequested.emit(utterance_id, self._suggested_indices[row])
+        self.changeUtteranceSpeakerRequested.emit(utterance_id, self.suggested_indices[row])
         self.layoutAboutToBeChanged.emit()
         self._data.pop(row)
-        self._utterance_ids.pop(row)
-        self._suggested_indices.pop(row)
-        self._speaker_indices.pop(row)
+        self.utterance_ids.pop(row)
+        self.suggested_indices.pop(row)
+        self.speaker_indices.pop(row)
         self.layoutChanged.emit()
     def merge_speakers(self, row: int):
-        speaker_id = self._speaker_indices[row]
+        speaker_id = self.speaker_indices[row]
         if self.inverted:
-            utterance_id = self._utterance_ids[row]
+            utterance_id = self.utterance_ids[row]
             self.corpus_model.addCommand.emit(
                 undo.ChangeSpeakerCommand([utterance_id], speaker_id, 0, self)
             )
         else:
-            self.corpus_model.merge_speakers([self._suggested_indices[row], speaker_id])
+            self.corpus_model.merge_speakers([self.suggested_indices[row], speaker_id])
         self.layoutAboutToBeChanged.emit()
         self._data.pop(row)
-        self._utterance_ids.pop(row)
-        self._suggested_indices.pop(row)
-        self._speaker_indices.pop(row)
+        self.utterance_ids.pop(row)
+        self.suggested_indices.pop(row)
+        self.speaker_indices.pop(row)
         self.layoutChanged.emit()
@@ -1828,17 +1863,16 @@ class DiarizationModel(TableModel):
     def finish_update_data(self, result, *args, **kwargs):
         self.layoutAboutToBeChanged.emit()
         if result is None:
-            self._data, self._utterance_ids, self._suggested_indices, self._speaker_indices = (
-                [],
-                [],
-                [],
-            )
+            self._data = []
+            self.utterance_ids = []
+            self.suggested_indices = []
+            self.speaker_indices = []
         else:
             (
                 self._data,
-                self._utterance_ids,
-                self._suggested_indices,
-                self._speaker_indices,
+                self.utterance_ids,
+                self.suggested_indices,
+                self.speaker_indices,
             ) = result
         self.layoutChanged.emit()
         self.newResults.emit()

Anchor-annotator 0.3.3__py3-none-any.whl → 0.5.0__py3-none-any.whl

Anchor-annotator 0.3.3py3-none-any.whl → 0.5.0py3-none-any.whl