PyPI - psaiops - Versions diffs - 0.0.14__py3-none-any.whl → 0.0.16__py3-none-any.whl - Mend

psaiops 0.0.14py3-none-any.whl → 0.0.16py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Potentially problematic release.

This version of psaiops might be problematic. Click here for more details.

Files changed (5) hide show

psaiops/score/attention/app.py CHANGED Viewed

@@ -121,57 +121,77 @@ def create_layout(intro: str=INTRO) -> dict:
 def update_layer_range(value: float, model: str) -> dict:
     return gradio.update(maximum=35, value=min(35, int(value))) if '120b' in model else gradio.update(maximum=23, value=min(23, int(value)))
-def update_position_range(value: float, tokens: list) -> dict:
-    return gradio.update(maximum=len(tokens) - 1, value=min(len(tokens) - 1, int(value)))
+def update_position_range(value: float, tokens: float) -> dict:
+    return gradio.update(maximum=int(tokens) - 1, value=min(int(tokens) - 1, int(value)))
 def update_computation_state(
     token_num: float,
     topk_num: float,
     topp_num: float,
+    token_idx: float,
+    layer_idx: float,
+    head_idx: float,
     prompt_str: str,
     device_str: str,
     model_obj: object,
     tokenizer_obj: object,
 ) -> tuple:
     # sanitize the inputs
-    __limit = max(1, min(128, int(token_num)))
-    __topk = max(1, min(128, int(token_num)))
-    __topp = max(0.0, min(1.0, float(token_num)))
-    __prompt = prompt_str.strip()
-    __device = device_str if (device_str in ['cpu', 'cuda']) else 'cpu'
+    __token_num = max(1, min(128, int(token_num)))
+    __topk_num = max(1, min(8, int(topk_num)))
+    __topp_num = max(0.0, min(1.0, float(topp_num)))
+    __token_idx = max(-1, min(__token_num, int(token_idx)))
+    __layer_idx = max(-1, int(layer_idx))
+    __head_idx = max(-1, int(head_idx))
+    __prompt_str = prompt_str.strip()
+    __device_str = device_str if (device_str in ['cpu', 'cuda']) else 'cpu'
+    # exit if some values are missing
+    if (not __prompt_str) or (model_obj is None) or (tokenizer_obj is None):
+        return ([], [], [], torch.empty(0))
     # handle all exceptions at once
     try:
         # dictionary {'input_ids': _, 'attention_mask': _}
-        __inputs = psaiops.score.attention.lib.preprocess_token_ids(
+        __input_data = psaiops.score.attention.lib.preprocess_token_ids(
             tokenizer_obj=tokenizer_obj,
-            prompt_str=__prompt,
-            device_str=__device)
+            prompt_str=__prompt_str,
+            device_str=__device_str)
         # parse the inputs
-        __input_dim = int(__inputs['input_ids'].shape[-1])
+        __input_dim = int(__input_data['input_ids'].shape[-1])
         # tensor (1, T)
-        __outputs = psaiops.score.attention.lib.generate_token_ids(
+        __output_data = psaiops.score.attention.lib.generate_token_ids(
             model_obj=model_obj,
-            input_args=__inputs,
-            token_num=__limit,
-            topk_num=__topk,
-            topp_num=__topp)
+            input_args=__input_data,
+            token_num=__token_num,
+            topk_num=__topk_num,
+            topp_num=__topp_num)
         # tensor (L, S, H, T, T)
-        __attentions = psaiops.score.attention.lib.compute_attention_weights(
+        __attention_data = psaiops.score.attention.lib.compute_attention_weights(
             model_obj=model_obj,
-            token_obj=__outputs)
+            token_obj=__output_data)
+        # reduce the layer, sample, head and output token axes => tensor (T,)
+        __score_data = psaiops.score.attention.lib.reduce_attention_weights(
+            attention_data=__attention_data,
+            token_idx=__token_idx,
+            layer_idx=__layer_idx,
+            head_idx=__head_idx,
+            input_dim=__input_dim)
+        # translate the scores into integer labels
+        __labels = psaiops.score.attention.lib.postprocess_attention_scores(
+            attention_data=__score_data,
+            input_dim=__input_dim,
+            token_idx=__token_idx)
         # detokenize the IDs
         __tokens = psaiops.score.attention.lib.postprocess_token_ids(
             tokenizer_obj=tokenizer_obj,
-            token_obj=__outputs)
-        # update each component => (input, output, attention) states
+            token_obj=__output_data)
+        # update each component => (input, output, attention, highligh) states
         return (
-            gradio.update(value=__tokens[:__input_dim]),
-            gradio.update(value=__tokens[__input_dim:]),
-            gradio.update(value=__attentions),)
+            list(zip(__tokens, __labels)),
+            __tokens[:__input_dim],
+            __tokens[__input_dim:],
+            __attention_data,)
     except:
         raise Exception('Attention generation aborted with an error.')
-    finally:
-        return (gradio.update(), gradio.update(), gradio.update())
 def update_text_highlight(
     token_idx: float,
@@ -180,15 +200,16 @@ def update_text_highlight(
     input_data: list,
     output_data: list,
     attention_data: torch.Tensor,
-) -> dict:
+) -> list:
     # sanitize the inputs
     __input_data = input_data or []
     __output_data = output_data or []
-    __attention_data = attention_data or torch.empty(0)
+    __attention_data = torch.empty(0) if (attention_data is None) else attention_data
     __input_dim = len(__input_data)
-    __token_idx = max(0, min(__input_dim, int(token_idx)))
-    __layer_idx = max(0, int(layer_idx))
-    __head_idx = max(0, int(head_idx))
+    __output_dim = len(__output_data)
+    __token_idx = max(-1, min(__output_dim, int(token_idx)))
+    __layer_idx = max(-1, int(layer_idx))
+    __head_idx = max(-1, int(head_idx))
     # exit if the data has not yet been computed
     if (not __input_data) or (not __output_data) or (attention_data is None) or (len(attention_data) == 0):
         return gradio.update()
@@ -209,11 +230,9 @@ def update_text_highlight(
             input_dim=__input_dim,
             token_idx=__token_idx)
         # update the component with [(token, label), ...]
-        return gradio.update(value=list(zip(__tokens, __labels)))
+        return list(zip(__tokens, __labels))
     except:
         raise Exception('Attention reduction aborted with an error.')
-    finally:
-        return gradio.update()
 # APP ##########################################################################
@@ -230,32 +249,23 @@ def create_app(title: str=TITLE, intro: str=INTRO, style: str=STYLE, model: str=
         __fields.update(create_layout(intro=intro))
         # init the state
         __fields.update(create_state())
-        # fetch the relevant fields
-        __button_block, __position_block, __output_block = (__fields['process_block'], __fields['position_block'], __fields['output_block'])
-        __output_state, __attention_state = (__fields['output_state'], __fields['attention_state'])
         # wire the input fields
-        __button_block.click(
+        __fields['process_block'].click(
             fn=__compute,
-            inputs=[__fields[__k] for __k in ['tokens_block', 'topk_block', 'topp_block', 'input_block']],
-            outputs=[__fields[__k] for __k in ['input_state', 'output_state', 'attention_state']],
+            inputs=[__fields[__k] for __k in ['tokens_block', 'topk_block', 'topp_block', 'position_block', 'layer_block', 'head_block', 'input_block']],
+            outputs=[__fields[__k] for __k in ['output_block', 'input_state', 'output_state', 'attention_state']],
             queue=False,
             show_progress='full')
-        __output_state.change(
+        __fields['tokens_block'].change(
             fn=update_position_range,
-            inputs=[__position_block, __output_state],
-            outputs=__position_block,
-            queue=False,
-            show_progress='hidden')
-        __attention_state.change(
-            fn=update_text_highlight,
-            inputs=[__fields[__k] for __k in ['position_block', 'layer_block', 'head_block', 'input_state', 'output_state', 'attention_state']],
-            outputs=__output_block,
+            inputs=[__fields[__k] for __k in ['position_block', 'tokens_block']],
+            outputs=__fields['position_block'],
             queue=False,
             show_progress='hidden')
-        __position_block.change(
+        __fields['position_block'].change(
             fn=update_text_highlight,
             inputs=[__fields[__k] for __k in ['position_block', 'layer_block', 'head_block', 'input_state', 'output_state', 'attention_state']],
-            outputs=__output_block,
+            outputs=__fields['output_block'],
             queue=False,
             show_progress='hidden')
         # gradio application

psaiops/score/attention/lib.py CHANGED Viewed

@@ -119,7 +119,7 @@ def postprocess_attention_scores(
     __output_range = list(range(__output_dim - input_dim)) if (__token_idx < 0) else [__token_idx]
     __output_mask = torch.BoolTensor([__i in __output_range for __i in range(__output_dim - input_dim)])
     # normalize the scores
-    __input_scores = attention_data[__input_slice] / (attention_data[__input_slice].sum() + 1e-5)
+    __input_scores = attention_data[__input_slice] / (attention_data[__input_slice].mean() + 1e-5)
     # round to obtain integer labels from 0 to 100
     __input_scores = torch.round(100.0 * __input_scores, decimals=0).type(torch.int32)
     # the generated tokens are not scored

{psaiops-0.0.14.dist-info → psaiops-0.0.16.dist-info}/METADATA RENAMED Viewed

@@ -1,6 +1,6 @@
 Metadata-Version: 2.3
 Name: psaiops
-Version: 0.0.14
+Version: 0.0.16
 Summary: Web apps to inspect & engineer NN activations.
 License: .github/LICENSE.md
 Author: apehex

{psaiops-0.0.14.dist-info → psaiops-0.0.16.dist-info}/RECORD RENAMED Viewed

@@ -7,9 +7,9 @@ psaiops/elements/__init__.py,sha256=47DEQpj8HBSa-_TImW-5JCeuQeRkm5NMpJWZG3hSuFU,
 psaiops/elements/data.py,sha256=vGYeMN11uP9gs8rV6aSDffE_TeIX5PmdzWGwUpdGE2Y,906
 psaiops/score/__init__.py,sha256=47DEQpj8HBSa-_TImW-5JCeuQeRkm5NMpJWZG3hSuFU,0
 psaiops/score/attention/__init__.py,sha256=47DEQpj8HBSa-_TImW-5JCeuQeRkm5NMpJWZG3hSuFU,0
-psaiops/score/attention/app.py,sha256=H9z-o33Gbe8v2dEnPS5SDA7PYaR7e4K3zH_MLFm4fMw,11967
-psaiops/score/attention/lib.py,sha256=kPLdmWCYbpMnd7fi4ZeCvxiGzJuvTKYSXgRAm_w02KA,6928
+psaiops/score/attention/app.py,sha256=nmjYjbLJG5icbOLm3WTk91H-3GBQcj_8KE4DNIEIhN8,12446
+psaiops/score/attention/lib.py,sha256=vyJrp6BK2LvKfmq4JkkmvlsqE4_OcIeBmlq_YMq9jN4,6929
 psaiops/steer/__init__.py,sha256=47DEQpj8HBSa-_TImW-5JCeuQeRkm5NMpJWZG3hSuFU,0
-psaiops-0.0.14.dist-info/METADATA,sha256=hrVZ3NeNFyejjrvy3b0uylWqekHKh61gpeCfMGv_7fU,1222
-psaiops-0.0.14.dist-info/WHEEL,sha256=fGIA9gx4Qxk2KDKeNJCbOEwSrmLtjWCwzBz351GyrPQ,88
-psaiops-0.0.14.dist-info/RECORD,,
+psaiops-0.0.16.dist-info/METADATA,sha256=b91j3iHFy9G3sVCOkQo8B7xhnSBlkyw8i2G0ed6wy9s,1222
+psaiops-0.0.16.dist-info/WHEEL,sha256=fGIA9gx4Qxk2KDKeNJCbOEwSrmLtjWCwzBz351GyrPQ,88
+psaiops-0.0.16.dist-info/RECORD,,

{psaiops-0.0.14.dist-info → psaiops-0.0.16.dist-info}/WHEEL RENAMED Viewed

File without changes

psaiops 0.0.14__py3-none-any.whl → 0.0.16__py3-none-any.whl

Potentially problematic release.

psaiops 0.0.14py3-none-any.whl → 0.0.16py3-none-any.whl