PyPI - oscura - Versions diffs - 0.5.1__py3-none-any.whl → 0.7.0__py3-none-any.whl - Mend

oscura 0.5.1py3-none-any.whl → 0.7.0py3-none-any.whl

This diff represents the content of publicly available package versions that have been released to one of the supported registries. The information contained in this diff is provided for informational purposes only and reflects changes between package versions as they appear in their respective public registries.

Files changed (497) hide show

oscura/__init__.py +169 -167
oscura/analyzers/__init__.py +3 -0
oscura/analyzers/classification.py +659 -0
oscura/analyzers/digital/edges.py +325 -65
oscura/analyzers/digital/quality.py +293 -166
oscura/analyzers/digital/timing.py +260 -115
oscura/analyzers/digital/timing_numba.py +334 -0
oscura/analyzers/entropy.py +605 -0
oscura/analyzers/eye/diagram.py +176 -109
oscura/analyzers/eye/metrics.py +5 -5
oscura/analyzers/jitter/__init__.py +6 -4
oscura/analyzers/jitter/ber.py +52 -52
oscura/analyzers/jitter/classification.py +156 -0
oscura/analyzers/jitter/decomposition.py +163 -113
oscura/analyzers/jitter/spectrum.py +80 -64
oscura/analyzers/ml/__init__.py +39 -0
oscura/analyzers/ml/features.py +600 -0
oscura/analyzers/ml/signal_classifier.py +604 -0
oscura/analyzers/packet/daq.py +246 -158
oscura/analyzers/packet/parser.py +12 -1
oscura/analyzers/packet/payload.py +50 -2110
oscura/analyzers/packet/payload_analysis.py +361 -181
oscura/analyzers/packet/payload_patterns.py +133 -70
oscura/analyzers/packet/stream.py +84 -23
oscura/analyzers/patterns/__init__.py +26 -5
oscura/analyzers/patterns/anomaly_detection.py +908 -0
oscura/analyzers/patterns/clustering.py +169 -108
oscura/analyzers/patterns/clustering_optimized.py +227 -0
oscura/analyzers/patterns/discovery.py +1 -1
oscura/analyzers/patterns/matching.py +581 -197
oscura/analyzers/patterns/pattern_mining.py +778 -0
oscura/analyzers/patterns/periodic.py +121 -38
oscura/analyzers/patterns/sequences.py +175 -78
oscura/analyzers/power/conduction.py +1 -1
oscura/analyzers/power/soa.py +6 -6
oscura/analyzers/power/switching.py +250 -110
oscura/analyzers/protocol/__init__.py +17 -1
oscura/analyzers/protocols/base.py +6 -6
oscura/analyzers/protocols/ble/__init__.py +38 -0
oscura/analyzers/protocols/ble/analyzer.py +809 -0
oscura/analyzers/protocols/ble/uuids.py +288 -0
oscura/analyzers/protocols/can.py +257 -127
oscura/analyzers/protocols/can_fd.py +107 -80
oscura/analyzers/protocols/flexray.py +139 -80
oscura/analyzers/protocols/hdlc.py +93 -58
oscura/analyzers/protocols/i2c.py +247 -106
oscura/analyzers/protocols/i2s.py +138 -86
oscura/analyzers/protocols/industrial/__init__.py +40 -0
oscura/analyzers/protocols/industrial/bacnet/__init__.py +33 -0
oscura/analyzers/protocols/industrial/bacnet/analyzer.py +708 -0
oscura/analyzers/protocols/industrial/bacnet/encoding.py +412 -0
oscura/analyzers/protocols/industrial/bacnet/services.py +622 -0
oscura/analyzers/protocols/industrial/ethercat/__init__.py +30 -0
oscura/analyzers/protocols/industrial/ethercat/analyzer.py +474 -0
oscura/analyzers/protocols/industrial/ethercat/mailbox.py +339 -0
oscura/analyzers/protocols/industrial/ethercat/topology.py +166 -0
oscura/analyzers/protocols/industrial/modbus/__init__.py +31 -0
oscura/analyzers/protocols/industrial/modbus/analyzer.py +525 -0
oscura/analyzers/protocols/industrial/modbus/crc.py +79 -0
oscura/analyzers/protocols/industrial/modbus/functions.py +436 -0
oscura/analyzers/protocols/industrial/opcua/__init__.py +21 -0
oscura/analyzers/protocols/industrial/opcua/analyzer.py +552 -0
oscura/analyzers/protocols/industrial/opcua/datatypes.py +446 -0
oscura/analyzers/protocols/industrial/opcua/services.py +264 -0
oscura/analyzers/protocols/industrial/profinet/__init__.py +23 -0
oscura/analyzers/protocols/industrial/profinet/analyzer.py +441 -0
oscura/analyzers/protocols/industrial/profinet/dcp.py +263 -0
oscura/analyzers/protocols/industrial/profinet/ptcp.py +200 -0
oscura/analyzers/protocols/jtag.py +180 -98
oscura/analyzers/protocols/lin.py +219 -114
oscura/analyzers/protocols/manchester.py +4 -4
oscura/analyzers/protocols/onewire.py +253 -149
oscura/analyzers/protocols/parallel_bus/__init__.py +20 -0
oscura/analyzers/protocols/parallel_bus/centronics.py +92 -0
oscura/analyzers/protocols/parallel_bus/gpib.py +137 -0
oscura/analyzers/protocols/spi.py +192 -95
oscura/analyzers/protocols/swd.py +321 -167
oscura/analyzers/protocols/uart.py +267 -125
oscura/analyzers/protocols/usb.py +235 -131
oscura/analyzers/side_channel/power.py +17 -12
oscura/analyzers/signal/__init__.py +15 -0
oscura/analyzers/signal/timing_analysis.py +1086 -0
oscura/analyzers/signal_integrity/__init__.py +4 -1
oscura/analyzers/signal_integrity/sparams.py +2 -19
oscura/analyzers/spectral/chunked.py +129 -60
oscura/analyzers/spectral/chunked_fft.py +300 -94
oscura/analyzers/spectral/chunked_wavelet.py +100 -80
oscura/analyzers/statistical/checksum.py +376 -217
oscura/analyzers/statistical/classification.py +229 -107
oscura/analyzers/statistical/entropy.py +78 -53
oscura/analyzers/statistics/correlation.py +407 -211
oscura/analyzers/statistics/outliers.py +2 -2
oscura/analyzers/statistics/streaming.py +30 -5
oscura/analyzers/validation.py +216 -101
oscura/analyzers/waveform/measurements.py +9 -0
oscura/analyzers/waveform/measurements_with_uncertainty.py +31 -15
oscura/analyzers/waveform/spectral.py +500 -228
oscura/api/__init__.py +31 -5
oscura/api/dsl/__init__.py +582 -0
oscura/{dsl → api/dsl}/commands.py +43 -76
oscura/{dsl → api/dsl}/interpreter.py +26 -51
oscura/{dsl → api/dsl}/parser.py +107 -77
oscura/{dsl → api/dsl}/repl.py +2 -2
oscura/api/dsl.py +1 -1
oscura/{integrations → api/integrations}/__init__.py +1 -1
oscura/{integrations → api/integrations}/llm.py +201 -102
oscura/api/operators.py +3 -3
oscura/api/optimization.py +144 -30
oscura/api/rest_server.py +921 -0
oscura/api/server/__init__.py +17 -0
oscura/api/server/dashboard.py +850 -0
oscura/api/server/static/README.md +34 -0
oscura/api/server/templates/base.html +181 -0
oscura/api/server/templates/export.html +120 -0
oscura/api/server/templates/home.html +284 -0
oscura/api/server/templates/protocols.html +58 -0
oscura/api/server/templates/reports.html +43 -0
oscura/api/server/templates/session_detail.html +89 -0
oscura/api/server/templates/sessions.html +83 -0
oscura/api/server/templates/waveforms.html +73 -0
oscura/automotive/__init__.py +8 -1
oscura/automotive/can/__init__.py +10 -0
oscura/automotive/can/checksum.py +3 -1
oscura/automotive/can/dbc_generator.py +590 -0
oscura/automotive/can/message_wrapper.py +121 -74
oscura/automotive/can/patterns.py +98 -21
oscura/automotive/can/session.py +292 -56
oscura/automotive/can/state_machine.py +6 -3
oscura/automotive/can/stimulus_response.py +97 -75
oscura/automotive/dbc/__init__.py +10 -2
oscura/automotive/dbc/generator.py +84 -56
oscura/automotive/dbc/parser.py +6 -6
oscura/automotive/dtc/data.json +17 -102
oscura/automotive/dtc/database.py +2 -2
oscura/automotive/flexray/__init__.py +31 -0
oscura/automotive/flexray/analyzer.py +504 -0
oscura/automotive/flexray/crc.py +185 -0
oscura/automotive/flexray/fibex.py +449 -0
oscura/automotive/j1939/__init__.py +45 -8
oscura/automotive/j1939/analyzer.py +605 -0
oscura/automotive/j1939/spns.py +326 -0
oscura/automotive/j1939/transport.py +306 -0
oscura/automotive/lin/__init__.py +47 -0
oscura/automotive/lin/analyzer.py +612 -0
oscura/automotive/loaders/blf.py +13 -2
oscura/automotive/loaders/csv_can.py +143 -72
oscura/automotive/loaders/dispatcher.py +50 -2
oscura/automotive/loaders/mdf.py +86 -45
oscura/automotive/loaders/pcap.py +111 -61
oscura/automotive/uds/__init__.py +4 -0
oscura/automotive/uds/analyzer.py +725 -0
oscura/automotive/uds/decoder.py +140 -58
oscura/automotive/uds/models.py +7 -1
oscura/automotive/visualization.py +1 -1
oscura/cli/analyze.py +348 -0
oscura/cli/batch.py +142 -122
oscura/cli/benchmark.py +275 -0
oscura/cli/characterize.py +137 -82
oscura/cli/compare.py +224 -131
oscura/cli/completion.py +250 -0
oscura/cli/config_cmd.py +361 -0
oscura/cli/decode.py +164 -87
oscura/cli/export.py +286 -0
oscura/cli/main.py +115 -31
oscura/{onboarding → cli/onboarding}/__init__.py +3 -3
oscura/{onboarding → cli/onboarding}/help.py +80 -58
oscura/{onboarding → cli/onboarding}/tutorials.py +97 -72
oscura/{onboarding → cli/onboarding}/wizard.py +55 -36
oscura/cli/progress.py +147 -0
oscura/cli/shell.py +157 -135
oscura/cli/validate_cmd.py +204 -0
oscura/cli/visualize.py +158 -0
oscura/convenience.py +125 -79
oscura/core/__init__.py +4 -2
oscura/core/backend_selector.py +3 -3
oscura/core/cache.py +126 -15
oscura/core/cancellation.py +1 -1
oscura/{config → core/config}/__init__.py +20 -11
oscura/{config → core/config}/defaults.py +1 -1
oscura/{config → core/config}/loader.py +7 -5
oscura/{config → core/config}/memory.py +5 -5
oscura/{config → core/config}/migration.py +1 -1
oscura/{config → core/config}/pipeline.py +99 -23
oscura/{config → core/config}/preferences.py +1 -1
oscura/{config → core/config}/protocol.py +3 -3
oscura/{config → core/config}/schema.py +426 -272
oscura/{config → core/config}/settings.py +1 -1
oscura/{config → core/config}/thresholds.py +195 -153
oscura/core/correlation.py +5 -6
oscura/core/cross_domain.py +0 -2
oscura/core/debug.py +9 -5
oscura/{extensibility → core/extensibility}/docs.py +158 -70
oscura/{extensibility → core/extensibility}/extensions.py +160 -76
oscura/{extensibility → core/extensibility}/logging.py +1 -1
oscura/{extensibility → core/extensibility}/measurements.py +1 -1
oscura/{extensibility → core/extensibility}/plugins.py +1 -1
oscura/{extensibility → core/extensibility}/templates.py +73 -3
oscura/{extensibility → core/extensibility}/validation.py +1 -1
oscura/core/gpu_backend.py +11 -7
oscura/core/log_query.py +101 -11
oscura/core/logging.py +126 -54
oscura/core/logging_advanced.py +5 -5
oscura/core/memory_limits.py +108 -70
oscura/core/memory_monitor.py +2 -2
oscura/core/memory_progress.py +7 -7
oscura/core/memory_warnings.py +1 -1
oscura/core/numba_backend.py +13 -13
oscura/{plugins → core/plugins}/__init__.py +9 -9
oscura/{plugins → core/plugins}/base.py +7 -7
oscura/{plugins → core/plugins}/cli.py +3 -3
oscura/{plugins → core/plugins}/discovery.py +186 -106
oscura/{plugins → core/plugins}/lifecycle.py +1 -1
oscura/{plugins → core/plugins}/manager.py +7 -7
oscura/{plugins → core/plugins}/registry.py +3 -3
oscura/{plugins → core/plugins}/versioning.py +1 -1
oscura/core/progress.py +16 -1
oscura/core/provenance.py +8 -2
oscura/{schemas → core/schemas}/__init__.py +2 -2
oscura/{schemas → core/schemas}/device_mapping.json +2 -8
oscura/{schemas → core/schemas}/packet_format.json +4 -24
oscura/{schemas → core/schemas}/protocol_definition.json +2 -12
oscura/core/types.py +4 -0
oscura/core/uncertainty.py +3 -3
oscura/correlation/__init__.py +52 -0
oscura/correlation/multi_protocol.py +811 -0
oscura/discovery/auto_decoder.py +117 -35
oscura/discovery/comparison.py +191 -86
oscura/discovery/quality_validator.py +155 -68
oscura/discovery/signal_detector.py +196 -79
oscura/export/__init__.py +18 -8
oscura/export/kaitai_struct.py +513 -0
oscura/export/scapy_layer.py +801 -0
oscura/export/wireshark/generator.py +1 -1
oscura/export/wireshark/templates/dissector.lua.j2 +2 -2
oscura/export/wireshark_dissector.py +746 -0
oscura/guidance/wizard.py +207 -111
oscura/hardware/__init__.py +19 -0
oscura/{acquisition → hardware/acquisition}/__init__.py +4 -4
oscura/{acquisition → hardware/acquisition}/file.py +2 -2
oscura/{acquisition → hardware/acquisition}/hardware.py +7 -7
oscura/{acquisition → hardware/acquisition}/saleae.py +15 -12
oscura/{acquisition → hardware/acquisition}/socketcan.py +1 -1
oscura/{acquisition → hardware/acquisition}/streaming.py +2 -2
oscura/{acquisition → hardware/acquisition}/synthetic.py +3 -3
oscura/{acquisition → hardware/acquisition}/visa.py +33 -11
oscura/hardware/firmware/__init__.py +29 -0
oscura/hardware/firmware/pattern_recognition.py +874 -0
oscura/hardware/hal_detector.py +736 -0
oscura/hardware/security/__init__.py +37 -0
oscura/hardware/security/side_channel_detector.py +1126 -0
oscura/inference/__init__.py +4 -0
oscura/inference/active_learning/observation_table.py +4 -1
oscura/inference/alignment.py +216 -123
oscura/inference/bayesian.py +113 -33
oscura/inference/crc_reverse.py +101 -55
oscura/inference/logic.py +6 -2
oscura/inference/message_format.py +342 -183
oscura/inference/protocol.py +95 -44
oscura/inference/protocol_dsl.py +180 -82
oscura/inference/signal_intelligence.py +1439 -706
oscura/inference/spectral.py +99 -57
oscura/inference/state_machine.py +810 -158
oscura/inference/stream.py +270 -110
oscura/iot/__init__.py +34 -0
oscura/iot/coap/__init__.py +32 -0
oscura/iot/coap/analyzer.py +668 -0
oscura/iot/coap/options.py +212 -0
oscura/iot/lorawan/__init__.py +21 -0
oscura/iot/lorawan/crypto.py +206 -0
oscura/iot/lorawan/decoder.py +801 -0
oscura/iot/lorawan/mac_commands.py +341 -0
oscura/iot/mqtt/__init__.py +27 -0
oscura/iot/mqtt/analyzer.py +999 -0
oscura/iot/mqtt/properties.py +315 -0
oscura/iot/zigbee/__init__.py +31 -0
oscura/iot/zigbee/analyzer.py +615 -0
oscura/iot/zigbee/security.py +153 -0
oscura/iot/zigbee/zcl.py +349 -0
oscura/jupyter/display.py +125 -45
oscura/{exploratory → jupyter/exploratory}/__init__.py +8 -8
oscura/{exploratory → jupyter/exploratory}/error_recovery.py +298 -141
oscura/jupyter/exploratory/fuzzy.py +746 -0
oscura/{exploratory → jupyter/exploratory}/fuzzy_advanced.py +258 -100
oscura/{exploratory → jupyter/exploratory}/legacy.py +464 -242
oscura/{exploratory → jupyter/exploratory}/parse.py +167 -145
oscura/{exploratory → jupyter/exploratory}/recovery.py +119 -87
oscura/jupyter/exploratory/sync.py +612 -0
oscura/{exploratory → jupyter/exploratory}/unknown.py +299 -176
oscura/jupyter/magic.py +4 -4
oscura/{ui → jupyter/ui}/__init__.py +2 -2
oscura/{ui → jupyter/ui}/formatters.py +3 -3
oscura/{ui → jupyter/ui}/progressive_display.py +153 -82
oscura/loaders/__init__.py +183 -67
oscura/loaders/binary.py +88 -1
oscura/loaders/chipwhisperer.py +153 -137
oscura/loaders/configurable.py +208 -86
oscura/loaders/csv_loader.py +458 -215
oscura/loaders/hdf5_loader.py +278 -119
oscura/loaders/lazy.py +87 -54
oscura/loaders/mmap_loader.py +1 -1
oscura/loaders/numpy_loader.py +253 -116
oscura/loaders/pcap.py +226 -151
oscura/loaders/rigol.py +110 -49
oscura/loaders/sigrok.py +201 -78
oscura/loaders/tdms.py +81 -58
oscura/loaders/tektronix.py +291 -174
oscura/loaders/touchstone.py +182 -87
oscura/loaders/tss.py +456 -0
oscura/loaders/vcd.py +215 -117
oscura/loaders/wav.py +155 -68
oscura/reporting/__init__.py +9 -0
oscura/reporting/analyze.py +352 -146
oscura/reporting/argument_preparer.py +69 -14
oscura/reporting/auto_report.py +97 -61
oscura/reporting/batch.py +131 -58
oscura/reporting/chart_selection.py +57 -45
oscura/reporting/comparison.py +63 -17
oscura/reporting/content/executive.py +76 -24
oscura/reporting/core_formats/multi_format.py +11 -8
oscura/reporting/engine.py +312 -158
oscura/reporting/enhanced_reports.py +949 -0
oscura/reporting/export.py +86 -43
oscura/reporting/formatting/numbers.py +69 -42
oscura/reporting/html.py +139 -58
oscura/reporting/index.py +137 -65
oscura/reporting/output.py +158 -67
oscura/reporting/pdf.py +67 -102
oscura/reporting/plots.py +191 -112
oscura/reporting/sections.py +88 -47
oscura/reporting/standards.py +104 -61
oscura/reporting/summary_generator.py +75 -55
oscura/reporting/tables.py +138 -54
oscura/reporting/templates/enhanced/protocol_re.html +525 -0
oscura/sessions/__init__.py +14 -23
oscura/sessions/base.py +3 -3
oscura/sessions/blackbox.py +106 -10
oscura/sessions/generic.py +2 -2
oscura/sessions/legacy.py +783 -0
oscura/side_channel/__init__.py +63 -0
oscura/side_channel/dpa.py +1025 -0
oscura/utils/__init__.py +15 -1
oscura/utils/bitwise.py +118 -0
oscura/{builders → utils/builders}/__init__.py +1 -1
oscura/{comparison → utils/comparison}/__init__.py +6 -6
oscura/{comparison → utils/comparison}/compare.py +202 -101
oscura/{comparison → utils/comparison}/golden.py +83 -63
oscura/{comparison → utils/comparison}/limits.py +313 -89
oscura/{comparison → utils/comparison}/mask.py +151 -45
oscura/{comparison → utils/comparison}/trace_diff.py +1 -1
oscura/{comparison → utils/comparison}/visualization.py +147 -89
oscura/{component → utils/component}/__init__.py +3 -3
oscura/{component → utils/component}/impedance.py +122 -58
oscura/{component → utils/component}/reactive.py +165 -168
oscura/{component → utils/component}/transmission_line.py +3 -3
oscura/{filtering → utils/filtering}/__init__.py +6 -6
oscura/{filtering → utils/filtering}/base.py +1 -1
oscura/{filtering → utils/filtering}/convenience.py +2 -2
oscura/{filtering → utils/filtering}/design.py +169 -93
oscura/{filtering → utils/filtering}/filters.py +2 -2
oscura/{filtering → utils/filtering}/introspection.py +2 -2
oscura/utils/geometry.py +31 -0
oscura/utils/imports.py +184 -0
oscura/utils/lazy.py +1 -1
oscura/{math → utils/math}/__init__.py +2 -2
oscura/{math → utils/math}/arithmetic.py +114 -48
oscura/{math → utils/math}/interpolation.py +139 -106
oscura/utils/memory.py +129 -66
oscura/utils/memory_advanced.py +92 -9
oscura/utils/memory_extensions.py +10 -8
oscura/{optimization → utils/optimization}/__init__.py +1 -1
oscura/{optimization → utils/optimization}/search.py +2 -2
oscura/utils/performance/__init__.py +58 -0
oscura/utils/performance/caching.py +889 -0
oscura/utils/performance/lsh_clustering.py +333 -0
oscura/utils/performance/memory_optimizer.py +699 -0
oscura/utils/performance/optimizations.py +675 -0
oscura/utils/performance/parallel.py +654 -0
oscura/utils/performance/profiling.py +661 -0
oscura/{pipeline → utils/pipeline}/base.py +1 -1
oscura/{pipeline → utils/pipeline}/composition.py +1 -1
oscura/{pipeline → utils/pipeline}/parallel.py +3 -2
oscura/{pipeline → utils/pipeline}/pipeline.py +1 -1
oscura/{pipeline → utils/pipeline}/reverse_engineering.py +412 -221
oscura/{search → utils/search}/__init__.py +3 -3
oscura/{search → utils/search}/anomaly.py +188 -58
oscura/utils/search/context.py +294 -0
oscura/{search → utils/search}/pattern.py +138 -10
oscura/utils/serial.py +51 -0
oscura/utils/storage/__init__.py +61 -0
oscura/utils/storage/database.py +1166 -0
oscura/{streaming → utils/streaming}/chunked.py +302 -143
oscura/{streaming → utils/streaming}/progressive.py +1 -1
oscura/{streaming → utils/streaming}/realtime.py +3 -2
oscura/{triggering → utils/triggering}/__init__.py +6 -6
oscura/{triggering → utils/triggering}/base.py +6 -6
oscura/{triggering → utils/triggering}/edge.py +2 -2
oscura/{triggering → utils/triggering}/pattern.py +2 -2
oscura/{triggering → utils/triggering}/pulse.py +115 -74
oscura/{triggering → utils/triggering}/window.py +2 -2
oscura/utils/validation.py +32 -0
oscura/validation/__init__.py +121 -0
oscura/{compliance → validation/compliance}/__init__.py +5 -5
oscura/{compliance → validation/compliance}/advanced.py +5 -5
oscura/{compliance → validation/compliance}/masks.py +1 -1
oscura/{compliance → validation/compliance}/reporting.py +127 -53
oscura/{compliance → validation/compliance}/testing.py +114 -52
oscura/validation/compliance_tests.py +915 -0
oscura/validation/fuzzer.py +990 -0
oscura/validation/grammar_tests.py +596 -0
oscura/validation/grammar_validator.py +904 -0
oscura/validation/hil_testing.py +977 -0
oscura/{quality → validation/quality}/__init__.py +4 -4
oscura/{quality → validation/quality}/ensemble.py +251 -171
oscura/{quality → validation/quality}/explainer.py +3 -3
oscura/{quality → validation/quality}/scoring.py +1 -1
oscura/{quality → validation/quality}/warnings.py +4 -4
oscura/validation/regression_suite.py +808 -0
oscura/validation/replay.py +788 -0
oscura/{testing → validation/testing}/__init__.py +2 -2
oscura/{testing → validation/testing}/synthetic.py +5 -5
oscura/visualization/__init__.py +9 -0
oscura/visualization/accessibility.py +1 -1
oscura/visualization/annotations.py +64 -67
oscura/visualization/colors.py +7 -7
oscura/visualization/digital.py +180 -81
oscura/visualization/eye.py +236 -85
oscura/visualization/interactive.py +320 -143
oscura/visualization/jitter.py +587 -247
oscura/visualization/layout.py +169 -134
oscura/visualization/optimization.py +103 -52
oscura/visualization/palettes.py +1 -1
oscura/visualization/power.py +427 -211
oscura/visualization/power_extended.py +626 -297
oscura/visualization/presets.py +2 -0
oscura/visualization/protocols.py +495 -181
oscura/visualization/render.py +79 -63
oscura/visualization/reverse_engineering.py +171 -124
oscura/visualization/signal_integrity.py +460 -279
oscura/visualization/specialized.py +190 -100
oscura/visualization/spectral.py +670 -255
oscura/visualization/thumbnails.py +166 -137
oscura/visualization/waveform.py +150 -63
oscura/workflows/__init__.py +3 -0
oscura/{batch → workflows/batch}/__init__.py +5 -5
oscura/{batch → workflows/batch}/advanced.py +150 -75
oscura/workflows/batch/aggregate.py +531 -0
oscura/workflows/batch/analyze.py +236 -0
oscura/{batch → workflows/batch}/logging.py +2 -2
oscura/{batch → workflows/batch}/metrics.py +1 -1
oscura/workflows/complete_re.py +1144 -0
oscura/workflows/compliance.py +44 -54
oscura/workflows/digital.py +197 -51
oscura/workflows/legacy/__init__.py +12 -0
oscura/{workflow → workflows/legacy}/dag.py +4 -1
oscura/workflows/multi_trace.py +9 -9
oscura/workflows/power.py +42 -62
oscura/workflows/protocol.py +82 -49
oscura/workflows/reverse_engineering.py +351 -150
oscura/workflows/signal_integrity.py +157 -82
oscura-0.7.0.dist-info/METADATA +661 -0
oscura-0.7.0.dist-info/RECORD +591 -0
oscura/batch/aggregate.py +0 -300
oscura/batch/analyze.py +0 -139
oscura/dsl/__init__.py +0 -73
oscura/exceptions.py +0 -59
oscura/exploratory/fuzzy.py +0 -513
oscura/exploratory/sync.py +0 -384
oscura/exporters/__init__.py +0 -94
oscura/exporters/csv.py +0 -303
oscura/exporters/exporters.py +0 -44
oscura/exporters/hdf5.py +0 -217
oscura/exporters/html_export.py +0 -701
oscura/exporters/json_export.py +0 -291
oscura/exporters/markdown_export.py +0 -367
oscura/exporters/matlab_export.py +0 -354
oscura/exporters/npz_export.py +0 -219
oscura/exporters/spice_export.py +0 -210
oscura/search/context.py +0 -149
oscura/session/__init__.py +0 -34
oscura/session/annotations.py +0 -289
oscura/session/history.py +0 -313
oscura/session/session.py +0 -520
oscura/workflow/__init__.py +0 -13
oscura-0.5.1.dist-info/METADATA +0 -583
oscura-0.5.1.dist-info/RECORD +0 -481
/oscura/core/{config.py → config/legacy.py} +0 -0
/oscura/{extensibility → core/extensibility}/__init__.py +0 -0
/oscura/{extensibility → core/extensibility}/registry.py +0 -0
/oscura/{plugins → core/plugins}/isolation.py +0 -0
/oscura/{schemas → core/schemas}/bus_configuration.json +0 -0
/oscura/{builders → utils/builders}/signal_builder.py +0 -0
/oscura/{optimization → utils/optimization}/parallel.py +0 -0
/oscura/{pipeline → utils/pipeline}/__init__.py +0 -0
/oscura/{streaming → utils/streaming}/__init__.py +0 -0
{oscura-0.5.1.dist-info → oscura-0.7.0.dist-info}/WHEEL +0 -0
{oscura-0.5.1.dist-info → oscura-0.7.0.dist-info}/entry_points.txt +0 -0
{oscura-0.5.1.dist-info → oscura-0.7.0.dist-info}/licenses/LICENSE +0 -0

oscura/analyzers/packet/payload_analysis.py CHANGED Viewed

@@ -469,17 +469,9 @@ class FieldInferrer:
         """
         size = end - start
         name = f"field_{index}"
+        raw_values = self._extract_field_values(messages, start, end)
-        # Extract field values
-        values = []
-        raw_values = []
-        for msg in messages:
-            if len(msg) >= end:
-                field_bytes = msg[start:end]
-                raw_values.append(field_bytes)
-                values.append(field_bytes)
-        if not values:
+        if not raw_values:
             return InferredField(
                 name=name,
                 offset=start,
@@ -488,31 +480,60 @@ class FieldInferrer:
                 confidence=0.0,
             )
-        # Check if constant
+        # Analyze field properties
         unique_values = set(raw_values)
         is_constant = len(unique_values) == 1
+        is_sequence = self._check_sequence(raw_values, size, is_constant)
+        is_checksum = self._check_checksum(messages, start, size)
-        # Check if sequence
-        is_sequence = False
-        if not is_constant and size in [1, 2, 4, 8]:
-            int_values = [int.from_bytes(v, "big") for v in raw_values]
-            is_sequence = self._is_sequence(int_values)
+        # Infer type and create sample values
+        inferred_type, endianness, confidence = self._infer_type(raw_values, size)
+        sample_values = self._create_sample_values(raw_values[:5], inferred_type, endianness)
-        # Check for checksum patterns
-        is_checksum = False
-        if start >= min(len(m) for m in messages) - 4:
-            score = self._check_checksum_correlation(messages, start, size)
-            is_checksum = score > 0.7
+        # Cast to Literal types for type checker
+        type_literal = self._cast_type_literal(inferred_type)
+        endianness_literal = self._cast_endianness_literal(endianness)
-        # Infer type
-        inferred_type, endianness, confidence = self._infer_type(raw_values, size)
+        return InferredField(
+            name=name,
+            offset=start,
+            size=size,
+            inferred_type=type_literal,
+            endianness=endianness_literal,
+            is_constant=is_constant,
+            is_sequence=is_sequence,
+            is_checksum=is_checksum,
+            constant_value=raw_values[0] if is_constant else None,
+            confidence=confidence,
+            sample_values=sample_values,
+        )
+    def _extract_field_values(self, messages: Sequence[bytes], start: int, end: int) -> list[bytes]:
+        """Extract field values from messages."""
+        return [msg[start:end] for msg in messages if len(msg) >= end]
+    def _check_sequence(self, raw_values: list[bytes], size: int, is_constant: bool) -> bool:
+        """Check if field values form a sequence."""
+        if is_constant or size not in [1, 2, 4, 8]:
+            return False
+        int_values = [int.from_bytes(v, "big") for v in raw_values]
+        return self._is_sequence(int_values)
-        # Sample values for debugging
+    def _check_checksum(self, messages: Sequence[bytes], start: int, size: int) -> bool:
+        """Check if field appears to be a checksum."""
+        if start < min(len(m) for m in messages) - 4:
+            return False
+        score = self._check_checksum_correlation(messages, start, size)
+        return score > 0.7
+    def _create_sample_values(
+        self, raw_values: list[bytes], inferred_type: str, endianness: str
+    ) -> list[int | str]:
+        """Create sample values for debugging."""
         sample_values: list[int | str] = []
-        for v in raw_values[:5]:
-            if inferred_type.startswith("uint") or inferred_type.startswith("int"):
+        for v in raw_values:
+            if inferred_type.startswith(("uint", "int")):
                 try:
-                    # Cast endianness to Literal type for type checker
                     byte_order: Literal["big", "little"] = (
                         "big" if endianness == "n/a" else endianness  # type: ignore[assignment]
                     )
@@ -526,38 +547,31 @@ class FieldInferrer:
                     sample_values.append(v.hex())
             else:
                 sample_values.append(v.hex())
+        return sample_values
-        # Cast to Literal types for type checker
-        inferred_type_literal: Literal[
-            "uint8",
-            "uint16",
-            "uint32",
-            "uint64",
-            "int8",
-            "int16",
-            "int32",
-            "int64",
-            "float32",
-            "float64",
-            "bytes",
-            "string",
-            "unknown",
-        ] = inferred_type  # type: ignore[assignment]
-        endianness_literal: Literal["big", "little", "n/a"] = endianness  # type: ignore[assignment]
+    def _cast_type_literal(
+        self, inferred_type: str
+    ) -> Literal[
+        "uint8",
+        "uint16",
+        "uint32",
+        "uint64",
+        "int8",
+        "int16",
+        "int32",
+        "int64",
+        "float32",
+        "float64",
+        "bytes",
+        "string",
+        "unknown",
+    ]:
+        """Cast inferred type to Literal for type checker."""
+        return inferred_type  # type: ignore[return-value]
-        return InferredField(
-            name=name,
-            offset=start,
-            size=size,
-            inferred_type=inferred_type_literal,
-            endianness=endianness_literal,
-            is_constant=is_constant,
-            is_sequence=is_sequence,
-            is_checksum=is_checksum,
-            constant_value=raw_values[0] if is_constant else None,
-            confidence=confidence,
-            sample_values=sample_values,
-        )
+    def _cast_endianness_literal(self, endianness: str) -> Literal["big", "little", "n/a"]:
+        """Cast endianness to Literal for type checker."""
+        return endianness  # type: ignore[return-value]
     def _infer_type(
         self,
@@ -576,59 +590,114 @@ class FieldInferrer:
         if not values:
             return "unknown", "n/a", 0.0
-        # Check for string (high printable ratio)
+        # Check for string first
+        string_result = self._check_string_type(values, size)
+        if string_result is not None:
+            return string_result
+        # Infer based on field size
+        if size == 1:
+            return "uint8", "n/a", 0.9
+        elif size == 2:
+            return self._infer_uint16_type(values)
+        elif size == 4:
+            return self._infer_4byte_type(values)
+        elif size == 8:
+            return self._infer_uint64_type(values)
+        else:
+            return "bytes", "n/a", 0.6
+    def _check_string_type(self, values: list[bytes], size: int) -> tuple[str, str, float] | None:
+        """Check if values represent string data.
+        Args:
+            values: Field values to check.
+            size: Field size.
+        Returns:
+            Type tuple if string, None otherwise.
+        """
         printable_ratio = sum(
             1 for v in values for b in v if 32 <= b <= 126 or b in (9, 10, 13)
         ) / (len(values) * size)
         if printable_ratio > 0.8:
             return "string", "n/a", printable_ratio
+        return None
-        # Check for standard integer sizes
-        if size == 1:
-            return "uint8", "n/a", 0.9
+    def _infer_uint16_type(self, values: list[bytes]) -> tuple[str, str, float]:
+        """Infer uint16 type and detect endianness.
-        elif size == 2:
-            # Try to detect endianness
-            be_variance = np.var([int.from_bytes(v, "big") for v in values])
-            le_variance = np.var([int.from_bytes(v, "little") for v in values])
+        Args:
+            values: Field values.
-            if be_variance < le_variance:
-                endian = "big"
-            else:
-                endian = "little"
+        Returns:
+            Type tuple with endianness.
+        """
+        endian = self._detect_endianness(values)
+        return "uint16", endian, 0.8
-            return "uint16", endian, 0.8
+    def _infer_4byte_type(self, values: list[bytes]) -> tuple[str, str, float]:
+        """Infer 4-byte type (float32 or uint32).
-        elif size == 4:
-            # Check for float
-            float_valid = 0
-            for v in values:
-                try:
-                    f = struct.unpack(">f", v)[0]
-                    if not (np.isnan(f) or np.isinf(f)) and -1e10 < f < 1e10:
-                        float_valid += 1
-                except Exception:
-                    pass
+        Args:
+            values: Field values.
-            if float_valid / len(values) > 0.8:
-                return "float32", "big", 0.7
+        Returns:
+            Type tuple with endianness.
+        """
+        # Check if float32
+        if self._is_valid_float32(values):
+            return "float32", "big", 0.7
-            # Otherwise integer
-            be_variance = np.var([int.from_bytes(v, "big") for v in values])
-            le_variance = np.var([int.from_bytes(v, "little") for v in values])
-            endian = "big" if be_variance < le_variance else "little"
-            return "uint32", endian, 0.8
+        # Otherwise uint32
+        endian = self._detect_endianness(values)
+        return "uint32", endian, 0.8
-        elif size == 8:
-            # Check for float64 or uint64
-            be_variance = np.var([int.from_bytes(v, "big") for v in values])
-            le_variance = np.var([int.from_bytes(v, "little") for v in values])
-            endian = "big" if be_variance < le_variance else "little"
-            return "uint64", endian, 0.7
+    def _infer_uint64_type(self, values: list[bytes]) -> tuple[str, str, float]:
+        """Infer uint64 type and detect endianness.
-        else:
-            return "bytes", "n/a", 0.6
+        Args:
+            values: Field values.
+        Returns:
+            Type tuple with endianness.
+        """
+        endian = self._detect_endianness(values)
+        return "uint64", endian, 0.7
+    def _detect_endianness(self, values: list[bytes]) -> str:
+        """Detect endianness by comparing variance.
+        Args:
+            values: Field values.
+        Returns:
+            Endianness string ("big" or "little").
+        """
+        be_variance = np.var([int.from_bytes(v, "big") for v in values])
+        le_variance = np.var([int.from_bytes(v, "little") for v in values])
+        return "big" if be_variance < le_variance else "little"
+    def _is_valid_float32(self, values: list[bytes]) -> bool:
+        """Check if values are valid float32 numbers.
+        Args:
+            values: Field values to check.
+        Returns:
+            True if majority are valid floats.
+        """
+        float_valid = 0
+        for v in values:
+            try:
+                f = struct.unpack(">f", v)[0]
+                if not (np.isnan(f) or np.isinf(f)) and -1e10 < f < 1e10:
+                    float_valid += 1
+            except Exception:
+                pass
+        return float_valid / len(values) > 0.8
     def _is_sequence(self, values: list[int]) -> bool:
         """Check if values form a sequence.
@@ -827,30 +896,82 @@ def diff_payloads(payload_a: bytes, payload_b: bytes) -> PayloadDiff:
         >>> print(f"Common prefix: {diff.common_prefix_length} bytes")
         >>> print(f"Different bytes: {len(diff.differences)}")
     """
-    # Find common prefix
-    common_prefix = 0
     min_len = min(len(payload_a), len(payload_b))
+    common_prefix = _find_common_prefix(payload_a, payload_b, min_len)
+    common_suffix = _find_common_suffix(payload_a, payload_b, min_len, common_prefix)
+    differences = _find_payload_differences(payload_a, payload_b, min_len)
+    similarity = _calculate_similarity(payload_a, payload_b, min_len, differences)
+    edit_distance = _levenshtein_distance(payload_a, payload_b)
+    return PayloadDiff(
+        common_prefix_length=common_prefix,
+        common_suffix_length=common_suffix,
+        differences=differences,
+        similarity=similarity,
+        edit_distance=edit_distance,
+    )
+def _find_common_prefix(payload_a: bytes, payload_b: bytes, min_len: int) -> int:
+    """Find length of common prefix.
+    Args:
+        payload_a: First payload.
+        payload_b: Second payload.
+        min_len: Minimum payload length.
+    Returns:
+        Length of common prefix in bytes.
+    """
     for i in range(min_len):
-        if payload_a[i] == payload_b[i]:
-            common_prefix += 1
-        else:
-            break
+        if payload_a[i] != payload_b[i]:
+            return i
+    return min_len
-    # Find common suffix
-    common_suffix = 0
+def _find_common_suffix(
+    payload_a: bytes, payload_b: bytes, min_len: int, common_prefix: int
+) -> int:
+    """Find length of common suffix.
+    Args:
+        payload_a: First payload.
+        payload_b: Second payload.
+        min_len: Minimum payload length.
+        common_prefix: Length of common prefix.
+    Returns:
+        Length of common suffix in bytes.
+    """
     for i in range(1, min_len - common_prefix + 1):
-        if payload_a[-i] == payload_b[-i]:
-            common_suffix += 1
-        else:
-            break
+        if payload_a[-i] != payload_b[-i]:
+            return i - 1
+    return min_len - common_prefix
+def _find_payload_differences(
+    payload_a: bytes, payload_b: bytes, min_len: int
+) -> list[tuple[int, int, int]]:
+    """Find all byte differences between payloads.
+    Args:
+        payload_a: First payload.
+        payload_b: Second payload.
+        min_len: Minimum payload length.
-    # Find all differences
+    Returns:
+        List of (offset, byte_a, byte_b) tuples (-1 for missing bytes).
+    """
     differences = []
+    # Differences in overlapping region
     for i in range(min_len):
         if payload_a[i] != payload_b[i]:
             differences.append((i, payload_a[i], payload_b[i]))
-    # Add length differences
+    # Length differences
     if len(payload_a) > len(payload_b):
         for i in range(len(payload_b), len(payload_a)):
             differences.append((i, payload_a[i], -1))
@@ -858,24 +979,29 @@ def diff_payloads(payload_a: bytes, payload_b: bytes) -> PayloadDiff:
         for i in range(len(payload_a), len(payload_b)):
             differences.append((i, -1, payload_b[i]))
-    # Calculate similarity
+    return differences
+def _calculate_similarity(
+    payload_a: bytes, payload_b: bytes, min_len: int, differences: list[tuple[int, int, int]]
+) -> float:
+    """Calculate payload similarity ratio.
+    Args:
+        payload_a: First payload.
+        payload_b: Second payload.
+        min_len: Minimum payload length.
+        differences: List of differences.
+    Returns:
+        Similarity ratio (0.0-1.0).
+    """
     max_len = max(len(payload_a), len(payload_b))
     if max_len == 0:
-        similarity = 1.0
-    else:
-        matching = min_len - len([d for d in differences if d[0] < min_len])
-        similarity = matching / max_len
+        return 1.0
-    # Calculate edit distance (simplified Levenshtein)
-    edit_distance = _levenshtein_distance(payload_a, payload_b)
-    return PayloadDiff(
-        common_prefix_length=common_prefix,
-        common_suffix_length=common_suffix,
-        differences=differences,
-        similarity=similarity,
-        edit_distance=edit_distance,
-    )
+    matching = min_len - len([d for d in differences if d[0] < min_len])
+    return matching / max_len
 def find_common_bytes(payloads: Sequence[bytes]) -> bytes:
@@ -1008,7 +1134,7 @@ def compute_similarity(
 def cluster_payloads(
     payloads: Sequence[bytes],
     threshold: float = 0.8,
-    algorithm: Literal["greedy", "dbscan"] = "greedy",
+    algorithm: Literal["greedy", "dbscan", "lsh"] = "greedy",
 ) -> list[PayloadCluster]:
     """Cluster similar payloads together.
@@ -1017,7 +1143,7 @@ def cluster_payloads(
     Args:
         payloads: List of payloads to cluster.
         threshold: Similarity threshold for clustering.
-        algorithm: Clustering algorithm.
+        algorithm: Clustering algorithm (greedy: O(n²), lsh: O(n log n)).
     Returns:
         List of PayloadCluster objects.
@@ -1026,11 +1152,19 @@ def cluster_payloads(
         >>> clusters = cluster_payloads(payloads, threshold=0.85)
         >>> for c in clusters:
         ...     print(f"Cluster {c.cluster_id}: {c.size} payloads")
+        >>> # For large datasets (>1000 payloads), use LSH for 100-1000x speedup
+        >>> clusters = cluster_payloads(payloads, threshold=0.85, algorithm="lsh")
     """
     if not payloads:
         return []
-    if algorithm == "greedy":
+    if algorithm == "lsh":
+        # Use LSH for O(n log n) performance on large datasets
+        from oscura.utils.performance.lsh_clustering import cluster_payloads_lsh
+        return cluster_payloads_lsh(payloads, threshold=threshold)
+    elif algorithm == "greedy":
         return _cluster_greedy_optimized(payloads, threshold)
     # algorithm == "dbscan"
     return _cluster_dbscan(payloads, threshold)
@@ -1103,78 +1237,82 @@ def _levenshtein_distance(a: bytes, b: bytes) -> int:
     return previous_row[-1]
-def _fast_similarity(payload_a: bytes, payload_b: bytes, threshold: float) -> float | None:
-    """Fast similarity check with early termination.
-    Uses length-based filtering and sampling to quickly reject dissimilar payloads.
-    Returns None if payloads are likely similar (needs full check),
-    or a similarity value if they can be quickly determined.
+def _check_length_similarity(len_a: int, len_b: int, threshold: float) -> float | None:
+    """Check if length difference allows similarity threshold.
     Args:
-        payload_a: First payload.
-        payload_b: Second payload.
-        threshold: Similarity threshold for clustering.
+        len_a: Length of first payload.
+        len_b: Length of second payload.
+        threshold: Similarity threshold.
     Returns:
-        Similarity value if quickly determined, None if full check needed.
+        Similarity if can be determined from length, None otherwise.
     """
-    len_a = len(payload_a)
-    len_b = len(payload_b)
     # Empty payloads
     if len_a == 0 and len_b == 0:
         return 1.0
     if len_a == 0 or len_b == 0:
         return 0.0
-    # Length difference filter: if lengths differ by more than (1-threshold)*max_len,
-    # similarity can't exceed threshold
+    # Maximum possible similarity given length difference
     max_len = max(len_a, len_b)
     min_len = min(len_a, len_b)
-    _length_diff = max_len - min_len
-    # Maximum possible similarity given length difference
     max_possible_similarity = min_len / max_len
     if max_possible_similarity < threshold:
         return max_possible_similarity
-    # For same-length payloads, use fast hamming similarity
-    if len_a == len_b:
-        # Sample comparison for large payloads
-        if len_a > 50:
-            # Sample first 16, last 16, and some middle bytes
-            sample_size = min(48, len_a)
-            mismatches = 0
-            # First 16 bytes
-            for i in range(min(16, len_a)):
-                if payload_a[i] != payload_b[i]:
-                    mismatches += 1
-            # Last 16 bytes
-            for i in range(1, min(17, len_a + 1)):
-                if payload_a[-i] != payload_b[-i]:
-                    mismatches += 1
-            # Middle samples (len_a > 32 always true here since len_a > 50)
-            step = (len_a - 32) // 16
-            if step > 0:
-                for i in range(16, len_a - 16, step):
-                    if payload_a[i] != payload_b[i]:
-                        mismatches += 1
-            # Estimate similarity from sample
-            estimated_similarity = 1.0 - (mismatches / sample_size)
+    return None
-            # If sample shows very low similarity, reject early
-            if estimated_similarity < threshold * 0.8:
-                return estimated_similarity
-        # Full hamming comparison for same-length payloads (faster than Levenshtein)
-        matches = sum(a == b for a, b in zip(payload_a, payload_b, strict=True))
-        return matches / len_a
+def _sample_hamming_similarity(payload_a: bytes, payload_b: bytes, length: int) -> float:
+    """Compute similarity by sampling first 16, last 16, and middle bytes.
-    # For different-length payloads, use common prefix/suffix heuristic
+    Args:
+        payload_a: First payload.
+        payload_b: Second payload.
+        length: Length of payloads (must be equal).
+    Returns:
+        Estimated similarity based on samples.
+    """
+    sample_size = min(48, length)
+    mismatches = 0
+    # First 16 bytes
+    for i in range(min(16, length)):
+        if payload_a[i] != payload_b[i]:
+            mismatches += 1
+    # Last 16 bytes
+    for i in range(1, min(17, length + 1)):
+        if payload_a[-i] != payload_b[-i]:
+            mismatches += 1
+    # Middle samples (only if length > 32)
+    step = (length - 32) // 16
+    if step > 0:
+        for i in range(16, length - 16, step):
+            if payload_a[i] != payload_b[i]:
+                mismatches += 1
+    return 1.0 - (mismatches / sample_size)
+def _prefix_suffix_similarity(
+    payload_a: bytes, payload_b: bytes, min_len: int, max_len: int
+) -> float:
+    """Estimate similarity from common prefix and suffix.
+    Args:
+        payload_a: First payload.
+        payload_b: Second payload.
+        min_len: Minimum length.
+        max_len: Maximum length.
+    Returns:
+        Estimated similarity.
+    """
     common_prefix = 0
     for i in range(min_len):
         if payload_a[i] == payload_b[i]:
@@ -1189,9 +1327,51 @@ def _fast_similarity(payload_a: bytes, payload_b: bytes, threshold: float) -> fl
         else:
             break
-    # Estimate similarity from prefix/suffix
     common_bytes = common_prefix + common_suffix
-    estimated_similarity = common_bytes / max_len
+    return common_bytes / max_len
+def _fast_similarity(payload_a: bytes, payload_b: bytes, threshold: float) -> float | None:
+    """Fast similarity check with early termination.
+    Uses length-based filtering and sampling to quickly reject dissimilar payloads.
+    Returns None if payloads are likely similar (needs full check),
+    or a similarity value if they can be quickly determined.
+    Args:
+        payload_a: First payload.
+        payload_b: Second payload.
+        threshold: Similarity threshold for clustering.
+    Returns:
+        Similarity value if quickly determined, None if full check needed.
+    """
+    len_a = len(payload_a)
+    len_b = len(payload_b)
+    # Check length-based similarity
+    length_result = _check_length_similarity(len_a, len_b, threshold)
+    if length_result is not None:
+        return length_result
+    # For same-length payloads, use fast hamming similarity
+    if len_a == len_b:
+        # Sample comparison for large payloads
+        if len_a > 50:
+            estimated_similarity = _sample_hamming_similarity(payload_a, payload_b, len_a)
+            # If sample shows very low similarity, reject early
+            if estimated_similarity < threshold * 0.8:
+                return estimated_similarity
+        # Full hamming comparison for same-length payloads (faster than Levenshtein)
+        matches = sum(a == b for a, b in zip(payload_a, payload_b, strict=True))
+        return matches / len_a
+    # For different-length payloads, use common prefix/suffix heuristic
+    max_len = max(len_a, len_b)
+    min_len = min(len_a, len_b)
+    estimated_similarity = _prefix_suffix_similarity(payload_a, payload_b, min_len, max_len)
     # If common bytes suggest low similarity, reject
     if estimated_similarity < threshold * 0.7:

oscura 0.5.1__py3-none-any.whl → 0.7.0__py3-none-any.whl

oscura 0.5.1py3-none-any.whl → 0.7.0py3-none-any.whl