rbnacl-libsodium 1.0.11 → 1.0.13
Sign up to get free protection for your applications and to get access to all the features.
- checksums.yaml +4 -4
- data/CHANGES.md +4 -0
- data/lib/rbnacl/libsodium/version.rb +1 -1
- data/vendor/libsodium/AUTHORS +45 -33
- data/vendor/libsodium/ChangeLog +63 -2
- data/vendor/libsodium/LICENSE +1 -1
- data/vendor/libsodium/Makefile.am +1 -0
- data/vendor/libsodium/Makefile.in +17 -14
- data/vendor/libsodium/README.markdown +1 -0
- data/vendor/libsodium/THANKS +38 -4
- data/vendor/libsodium/aclocal.m4 +25 -24
- data/vendor/libsodium/autogen.sh +12 -7
- data/vendor/libsodium/autom4te.cache/output.0 +5066 -2281
- data/vendor/libsodium/autom4te.cache/output.1 +1013 -600
- data/vendor/libsodium/autom4te.cache/output.2 +5066 -2281
- data/vendor/libsodium/autom4te.cache/requests +426 -1584
- data/vendor/libsodium/autom4te.cache/traces.0 +2044 -876
- data/vendor/libsodium/autom4te.cache/traces.1 +996 -523
- data/vendor/libsodium/autom4te.cache/traces.2 +1996 -828
- data/vendor/libsodium/build-aux/compile +5 -4
- data/vendor/libsodium/build-aux/config.guess +120 -68
- data/vendor/libsodium/build-aux/config.sub +51 -22
- data/vendor/libsodium/build-aux/depcomp +3 -3
- data/vendor/libsodium/build-aux/install-sh +2 -2
- data/vendor/libsodium/build-aux/missing +3 -3
- data/vendor/libsodium/build-aux/test-driver +3 -3
- data/vendor/libsodium/builds/msvc/properties/Win32.props +4 -1
- data/vendor/libsodium/builds/msvc/properties/x64.props +4 -1
- data/vendor/libsodium/builds/msvc/resource.h +14 -0
- data/vendor/libsodium/builds/msvc/resource.rc +63 -0
- data/vendor/libsodium/builds/msvc/version.h +7 -4
- data/vendor/libsodium/builds/msvc/vs2010/libsodium.import.props +1 -1
- data/vendor/libsodium/builds/msvc/vs2010/libsodium/libsodium.props +10 -5
- data/vendor/libsodium/builds/msvc/vs2010/libsodium/libsodium.vcxproj +182 -139
- data/vendor/libsodium/builds/msvc/vs2010/libsodium/libsodium.vcxproj.filters +632 -470
- data/vendor/libsodium/builds/msvc/vs2012/libsodium.import.props +1 -1
- data/vendor/libsodium/builds/msvc/vs2012/libsodium/libsodium.props +10 -5
- data/vendor/libsodium/builds/msvc/vs2012/libsodium/libsodium.vcxproj +182 -129
- data/vendor/libsodium/builds/msvc/vs2012/libsodium/libsodium.vcxproj.filters +632 -470
- data/vendor/libsodium/builds/msvc/vs2013/libsodium.import.props +1 -1
- data/vendor/libsodium/builds/msvc/vs2013/libsodium/libsodium.props +10 -5
- data/vendor/libsodium/builds/msvc/vs2013/libsodium/libsodium.vcxproj +182 -129
- data/vendor/libsodium/builds/msvc/vs2013/libsodium/libsodium.vcxproj.filters +632 -470
- data/vendor/libsodium/builds/msvc/vs2015/libsodium.import.props +1 -1
- data/vendor/libsodium/builds/msvc/vs2015/libsodium/libsodium.props +10 -5
- data/vendor/libsodium/builds/msvc/vs2015/libsodium/libsodium.vcxproj +181 -118
- data/vendor/libsodium/builds/msvc/vs2015/libsodium/libsodium.vcxproj.filters +632 -470
- data/vendor/libsodium/builds/msvc/vs2017/libsodium.import.props +52 -0
- data/vendor/libsodium/builds/msvc/vs2017/libsodium.import.xml +17 -0
- data/vendor/libsodium/builds/msvc/vs2017/libsodium.sln +52 -0
- data/vendor/libsodium/builds/msvc/vs2017/libsodium/libsodium.props +48 -0
- data/vendor/libsodium/builds/msvc/vs2017/libsodium/libsodium.vcxproj +320 -0
- data/vendor/libsodium/builds/msvc/vs2017/libsodium/libsodium.vcxproj.filters +962 -0
- data/vendor/libsodium/builds/msvc/vs2017/libsodium/libsodium.xml +15 -0
- data/vendor/libsodium/configure +1002 -589
- data/vendor/libsodium/configure.ac +48 -21
- data/vendor/libsodium/contrib/Findsodium.cmake +267 -0
- data/vendor/libsodium/contrib/Makefile.am +3 -0
- data/vendor/libsodium/contrib/Makefile.in +483 -0
- data/vendor/libsodium/dist-build/Makefile.in +11 -7
- data/vendor/libsodium/dist-build/android-armv8-a.sh +1 -1
- data/vendor/libsodium/dist-build/android-build.sh +25 -17
- data/vendor/libsodium/dist-build/android-mips32.sh +1 -1
- data/vendor/libsodium/dist-build/android-mips64.sh +1 -1
- data/vendor/libsodium/dist-build/android-x86_64.sh +1 -1
- data/vendor/libsodium/dist-build/emscripten-symbols.def +150 -2
- data/vendor/libsodium/dist-build/emscripten-wasm.sh +132 -0
- data/vendor/libsodium/dist-build/emscripten.sh +8 -6
- data/vendor/libsodium/dist-build/ios.sh +29 -5
- data/vendor/libsodium/libsodium.vcxproj +139 -77
- data/vendor/libsodium/libsodium.vcxproj.filters +315 -144
- data/vendor/libsodium/m4/ax_check_catchable_segv.m4 +42 -0
- data/vendor/libsodium/m4/ax_check_compile_flag.m4 +6 -4
- data/vendor/libsodium/m4/ax_check_define.m4 +3 -3
- data/vendor/libsodium/m4/ax_check_gnu_make.m4 +31 -25
- data/vendor/libsodium/m4/ax_check_link_flag.m4 +8 -6
- data/vendor/libsodium/m4/ax_pthread.m4 +275 -275
- data/vendor/libsodium/m4/ax_valgrind_check.m4 +92 -41
- data/vendor/libsodium/m4/pkg.m4 +1 -1
- data/vendor/libsodium/msvc-scripts/Makefile.in +11 -7
- data/vendor/libsodium/msvc-scripts/process.bat +4 -3
- data/vendor/libsodium/packaging/dotnet-core/README.md +59 -0
- data/vendor/libsodium/packaging/dotnet-core/desktop.targets +16 -0
- data/vendor/libsodium/packaging/dotnet-core/libsodium.props +33 -0
- data/vendor/libsodium/packaging/dotnet-core/prepare.py +262 -0
- data/vendor/libsodium/packaging/dotnet-core/recipes/alpine-x64 +3 -0
- data/vendor/libsodium/packaging/dotnet-core/recipes/build +9 -0
- data/vendor/libsodium/packaging/dotnet-core/recipes/centos-x64 +3 -0
- data/vendor/libsodium/packaging/dotnet-core/recipes/debian-x64 +4 -0
- data/vendor/libsodium/packaging/dotnet-core/recipes/fedora-x64 +3 -0
- data/vendor/libsodium/packaging/dotnet-core/recipes/opensuse-x64 +3 -0
- data/vendor/libsodium/packaging/dotnet-core/recipes/pack +5 -0
- data/vendor/libsodium/packaging/dotnet-core/recipes/test +27 -0
- data/vendor/libsodium/packaging/dotnet-core/recipes/ubuntu-x64 +4 -0
- data/vendor/libsodium/packaging/nuget/package.config +1 -1
- data/vendor/libsodium/packaging/nuget/package.gsl +3 -3
- data/vendor/libsodium/src/Makefile.in +11 -7
- data/vendor/libsodium/src/libsodium/Makefile.am +113 -98
- data/vendor/libsodium/src/libsodium/Makefile.in +1034 -1236
- data/vendor/libsodium/src/libsodium/crypto_aead/aes256gcm/aesni/aead_aes256gcm_aesni.c +31 -12
- data/vendor/libsodium/src/libsodium/crypto_aead/chacha20poly1305/sodium/aead_chacha20poly1305.c +31 -10
- data/vendor/libsodium/src/libsodium/crypto_aead/xchacha20poly1305/sodium/aead_xchacha20poly1305.c +153 -0
- data/vendor/libsodium/src/libsodium/crypto_auth/crypto_auth.c +7 -0
- data/vendor/libsodium/src/libsodium/crypto_auth/hmacsha256/{cp/hmac_hmacsha256.c → auth_hmacsha256.c} +43 -35
- data/vendor/libsodium/src/libsodium/crypto_auth/hmacsha512/{cp/hmac_hmacsha512.c → auth_hmacsha512.c} +43 -35
- data/vendor/libsodium/src/libsodium/crypto_auth/hmacsha512256/{cp/hmac_hmacsha512256.c → auth_hmacsha512256.c} +48 -9
- data/vendor/libsodium/src/libsodium/crypto_box/crypto_box_easy.c +4 -3
- data/vendor/libsodium/src/libsodium/crypto_box/crypto_box_seal.c +2 -1
- data/vendor/libsodium/src/libsodium/crypto_box/curve25519xchacha20poly1305/box_curve25519xchacha20poly1305.c +197 -0
- data/vendor/libsodium/src/libsodium/crypto_box/curve25519xchacha20poly1305/box_seal_curve25519xchacha20poly1305.c +79 -0
- data/vendor/libsodium/src/libsodium/crypto_box/curve25519xsalsa20poly1305/box_curve25519xsalsa20poly1305.c +150 -0
- data/vendor/libsodium/src/libsodium/crypto_core/curve25519/ref10/curve25519_ref10.c +1156 -662
- data/vendor/libsodium/src/libsodium/crypto_core/hchacha20/core_hchacha20.c +12 -5
- data/vendor/libsodium/src/libsodium/crypto_core/hsalsa20/{core_hsalsa20_api.c → core_hsalsa20.c} +0 -0
- data/vendor/libsodium/src/libsodium/crypto_core/hsalsa20/ref2/core_hsalsa20_ref2.c +95 -0
- data/vendor/libsodium/src/libsodium/crypto_core/salsa/ref/core_salsa_ref.c +195 -0
- data/vendor/libsodium/src/libsodium/crypto_generichash/{blake2/generichash_blake2_api.c → blake2b/generichash_blake2.c} +7 -0
- data/vendor/libsodium/src/libsodium/crypto_generichash/blake2b/ref/blake2.h +109 -0
- data/vendor/libsodium/src/libsodium/crypto_generichash/blake2b/ref/blake2b-compress-avx2.c +49 -0
- data/vendor/libsodium/src/libsodium/crypto_generichash/blake2b/ref/blake2b-compress-avx2.h +140 -0
- data/vendor/libsodium/src/libsodium/crypto_generichash/blake2b/ref/blake2b-compress-ref.c +92 -0
- data/vendor/libsodium/src/libsodium/crypto_generichash/blake2b/ref/blake2b-compress-sse41.c +87 -0
- data/vendor/libsodium/src/libsodium/crypto_generichash/blake2b/ref/blake2b-compress-sse41.h +103 -0
- data/vendor/libsodium/src/libsodium/crypto_generichash/blake2b/ref/blake2b-compress-ssse3.c +90 -0
- data/vendor/libsodium/src/libsodium/crypto_generichash/blake2b/ref/blake2b-compress-ssse3.h +103 -0
- data/vendor/libsodium/src/libsodium/crypto_generichash/blake2b/ref/blake2b-load-avx2.h +340 -0
- data/vendor/libsodium/src/libsodium/crypto_generichash/blake2b/ref/blake2b-load-sse2.h +164 -0
- data/vendor/libsodium/src/libsodium/crypto_generichash/blake2b/ref/blake2b-load-sse41.h +307 -0
- data/vendor/libsodium/src/libsodium/crypto_generichash/blake2b/ref/blake2b-ref.c +494 -0
- data/vendor/libsodium/src/libsodium/crypto_generichash/{blake2 → blake2b}/ref/generichash_blake2b.c +22 -26
- data/vendor/libsodium/src/libsodium/crypto_generichash/crypto_generichash.c +7 -0
- data/vendor/libsodium/src/libsodium/crypto_hash/sha256/cp/hash_sha256_cp.c +254 -0
- data/vendor/libsodium/src/libsodium/crypto_hash/sha256/{hash_sha256_api.c → hash_sha256.c} +4 -2
- data/vendor/libsodium/src/libsodium/crypto_hash/sha512/cp/hash_sha512_cp.c +280 -0
- data/vendor/libsodium/src/libsodium/crypto_hash/sha512/{hash_sha512_api.c → hash_sha512.c} +4 -2
- data/vendor/libsodium/src/libsodium/crypto_kdf/blake2b/kdf_blake2b.c +52 -0
- data/vendor/libsodium/src/libsodium/crypto_kdf/crypto_kdf.c +49 -0
- data/vendor/libsodium/src/libsodium/crypto_kx/crypto_kx.c +136 -0
- data/vendor/libsodium/src/libsodium/crypto_onetimeauth/crypto_onetimeauth.c +6 -0
- data/vendor/libsodium/src/libsodium/crypto_onetimeauth/poly1305/donna/poly1305_donna.c +34 -27
- data/vendor/libsodium/src/libsodium/crypto_onetimeauth/poly1305/donna/poly1305_donna.h +1 -1
- data/vendor/libsodium/src/libsodium/crypto_onetimeauth/poly1305/donna/poly1305_donna32.h +203 -156
- data/vendor/libsodium/src/libsodium/crypto_onetimeauth/poly1305/donna/poly1305_donna64.h +178 -134
- data/vendor/libsodium/src/libsodium/crypto_onetimeauth/poly1305/onetimeauth_poly1305.c +22 -4
- data/vendor/libsodium/src/libsodium/crypto_onetimeauth/poly1305/onetimeauth_poly1305.h +10 -12
- data/vendor/libsodium/src/libsodium/crypto_onetimeauth/poly1305/sse2/poly1305_sse2.c +564 -315
- data/vendor/libsodium/src/libsodium/crypto_onetimeauth/poly1305/sse2/poly1305_sse2.h +1 -1
- data/vendor/libsodium/src/libsodium/crypto_pwhash/argon2/argon2-core.c +131 -84
- data/vendor/libsodium/src/libsodium/crypto_pwhash/argon2/argon2-core.h +23 -18
- data/vendor/libsodium/src/libsodium/crypto_pwhash/argon2/argon2-encoding.c +163 -145
- data/vendor/libsodium/src/libsodium/crypto_pwhash/argon2/argon2-encoding.h +2 -1
- data/vendor/libsodium/src/libsodium/crypto_pwhash/argon2/argon2-fill-block-avx2.c +247 -0
- data/vendor/libsodium/src/libsodium/crypto_pwhash/argon2/argon2-fill-block-ref.c +42 -29
- data/vendor/libsodium/src/libsodium/crypto_pwhash/argon2/argon2-fill-block-ssse3.c +71 -47
- data/vendor/libsodium/src/libsodium/crypto_pwhash/argon2/argon2.c +100 -65
- data/vendor/libsodium/src/libsodium/crypto_pwhash/argon2/argon2.h +77 -23
- data/vendor/libsodium/src/libsodium/crypto_pwhash/argon2/blake2b-long.c +30 -31
- data/vendor/libsodium/src/libsodium/crypto_pwhash/argon2/blamka-round-avx2.h +150 -0
- data/vendor/libsodium/src/libsodium/crypto_pwhash/argon2/blamka-round-ref.h +28 -26
- data/vendor/libsodium/src/libsodium/crypto_pwhash/argon2/blamka-round-ssse3.h +102 -99
- data/vendor/libsodium/src/libsodium/crypto_pwhash/argon2/pwhash_argon2i.c +90 -41
- data/vendor/libsodium/src/libsodium/crypto_pwhash/argon2/pwhash_argon2id.c +213 -0
- data/vendor/libsodium/src/libsodium/crypto_pwhash/crypto_pwhash.c +72 -4
- data/vendor/libsodium/src/libsodium/crypto_pwhash/scryptsalsa208sha256/crypto_scrypt-common.c +34 -37
- data/vendor/libsodium/src/libsodium/crypto_pwhash/scryptsalsa208sha256/crypto_scrypt.h +27 -32
- data/vendor/libsodium/src/libsodium/crypto_pwhash/scryptsalsa208sha256/nosse/pwhash_scryptsalsa208sha256_nosse.c +120 -86
- data/vendor/libsodium/src/libsodium/crypto_pwhash/scryptsalsa208sha256/pbkdf2-sha256.c +16 -13
- data/vendor/libsodium/src/libsodium/crypto_pwhash/scryptsalsa208sha256/pbkdf2-sha256.h +4 -4
- data/vendor/libsodium/src/libsodium/crypto_pwhash/scryptsalsa208sha256/pwhash_scryptsalsa208sha256.c +98 -50
- data/vendor/libsodium/src/libsodium/crypto_pwhash/scryptsalsa208sha256/scrypt_platform.c +23 -18
- data/vendor/libsodium/src/libsodium/crypto_pwhash/scryptsalsa208sha256/sse/pwhash_scryptsalsa208sha256_sse.c +105 -105
- data/vendor/libsodium/src/libsodium/crypto_scalarmult/curve25519/donna_c64/curve25519_donna_c64.c +395 -330
- data/vendor/libsodium/src/libsodium/crypto_scalarmult/curve25519/ref10/x25519_ref10.c +225 -198
- data/vendor/libsodium/src/libsodium/crypto_secretbox/crypto_secretbox.c +7 -0
- data/vendor/libsodium/src/libsodium/crypto_secretbox/crypto_secretbox_easy.c +6 -5
- data/vendor/libsodium/src/libsodium/crypto_secretbox/xchacha20poly1305/secretbox_xchacha20poly1305.c +170 -0
- data/vendor/libsodium/src/libsodium/crypto_secretbox/xsalsa20poly1305/secretbox_xsalsa20poly1305.c +83 -0
- data/vendor/libsodium/src/libsodium/crypto_shorthash/crypto_shorthash.c +7 -0
- data/vendor/libsodium/src/libsodium/crypto_shorthash/siphash24/ref/shorthash_siphash24_ref.c +65 -0
- data/vendor/libsodium/src/libsodium/crypto_shorthash/siphash24/ref/shorthash_siphash_ref.h +24 -0
- data/vendor/libsodium/src/libsodium/crypto_shorthash/siphash24/ref/shorthash_siphashx24_ref.c +71 -0
- data/vendor/libsodium/src/libsodium/crypto_shorthash/siphash24/{shorthash_siphash24_api.c → shorthash_siphash24.c} +0 -0
- data/vendor/libsodium/src/libsodium/crypto_shorthash/siphash24/shorthash_siphashx24.c +11 -0
- data/vendor/libsodium/src/libsodium/crypto_sign/crypto_sign.c +33 -0
- data/vendor/libsodium/src/libsodium/crypto_sign/ed25519/ref10/ed25519_ref10.h +18 -0
- data/vendor/libsodium/src/libsodium/crypto_sign/ed25519/ref10/keypair.c +18 -13
- data/vendor/libsodium/src/libsodium/crypto_sign/ed25519/ref10/obsolete.c +29 -26
- data/vendor/libsodium/src/libsodium/crypto_sign/ed25519/ref10/open.c +75 -36
- data/vendor/libsodium/src/libsodium/crypto_sign/ed25519/ref10/sign.c +39 -15
- data/vendor/libsodium/src/libsodium/crypto_sign/ed25519/sign_ed25519.c +91 -0
- data/vendor/libsodium/src/libsodium/crypto_stream/aes128ctr/nacl/afternm_aes128ctr.c +174 -0
- data/vendor/libsodium/src/libsodium/crypto_stream/aes128ctr/nacl/beforenm_aes128ctr.c +66 -0
- data/vendor/libsodium/src/libsodium/crypto_stream/aes128ctr/nacl/common.h +766 -0
- data/vendor/libsodium/src/libsodium/crypto_stream/aes128ctr/nacl/consts.h +28 -0
- data/vendor/libsodium/src/libsodium/crypto_stream/aes128ctr/nacl/consts_aes128ctr.c +28 -0
- data/vendor/libsodium/src/libsodium/crypto_stream/aes128ctr/nacl/int128.h +50 -0
- data/vendor/libsodium/src/libsodium/crypto_stream/aes128ctr/nacl/int128_aes128ctr.c +149 -0
- data/vendor/libsodium/src/libsodium/crypto_stream/aes128ctr/nacl/stream_aes128ctr_nacl.c +31 -0
- data/vendor/libsodium/src/libsodium/crypto_stream/aes128ctr/nacl/xor_afternm_aes128ctr.c +195 -0
- data/vendor/libsodium/src/libsodium/crypto_stream/aes128ctr/{stream_aes128ctr_api.c → stream_aes128ctr.c} +6 -3
- data/vendor/libsodium/src/libsodium/crypto_stream/chacha20/dolbeau/chacha20_dolbeau-avx2.c +179 -0
- data/vendor/libsodium/src/libsodium/crypto_stream/chacha20/dolbeau/chacha20_dolbeau-avx2.h +8 -0
- data/vendor/libsodium/src/libsodium/crypto_stream/chacha20/dolbeau/chacha20_dolbeau-ssse3.c +173 -0
- data/vendor/libsodium/src/libsodium/crypto_stream/chacha20/dolbeau/chacha20_dolbeau-ssse3.h +8 -0
- data/vendor/libsodium/src/libsodium/crypto_stream/chacha20/dolbeau/u0.h +86 -0
- data/vendor/libsodium/src/libsodium/crypto_stream/chacha20/dolbeau/u1.h +98 -0
- data/vendor/libsodium/src/libsodium/crypto_stream/chacha20/dolbeau/u4.h +175 -0
- data/vendor/libsodium/src/libsodium/crypto_stream/chacha20/dolbeau/u8.h +357 -0
- data/vendor/libsodium/src/libsodium/crypto_stream/chacha20/ref/{stream_chacha20_ref.c → chacha20_ref.c} +93 -94
- data/vendor/libsodium/src/libsodium/crypto_stream/chacha20/ref/chacha20_ref.h +8 -0
- data/vendor/libsodium/src/libsodium/crypto_stream/chacha20/stream_chacha20.c +39 -7
- data/vendor/libsodium/src/libsodium/crypto_stream/crypto_stream.c +7 -0
- data/vendor/libsodium/src/libsodium/crypto_stream/salsa20/ref/salsa20_ref.c +120 -0
- data/vendor/libsodium/src/libsodium/crypto_stream/salsa20/ref/salsa20_ref.h +8 -0
- data/vendor/libsodium/src/libsodium/crypto_stream/salsa20/stream_salsa20.c +93 -0
- data/vendor/libsodium/src/libsodium/crypto_stream/salsa20/stream_salsa20.h +16 -0
- data/vendor/libsodium/src/libsodium/crypto_stream/salsa20/{amd64_xmm6/stream_salsa20_amd64_xmm6.S → xmm6/salsa20_xmm6-asm.S} +20 -12
- data/vendor/libsodium/src/libsodium/crypto_stream/salsa20/xmm6/salsa20_xmm6.c +31 -0
- data/vendor/libsodium/src/libsodium/crypto_stream/salsa20/xmm6/salsa20_xmm6.h +8 -0
- data/vendor/libsodium/src/libsodium/crypto_stream/salsa20/xmm6int/salsa20_xmm6int-avx2.c +131 -0
- data/vendor/libsodium/src/libsodium/crypto_stream/salsa20/xmm6int/salsa20_xmm6int-avx2.h +8 -0
- data/vendor/libsodium/src/libsodium/crypto_stream/salsa20/xmm6int/salsa20_xmm6int-sse2.c +122 -0
- data/vendor/libsodium/src/libsodium/crypto_stream/salsa20/xmm6int/salsa20_xmm6int-sse2.h +8 -0
- data/vendor/libsodium/src/libsodium/crypto_stream/salsa20/xmm6int/u0.h +195 -0
- data/vendor/libsodium/src/libsodium/crypto_stream/salsa20/xmm6int/u1.h +207 -0
- data/vendor/libsodium/src/libsodium/crypto_stream/salsa20/xmm6int/u4.h +547 -0
- data/vendor/libsodium/src/libsodium/crypto_stream/salsa20/xmm6int/u8.h +476 -0
- data/vendor/libsodium/src/libsodium/crypto_stream/salsa2012/ref/stream_salsa2012_ref.c +106 -0
- data/vendor/libsodium/src/libsodium/crypto_stream/salsa2012/stream_salsa2012.c +20 -0
- data/vendor/libsodium/src/libsodium/crypto_stream/salsa208/ref/stream_salsa208_ref.c +106 -0
- data/vendor/libsodium/src/libsodium/crypto_stream/salsa208/stream_salsa208.c +20 -0
- data/vendor/libsodium/src/libsodium/crypto_stream/xchacha20/stream_xchacha20.c +63 -0
- data/vendor/libsodium/src/libsodium/crypto_stream/xsalsa20/stream_xsalsa20.c +60 -0
- data/vendor/libsodium/src/libsodium/crypto_verify/sodium/verify.c +61 -0
- data/vendor/libsodium/src/libsodium/include/Makefile.am +8 -6
- data/vendor/libsodium/src/libsodium/include/Makefile.in +29 -21
- data/vendor/libsodium/src/libsodium/include/sodium.h +15 -4
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_aead_aes256gcm.h +4 -0
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_aead_chacha20poly1305.h +6 -0
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_aead_xchacha20poly1305.h +91 -0
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_auth.h +3 -0
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_auth_hmacsha256.h +5 -0
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_auth_hmacsha512.h +4 -0
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_auth_hmacsha512256.h +4 -0
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_box_curve25519xchacha20poly1305.h +153 -0
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_generichash.h +4 -0
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_generichash_blake2b.h +3 -4
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_hash_sha256.h +4 -3
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_hash_sha512.h +4 -3
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_kdf.h +51 -0
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_kdf_blake2b.h +42 -0
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_kx.h +64 -0
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_onetimeauth.h +4 -0
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_onetimeauth_poly1305.h +11 -9
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_pwhash.h +37 -1
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_pwhash_argon2i.h +40 -10
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_pwhash_argon2id.h +116 -0
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_pwhash_scryptsalsa208sha256.h +37 -4
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_scalarmult_curve25519.h +0 -4
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_secretbox.h +3 -0
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_secretbox_xchacha20poly1305.h +62 -0
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_secretbox_xsalsa20poly1305.h +5 -1
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_shorthash.h +3 -0
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_shorthash_siphash24.h +18 -0
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_sign.h +22 -0
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_sign_ed25519.h +28 -0
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_stream.h +3 -0
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_stream_aes128ctr.h +10 -5
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_stream_chacha20.h +14 -3
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_stream_salsa20.h +4 -0
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_stream_salsa2012.h +3 -0
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_stream_salsa208.h +3 -0
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_stream_xchacha20.h +53 -0
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_stream_xsalsa20.h +4 -0
- data/vendor/libsodium/src/libsodium/include/sodium/private/common.h +84 -17
- data/vendor/libsodium/src/libsodium/include/sodium/private/implementations.h +11 -0
- data/vendor/libsodium/src/libsodium/include/sodium/private/sse2_64_32.h +50 -0
- data/vendor/libsodium/src/libsodium/include/sodium/randombytes.h +10 -2
- data/vendor/libsodium/src/libsodium/include/sodium/utils.h +4 -5
- data/vendor/libsodium/src/libsodium/include/sodium/version.h.in +4 -0
- data/vendor/libsodium/src/libsodium/randombytes/randombytes.c +47 -19
- data/vendor/libsodium/src/libsodium/randombytes/salsa20/randombytes_salsa20_random.c +30 -50
- data/vendor/libsodium/src/libsodium/randombytes/sysrandom/randombytes_sysrandom.c +25 -15
- data/vendor/libsodium/src/libsodium/sodium/core.c +25 -23
- data/vendor/libsodium/src/libsodium/sodium/runtime.c +66 -57
- data/vendor/libsodium/src/libsodium/sodium/utils.c +120 -106
- data/vendor/libsodium/src/libsodium/sodium/version.c +10 -0
- data/vendor/libsodium/test/Makefile.in +11 -7
- data/vendor/libsodium/test/default/Makefile.am +65 -5
- data/vendor/libsodium/test/default/Makefile.in +243 -78
- data/vendor/libsodium/test/default/aead_aes256gcm.c +2 -2
- data/vendor/libsodium/test/default/aead_xchacha20poly1305.c +188 -0
- data/vendor/libsodium/test/default/aead_xchacha20poly1305.exp +51 -0
- data/vendor/libsodium/test/default/auth.c +11 -7
- data/vendor/libsodium/test/default/auth2.c +15 -12
- data/vendor/libsodium/test/default/auth3.c +18 -15
- data/vendor/libsodium/test/default/auth5.c +3 -2
- data/vendor/libsodium/test/default/auth6.c +4 -3
- data/vendor/libsodium/test/default/auth7.c +3 -2
- data/vendor/libsodium/test/default/box.c +57 -52
- data/vendor/libsodium/test/default/box2.c +41 -36
- data/vendor/libsodium/test/default/box7.c +4 -3
- data/vendor/libsodium/test/default/box8.c +4 -3
- data/vendor/libsodium/test/default/box_easy.c +36 -32
- data/vendor/libsodium/test/default/box_easy2.c +41 -34
- data/vendor/libsodium/test/default/box_seal.c +7 -6
- data/vendor/libsodium/test/default/box_seed.c +10 -8
- data/vendor/libsodium/test/default/chacha20.c +18 -3
- data/vendor/libsodium/test/default/chacha20.exp +45 -0
- data/vendor/libsodium/test/default/cmptest.h +1 -0
- data/vendor/libsodium/test/default/core1.c +10 -9
- data/vendor/libsodium/test/default/core2.c +13 -12
- data/vendor/libsodium/test/default/core3.c +13 -12
- data/vendor/libsodium/test/default/core4.c +11 -12
- data/vendor/libsodium/test/default/core5.c +13 -12
- data/vendor/libsodium/test/default/core6.c +15 -13
- data/vendor/libsodium/test/default/ed25519_convert.c +12 -9
- data/vendor/libsodium/test/default/hash.c +10 -6
- data/vendor/libsodium/test/default/hash3.c +3 -2
- data/vendor/libsodium/test/default/index-wasm.html.tpl +118 -0
- data/vendor/libsodium/test/default/kdf.c +61 -0
- data/vendor/libsodium/test/default/kdf.exp +77 -0
- data/vendor/libsodium/test/default/keygen.c +64 -0
- data/vendor/libsodium/test/default/keygen.exp +1 -0
- data/vendor/libsodium/test/default/kx.c +119 -0
- data/vendor/libsodium/test/default/kx.exp +7 -0
- data/vendor/libsodium/test/default/nacl-test-wrapper.sh +9 -2
- data/vendor/libsodium/test/default/onetimeauth.c +26 -23
- data/vendor/libsodium/test/default/onetimeauth2.c +22 -20
- data/vendor/libsodium/test/default/onetimeauth7.c +3 -2
- data/vendor/libsodium/test/default/pwhash.c +209 -157
- data/vendor/libsodium/test/default/pwhash_argon2id.c +388 -0
- data/vendor/libsodium/test/default/pwhash_argon2id.exp +15 -0
- data/vendor/libsodium/test/default/pwhash_scrypt.c +232 -224
- data/vendor/libsodium/test/default/pwhash_scrypt.exp +2 -1
- data/vendor/libsodium/test/default/pwhash_scrypt_ll.c +39 -41
- data/vendor/libsodium/test/default/randombytes.c +34 -13
- data/vendor/libsodium/test/default/randombytes.exp +1 -0
- data/vendor/libsodium/test/default/scalarmult.c +21 -18
- data/vendor/libsodium/test/default/scalarmult2.c +8 -6
- data/vendor/libsodium/test/default/scalarmult5.c +13 -10
- data/vendor/libsodium/test/default/scalarmult6.c +17 -14
- data/vendor/libsodium/test/default/scalarmult7.c +9 -10
- data/vendor/libsodium/test/default/secretbox.c +39 -36
- data/vendor/libsodium/test/default/secretbox2.c +28 -25
- data/vendor/libsodium/test/default/secretbox7.c +3 -2
- data/vendor/libsodium/test/default/secretbox8.c +4 -3
- data/vendor/libsodium/test/default/secretbox_easy.c +40 -37
- data/vendor/libsodium/test/default/secretbox_easy2.c +19 -18
- data/vendor/libsodium/test/default/shorthash.c +4 -4
- data/vendor/libsodium/test/default/sign.c +70 -13
- data/vendor/libsodium/test/default/sign.exp +2 -0
- data/vendor/libsodium/test/default/siphashx24.c +33 -0
- data/vendor/libsodium/test/default/siphashx24.exp +64 -0
- data/vendor/libsodium/test/default/sodium_core.c +9 -8
- data/vendor/libsodium/test/default/sodium_utils.c +52 -46
- data/vendor/libsodium/test/default/sodium_utils2.c +17 -8
- data/vendor/libsodium/test/default/sodium_utils3.c +15 -6
- data/vendor/libsodium/test/default/sodium_version.c +7 -1
- data/vendor/libsodium/test/default/stream.c +31 -18
- data/vendor/libsodium/test/default/stream.exp +65 -0
- data/vendor/libsodium/test/default/stream2.c +13 -9
- data/vendor/libsodium/test/default/stream3.c +12 -10
- data/vendor/libsodium/test/default/stream4.c +30 -27
- data/vendor/libsodium/test/default/verify1.c +5 -4
- data/vendor/libsodium/test/default/xchacha20.c +376 -0
- data/vendor/libsodium/test/default/xchacha20.exp +5 -0
- data/vendor/libsodium/test/quirks/quirks.h +4 -3
- metadata +140 -111
- data/vendor/libsodium/autom4te.cache/output.3 +0 -17240
- data/vendor/libsodium/autom4te.cache/output.4 +0 -17517
- data/vendor/libsodium/autom4te.cache/output.5 +0 -18535
- data/vendor/libsodium/autom4te.cache/output.6 +0 -19077
- data/vendor/libsodium/autom4te.cache/output.7 +0 -19837
- data/vendor/libsodium/autom4te.cache/traces.3 +0 -2833
- data/vendor/libsodium/autom4te.cache/traces.4 +0 -2951
- data/vendor/libsodium/autom4te.cache/traces.5 +0 -3042
- data/vendor/libsodium/autom4te.cache/traces.6 +0 -3194
- data/vendor/libsodium/autom4te.cache/traces.7 +0 -3614
- data/vendor/libsodium/builds/msvc/properties/ARM.props +0 -20
- data/vendor/libsodium/compile +0 -347
- data/vendor/libsodium/config.guess +0 -1568
- data/vendor/libsodium/config.sub +0 -1793
- data/vendor/libsodium/depcomp +0 -791
- data/vendor/libsodium/install-sh +0 -527
- data/vendor/libsodium/ltmain.sh +0 -9655
- data/vendor/libsodium/missing +0 -215
- data/vendor/libsodium/src/libsodium/crypto_auth/hmacsha256/auth_hmacsha256_api.c +0 -16
- data/vendor/libsodium/src/libsodium/crypto_auth/hmacsha256/cp/verify_hmacsha256.c +0 -11
- data/vendor/libsodium/src/libsodium/crypto_auth/hmacsha512/auth_hmacsha512_api.c +0 -16
- data/vendor/libsodium/src/libsodium/crypto_auth/hmacsha512/cp/verify_hmacsha512.c +0 -12
- data/vendor/libsodium/src/libsodium/crypto_auth/hmacsha512256/auth_hmacsha512256_api.c +0 -16
- data/vendor/libsodium/src/libsodium/crypto_auth/hmacsha512256/cp/verify_hmacsha512256.c +0 -14
- data/vendor/libsodium/src/libsodium/crypto_box/curve25519xsalsa20poly1305/box_curve25519xsalsa20poly1305_api.c +0 -41
- data/vendor/libsodium/src/libsodium/crypto_box/curve25519xsalsa20poly1305/ref/after_curve25519xsalsa20poly1305.c +0 -22
- data/vendor/libsodium/src/libsodium/crypto_box/curve25519xsalsa20poly1305/ref/before_curve25519xsalsa20poly1305.c +0 -18
- data/vendor/libsodium/src/libsodium/crypto_box/curve25519xsalsa20poly1305/ref/box_curve25519xsalsa20poly1305.c +0 -42
- data/vendor/libsodium/src/libsodium/crypto_box/curve25519xsalsa20poly1305/ref/keypair_curve25519xsalsa20poly1305.c +0 -29
- data/vendor/libsodium/src/libsodium/crypto_core/hchacha20/core_hchacha20.h +0 -28
- data/vendor/libsodium/src/libsodium/crypto_core/hsalsa20/ref2/core_hsalsa20.c +0 -100
- data/vendor/libsodium/src/libsodium/crypto_core/salsa20/core_salsa20_api.c +0 -21
- data/vendor/libsodium/src/libsodium/crypto_core/salsa20/ref/core_salsa20.c +0 -126
- data/vendor/libsodium/src/libsodium/crypto_core/salsa2012/core_salsa2012_api.c +0 -21
- data/vendor/libsodium/src/libsodium/crypto_core/salsa2012/ref/core_salsa2012.c +0 -126
- data/vendor/libsodium/src/libsodium/crypto_core/salsa208/core_salsa208_api.c +0 -21
- data/vendor/libsodium/src/libsodium/crypto_core/salsa208/ref/core_salsa208.c +0 -126
- data/vendor/libsodium/src/libsodium/crypto_generichash/blake2/ref/blake2-impl.h +0 -48
- data/vendor/libsodium/src/libsodium/crypto_generichash/blake2/ref/blake2.h +0 -97
- data/vendor/libsodium/src/libsodium/crypto_generichash/blake2/ref/blake2b-compress-avx2.c +0 -45
- data/vendor/libsodium/src/libsodium/crypto_generichash/blake2/ref/blake2b-compress-avx2.h +0 -123
- data/vendor/libsodium/src/libsodium/crypto_generichash/blake2/ref/blake2b-compress-ref.c +0 -94
- data/vendor/libsodium/src/libsodium/crypto_generichash/blake2/ref/blake2b-compress-sse41.c +0 -80
- data/vendor/libsodium/src/libsodium/crypto_generichash/blake2/ref/blake2b-compress-sse41.h +0 -97
- data/vendor/libsodium/src/libsodium/crypto_generichash/blake2/ref/blake2b-compress-ssse3.c +0 -87
- data/vendor/libsodium/src/libsodium/crypto_generichash/blake2/ref/blake2b-compress-ssse3.h +0 -97
- data/vendor/libsodium/src/libsodium/crypto_generichash/blake2/ref/blake2b-load-avx2.h +0 -339
- data/vendor/libsodium/src/libsodium/crypto_generichash/blake2/ref/blake2b-load-sse2.h +0 -66
- data/vendor/libsodium/src/libsodium/crypto_generichash/blake2/ref/blake2b-load-sse41.h +0 -400
- data/vendor/libsodium/src/libsodium/crypto_generichash/blake2/ref/blake2b-ref.c +0 -456
- data/vendor/libsodium/src/libsodium/crypto_hash/sha256/cp/hash_sha256.c +0 -269
- data/vendor/libsodium/src/libsodium/crypto_hash/sha512/cp/hash_sha512.c +0 -298
- data/vendor/libsodium/src/libsodium/crypto_pwhash/argon2/argon2-impl.h +0 -40
- data/vendor/libsodium/src/libsodium/crypto_secretbox/xsalsa20poly1305/ref/box_xsalsa20poly1305.c +0 -35
- data/vendor/libsodium/src/libsodium/crypto_secretbox/xsalsa20poly1305/secretbox_xsalsa20poly1305_api.c +0 -26
- data/vendor/libsodium/src/libsodium/crypto_shorthash/siphash24/ref/shorthash_siphash24.c +0 -72
- data/vendor/libsodium/src/libsodium/crypto_sign/ed25519/description +0 -1
- data/vendor/libsodium/src/libsodium/crypto_sign/ed25519/sign_ed25519_api.c +0 -39
- data/vendor/libsodium/src/libsodium/crypto_stream/aes128ctr/portable/afternm_aes128ctr.c +0 -159
- data/vendor/libsodium/src/libsodium/crypto_stream/aes128ctr/portable/beforenm_aes128ctr.c +0 -59
- data/vendor/libsodium/src/libsodium/crypto_stream/aes128ctr/portable/common.h +0 -771
- data/vendor/libsodium/src/libsodium/crypto_stream/aes128ctr/portable/consts.h +0 -28
- data/vendor/libsodium/src/libsodium/crypto_stream/aes128ctr/portable/consts_aes128ctr.c +0 -14
- data/vendor/libsodium/src/libsodium/crypto_stream/aes128ctr/portable/int128.h +0 -56
- data/vendor/libsodium/src/libsodium/crypto_stream/aes128ctr/portable/int128_aes128ctr.c +0 -131
- data/vendor/libsodium/src/libsodium/crypto_stream/aes128ctr/portable/stream_aes128ctr.c +0 -29
- data/vendor/libsodium/src/libsodium/crypto_stream/aes128ctr/portable/types.h +0 -10
- data/vendor/libsodium/src/libsodium/crypto_stream/aes128ctr/portable/xor_afternm_aes128ctr.c +0 -180
- data/vendor/libsodium/src/libsodium/crypto_stream/chacha20/ref/stream_chacha20_ref.h +0 -28
- data/vendor/libsodium/src/libsodium/crypto_stream/chacha20/vec/stream_chacha20_vec.c +0 -336
- data/vendor/libsodium/src/libsodium/crypto_stream/chacha20/vec/stream_chacha20_vec.h +0 -28
- data/vendor/libsodium/src/libsodium/crypto_stream/salsa20/ref/stream_salsa20_ref.c +0 -55
- data/vendor/libsodium/src/libsodium/crypto_stream/salsa20/ref/xor_salsa20_ref.c +0 -63
- data/vendor/libsodium/src/libsodium/crypto_stream/salsa20/stream_salsa20_api.c +0 -19
- data/vendor/libsodium/src/libsodium/crypto_stream/salsa2012/ref/stream_salsa2012.c +0 -51
- data/vendor/libsodium/src/libsodium/crypto_stream/salsa2012/ref/xor_salsa2012.c +0 -54
- data/vendor/libsodium/src/libsodium/crypto_stream/salsa2012/stream_salsa2012_api.c +0 -11
- data/vendor/libsodium/src/libsodium/crypto_stream/salsa208/ref/stream_salsa208.c +0 -51
- data/vendor/libsodium/src/libsodium/crypto_stream/salsa208/ref/xor_salsa208.c +0 -54
- data/vendor/libsodium/src/libsodium/crypto_stream/salsa208/stream_salsa208_api.c +0 -11
- data/vendor/libsodium/src/libsodium/crypto_stream/xsalsa20/ref/stream_xsalsa20.c +0 -24
- data/vendor/libsodium/src/libsodium/crypto_stream/xsalsa20/ref/xor_xsalsa20.c +0 -35
- data/vendor/libsodium/src/libsodium/crypto_stream/xsalsa20/stream_xsalsa20_api.c +0 -11
- data/vendor/libsodium/src/libsodium/crypto_verify/16/ref/verify_16.c +0 -17
- data/vendor/libsodium/src/libsodium/crypto_verify/16/verify_16_api.c +0 -6
- data/vendor/libsodium/src/libsodium/crypto_verify/32/ref/verify_32.c +0 -17
- data/vendor/libsodium/src/libsodium/crypto_verify/32/verify_32_api.c +0 -6
- data/vendor/libsodium/src/libsodium/crypto_verify/64/ref/verify_64.c +0 -17
- data/vendor/libsodium/src/libsodium/crypto_verify/64/verify_64_api.c +0 -6
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_int32.h +0 -8
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_int64.h +0 -8
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_uint16.h +0 -8
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_uint32.h +0 -8
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_uint64.h +0 -8
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_uint8.h +0 -8
- data/vendor/libsodium/test-driver +0 -139
@@ -0,0 +1,195 @@
|
|
1
|
+
if (bytes > 0) {
|
2
|
+
__m128i diag0 = _mm_loadu_si128((__m128i *) (x + 0));
|
3
|
+
__m128i diag1 = _mm_loadu_si128((__m128i *) (x + 4));
|
4
|
+
__m128i diag2 = _mm_loadu_si128((__m128i *) (x + 8));
|
5
|
+
__m128i diag3 = _mm_loadu_si128((__m128i *) (x + 12));
|
6
|
+
__m128i a0, a1, a2, a3, a4, a5, a6, a7;
|
7
|
+
__m128i b0, b1, b2, b3, b4, b5, b6, b7;
|
8
|
+
uint8_t partialblock[64];
|
9
|
+
|
10
|
+
int i;
|
11
|
+
|
12
|
+
a0 = diag1;
|
13
|
+
for (i = 0; i < ROUNDS; i += 4) {
|
14
|
+
a0 = _mm_add_epi32(a0, diag0);
|
15
|
+
a1 = diag0;
|
16
|
+
b0 = a0;
|
17
|
+
a0 = _mm_slli_epi32(a0, 7);
|
18
|
+
b0 = _mm_srli_epi32(b0, 25);
|
19
|
+
diag3 = _mm_xor_si128(diag3, a0);
|
20
|
+
|
21
|
+
diag3 = _mm_xor_si128(diag3, b0);
|
22
|
+
|
23
|
+
a1 = _mm_add_epi32(a1, diag3);
|
24
|
+
a2 = diag3;
|
25
|
+
b1 = a1;
|
26
|
+
a1 = _mm_slli_epi32(a1, 9);
|
27
|
+
b1 = _mm_srli_epi32(b1, 23);
|
28
|
+
diag2 = _mm_xor_si128(diag2, a1);
|
29
|
+
diag3 = _mm_shuffle_epi32(diag3, 0x93);
|
30
|
+
diag2 = _mm_xor_si128(diag2, b1);
|
31
|
+
|
32
|
+
a2 = _mm_add_epi32(a2, diag2);
|
33
|
+
a3 = diag2;
|
34
|
+
b2 = a2;
|
35
|
+
a2 = _mm_slli_epi32(a2, 13);
|
36
|
+
b2 = _mm_srli_epi32(b2, 19);
|
37
|
+
diag1 = _mm_xor_si128(diag1, a2);
|
38
|
+
diag2 = _mm_shuffle_epi32(diag2, 0x4e);
|
39
|
+
diag1 = _mm_xor_si128(diag1, b2);
|
40
|
+
|
41
|
+
a3 = _mm_add_epi32(a3, diag1);
|
42
|
+
a4 = diag3;
|
43
|
+
b3 = a3;
|
44
|
+
a3 = _mm_slli_epi32(a3, 18);
|
45
|
+
b3 = _mm_srli_epi32(b3, 14);
|
46
|
+
diag0 = _mm_xor_si128(diag0, a3);
|
47
|
+
diag1 = _mm_shuffle_epi32(diag1, 0x39);
|
48
|
+
diag0 = _mm_xor_si128(diag0, b3);
|
49
|
+
|
50
|
+
a4 = _mm_add_epi32(a4, diag0);
|
51
|
+
a5 = diag0;
|
52
|
+
b4 = a4;
|
53
|
+
a4 = _mm_slli_epi32(a4, 7);
|
54
|
+
b4 = _mm_srli_epi32(b4, 25);
|
55
|
+
diag1 = _mm_xor_si128(diag1, a4);
|
56
|
+
|
57
|
+
diag1 = _mm_xor_si128(diag1, b4);
|
58
|
+
|
59
|
+
a5 = _mm_add_epi32(a5, diag1);
|
60
|
+
a6 = diag1;
|
61
|
+
b5 = a5;
|
62
|
+
a5 = _mm_slli_epi32(a5, 9);
|
63
|
+
b5 = _mm_srli_epi32(b5, 23);
|
64
|
+
diag2 = _mm_xor_si128(diag2, a5);
|
65
|
+
diag1 = _mm_shuffle_epi32(diag1, 0x93);
|
66
|
+
diag2 = _mm_xor_si128(diag2, b5);
|
67
|
+
|
68
|
+
a6 = _mm_add_epi32(a6, diag2);
|
69
|
+
a7 = diag2;
|
70
|
+
b6 = a6;
|
71
|
+
a6 = _mm_slli_epi32(a6, 13);
|
72
|
+
b6 = _mm_srli_epi32(b6, 19);
|
73
|
+
diag3 = _mm_xor_si128(diag3, a6);
|
74
|
+
diag2 = _mm_shuffle_epi32(diag2, 0x4e);
|
75
|
+
diag3 = _mm_xor_si128(diag3, b6);
|
76
|
+
|
77
|
+
a7 = _mm_add_epi32(a7, diag3);
|
78
|
+
a0 = diag1;
|
79
|
+
b7 = a7;
|
80
|
+
a7 = _mm_slli_epi32(a7, 18);
|
81
|
+
b7 = _mm_srli_epi32(b7, 14);
|
82
|
+
diag0 = _mm_xor_si128(diag0, a7);
|
83
|
+
diag3 = _mm_shuffle_epi32(diag3, 0x39);
|
84
|
+
diag0 = _mm_xor_si128(diag0, b7);
|
85
|
+
|
86
|
+
a0 = _mm_add_epi32(a0, diag0);
|
87
|
+
a1 = diag0;
|
88
|
+
b0 = a0;
|
89
|
+
a0 = _mm_slli_epi32(a0, 7);
|
90
|
+
b0 = _mm_srli_epi32(b0, 25);
|
91
|
+
diag3 = _mm_xor_si128(diag3, a0);
|
92
|
+
|
93
|
+
diag3 = _mm_xor_si128(diag3, b0);
|
94
|
+
|
95
|
+
a1 = _mm_add_epi32(a1, diag3);
|
96
|
+
a2 = diag3;
|
97
|
+
b1 = a1;
|
98
|
+
a1 = _mm_slli_epi32(a1, 9);
|
99
|
+
b1 = _mm_srli_epi32(b1, 23);
|
100
|
+
diag2 = _mm_xor_si128(diag2, a1);
|
101
|
+
diag3 = _mm_shuffle_epi32(diag3, 0x93);
|
102
|
+
diag2 = _mm_xor_si128(diag2, b1);
|
103
|
+
|
104
|
+
a2 = _mm_add_epi32(a2, diag2);
|
105
|
+
a3 = diag2;
|
106
|
+
b2 = a2;
|
107
|
+
a2 = _mm_slli_epi32(a2, 13);
|
108
|
+
b2 = _mm_srli_epi32(b2, 19);
|
109
|
+
diag1 = _mm_xor_si128(diag1, a2);
|
110
|
+
diag2 = _mm_shuffle_epi32(diag2, 0x4e);
|
111
|
+
diag1 = _mm_xor_si128(diag1, b2);
|
112
|
+
|
113
|
+
a3 = _mm_add_epi32(a3, diag1);
|
114
|
+
a4 = diag3;
|
115
|
+
b3 = a3;
|
116
|
+
a3 = _mm_slli_epi32(a3, 18);
|
117
|
+
b3 = _mm_srli_epi32(b3, 14);
|
118
|
+
diag0 = _mm_xor_si128(diag0, a3);
|
119
|
+
diag1 = _mm_shuffle_epi32(diag1, 0x39);
|
120
|
+
diag0 = _mm_xor_si128(diag0, b3);
|
121
|
+
|
122
|
+
a4 = _mm_add_epi32(a4, diag0);
|
123
|
+
a5 = diag0;
|
124
|
+
b4 = a4;
|
125
|
+
a4 = _mm_slli_epi32(a4, 7);
|
126
|
+
b4 = _mm_srli_epi32(b4, 25);
|
127
|
+
diag1 = _mm_xor_si128(diag1, a4);
|
128
|
+
|
129
|
+
diag1 = _mm_xor_si128(diag1, b4);
|
130
|
+
|
131
|
+
a5 = _mm_add_epi32(a5, diag1);
|
132
|
+
a6 = diag1;
|
133
|
+
b5 = a5;
|
134
|
+
a5 = _mm_slli_epi32(a5, 9);
|
135
|
+
b5 = _mm_srli_epi32(b5, 23);
|
136
|
+
diag2 = _mm_xor_si128(diag2, a5);
|
137
|
+
diag1 = _mm_shuffle_epi32(diag1, 0x93);
|
138
|
+
diag2 = _mm_xor_si128(diag2, b5);
|
139
|
+
|
140
|
+
a6 = _mm_add_epi32(a6, diag2);
|
141
|
+
a7 = diag2;
|
142
|
+
b6 = a6;
|
143
|
+
a6 = _mm_slli_epi32(a6, 13);
|
144
|
+
b6 = _mm_srli_epi32(b6, 19);
|
145
|
+
diag3 = _mm_xor_si128(diag3, a6);
|
146
|
+
diag2 = _mm_shuffle_epi32(diag2, 0x4e);
|
147
|
+
diag3 = _mm_xor_si128(diag3, b6);
|
148
|
+
|
149
|
+
a7 = _mm_add_epi32(a7, diag3);
|
150
|
+
a0 = diag1;
|
151
|
+
b7 = a7;
|
152
|
+
a7 = _mm_slli_epi32(a7, 18);
|
153
|
+
b7 = _mm_srli_epi32(b7, 14);
|
154
|
+
diag0 = _mm_xor_si128(diag0, a7);
|
155
|
+
diag3 = _mm_shuffle_epi32(diag3, 0x39);
|
156
|
+
diag0 = _mm_xor_si128(diag0, b7);
|
157
|
+
}
|
158
|
+
|
159
|
+
diag0 = _mm_add_epi32(diag0, _mm_loadu_si128((__m128i *) (x + 0)));
|
160
|
+
diag1 = _mm_add_epi32(diag1, _mm_loadu_si128((__m128i *) (x + 4)));
|
161
|
+
diag2 = _mm_add_epi32(diag2, _mm_loadu_si128((__m128i *) (x + 8)));
|
162
|
+
diag3 = _mm_add_epi32(diag3, _mm_loadu_si128((__m128i *) (x + 12)));
|
163
|
+
|
164
|
+
#define ONEQUAD_SHUFFLE(A, B, C, D) \
|
165
|
+
do { \
|
166
|
+
uint32_t in##A = _mm_cvtsi128_si32(diag0); \
|
167
|
+
uint32_t in##B = _mm_cvtsi128_si32(diag1); \
|
168
|
+
uint32_t in##C = _mm_cvtsi128_si32(diag2); \
|
169
|
+
uint32_t in##D = _mm_cvtsi128_si32(diag3); \
|
170
|
+
diag0 = _mm_shuffle_epi32(diag0, 0x39); \
|
171
|
+
diag1 = _mm_shuffle_epi32(diag1, 0x39); \
|
172
|
+
diag2 = _mm_shuffle_epi32(diag2, 0x39); \
|
173
|
+
diag3 = _mm_shuffle_epi32(diag3, 0x39); \
|
174
|
+
*(uint32_t *) (partialblock + (A * 4)) = in##A; \
|
175
|
+
*(uint32_t *) (partialblock + (B * 4)) = in##B; \
|
176
|
+
*(uint32_t *) (partialblock + (C * 4)) = in##C; \
|
177
|
+
*(uint32_t *) (partialblock + (D * 4)) = in##D; \
|
178
|
+
} while (0)
|
179
|
+
|
180
|
+
#define ONEQUAD(A, B, C, D) ONEQUAD_SHUFFLE(A, B, C, D)
|
181
|
+
|
182
|
+
ONEQUAD(0, 12, 8, 4);
|
183
|
+
ONEQUAD(5, 1, 13, 9);
|
184
|
+
ONEQUAD(10, 6, 2, 14);
|
185
|
+
ONEQUAD(15, 11, 7, 3);
|
186
|
+
|
187
|
+
#undef ONEQUAD
|
188
|
+
#undef ONEQUAD_SHUFFLE
|
189
|
+
|
190
|
+
for (i = 0; i < bytes; i++) {
|
191
|
+
c[i] = m[i] ^ partialblock[i];
|
192
|
+
}
|
193
|
+
|
194
|
+
sodium_memzero(partialblock, sizeof partialblock);
|
195
|
+
}
|
@@ -0,0 +1,207 @@
|
|
1
|
+
while (bytes >= 64) {
|
2
|
+
__m128i diag0 = _mm_loadu_si128((__m128i *) (x + 0));
|
3
|
+
__m128i diag1 = _mm_loadu_si128((__m128i *) (x + 4));
|
4
|
+
__m128i diag2 = _mm_loadu_si128((__m128i *) (x + 8));
|
5
|
+
__m128i diag3 = _mm_loadu_si128((__m128i *) (x + 12));
|
6
|
+
__m128i a0, a1, a2, a3, a4, a5, a6, a7;
|
7
|
+
__m128i b0, b1, b2, b3, b4, b5, b6, b7;
|
8
|
+
|
9
|
+
uint32_t in8;
|
10
|
+
uint32_t in9;
|
11
|
+
int i;
|
12
|
+
|
13
|
+
a0 = diag1;
|
14
|
+
for (i = 0; i < ROUNDS; i += 4) {
|
15
|
+
a0 = _mm_add_epi32(a0, diag0);
|
16
|
+
a1 = diag0;
|
17
|
+
b0 = a0;
|
18
|
+
a0 = _mm_slli_epi32(a0, 7);
|
19
|
+
b0 = _mm_srli_epi32(b0, 25);
|
20
|
+
diag3 = _mm_xor_si128(diag3, a0);
|
21
|
+
|
22
|
+
diag3 = _mm_xor_si128(diag3, b0);
|
23
|
+
|
24
|
+
a1 = _mm_add_epi32(a1, diag3);
|
25
|
+
a2 = diag3;
|
26
|
+
b1 = a1;
|
27
|
+
a1 = _mm_slli_epi32(a1, 9);
|
28
|
+
b1 = _mm_srli_epi32(b1, 23);
|
29
|
+
diag2 = _mm_xor_si128(diag2, a1);
|
30
|
+
diag3 = _mm_shuffle_epi32(diag3, 0x93);
|
31
|
+
diag2 = _mm_xor_si128(diag2, b1);
|
32
|
+
|
33
|
+
a2 = _mm_add_epi32(a2, diag2);
|
34
|
+
a3 = diag2;
|
35
|
+
b2 = a2;
|
36
|
+
a2 = _mm_slli_epi32(a2, 13);
|
37
|
+
b2 = _mm_srli_epi32(b2, 19);
|
38
|
+
diag1 = _mm_xor_si128(diag1, a2);
|
39
|
+
diag2 = _mm_shuffle_epi32(diag2, 0x4e);
|
40
|
+
diag1 = _mm_xor_si128(diag1, b2);
|
41
|
+
|
42
|
+
a3 = _mm_add_epi32(a3, diag1);
|
43
|
+
a4 = diag3;
|
44
|
+
b3 = a3;
|
45
|
+
a3 = _mm_slli_epi32(a3, 18);
|
46
|
+
b3 = _mm_srli_epi32(b3, 14);
|
47
|
+
diag0 = _mm_xor_si128(diag0, a3);
|
48
|
+
diag1 = _mm_shuffle_epi32(diag1, 0x39);
|
49
|
+
diag0 = _mm_xor_si128(diag0, b3);
|
50
|
+
|
51
|
+
a4 = _mm_add_epi32(a4, diag0);
|
52
|
+
a5 = diag0;
|
53
|
+
b4 = a4;
|
54
|
+
a4 = _mm_slli_epi32(a4, 7);
|
55
|
+
b4 = _mm_srli_epi32(b4, 25);
|
56
|
+
diag1 = _mm_xor_si128(diag1, a4);
|
57
|
+
|
58
|
+
diag1 = _mm_xor_si128(diag1, b4);
|
59
|
+
|
60
|
+
a5 = _mm_add_epi32(a5, diag1);
|
61
|
+
a6 = diag1;
|
62
|
+
b5 = a5;
|
63
|
+
a5 = _mm_slli_epi32(a5, 9);
|
64
|
+
b5 = _mm_srli_epi32(b5, 23);
|
65
|
+
diag2 = _mm_xor_si128(diag2, a5);
|
66
|
+
diag1 = _mm_shuffle_epi32(diag1, 0x93);
|
67
|
+
diag2 = _mm_xor_si128(diag2, b5);
|
68
|
+
|
69
|
+
a6 = _mm_add_epi32(a6, diag2);
|
70
|
+
a7 = diag2;
|
71
|
+
b6 = a6;
|
72
|
+
a6 = _mm_slli_epi32(a6, 13);
|
73
|
+
b6 = _mm_srli_epi32(b6, 19);
|
74
|
+
diag3 = _mm_xor_si128(diag3, a6);
|
75
|
+
diag2 = _mm_shuffle_epi32(diag2, 0x4e);
|
76
|
+
diag3 = _mm_xor_si128(diag3, b6);
|
77
|
+
|
78
|
+
a7 = _mm_add_epi32(a7, diag3);
|
79
|
+
a0 = diag1;
|
80
|
+
b7 = a7;
|
81
|
+
a7 = _mm_slli_epi32(a7, 18);
|
82
|
+
b7 = _mm_srli_epi32(b7, 14);
|
83
|
+
diag0 = _mm_xor_si128(diag0, a7);
|
84
|
+
diag3 = _mm_shuffle_epi32(diag3, 0x39);
|
85
|
+
diag0 = _mm_xor_si128(diag0, b7);
|
86
|
+
|
87
|
+
a0 = _mm_add_epi32(a0, diag0);
|
88
|
+
a1 = diag0;
|
89
|
+
b0 = a0;
|
90
|
+
a0 = _mm_slli_epi32(a0, 7);
|
91
|
+
b0 = _mm_srli_epi32(b0, 25);
|
92
|
+
diag3 = _mm_xor_si128(diag3, a0);
|
93
|
+
|
94
|
+
diag3 = _mm_xor_si128(diag3, b0);
|
95
|
+
|
96
|
+
a1 = _mm_add_epi32(a1, diag3);
|
97
|
+
a2 = diag3;
|
98
|
+
b1 = a1;
|
99
|
+
a1 = _mm_slli_epi32(a1, 9);
|
100
|
+
b1 = _mm_srli_epi32(b1, 23);
|
101
|
+
diag2 = _mm_xor_si128(diag2, a1);
|
102
|
+
diag3 = _mm_shuffle_epi32(diag3, 0x93);
|
103
|
+
diag2 = _mm_xor_si128(diag2, b1);
|
104
|
+
|
105
|
+
a2 = _mm_add_epi32(a2, diag2);
|
106
|
+
a3 = diag2;
|
107
|
+
b2 = a2;
|
108
|
+
a2 = _mm_slli_epi32(a2, 13);
|
109
|
+
b2 = _mm_srli_epi32(b2, 19);
|
110
|
+
diag1 = _mm_xor_si128(diag1, a2);
|
111
|
+
diag2 = _mm_shuffle_epi32(diag2, 0x4e);
|
112
|
+
diag1 = _mm_xor_si128(diag1, b2);
|
113
|
+
|
114
|
+
a3 = _mm_add_epi32(a3, diag1);
|
115
|
+
a4 = diag3;
|
116
|
+
b3 = a3;
|
117
|
+
a3 = _mm_slli_epi32(a3, 18);
|
118
|
+
b3 = _mm_srli_epi32(b3, 14);
|
119
|
+
diag0 = _mm_xor_si128(diag0, a3);
|
120
|
+
diag1 = _mm_shuffle_epi32(diag1, 0x39);
|
121
|
+
diag0 = _mm_xor_si128(diag0, b3);
|
122
|
+
|
123
|
+
a4 = _mm_add_epi32(a4, diag0);
|
124
|
+
a5 = diag0;
|
125
|
+
b4 = a4;
|
126
|
+
a4 = _mm_slli_epi32(a4, 7);
|
127
|
+
b4 = _mm_srli_epi32(b4, 25);
|
128
|
+
diag1 = _mm_xor_si128(diag1, a4);
|
129
|
+
|
130
|
+
diag1 = _mm_xor_si128(diag1, b4);
|
131
|
+
|
132
|
+
a5 = _mm_add_epi32(a5, diag1);
|
133
|
+
a6 = diag1;
|
134
|
+
b5 = a5;
|
135
|
+
a5 = _mm_slli_epi32(a5, 9);
|
136
|
+
b5 = _mm_srli_epi32(b5, 23);
|
137
|
+
diag2 = _mm_xor_si128(diag2, a5);
|
138
|
+
diag1 = _mm_shuffle_epi32(diag1, 0x93);
|
139
|
+
diag2 = _mm_xor_si128(diag2, b5);
|
140
|
+
|
141
|
+
a6 = _mm_add_epi32(a6, diag2);
|
142
|
+
a7 = diag2;
|
143
|
+
b6 = a6;
|
144
|
+
a6 = _mm_slli_epi32(a6, 13);
|
145
|
+
b6 = _mm_srli_epi32(b6, 19);
|
146
|
+
diag3 = _mm_xor_si128(diag3, a6);
|
147
|
+
diag2 = _mm_shuffle_epi32(diag2, 0x4e);
|
148
|
+
diag3 = _mm_xor_si128(diag3, b6);
|
149
|
+
|
150
|
+
a7 = _mm_add_epi32(a7, diag3);
|
151
|
+
a0 = diag1;
|
152
|
+
b7 = a7;
|
153
|
+
a7 = _mm_slli_epi32(a7, 18);
|
154
|
+
b7 = _mm_srli_epi32(b7, 14);
|
155
|
+
diag0 = _mm_xor_si128(diag0, a7);
|
156
|
+
diag3 = _mm_shuffle_epi32(diag3, 0x39);
|
157
|
+
diag0 = _mm_xor_si128(diag0, b7);
|
158
|
+
}
|
159
|
+
|
160
|
+
diag0 = _mm_add_epi32(diag0, _mm_loadu_si128((__m128i *) (x + 0)));
|
161
|
+
diag1 = _mm_add_epi32(diag1, _mm_loadu_si128((__m128i *) (x + 4)));
|
162
|
+
diag2 = _mm_add_epi32(diag2, _mm_loadu_si128((__m128i *) (x + 8)));
|
163
|
+
diag3 = _mm_add_epi32(diag3, _mm_loadu_si128((__m128i *) (x + 12)));
|
164
|
+
|
165
|
+
#define ONEQUAD_SHUFFLE(A, B, C, D) \
|
166
|
+
do { \
|
167
|
+
uint32_t in##A = _mm_cvtsi128_si32(diag0); \
|
168
|
+
uint32_t in##B = _mm_cvtsi128_si32(diag1); \
|
169
|
+
uint32_t in##C = _mm_cvtsi128_si32(diag2); \
|
170
|
+
uint32_t in##D = _mm_cvtsi128_si32(diag3); \
|
171
|
+
diag0 = _mm_shuffle_epi32(diag0, 0x39); \
|
172
|
+
diag1 = _mm_shuffle_epi32(diag1, 0x39); \
|
173
|
+
diag2 = _mm_shuffle_epi32(diag2, 0x39); \
|
174
|
+
diag3 = _mm_shuffle_epi32(diag3, 0x39); \
|
175
|
+
in##A ^= *(uint32_t *) (m + (A * 4)); \
|
176
|
+
in##B ^= *(uint32_t *) (m + (B * 4)); \
|
177
|
+
in##C ^= *(uint32_t *) (m + (C * 4)); \
|
178
|
+
in##D ^= *(uint32_t *) (m + (D * 4)); \
|
179
|
+
*(uint32_t *) (c + (A * 4)) = in##A; \
|
180
|
+
*(uint32_t *) (c + (B * 4)) = in##B; \
|
181
|
+
*(uint32_t *) (c + (C * 4)) = in##C; \
|
182
|
+
*(uint32_t *) (c + (D * 4)) = in##D; \
|
183
|
+
} while (0)
|
184
|
+
|
185
|
+
#define ONEQUAD(A, B, C, D) ONEQUAD_SHUFFLE(A, B, C, D)
|
186
|
+
|
187
|
+
ONEQUAD(0, 12, 8, 4);
|
188
|
+
ONEQUAD(5, 1, 13, 9);
|
189
|
+
ONEQUAD(10, 6, 2, 14);
|
190
|
+
ONEQUAD(15, 11, 7, 3);
|
191
|
+
|
192
|
+
#undef ONEQUAD
|
193
|
+
#undef ONEQUAD_SHUFFLE
|
194
|
+
|
195
|
+
in8 = x[8];
|
196
|
+
in9 = x[13];
|
197
|
+
in8++;
|
198
|
+
if (in8 == 0) {
|
199
|
+
in9++;
|
200
|
+
}
|
201
|
+
x[8] = in8;
|
202
|
+
x[13] = in9;
|
203
|
+
|
204
|
+
c += 64;
|
205
|
+
m += 64;
|
206
|
+
bytes -= 64;
|
207
|
+
}
|
@@ -0,0 +1,547 @@
|
|
1
|
+
if (bytes >= 256) {
|
2
|
+
__m128i y0, y1, y2, y3, y4, y5, y6, y7, y8, y9, y10, y11, y12, y13, y14,
|
3
|
+
y15;
|
4
|
+
__m128i z0, z1, z2, z3, z4, z5, z6, z7, z8, z9, z10, z11, z12, z13, z14,
|
5
|
+
z15;
|
6
|
+
__m128i orig0, orig1, orig2, orig3, orig4, orig5, orig6, orig7, orig8,
|
7
|
+
orig9, orig10, orig11, orig12, orig13, orig14, orig15;
|
8
|
+
|
9
|
+
uint32_t in8;
|
10
|
+
uint32_t in9;
|
11
|
+
int i;
|
12
|
+
|
13
|
+
/* element broadcast immediate for _mm_shuffle_epi32 are in order:
|
14
|
+
0x00, 0x55, 0xaa, 0xff */
|
15
|
+
z0 = _mm_loadu_si128((__m128i *) (x + 0));
|
16
|
+
z5 = _mm_shuffle_epi32(z0, 0x55);
|
17
|
+
z10 = _mm_shuffle_epi32(z0, 0xaa);
|
18
|
+
z15 = _mm_shuffle_epi32(z0, 0xff);
|
19
|
+
z0 = _mm_shuffle_epi32(z0, 0x00);
|
20
|
+
z1 = _mm_loadu_si128((__m128i *) (x + 4));
|
21
|
+
z6 = _mm_shuffle_epi32(z1, 0xaa);
|
22
|
+
z11 = _mm_shuffle_epi32(z1, 0xff);
|
23
|
+
z12 = _mm_shuffle_epi32(z1, 0x00);
|
24
|
+
z1 = _mm_shuffle_epi32(z1, 0x55);
|
25
|
+
z2 = _mm_loadu_si128((__m128i *) (x + 8));
|
26
|
+
z7 = _mm_shuffle_epi32(z2, 0xff);
|
27
|
+
z13 = _mm_shuffle_epi32(z2, 0x55);
|
28
|
+
z2 = _mm_shuffle_epi32(z2, 0xaa);
|
29
|
+
/* no z8 -> first half of the nonce, will fill later */
|
30
|
+
z3 = _mm_loadu_si128((__m128i *) (x + 12));
|
31
|
+
z4 = _mm_shuffle_epi32(z3, 0x00);
|
32
|
+
z14 = _mm_shuffle_epi32(z3, 0xaa);
|
33
|
+
z3 = _mm_shuffle_epi32(z3, 0xff);
|
34
|
+
/* no z9 -> second half of the nonce, will fill later */
|
35
|
+
orig0 = z0;
|
36
|
+
orig1 = z1;
|
37
|
+
orig2 = z2;
|
38
|
+
orig3 = z3;
|
39
|
+
orig4 = z4;
|
40
|
+
orig5 = z5;
|
41
|
+
orig6 = z6;
|
42
|
+
orig7 = z7;
|
43
|
+
orig10 = z10;
|
44
|
+
orig11 = z11;
|
45
|
+
orig12 = z12;
|
46
|
+
orig13 = z13;
|
47
|
+
orig14 = z14;
|
48
|
+
orig15 = z15;
|
49
|
+
|
50
|
+
while (bytes >= 256) {
|
51
|
+
/* vector implementation for z8 and z9 */
|
52
|
+
/* not sure if it helps for only 4 blocks */
|
53
|
+
const __m128i addv8 = _mm_set_epi64x(1, 0);
|
54
|
+
const __m128i addv9 = _mm_set_epi64x(3, 2);
|
55
|
+
__m128i t8, t9;
|
56
|
+
uint64_t in89;
|
57
|
+
|
58
|
+
in8 = x[8];
|
59
|
+
in9 = x[13];
|
60
|
+
in89 = ((uint64_t) in8) | (((uint64_t) in9) << 32);
|
61
|
+
t8 = _mm_set1_epi64x(in89);
|
62
|
+
t9 = _mm_set1_epi64x(in89);
|
63
|
+
|
64
|
+
z8 = _mm_add_epi64(addv8, t8);
|
65
|
+
z9 = _mm_add_epi64(addv9, t9);
|
66
|
+
|
67
|
+
t8 = _mm_unpacklo_epi32(z8, z9);
|
68
|
+
t9 = _mm_unpackhi_epi32(z8, z9);
|
69
|
+
|
70
|
+
z8 = _mm_unpacklo_epi32(t8, t9);
|
71
|
+
z9 = _mm_unpackhi_epi32(t8, t9);
|
72
|
+
|
73
|
+
orig8 = z8;
|
74
|
+
orig9 = z9;
|
75
|
+
|
76
|
+
in89 += 4;
|
77
|
+
|
78
|
+
x[8] = in89 & 0xFFFFFFFF;
|
79
|
+
x[13] = (in89 >> 32) & 0xFFFFFFFF;
|
80
|
+
|
81
|
+
z5 = orig5;
|
82
|
+
z10 = orig10;
|
83
|
+
z15 = orig15;
|
84
|
+
z14 = orig14;
|
85
|
+
z3 = orig3;
|
86
|
+
z6 = orig6;
|
87
|
+
z11 = orig11;
|
88
|
+
z1 = orig1;
|
89
|
+
|
90
|
+
z7 = orig7;
|
91
|
+
z13 = orig13;
|
92
|
+
z2 = orig2;
|
93
|
+
z9 = orig9;
|
94
|
+
z0 = orig0;
|
95
|
+
z12 = orig12;
|
96
|
+
z4 = orig4;
|
97
|
+
z8 = orig8;
|
98
|
+
|
99
|
+
for (i = 0; i < ROUNDS; i += 2) {
|
100
|
+
/* the inner loop is a direct translation (regexp search/replace)
|
101
|
+
* from the amd64-xmm6 ASM */
|
102
|
+
__m128i r0, r1, r2, r3, r4, r5, r6, r7, r8, r9, r10, r11, r12, r13,
|
103
|
+
r14, r15;
|
104
|
+
|
105
|
+
y4 = z12;
|
106
|
+
y4 = _mm_add_epi32(y4, z0);
|
107
|
+
r4 = y4;
|
108
|
+
y4 = _mm_slli_epi32(y4, 7);
|
109
|
+
z4 = _mm_xor_si128(z4, y4);
|
110
|
+
r4 = _mm_srli_epi32(r4, 25);
|
111
|
+
z4 = _mm_xor_si128(z4, r4);
|
112
|
+
|
113
|
+
y9 = z1;
|
114
|
+
y9 = _mm_add_epi32(y9, z5);
|
115
|
+
r9 = y9;
|
116
|
+
y9 = _mm_slli_epi32(y9, 7);
|
117
|
+
z9 = _mm_xor_si128(z9, y9);
|
118
|
+
r9 = _mm_srli_epi32(r9, 25);
|
119
|
+
z9 = _mm_xor_si128(z9, r9);
|
120
|
+
|
121
|
+
y8 = z0;
|
122
|
+
y8 = _mm_add_epi32(y8, z4);
|
123
|
+
r8 = y8;
|
124
|
+
y8 = _mm_slli_epi32(y8, 9);
|
125
|
+
z8 = _mm_xor_si128(z8, y8);
|
126
|
+
r8 = _mm_srli_epi32(r8, 23);
|
127
|
+
z8 = _mm_xor_si128(z8, r8);
|
128
|
+
|
129
|
+
y13 = z5;
|
130
|
+
y13 = _mm_add_epi32(y13, z9);
|
131
|
+
r13 = y13;
|
132
|
+
y13 = _mm_slli_epi32(y13, 9);
|
133
|
+
z13 = _mm_xor_si128(z13, y13);
|
134
|
+
r13 = _mm_srli_epi32(r13, 23);
|
135
|
+
z13 = _mm_xor_si128(z13, r13);
|
136
|
+
|
137
|
+
y12 = z4;
|
138
|
+
y12 = _mm_add_epi32(y12, z8);
|
139
|
+
r12 = y12;
|
140
|
+
y12 = _mm_slli_epi32(y12, 13);
|
141
|
+
z12 = _mm_xor_si128(z12, y12);
|
142
|
+
r12 = _mm_srli_epi32(r12, 19);
|
143
|
+
z12 = _mm_xor_si128(z12, r12);
|
144
|
+
|
145
|
+
y1 = z9;
|
146
|
+
y1 = _mm_add_epi32(y1, z13);
|
147
|
+
r1 = y1;
|
148
|
+
y1 = _mm_slli_epi32(y1, 13);
|
149
|
+
z1 = _mm_xor_si128(z1, y1);
|
150
|
+
r1 = _mm_srli_epi32(r1, 19);
|
151
|
+
z1 = _mm_xor_si128(z1, r1);
|
152
|
+
|
153
|
+
y0 = z8;
|
154
|
+
y0 = _mm_add_epi32(y0, z12);
|
155
|
+
r0 = y0;
|
156
|
+
y0 = _mm_slli_epi32(y0, 18);
|
157
|
+
z0 = _mm_xor_si128(z0, y0);
|
158
|
+
r0 = _mm_srli_epi32(r0, 14);
|
159
|
+
z0 = _mm_xor_si128(z0, r0);
|
160
|
+
|
161
|
+
y5 = z13;
|
162
|
+
y5 = _mm_add_epi32(y5, z1);
|
163
|
+
r5 = y5;
|
164
|
+
y5 = _mm_slli_epi32(y5, 18);
|
165
|
+
z5 = _mm_xor_si128(z5, y5);
|
166
|
+
r5 = _mm_srli_epi32(r5, 14);
|
167
|
+
z5 = _mm_xor_si128(z5, r5);
|
168
|
+
|
169
|
+
y14 = z6;
|
170
|
+
y14 = _mm_add_epi32(y14, z10);
|
171
|
+
r14 = y14;
|
172
|
+
y14 = _mm_slli_epi32(y14, 7);
|
173
|
+
z14 = _mm_xor_si128(z14, y14);
|
174
|
+
r14 = _mm_srli_epi32(r14, 25);
|
175
|
+
z14 = _mm_xor_si128(z14, r14);
|
176
|
+
|
177
|
+
y3 = z11;
|
178
|
+
y3 = _mm_add_epi32(y3, z15);
|
179
|
+
r3 = y3;
|
180
|
+
y3 = _mm_slli_epi32(y3, 7);
|
181
|
+
z3 = _mm_xor_si128(z3, y3);
|
182
|
+
r3 = _mm_srli_epi32(r3, 25);
|
183
|
+
z3 = _mm_xor_si128(z3, r3);
|
184
|
+
|
185
|
+
y2 = z10;
|
186
|
+
y2 = _mm_add_epi32(y2, z14);
|
187
|
+
r2 = y2;
|
188
|
+
y2 = _mm_slli_epi32(y2, 9);
|
189
|
+
z2 = _mm_xor_si128(z2, y2);
|
190
|
+
r2 = _mm_srli_epi32(r2, 23);
|
191
|
+
z2 = _mm_xor_si128(z2, r2);
|
192
|
+
|
193
|
+
y7 = z15;
|
194
|
+
y7 = _mm_add_epi32(y7, z3);
|
195
|
+
r7 = y7;
|
196
|
+
y7 = _mm_slli_epi32(y7, 9);
|
197
|
+
z7 = _mm_xor_si128(z7, y7);
|
198
|
+
r7 = _mm_srli_epi32(r7, 23);
|
199
|
+
z7 = _mm_xor_si128(z7, r7);
|
200
|
+
|
201
|
+
y6 = z14;
|
202
|
+
y6 = _mm_add_epi32(y6, z2);
|
203
|
+
r6 = y6;
|
204
|
+
y6 = _mm_slli_epi32(y6, 13);
|
205
|
+
z6 = _mm_xor_si128(z6, y6);
|
206
|
+
r6 = _mm_srli_epi32(r6, 19);
|
207
|
+
z6 = _mm_xor_si128(z6, r6);
|
208
|
+
|
209
|
+
y11 = z3;
|
210
|
+
y11 = _mm_add_epi32(y11, z7);
|
211
|
+
r11 = y11;
|
212
|
+
y11 = _mm_slli_epi32(y11, 13);
|
213
|
+
z11 = _mm_xor_si128(z11, y11);
|
214
|
+
r11 = _mm_srli_epi32(r11, 19);
|
215
|
+
z11 = _mm_xor_si128(z11, r11);
|
216
|
+
|
217
|
+
y10 = z2;
|
218
|
+
y10 = _mm_add_epi32(y10, z6);
|
219
|
+
r10 = y10;
|
220
|
+
y10 = _mm_slli_epi32(y10, 18);
|
221
|
+
z10 = _mm_xor_si128(z10, y10);
|
222
|
+
r10 = _mm_srli_epi32(r10, 14);
|
223
|
+
z10 = _mm_xor_si128(z10, r10);
|
224
|
+
|
225
|
+
y1 = z3;
|
226
|
+
y1 = _mm_add_epi32(y1, z0);
|
227
|
+
r1 = y1;
|
228
|
+
y1 = _mm_slli_epi32(y1, 7);
|
229
|
+
z1 = _mm_xor_si128(z1, y1);
|
230
|
+
r1 = _mm_srli_epi32(r1, 25);
|
231
|
+
z1 = _mm_xor_si128(z1, r1);
|
232
|
+
|
233
|
+
y15 = z7;
|
234
|
+
y15 = _mm_add_epi32(y15, z11);
|
235
|
+
r15 = y15;
|
236
|
+
y15 = _mm_slli_epi32(y15, 18);
|
237
|
+
z15 = _mm_xor_si128(z15, y15);
|
238
|
+
r15 = _mm_srli_epi32(r15, 14);
|
239
|
+
z15 = _mm_xor_si128(z15, r15);
|
240
|
+
|
241
|
+
y6 = z4;
|
242
|
+
y6 = _mm_add_epi32(y6, z5);
|
243
|
+
r6 = y6;
|
244
|
+
y6 = _mm_slli_epi32(y6, 7);
|
245
|
+
z6 = _mm_xor_si128(z6, y6);
|
246
|
+
r6 = _mm_srli_epi32(r6, 25);
|
247
|
+
z6 = _mm_xor_si128(z6, r6);
|
248
|
+
|
249
|
+
y2 = z0;
|
250
|
+
y2 = _mm_add_epi32(y2, z1);
|
251
|
+
r2 = y2;
|
252
|
+
y2 = _mm_slli_epi32(y2, 9);
|
253
|
+
z2 = _mm_xor_si128(z2, y2);
|
254
|
+
r2 = _mm_srli_epi32(r2, 23);
|
255
|
+
z2 = _mm_xor_si128(z2, r2);
|
256
|
+
|
257
|
+
y7 = z5;
|
258
|
+
y7 = _mm_add_epi32(y7, z6);
|
259
|
+
r7 = y7;
|
260
|
+
y7 = _mm_slli_epi32(y7, 9);
|
261
|
+
z7 = _mm_xor_si128(z7, y7);
|
262
|
+
r7 = _mm_srli_epi32(r7, 23);
|
263
|
+
z7 = _mm_xor_si128(z7, r7);
|
264
|
+
|
265
|
+
y3 = z1;
|
266
|
+
y3 = _mm_add_epi32(y3, z2);
|
267
|
+
r3 = y3;
|
268
|
+
y3 = _mm_slli_epi32(y3, 13);
|
269
|
+
z3 = _mm_xor_si128(z3, y3);
|
270
|
+
r3 = _mm_srli_epi32(r3, 19);
|
271
|
+
z3 = _mm_xor_si128(z3, r3);
|
272
|
+
|
273
|
+
y4 = z6;
|
274
|
+
y4 = _mm_add_epi32(y4, z7);
|
275
|
+
r4 = y4;
|
276
|
+
y4 = _mm_slli_epi32(y4, 13);
|
277
|
+
z4 = _mm_xor_si128(z4, y4);
|
278
|
+
r4 = _mm_srli_epi32(r4, 19);
|
279
|
+
z4 = _mm_xor_si128(z4, r4);
|
280
|
+
|
281
|
+
y0 = z2;
|
282
|
+
y0 = _mm_add_epi32(y0, z3);
|
283
|
+
r0 = y0;
|
284
|
+
y0 = _mm_slli_epi32(y0, 18);
|
285
|
+
z0 = _mm_xor_si128(z0, y0);
|
286
|
+
r0 = _mm_srli_epi32(r0, 14);
|
287
|
+
z0 = _mm_xor_si128(z0, r0);
|
288
|
+
|
289
|
+
y5 = z7;
|
290
|
+
y5 = _mm_add_epi32(y5, z4);
|
291
|
+
r5 = y5;
|
292
|
+
y5 = _mm_slli_epi32(y5, 18);
|
293
|
+
z5 = _mm_xor_si128(z5, y5);
|
294
|
+
r5 = _mm_srli_epi32(r5, 14);
|
295
|
+
z5 = _mm_xor_si128(z5, r5);
|
296
|
+
|
297
|
+
y11 = z9;
|
298
|
+
y11 = _mm_add_epi32(y11, z10);
|
299
|
+
r11 = y11;
|
300
|
+
y11 = _mm_slli_epi32(y11, 7);
|
301
|
+
z11 = _mm_xor_si128(z11, y11);
|
302
|
+
r11 = _mm_srli_epi32(r11, 25);
|
303
|
+
z11 = _mm_xor_si128(z11, r11);
|
304
|
+
|
305
|
+
y12 = z14;
|
306
|
+
y12 = _mm_add_epi32(y12, z15);
|
307
|
+
r12 = y12;
|
308
|
+
y12 = _mm_slli_epi32(y12, 7);
|
309
|
+
z12 = _mm_xor_si128(z12, y12);
|
310
|
+
r12 = _mm_srli_epi32(r12, 25);
|
311
|
+
z12 = _mm_xor_si128(z12, r12);
|
312
|
+
|
313
|
+
y8 = z10;
|
314
|
+
y8 = _mm_add_epi32(y8, z11);
|
315
|
+
r8 = y8;
|
316
|
+
y8 = _mm_slli_epi32(y8, 9);
|
317
|
+
z8 = _mm_xor_si128(z8, y8);
|
318
|
+
r8 = _mm_srli_epi32(r8, 23);
|
319
|
+
z8 = _mm_xor_si128(z8, r8);
|
320
|
+
|
321
|
+
y13 = z15;
|
322
|
+
y13 = _mm_add_epi32(y13, z12);
|
323
|
+
r13 = y13;
|
324
|
+
y13 = _mm_slli_epi32(y13, 9);
|
325
|
+
z13 = _mm_xor_si128(z13, y13);
|
326
|
+
r13 = _mm_srli_epi32(r13, 23);
|
327
|
+
z13 = _mm_xor_si128(z13, r13);
|
328
|
+
|
329
|
+
y9 = z11;
|
330
|
+
y9 = _mm_add_epi32(y9, z8);
|
331
|
+
r9 = y9;
|
332
|
+
y9 = _mm_slli_epi32(y9, 13);
|
333
|
+
z9 = _mm_xor_si128(z9, y9);
|
334
|
+
r9 = _mm_srli_epi32(r9, 19);
|
335
|
+
z9 = _mm_xor_si128(z9, r9);
|
336
|
+
|
337
|
+
y14 = z12;
|
338
|
+
y14 = _mm_add_epi32(y14, z13);
|
339
|
+
r14 = y14;
|
340
|
+
y14 = _mm_slli_epi32(y14, 13);
|
341
|
+
z14 = _mm_xor_si128(z14, y14);
|
342
|
+
r14 = _mm_srli_epi32(r14, 19);
|
343
|
+
z14 = _mm_xor_si128(z14, r14);
|
344
|
+
|
345
|
+
y10 = z8;
|
346
|
+
y10 = _mm_add_epi32(y10, z9);
|
347
|
+
r10 = y10;
|
348
|
+
y10 = _mm_slli_epi32(y10, 18);
|
349
|
+
z10 = _mm_xor_si128(z10, y10);
|
350
|
+
r10 = _mm_srli_epi32(r10, 14);
|
351
|
+
z10 = _mm_xor_si128(z10, r10);
|
352
|
+
|
353
|
+
y15 = z13;
|
354
|
+
y15 = _mm_add_epi32(y15, z14);
|
355
|
+
r15 = y15;
|
356
|
+
y15 = _mm_slli_epi32(y15, 18);
|
357
|
+
z15 = _mm_xor_si128(z15, y15);
|
358
|
+
r15 = _mm_srli_epi32(r15, 14);
|
359
|
+
z15 = _mm_xor_si128(z15, r15);
|
360
|
+
}
|
361
|
+
|
362
|
+
/* store data ; this macro replicates the original amd64-xmm6 code */
|
363
|
+
#define ONEQUAD_SHUFFLE(A, B, C, D) \
|
364
|
+
z##A = _mm_add_epi32(z##A, orig##A); \
|
365
|
+
z##B = _mm_add_epi32(z##B, orig##B); \
|
366
|
+
z##C = _mm_add_epi32(z##C, orig##C); \
|
367
|
+
z##D = _mm_add_epi32(z##D, orig##D); \
|
368
|
+
in##A = _mm_cvtsi128_si32(z##A); \
|
369
|
+
in##B = _mm_cvtsi128_si32(z##B); \
|
370
|
+
in##C = _mm_cvtsi128_si32(z##C); \
|
371
|
+
in##D = _mm_cvtsi128_si32(z##D); \
|
372
|
+
z##A = _mm_shuffle_epi32(z##A, 0x39); \
|
373
|
+
z##B = _mm_shuffle_epi32(z##B, 0x39); \
|
374
|
+
z##C = _mm_shuffle_epi32(z##C, 0x39); \
|
375
|
+
z##D = _mm_shuffle_epi32(z##D, 0x39); \
|
376
|
+
\
|
377
|
+
in##A ^= *(uint32_t *) (m + 0); \
|
378
|
+
in##B ^= *(uint32_t *) (m + 4); \
|
379
|
+
in##C ^= *(uint32_t *) (m + 8); \
|
380
|
+
in##D ^= *(uint32_t *) (m + 12); \
|
381
|
+
\
|
382
|
+
*(uint32_t *) (c + 0) = in##A; \
|
383
|
+
*(uint32_t *) (c + 4) = in##B; \
|
384
|
+
*(uint32_t *) (c + 8) = in##C; \
|
385
|
+
*(uint32_t *) (c + 12) = in##D; \
|
386
|
+
\
|
387
|
+
in##A = _mm_cvtsi128_si32(z##A); \
|
388
|
+
in##B = _mm_cvtsi128_si32(z##B); \
|
389
|
+
in##C = _mm_cvtsi128_si32(z##C); \
|
390
|
+
in##D = _mm_cvtsi128_si32(z##D); \
|
391
|
+
z##A = _mm_shuffle_epi32(z##A, 0x39); \
|
392
|
+
z##B = _mm_shuffle_epi32(z##B, 0x39); \
|
393
|
+
z##C = _mm_shuffle_epi32(z##C, 0x39); \
|
394
|
+
z##D = _mm_shuffle_epi32(z##D, 0x39); \
|
395
|
+
\
|
396
|
+
in##A ^= *(uint32_t *) (m + 64); \
|
397
|
+
in##B ^= *(uint32_t *) (m + 68); \
|
398
|
+
in##C ^= *(uint32_t *) (m + 72); \
|
399
|
+
in##D ^= *(uint32_t *) (m + 76); \
|
400
|
+
*(uint32_t *) (c + 64) = in##A; \
|
401
|
+
*(uint32_t *) (c + 68) = in##B; \
|
402
|
+
*(uint32_t *) (c + 72) = in##C; \
|
403
|
+
*(uint32_t *) (c + 76) = in##D; \
|
404
|
+
\
|
405
|
+
in##A = _mm_cvtsi128_si32(z##A); \
|
406
|
+
in##B = _mm_cvtsi128_si32(z##B); \
|
407
|
+
in##C = _mm_cvtsi128_si32(z##C); \
|
408
|
+
in##D = _mm_cvtsi128_si32(z##D); \
|
409
|
+
z##A = _mm_shuffle_epi32(z##A, 0x39); \
|
410
|
+
z##B = _mm_shuffle_epi32(z##B, 0x39); \
|
411
|
+
z##C = _mm_shuffle_epi32(z##C, 0x39); \
|
412
|
+
z##D = _mm_shuffle_epi32(z##D, 0x39); \
|
413
|
+
\
|
414
|
+
in##A ^= *(uint32_t *) (m + 128); \
|
415
|
+
in##B ^= *(uint32_t *) (m + 132); \
|
416
|
+
in##C ^= *(uint32_t *) (m + 136); \
|
417
|
+
in##D ^= *(uint32_t *) (m + 140); \
|
418
|
+
*(uint32_t *) (c + 128) = in##A; \
|
419
|
+
*(uint32_t *) (c + 132) = in##B; \
|
420
|
+
*(uint32_t *) (c + 136) = in##C; \
|
421
|
+
*(uint32_t *) (c + 140) = in##D; \
|
422
|
+
\
|
423
|
+
in##A = _mm_cvtsi128_si32(z##A); \
|
424
|
+
in##B = _mm_cvtsi128_si32(z##B); \
|
425
|
+
in##C = _mm_cvtsi128_si32(z##C); \
|
426
|
+
in##D = _mm_cvtsi128_si32(z##D); \
|
427
|
+
\
|
428
|
+
in##A ^= *(uint32_t *) (m + 192); \
|
429
|
+
in##B ^= *(uint32_t *) (m + 196); \
|
430
|
+
in##C ^= *(uint32_t *) (m + 200); \
|
431
|
+
in##D ^= *(uint32_t *) (m + 204); \
|
432
|
+
*(uint32_t *) (c + 192) = in##A; \
|
433
|
+
*(uint32_t *) (c + 196) = in##B; \
|
434
|
+
*(uint32_t *) (c + 200) = in##C; \
|
435
|
+
*(uint32_t *) (c + 204) = in##D
|
436
|
+
|
437
|
+
/* store data ; this macro replaces shuffle+mov by a direct extract; not much
|
438
|
+
* difference */
|
439
|
+
#define ONEQUAD_EXTRACT(A, B, C, D) \
|
440
|
+
z##A = _mm_add_epi32(z##A, orig##A); \
|
441
|
+
z##B = _mm_add_epi32(z##B, orig##B); \
|
442
|
+
z##C = _mm_add_epi32(z##C, orig##C); \
|
443
|
+
z##D = _mm_add_epi32(z##D, orig##D); \
|
444
|
+
in##A = _mm_cvtsi128_si32(z##A); \
|
445
|
+
in##B = _mm_cvtsi128_si32(z##B); \
|
446
|
+
in##C = _mm_cvtsi128_si32(z##C); \
|
447
|
+
in##D = _mm_cvtsi128_si32(z##D); \
|
448
|
+
in##A ^= *(uint32_t *) (m + 0); \
|
449
|
+
in##B ^= *(uint32_t *) (m + 4); \
|
450
|
+
in##C ^= *(uint32_t *) (m + 8); \
|
451
|
+
in##D ^= *(uint32_t *) (m + 12); \
|
452
|
+
*(uint32_t *) (c + 0) = in##A; \
|
453
|
+
*(uint32_t *) (c + 4) = in##B; \
|
454
|
+
*(uint32_t *) (c + 8) = in##C; \
|
455
|
+
*(uint32_t *) (c + 12) = in##D; \
|
456
|
+
\
|
457
|
+
in##A = _mm_extract_epi32(z##A, 1); \
|
458
|
+
in##B = _mm_extract_epi32(z##B, 1); \
|
459
|
+
in##C = _mm_extract_epi32(z##C, 1); \
|
460
|
+
in##D = _mm_extract_epi32(z##D, 1); \
|
461
|
+
\
|
462
|
+
in##A ^= *(uint32_t *) (m + 64); \
|
463
|
+
in##B ^= *(uint32_t *) (m + 68); \
|
464
|
+
in##C ^= *(uint32_t *) (m + 72); \
|
465
|
+
in##D ^= *(uint32_t *) (m + 76); \
|
466
|
+
*(uint32_t *) (c + 64) = in##A; \
|
467
|
+
*(uint32_t *) (c + 68) = in##B; \
|
468
|
+
*(uint32_t *) (c + 72) = in##C; \
|
469
|
+
*(uint32_t *) (c + 76) = in##D; \
|
470
|
+
\
|
471
|
+
in##A = _mm_extract_epi32(z##A, 2); \
|
472
|
+
in##B = _mm_extract_epi32(z##B, 2); \
|
473
|
+
in##C = _mm_extract_epi32(z##C, 2); \
|
474
|
+
in##D = _mm_extract_epi32(z##D, 2); \
|
475
|
+
\
|
476
|
+
in##A ^= *(uint32_t *) (m + 128); \
|
477
|
+
in##B ^= *(uint32_t *) (m + 132); \
|
478
|
+
in##C ^= *(uint32_t *) (m + 136); \
|
479
|
+
in##D ^= *(uint32_t *) (m + 140); \
|
480
|
+
*(uint32_t *) (c + 128) = in##A; \
|
481
|
+
*(uint32_t *) (c + 132) = in##B; \
|
482
|
+
*(uint32_t *) (c + 136) = in##C; \
|
483
|
+
*(uint32_t *) (c + 140) = in##D; \
|
484
|
+
\
|
485
|
+
in##A = _mm_extract_epi32(z##A, 3); \
|
486
|
+
in##B = _mm_extract_epi32(z##B, 3); \
|
487
|
+
in##C = _mm_extract_epi32(z##C, 3); \
|
488
|
+
in##D = _mm_extract_epi32(z##D, 3); \
|
489
|
+
\
|
490
|
+
in##A ^= *(uint32_t *) (m + 192); \
|
491
|
+
in##B ^= *(uint32_t *) (m + 196); \
|
492
|
+
in##C ^= *(uint32_t *) (m + 200); \
|
493
|
+
in##D ^= *(uint32_t *) (m + 204); \
|
494
|
+
*(uint32_t *) (c + 192) = in##A; \
|
495
|
+
*(uint32_t *) (c + 196) = in##B; \
|
496
|
+
*(uint32_t *) (c + 200) = in##C; \
|
497
|
+
*(uint32_t *) (c + 204) = in##D
|
498
|
+
|
499
|
+
/* store data ; this macro first transpose data in-registers, and then store
|
500
|
+
* them in memory. much faster with icc. */
|
501
|
+
#define ONEQUAD_TRANSPOSE(A, B, C, D) \
|
502
|
+
z##A = _mm_add_epi32(z##A, orig##A); \
|
503
|
+
z##B = _mm_add_epi32(z##B, orig##B); \
|
504
|
+
z##C = _mm_add_epi32(z##C, orig##C); \
|
505
|
+
z##D = _mm_add_epi32(z##D, orig##D); \
|
506
|
+
y##A = _mm_unpacklo_epi32(z##A, z##B); \
|
507
|
+
y##B = _mm_unpacklo_epi32(z##C, z##D); \
|
508
|
+
y##C = _mm_unpackhi_epi32(z##A, z##B); \
|
509
|
+
y##D = _mm_unpackhi_epi32(z##C, z##D); \
|
510
|
+
z##A = _mm_unpacklo_epi64(y##A, y##B); \
|
511
|
+
z##B = _mm_unpackhi_epi64(y##A, y##B); \
|
512
|
+
z##C = _mm_unpacklo_epi64(y##C, y##D); \
|
513
|
+
z##D = _mm_unpackhi_epi64(y##C, y##D); \
|
514
|
+
y##A = _mm_xor_si128(z##A, _mm_loadu_si128((__m128i *) (m + 0))); \
|
515
|
+
_mm_storeu_si128((__m128i *) (c + 0), y##A); \
|
516
|
+
y##B = _mm_xor_si128(z##B, _mm_loadu_si128((__m128i *) (m + 64))); \
|
517
|
+
_mm_storeu_si128((__m128i *) (c + 64), y##B); \
|
518
|
+
y##C = _mm_xor_si128(z##C, _mm_loadu_si128((__m128i *) (m + 128))); \
|
519
|
+
_mm_storeu_si128((__m128i *) (c + 128), y##C); \
|
520
|
+
y##D = _mm_xor_si128(z##D, _mm_loadu_si128((__m128i *) (m + 192))); \
|
521
|
+
_mm_storeu_si128((__m128i *) (c + 192), y##D)
|
522
|
+
|
523
|
+
#define ONEQUAD(A, B, C, D) ONEQUAD_TRANSPOSE(A, B, C, D)
|
524
|
+
|
525
|
+
ONEQUAD(0, 1, 2, 3);
|
526
|
+
m += 16;
|
527
|
+
c += 16;
|
528
|
+
ONEQUAD(4, 5, 6, 7);
|
529
|
+
m += 16;
|
530
|
+
c += 16;
|
531
|
+
ONEQUAD(8, 9, 10, 11);
|
532
|
+
m += 16;
|
533
|
+
c += 16;
|
534
|
+
ONEQUAD(12, 13, 14, 15);
|
535
|
+
m -= 48;
|
536
|
+
c -= 48;
|
537
|
+
|
538
|
+
#undef ONEQUAD
|
539
|
+
#undef ONEQUAD_TRANSPOSE
|
540
|
+
#undef ONEQUAD_EXTRACT
|
541
|
+
#undef ONEQUAD_SHUFFLE
|
542
|
+
|
543
|
+
bytes -= 256;
|
544
|
+
c += 256;
|
545
|
+
m += 256;
|
546
|
+
}
|
547
|
+
}
|