rbnacl-libsodium 1.0.11 → 1.0.13
Sign up to get free protection for your applications and to get access to all the features.
- checksums.yaml +4 -4
- data/CHANGES.md +4 -0
- data/lib/rbnacl/libsodium/version.rb +1 -1
- data/vendor/libsodium/AUTHORS +45 -33
- data/vendor/libsodium/ChangeLog +63 -2
- data/vendor/libsodium/LICENSE +1 -1
- data/vendor/libsodium/Makefile.am +1 -0
- data/vendor/libsodium/Makefile.in +17 -14
- data/vendor/libsodium/README.markdown +1 -0
- data/vendor/libsodium/THANKS +38 -4
- data/vendor/libsodium/aclocal.m4 +25 -24
- data/vendor/libsodium/autogen.sh +12 -7
- data/vendor/libsodium/autom4te.cache/output.0 +5066 -2281
- data/vendor/libsodium/autom4te.cache/output.1 +1013 -600
- data/vendor/libsodium/autom4te.cache/output.2 +5066 -2281
- data/vendor/libsodium/autom4te.cache/requests +426 -1584
- data/vendor/libsodium/autom4te.cache/traces.0 +2044 -876
- data/vendor/libsodium/autom4te.cache/traces.1 +996 -523
- data/vendor/libsodium/autom4te.cache/traces.2 +1996 -828
- data/vendor/libsodium/build-aux/compile +5 -4
- data/vendor/libsodium/build-aux/config.guess +120 -68
- data/vendor/libsodium/build-aux/config.sub +51 -22
- data/vendor/libsodium/build-aux/depcomp +3 -3
- data/vendor/libsodium/build-aux/install-sh +2 -2
- data/vendor/libsodium/build-aux/missing +3 -3
- data/vendor/libsodium/build-aux/test-driver +3 -3
- data/vendor/libsodium/builds/msvc/properties/Win32.props +4 -1
- data/vendor/libsodium/builds/msvc/properties/x64.props +4 -1
- data/vendor/libsodium/builds/msvc/resource.h +14 -0
- data/vendor/libsodium/builds/msvc/resource.rc +63 -0
- data/vendor/libsodium/builds/msvc/version.h +7 -4
- data/vendor/libsodium/builds/msvc/vs2010/libsodium.import.props +1 -1
- data/vendor/libsodium/builds/msvc/vs2010/libsodium/libsodium.props +10 -5
- data/vendor/libsodium/builds/msvc/vs2010/libsodium/libsodium.vcxproj +182 -139
- data/vendor/libsodium/builds/msvc/vs2010/libsodium/libsodium.vcxproj.filters +632 -470
- data/vendor/libsodium/builds/msvc/vs2012/libsodium.import.props +1 -1
- data/vendor/libsodium/builds/msvc/vs2012/libsodium/libsodium.props +10 -5
- data/vendor/libsodium/builds/msvc/vs2012/libsodium/libsodium.vcxproj +182 -129
- data/vendor/libsodium/builds/msvc/vs2012/libsodium/libsodium.vcxproj.filters +632 -470
- data/vendor/libsodium/builds/msvc/vs2013/libsodium.import.props +1 -1
- data/vendor/libsodium/builds/msvc/vs2013/libsodium/libsodium.props +10 -5
- data/vendor/libsodium/builds/msvc/vs2013/libsodium/libsodium.vcxproj +182 -129
- data/vendor/libsodium/builds/msvc/vs2013/libsodium/libsodium.vcxproj.filters +632 -470
- data/vendor/libsodium/builds/msvc/vs2015/libsodium.import.props +1 -1
- data/vendor/libsodium/builds/msvc/vs2015/libsodium/libsodium.props +10 -5
- data/vendor/libsodium/builds/msvc/vs2015/libsodium/libsodium.vcxproj +181 -118
- data/vendor/libsodium/builds/msvc/vs2015/libsodium/libsodium.vcxproj.filters +632 -470
- data/vendor/libsodium/builds/msvc/vs2017/libsodium.import.props +52 -0
- data/vendor/libsodium/builds/msvc/vs2017/libsodium.import.xml +17 -0
- data/vendor/libsodium/builds/msvc/vs2017/libsodium.sln +52 -0
- data/vendor/libsodium/builds/msvc/vs2017/libsodium/libsodium.props +48 -0
- data/vendor/libsodium/builds/msvc/vs2017/libsodium/libsodium.vcxproj +320 -0
- data/vendor/libsodium/builds/msvc/vs2017/libsodium/libsodium.vcxproj.filters +962 -0
- data/vendor/libsodium/builds/msvc/vs2017/libsodium/libsodium.xml +15 -0
- data/vendor/libsodium/configure +1002 -589
- data/vendor/libsodium/configure.ac +48 -21
- data/vendor/libsodium/contrib/Findsodium.cmake +267 -0
- data/vendor/libsodium/contrib/Makefile.am +3 -0
- data/vendor/libsodium/contrib/Makefile.in +483 -0
- data/vendor/libsodium/dist-build/Makefile.in +11 -7
- data/vendor/libsodium/dist-build/android-armv8-a.sh +1 -1
- data/vendor/libsodium/dist-build/android-build.sh +25 -17
- data/vendor/libsodium/dist-build/android-mips32.sh +1 -1
- data/vendor/libsodium/dist-build/android-mips64.sh +1 -1
- data/vendor/libsodium/dist-build/android-x86_64.sh +1 -1
- data/vendor/libsodium/dist-build/emscripten-symbols.def +150 -2
- data/vendor/libsodium/dist-build/emscripten-wasm.sh +132 -0
- data/vendor/libsodium/dist-build/emscripten.sh +8 -6
- data/vendor/libsodium/dist-build/ios.sh +29 -5
- data/vendor/libsodium/libsodium.vcxproj +139 -77
- data/vendor/libsodium/libsodium.vcxproj.filters +315 -144
- data/vendor/libsodium/m4/ax_check_catchable_segv.m4 +42 -0
- data/vendor/libsodium/m4/ax_check_compile_flag.m4 +6 -4
- data/vendor/libsodium/m4/ax_check_define.m4 +3 -3
- data/vendor/libsodium/m4/ax_check_gnu_make.m4 +31 -25
- data/vendor/libsodium/m4/ax_check_link_flag.m4 +8 -6
- data/vendor/libsodium/m4/ax_pthread.m4 +275 -275
- data/vendor/libsodium/m4/ax_valgrind_check.m4 +92 -41
- data/vendor/libsodium/m4/pkg.m4 +1 -1
- data/vendor/libsodium/msvc-scripts/Makefile.in +11 -7
- data/vendor/libsodium/msvc-scripts/process.bat +4 -3
- data/vendor/libsodium/packaging/dotnet-core/README.md +59 -0
- data/vendor/libsodium/packaging/dotnet-core/desktop.targets +16 -0
- data/vendor/libsodium/packaging/dotnet-core/libsodium.props +33 -0
- data/vendor/libsodium/packaging/dotnet-core/prepare.py +262 -0
- data/vendor/libsodium/packaging/dotnet-core/recipes/alpine-x64 +3 -0
- data/vendor/libsodium/packaging/dotnet-core/recipes/build +9 -0
- data/vendor/libsodium/packaging/dotnet-core/recipes/centos-x64 +3 -0
- data/vendor/libsodium/packaging/dotnet-core/recipes/debian-x64 +4 -0
- data/vendor/libsodium/packaging/dotnet-core/recipes/fedora-x64 +3 -0
- data/vendor/libsodium/packaging/dotnet-core/recipes/opensuse-x64 +3 -0
- data/vendor/libsodium/packaging/dotnet-core/recipes/pack +5 -0
- data/vendor/libsodium/packaging/dotnet-core/recipes/test +27 -0
- data/vendor/libsodium/packaging/dotnet-core/recipes/ubuntu-x64 +4 -0
- data/vendor/libsodium/packaging/nuget/package.config +1 -1
- data/vendor/libsodium/packaging/nuget/package.gsl +3 -3
- data/vendor/libsodium/src/Makefile.in +11 -7
- data/vendor/libsodium/src/libsodium/Makefile.am +113 -98
- data/vendor/libsodium/src/libsodium/Makefile.in +1034 -1236
- data/vendor/libsodium/src/libsodium/crypto_aead/aes256gcm/aesni/aead_aes256gcm_aesni.c +31 -12
- data/vendor/libsodium/src/libsodium/crypto_aead/chacha20poly1305/sodium/aead_chacha20poly1305.c +31 -10
- data/vendor/libsodium/src/libsodium/crypto_aead/xchacha20poly1305/sodium/aead_xchacha20poly1305.c +153 -0
- data/vendor/libsodium/src/libsodium/crypto_auth/crypto_auth.c +7 -0
- data/vendor/libsodium/src/libsodium/crypto_auth/hmacsha256/{cp/hmac_hmacsha256.c → auth_hmacsha256.c} +43 -35
- data/vendor/libsodium/src/libsodium/crypto_auth/hmacsha512/{cp/hmac_hmacsha512.c → auth_hmacsha512.c} +43 -35
- data/vendor/libsodium/src/libsodium/crypto_auth/hmacsha512256/{cp/hmac_hmacsha512256.c → auth_hmacsha512256.c} +48 -9
- data/vendor/libsodium/src/libsodium/crypto_box/crypto_box_easy.c +4 -3
- data/vendor/libsodium/src/libsodium/crypto_box/crypto_box_seal.c +2 -1
- data/vendor/libsodium/src/libsodium/crypto_box/curve25519xchacha20poly1305/box_curve25519xchacha20poly1305.c +197 -0
- data/vendor/libsodium/src/libsodium/crypto_box/curve25519xchacha20poly1305/box_seal_curve25519xchacha20poly1305.c +79 -0
- data/vendor/libsodium/src/libsodium/crypto_box/curve25519xsalsa20poly1305/box_curve25519xsalsa20poly1305.c +150 -0
- data/vendor/libsodium/src/libsodium/crypto_core/curve25519/ref10/curve25519_ref10.c +1156 -662
- data/vendor/libsodium/src/libsodium/crypto_core/hchacha20/core_hchacha20.c +12 -5
- data/vendor/libsodium/src/libsodium/crypto_core/hsalsa20/{core_hsalsa20_api.c → core_hsalsa20.c} +0 -0
- data/vendor/libsodium/src/libsodium/crypto_core/hsalsa20/ref2/core_hsalsa20_ref2.c +95 -0
- data/vendor/libsodium/src/libsodium/crypto_core/salsa/ref/core_salsa_ref.c +195 -0
- data/vendor/libsodium/src/libsodium/crypto_generichash/{blake2/generichash_blake2_api.c → blake2b/generichash_blake2.c} +7 -0
- data/vendor/libsodium/src/libsodium/crypto_generichash/blake2b/ref/blake2.h +109 -0
- data/vendor/libsodium/src/libsodium/crypto_generichash/blake2b/ref/blake2b-compress-avx2.c +49 -0
- data/vendor/libsodium/src/libsodium/crypto_generichash/blake2b/ref/blake2b-compress-avx2.h +140 -0
- data/vendor/libsodium/src/libsodium/crypto_generichash/blake2b/ref/blake2b-compress-ref.c +92 -0
- data/vendor/libsodium/src/libsodium/crypto_generichash/blake2b/ref/blake2b-compress-sse41.c +87 -0
- data/vendor/libsodium/src/libsodium/crypto_generichash/blake2b/ref/blake2b-compress-sse41.h +103 -0
- data/vendor/libsodium/src/libsodium/crypto_generichash/blake2b/ref/blake2b-compress-ssse3.c +90 -0
- data/vendor/libsodium/src/libsodium/crypto_generichash/blake2b/ref/blake2b-compress-ssse3.h +103 -0
- data/vendor/libsodium/src/libsodium/crypto_generichash/blake2b/ref/blake2b-load-avx2.h +340 -0
- data/vendor/libsodium/src/libsodium/crypto_generichash/blake2b/ref/blake2b-load-sse2.h +164 -0
- data/vendor/libsodium/src/libsodium/crypto_generichash/blake2b/ref/blake2b-load-sse41.h +307 -0
- data/vendor/libsodium/src/libsodium/crypto_generichash/blake2b/ref/blake2b-ref.c +494 -0
- data/vendor/libsodium/src/libsodium/crypto_generichash/{blake2 → blake2b}/ref/generichash_blake2b.c +22 -26
- data/vendor/libsodium/src/libsodium/crypto_generichash/crypto_generichash.c +7 -0
- data/vendor/libsodium/src/libsodium/crypto_hash/sha256/cp/hash_sha256_cp.c +254 -0
- data/vendor/libsodium/src/libsodium/crypto_hash/sha256/{hash_sha256_api.c → hash_sha256.c} +4 -2
- data/vendor/libsodium/src/libsodium/crypto_hash/sha512/cp/hash_sha512_cp.c +280 -0
- data/vendor/libsodium/src/libsodium/crypto_hash/sha512/{hash_sha512_api.c → hash_sha512.c} +4 -2
- data/vendor/libsodium/src/libsodium/crypto_kdf/blake2b/kdf_blake2b.c +52 -0
- data/vendor/libsodium/src/libsodium/crypto_kdf/crypto_kdf.c +49 -0
- data/vendor/libsodium/src/libsodium/crypto_kx/crypto_kx.c +136 -0
- data/vendor/libsodium/src/libsodium/crypto_onetimeauth/crypto_onetimeauth.c +6 -0
- data/vendor/libsodium/src/libsodium/crypto_onetimeauth/poly1305/donna/poly1305_donna.c +34 -27
- data/vendor/libsodium/src/libsodium/crypto_onetimeauth/poly1305/donna/poly1305_donna.h +1 -1
- data/vendor/libsodium/src/libsodium/crypto_onetimeauth/poly1305/donna/poly1305_donna32.h +203 -156
- data/vendor/libsodium/src/libsodium/crypto_onetimeauth/poly1305/donna/poly1305_donna64.h +178 -134
- data/vendor/libsodium/src/libsodium/crypto_onetimeauth/poly1305/onetimeauth_poly1305.c +22 -4
- data/vendor/libsodium/src/libsodium/crypto_onetimeauth/poly1305/onetimeauth_poly1305.h +10 -12
- data/vendor/libsodium/src/libsodium/crypto_onetimeauth/poly1305/sse2/poly1305_sse2.c +564 -315
- data/vendor/libsodium/src/libsodium/crypto_onetimeauth/poly1305/sse2/poly1305_sse2.h +1 -1
- data/vendor/libsodium/src/libsodium/crypto_pwhash/argon2/argon2-core.c +131 -84
- data/vendor/libsodium/src/libsodium/crypto_pwhash/argon2/argon2-core.h +23 -18
- data/vendor/libsodium/src/libsodium/crypto_pwhash/argon2/argon2-encoding.c +163 -145
- data/vendor/libsodium/src/libsodium/crypto_pwhash/argon2/argon2-encoding.h +2 -1
- data/vendor/libsodium/src/libsodium/crypto_pwhash/argon2/argon2-fill-block-avx2.c +247 -0
- data/vendor/libsodium/src/libsodium/crypto_pwhash/argon2/argon2-fill-block-ref.c +42 -29
- data/vendor/libsodium/src/libsodium/crypto_pwhash/argon2/argon2-fill-block-ssse3.c +71 -47
- data/vendor/libsodium/src/libsodium/crypto_pwhash/argon2/argon2.c +100 -65
- data/vendor/libsodium/src/libsodium/crypto_pwhash/argon2/argon2.h +77 -23
- data/vendor/libsodium/src/libsodium/crypto_pwhash/argon2/blake2b-long.c +30 -31
- data/vendor/libsodium/src/libsodium/crypto_pwhash/argon2/blamka-round-avx2.h +150 -0
- data/vendor/libsodium/src/libsodium/crypto_pwhash/argon2/blamka-round-ref.h +28 -26
- data/vendor/libsodium/src/libsodium/crypto_pwhash/argon2/blamka-round-ssse3.h +102 -99
- data/vendor/libsodium/src/libsodium/crypto_pwhash/argon2/pwhash_argon2i.c +90 -41
- data/vendor/libsodium/src/libsodium/crypto_pwhash/argon2/pwhash_argon2id.c +213 -0
- data/vendor/libsodium/src/libsodium/crypto_pwhash/crypto_pwhash.c +72 -4
- data/vendor/libsodium/src/libsodium/crypto_pwhash/scryptsalsa208sha256/crypto_scrypt-common.c +34 -37
- data/vendor/libsodium/src/libsodium/crypto_pwhash/scryptsalsa208sha256/crypto_scrypt.h +27 -32
- data/vendor/libsodium/src/libsodium/crypto_pwhash/scryptsalsa208sha256/nosse/pwhash_scryptsalsa208sha256_nosse.c +120 -86
- data/vendor/libsodium/src/libsodium/crypto_pwhash/scryptsalsa208sha256/pbkdf2-sha256.c +16 -13
- data/vendor/libsodium/src/libsodium/crypto_pwhash/scryptsalsa208sha256/pbkdf2-sha256.h +4 -4
- data/vendor/libsodium/src/libsodium/crypto_pwhash/scryptsalsa208sha256/pwhash_scryptsalsa208sha256.c +98 -50
- data/vendor/libsodium/src/libsodium/crypto_pwhash/scryptsalsa208sha256/scrypt_platform.c +23 -18
- data/vendor/libsodium/src/libsodium/crypto_pwhash/scryptsalsa208sha256/sse/pwhash_scryptsalsa208sha256_sse.c +105 -105
- data/vendor/libsodium/src/libsodium/crypto_scalarmult/curve25519/donna_c64/curve25519_donna_c64.c +395 -330
- data/vendor/libsodium/src/libsodium/crypto_scalarmult/curve25519/ref10/x25519_ref10.c +225 -198
- data/vendor/libsodium/src/libsodium/crypto_secretbox/crypto_secretbox.c +7 -0
- data/vendor/libsodium/src/libsodium/crypto_secretbox/crypto_secretbox_easy.c +6 -5
- data/vendor/libsodium/src/libsodium/crypto_secretbox/xchacha20poly1305/secretbox_xchacha20poly1305.c +170 -0
- data/vendor/libsodium/src/libsodium/crypto_secretbox/xsalsa20poly1305/secretbox_xsalsa20poly1305.c +83 -0
- data/vendor/libsodium/src/libsodium/crypto_shorthash/crypto_shorthash.c +7 -0
- data/vendor/libsodium/src/libsodium/crypto_shorthash/siphash24/ref/shorthash_siphash24_ref.c +65 -0
- data/vendor/libsodium/src/libsodium/crypto_shorthash/siphash24/ref/shorthash_siphash_ref.h +24 -0
- data/vendor/libsodium/src/libsodium/crypto_shorthash/siphash24/ref/shorthash_siphashx24_ref.c +71 -0
- data/vendor/libsodium/src/libsodium/crypto_shorthash/siphash24/{shorthash_siphash24_api.c → shorthash_siphash24.c} +0 -0
- data/vendor/libsodium/src/libsodium/crypto_shorthash/siphash24/shorthash_siphashx24.c +11 -0
- data/vendor/libsodium/src/libsodium/crypto_sign/crypto_sign.c +33 -0
- data/vendor/libsodium/src/libsodium/crypto_sign/ed25519/ref10/ed25519_ref10.h +18 -0
- data/vendor/libsodium/src/libsodium/crypto_sign/ed25519/ref10/keypair.c +18 -13
- data/vendor/libsodium/src/libsodium/crypto_sign/ed25519/ref10/obsolete.c +29 -26
- data/vendor/libsodium/src/libsodium/crypto_sign/ed25519/ref10/open.c +75 -36
- data/vendor/libsodium/src/libsodium/crypto_sign/ed25519/ref10/sign.c +39 -15
- data/vendor/libsodium/src/libsodium/crypto_sign/ed25519/sign_ed25519.c +91 -0
- data/vendor/libsodium/src/libsodium/crypto_stream/aes128ctr/nacl/afternm_aes128ctr.c +174 -0
- data/vendor/libsodium/src/libsodium/crypto_stream/aes128ctr/nacl/beforenm_aes128ctr.c +66 -0
- data/vendor/libsodium/src/libsodium/crypto_stream/aes128ctr/nacl/common.h +766 -0
- data/vendor/libsodium/src/libsodium/crypto_stream/aes128ctr/nacl/consts.h +28 -0
- data/vendor/libsodium/src/libsodium/crypto_stream/aes128ctr/nacl/consts_aes128ctr.c +28 -0
- data/vendor/libsodium/src/libsodium/crypto_stream/aes128ctr/nacl/int128.h +50 -0
- data/vendor/libsodium/src/libsodium/crypto_stream/aes128ctr/nacl/int128_aes128ctr.c +149 -0
- data/vendor/libsodium/src/libsodium/crypto_stream/aes128ctr/nacl/stream_aes128ctr_nacl.c +31 -0
- data/vendor/libsodium/src/libsodium/crypto_stream/aes128ctr/nacl/xor_afternm_aes128ctr.c +195 -0
- data/vendor/libsodium/src/libsodium/crypto_stream/aes128ctr/{stream_aes128ctr_api.c → stream_aes128ctr.c} +6 -3
- data/vendor/libsodium/src/libsodium/crypto_stream/chacha20/dolbeau/chacha20_dolbeau-avx2.c +179 -0
- data/vendor/libsodium/src/libsodium/crypto_stream/chacha20/dolbeau/chacha20_dolbeau-avx2.h +8 -0
- data/vendor/libsodium/src/libsodium/crypto_stream/chacha20/dolbeau/chacha20_dolbeau-ssse3.c +173 -0
- data/vendor/libsodium/src/libsodium/crypto_stream/chacha20/dolbeau/chacha20_dolbeau-ssse3.h +8 -0
- data/vendor/libsodium/src/libsodium/crypto_stream/chacha20/dolbeau/u0.h +86 -0
- data/vendor/libsodium/src/libsodium/crypto_stream/chacha20/dolbeau/u1.h +98 -0
- data/vendor/libsodium/src/libsodium/crypto_stream/chacha20/dolbeau/u4.h +175 -0
- data/vendor/libsodium/src/libsodium/crypto_stream/chacha20/dolbeau/u8.h +357 -0
- data/vendor/libsodium/src/libsodium/crypto_stream/chacha20/ref/{stream_chacha20_ref.c → chacha20_ref.c} +93 -94
- data/vendor/libsodium/src/libsodium/crypto_stream/chacha20/ref/chacha20_ref.h +8 -0
- data/vendor/libsodium/src/libsodium/crypto_stream/chacha20/stream_chacha20.c +39 -7
- data/vendor/libsodium/src/libsodium/crypto_stream/crypto_stream.c +7 -0
- data/vendor/libsodium/src/libsodium/crypto_stream/salsa20/ref/salsa20_ref.c +120 -0
- data/vendor/libsodium/src/libsodium/crypto_stream/salsa20/ref/salsa20_ref.h +8 -0
- data/vendor/libsodium/src/libsodium/crypto_stream/salsa20/stream_salsa20.c +93 -0
- data/vendor/libsodium/src/libsodium/crypto_stream/salsa20/stream_salsa20.h +16 -0
- data/vendor/libsodium/src/libsodium/crypto_stream/salsa20/{amd64_xmm6/stream_salsa20_amd64_xmm6.S → xmm6/salsa20_xmm6-asm.S} +20 -12
- data/vendor/libsodium/src/libsodium/crypto_stream/salsa20/xmm6/salsa20_xmm6.c +31 -0
- data/vendor/libsodium/src/libsodium/crypto_stream/salsa20/xmm6/salsa20_xmm6.h +8 -0
- data/vendor/libsodium/src/libsodium/crypto_stream/salsa20/xmm6int/salsa20_xmm6int-avx2.c +131 -0
- data/vendor/libsodium/src/libsodium/crypto_stream/salsa20/xmm6int/salsa20_xmm6int-avx2.h +8 -0
- data/vendor/libsodium/src/libsodium/crypto_stream/salsa20/xmm6int/salsa20_xmm6int-sse2.c +122 -0
- data/vendor/libsodium/src/libsodium/crypto_stream/salsa20/xmm6int/salsa20_xmm6int-sse2.h +8 -0
- data/vendor/libsodium/src/libsodium/crypto_stream/salsa20/xmm6int/u0.h +195 -0
- data/vendor/libsodium/src/libsodium/crypto_stream/salsa20/xmm6int/u1.h +207 -0
- data/vendor/libsodium/src/libsodium/crypto_stream/salsa20/xmm6int/u4.h +547 -0
- data/vendor/libsodium/src/libsodium/crypto_stream/salsa20/xmm6int/u8.h +476 -0
- data/vendor/libsodium/src/libsodium/crypto_stream/salsa2012/ref/stream_salsa2012_ref.c +106 -0
- data/vendor/libsodium/src/libsodium/crypto_stream/salsa2012/stream_salsa2012.c +20 -0
- data/vendor/libsodium/src/libsodium/crypto_stream/salsa208/ref/stream_salsa208_ref.c +106 -0
- data/vendor/libsodium/src/libsodium/crypto_stream/salsa208/stream_salsa208.c +20 -0
- data/vendor/libsodium/src/libsodium/crypto_stream/xchacha20/stream_xchacha20.c +63 -0
- data/vendor/libsodium/src/libsodium/crypto_stream/xsalsa20/stream_xsalsa20.c +60 -0
- data/vendor/libsodium/src/libsodium/crypto_verify/sodium/verify.c +61 -0
- data/vendor/libsodium/src/libsodium/include/Makefile.am +8 -6
- data/vendor/libsodium/src/libsodium/include/Makefile.in +29 -21
- data/vendor/libsodium/src/libsodium/include/sodium.h +15 -4
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_aead_aes256gcm.h +4 -0
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_aead_chacha20poly1305.h +6 -0
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_aead_xchacha20poly1305.h +91 -0
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_auth.h +3 -0
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_auth_hmacsha256.h +5 -0
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_auth_hmacsha512.h +4 -0
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_auth_hmacsha512256.h +4 -0
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_box_curve25519xchacha20poly1305.h +153 -0
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_generichash.h +4 -0
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_generichash_blake2b.h +3 -4
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_hash_sha256.h +4 -3
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_hash_sha512.h +4 -3
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_kdf.h +51 -0
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_kdf_blake2b.h +42 -0
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_kx.h +64 -0
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_onetimeauth.h +4 -0
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_onetimeauth_poly1305.h +11 -9
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_pwhash.h +37 -1
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_pwhash_argon2i.h +40 -10
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_pwhash_argon2id.h +116 -0
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_pwhash_scryptsalsa208sha256.h +37 -4
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_scalarmult_curve25519.h +0 -4
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_secretbox.h +3 -0
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_secretbox_xchacha20poly1305.h +62 -0
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_secretbox_xsalsa20poly1305.h +5 -1
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_shorthash.h +3 -0
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_shorthash_siphash24.h +18 -0
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_sign.h +22 -0
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_sign_ed25519.h +28 -0
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_stream.h +3 -0
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_stream_aes128ctr.h +10 -5
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_stream_chacha20.h +14 -3
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_stream_salsa20.h +4 -0
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_stream_salsa2012.h +3 -0
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_stream_salsa208.h +3 -0
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_stream_xchacha20.h +53 -0
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_stream_xsalsa20.h +4 -0
- data/vendor/libsodium/src/libsodium/include/sodium/private/common.h +84 -17
- data/vendor/libsodium/src/libsodium/include/sodium/private/implementations.h +11 -0
- data/vendor/libsodium/src/libsodium/include/sodium/private/sse2_64_32.h +50 -0
- data/vendor/libsodium/src/libsodium/include/sodium/randombytes.h +10 -2
- data/vendor/libsodium/src/libsodium/include/sodium/utils.h +4 -5
- data/vendor/libsodium/src/libsodium/include/sodium/version.h.in +4 -0
- data/vendor/libsodium/src/libsodium/randombytes/randombytes.c +47 -19
- data/vendor/libsodium/src/libsodium/randombytes/salsa20/randombytes_salsa20_random.c +30 -50
- data/vendor/libsodium/src/libsodium/randombytes/sysrandom/randombytes_sysrandom.c +25 -15
- data/vendor/libsodium/src/libsodium/sodium/core.c +25 -23
- data/vendor/libsodium/src/libsodium/sodium/runtime.c +66 -57
- data/vendor/libsodium/src/libsodium/sodium/utils.c +120 -106
- data/vendor/libsodium/src/libsodium/sodium/version.c +10 -0
- data/vendor/libsodium/test/Makefile.in +11 -7
- data/vendor/libsodium/test/default/Makefile.am +65 -5
- data/vendor/libsodium/test/default/Makefile.in +243 -78
- data/vendor/libsodium/test/default/aead_aes256gcm.c +2 -2
- data/vendor/libsodium/test/default/aead_xchacha20poly1305.c +188 -0
- data/vendor/libsodium/test/default/aead_xchacha20poly1305.exp +51 -0
- data/vendor/libsodium/test/default/auth.c +11 -7
- data/vendor/libsodium/test/default/auth2.c +15 -12
- data/vendor/libsodium/test/default/auth3.c +18 -15
- data/vendor/libsodium/test/default/auth5.c +3 -2
- data/vendor/libsodium/test/default/auth6.c +4 -3
- data/vendor/libsodium/test/default/auth7.c +3 -2
- data/vendor/libsodium/test/default/box.c +57 -52
- data/vendor/libsodium/test/default/box2.c +41 -36
- data/vendor/libsodium/test/default/box7.c +4 -3
- data/vendor/libsodium/test/default/box8.c +4 -3
- data/vendor/libsodium/test/default/box_easy.c +36 -32
- data/vendor/libsodium/test/default/box_easy2.c +41 -34
- data/vendor/libsodium/test/default/box_seal.c +7 -6
- data/vendor/libsodium/test/default/box_seed.c +10 -8
- data/vendor/libsodium/test/default/chacha20.c +18 -3
- data/vendor/libsodium/test/default/chacha20.exp +45 -0
- data/vendor/libsodium/test/default/cmptest.h +1 -0
- data/vendor/libsodium/test/default/core1.c +10 -9
- data/vendor/libsodium/test/default/core2.c +13 -12
- data/vendor/libsodium/test/default/core3.c +13 -12
- data/vendor/libsodium/test/default/core4.c +11 -12
- data/vendor/libsodium/test/default/core5.c +13 -12
- data/vendor/libsodium/test/default/core6.c +15 -13
- data/vendor/libsodium/test/default/ed25519_convert.c +12 -9
- data/vendor/libsodium/test/default/hash.c +10 -6
- data/vendor/libsodium/test/default/hash3.c +3 -2
- data/vendor/libsodium/test/default/index-wasm.html.tpl +118 -0
- data/vendor/libsodium/test/default/kdf.c +61 -0
- data/vendor/libsodium/test/default/kdf.exp +77 -0
- data/vendor/libsodium/test/default/keygen.c +64 -0
- data/vendor/libsodium/test/default/keygen.exp +1 -0
- data/vendor/libsodium/test/default/kx.c +119 -0
- data/vendor/libsodium/test/default/kx.exp +7 -0
- data/vendor/libsodium/test/default/nacl-test-wrapper.sh +9 -2
- data/vendor/libsodium/test/default/onetimeauth.c +26 -23
- data/vendor/libsodium/test/default/onetimeauth2.c +22 -20
- data/vendor/libsodium/test/default/onetimeauth7.c +3 -2
- data/vendor/libsodium/test/default/pwhash.c +209 -157
- data/vendor/libsodium/test/default/pwhash_argon2id.c +388 -0
- data/vendor/libsodium/test/default/pwhash_argon2id.exp +15 -0
- data/vendor/libsodium/test/default/pwhash_scrypt.c +232 -224
- data/vendor/libsodium/test/default/pwhash_scrypt.exp +2 -1
- data/vendor/libsodium/test/default/pwhash_scrypt_ll.c +39 -41
- data/vendor/libsodium/test/default/randombytes.c +34 -13
- data/vendor/libsodium/test/default/randombytes.exp +1 -0
- data/vendor/libsodium/test/default/scalarmult.c +21 -18
- data/vendor/libsodium/test/default/scalarmult2.c +8 -6
- data/vendor/libsodium/test/default/scalarmult5.c +13 -10
- data/vendor/libsodium/test/default/scalarmult6.c +17 -14
- data/vendor/libsodium/test/default/scalarmult7.c +9 -10
- data/vendor/libsodium/test/default/secretbox.c +39 -36
- data/vendor/libsodium/test/default/secretbox2.c +28 -25
- data/vendor/libsodium/test/default/secretbox7.c +3 -2
- data/vendor/libsodium/test/default/secretbox8.c +4 -3
- data/vendor/libsodium/test/default/secretbox_easy.c +40 -37
- data/vendor/libsodium/test/default/secretbox_easy2.c +19 -18
- data/vendor/libsodium/test/default/shorthash.c +4 -4
- data/vendor/libsodium/test/default/sign.c +70 -13
- data/vendor/libsodium/test/default/sign.exp +2 -0
- data/vendor/libsodium/test/default/siphashx24.c +33 -0
- data/vendor/libsodium/test/default/siphashx24.exp +64 -0
- data/vendor/libsodium/test/default/sodium_core.c +9 -8
- data/vendor/libsodium/test/default/sodium_utils.c +52 -46
- data/vendor/libsodium/test/default/sodium_utils2.c +17 -8
- data/vendor/libsodium/test/default/sodium_utils3.c +15 -6
- data/vendor/libsodium/test/default/sodium_version.c +7 -1
- data/vendor/libsodium/test/default/stream.c +31 -18
- data/vendor/libsodium/test/default/stream.exp +65 -0
- data/vendor/libsodium/test/default/stream2.c +13 -9
- data/vendor/libsodium/test/default/stream3.c +12 -10
- data/vendor/libsodium/test/default/stream4.c +30 -27
- data/vendor/libsodium/test/default/verify1.c +5 -4
- data/vendor/libsodium/test/default/xchacha20.c +376 -0
- data/vendor/libsodium/test/default/xchacha20.exp +5 -0
- data/vendor/libsodium/test/quirks/quirks.h +4 -3
- metadata +140 -111
- data/vendor/libsodium/autom4te.cache/output.3 +0 -17240
- data/vendor/libsodium/autom4te.cache/output.4 +0 -17517
- data/vendor/libsodium/autom4te.cache/output.5 +0 -18535
- data/vendor/libsodium/autom4te.cache/output.6 +0 -19077
- data/vendor/libsodium/autom4te.cache/output.7 +0 -19837
- data/vendor/libsodium/autom4te.cache/traces.3 +0 -2833
- data/vendor/libsodium/autom4te.cache/traces.4 +0 -2951
- data/vendor/libsodium/autom4te.cache/traces.5 +0 -3042
- data/vendor/libsodium/autom4te.cache/traces.6 +0 -3194
- data/vendor/libsodium/autom4te.cache/traces.7 +0 -3614
- data/vendor/libsodium/builds/msvc/properties/ARM.props +0 -20
- data/vendor/libsodium/compile +0 -347
- data/vendor/libsodium/config.guess +0 -1568
- data/vendor/libsodium/config.sub +0 -1793
- data/vendor/libsodium/depcomp +0 -791
- data/vendor/libsodium/install-sh +0 -527
- data/vendor/libsodium/ltmain.sh +0 -9655
- data/vendor/libsodium/missing +0 -215
- data/vendor/libsodium/src/libsodium/crypto_auth/hmacsha256/auth_hmacsha256_api.c +0 -16
- data/vendor/libsodium/src/libsodium/crypto_auth/hmacsha256/cp/verify_hmacsha256.c +0 -11
- data/vendor/libsodium/src/libsodium/crypto_auth/hmacsha512/auth_hmacsha512_api.c +0 -16
- data/vendor/libsodium/src/libsodium/crypto_auth/hmacsha512/cp/verify_hmacsha512.c +0 -12
- data/vendor/libsodium/src/libsodium/crypto_auth/hmacsha512256/auth_hmacsha512256_api.c +0 -16
- data/vendor/libsodium/src/libsodium/crypto_auth/hmacsha512256/cp/verify_hmacsha512256.c +0 -14
- data/vendor/libsodium/src/libsodium/crypto_box/curve25519xsalsa20poly1305/box_curve25519xsalsa20poly1305_api.c +0 -41
- data/vendor/libsodium/src/libsodium/crypto_box/curve25519xsalsa20poly1305/ref/after_curve25519xsalsa20poly1305.c +0 -22
- data/vendor/libsodium/src/libsodium/crypto_box/curve25519xsalsa20poly1305/ref/before_curve25519xsalsa20poly1305.c +0 -18
- data/vendor/libsodium/src/libsodium/crypto_box/curve25519xsalsa20poly1305/ref/box_curve25519xsalsa20poly1305.c +0 -42
- data/vendor/libsodium/src/libsodium/crypto_box/curve25519xsalsa20poly1305/ref/keypair_curve25519xsalsa20poly1305.c +0 -29
- data/vendor/libsodium/src/libsodium/crypto_core/hchacha20/core_hchacha20.h +0 -28
- data/vendor/libsodium/src/libsodium/crypto_core/hsalsa20/ref2/core_hsalsa20.c +0 -100
- data/vendor/libsodium/src/libsodium/crypto_core/salsa20/core_salsa20_api.c +0 -21
- data/vendor/libsodium/src/libsodium/crypto_core/salsa20/ref/core_salsa20.c +0 -126
- data/vendor/libsodium/src/libsodium/crypto_core/salsa2012/core_salsa2012_api.c +0 -21
- data/vendor/libsodium/src/libsodium/crypto_core/salsa2012/ref/core_salsa2012.c +0 -126
- data/vendor/libsodium/src/libsodium/crypto_core/salsa208/core_salsa208_api.c +0 -21
- data/vendor/libsodium/src/libsodium/crypto_core/salsa208/ref/core_salsa208.c +0 -126
- data/vendor/libsodium/src/libsodium/crypto_generichash/blake2/ref/blake2-impl.h +0 -48
- data/vendor/libsodium/src/libsodium/crypto_generichash/blake2/ref/blake2.h +0 -97
- data/vendor/libsodium/src/libsodium/crypto_generichash/blake2/ref/blake2b-compress-avx2.c +0 -45
- data/vendor/libsodium/src/libsodium/crypto_generichash/blake2/ref/blake2b-compress-avx2.h +0 -123
- data/vendor/libsodium/src/libsodium/crypto_generichash/blake2/ref/blake2b-compress-ref.c +0 -94
- data/vendor/libsodium/src/libsodium/crypto_generichash/blake2/ref/blake2b-compress-sse41.c +0 -80
- data/vendor/libsodium/src/libsodium/crypto_generichash/blake2/ref/blake2b-compress-sse41.h +0 -97
- data/vendor/libsodium/src/libsodium/crypto_generichash/blake2/ref/blake2b-compress-ssse3.c +0 -87
- data/vendor/libsodium/src/libsodium/crypto_generichash/blake2/ref/blake2b-compress-ssse3.h +0 -97
- data/vendor/libsodium/src/libsodium/crypto_generichash/blake2/ref/blake2b-load-avx2.h +0 -339
- data/vendor/libsodium/src/libsodium/crypto_generichash/blake2/ref/blake2b-load-sse2.h +0 -66
- data/vendor/libsodium/src/libsodium/crypto_generichash/blake2/ref/blake2b-load-sse41.h +0 -400
- data/vendor/libsodium/src/libsodium/crypto_generichash/blake2/ref/blake2b-ref.c +0 -456
- data/vendor/libsodium/src/libsodium/crypto_hash/sha256/cp/hash_sha256.c +0 -269
- data/vendor/libsodium/src/libsodium/crypto_hash/sha512/cp/hash_sha512.c +0 -298
- data/vendor/libsodium/src/libsodium/crypto_pwhash/argon2/argon2-impl.h +0 -40
- data/vendor/libsodium/src/libsodium/crypto_secretbox/xsalsa20poly1305/ref/box_xsalsa20poly1305.c +0 -35
- data/vendor/libsodium/src/libsodium/crypto_secretbox/xsalsa20poly1305/secretbox_xsalsa20poly1305_api.c +0 -26
- data/vendor/libsodium/src/libsodium/crypto_shorthash/siphash24/ref/shorthash_siphash24.c +0 -72
- data/vendor/libsodium/src/libsodium/crypto_sign/ed25519/description +0 -1
- data/vendor/libsodium/src/libsodium/crypto_sign/ed25519/sign_ed25519_api.c +0 -39
- data/vendor/libsodium/src/libsodium/crypto_stream/aes128ctr/portable/afternm_aes128ctr.c +0 -159
- data/vendor/libsodium/src/libsodium/crypto_stream/aes128ctr/portable/beforenm_aes128ctr.c +0 -59
- data/vendor/libsodium/src/libsodium/crypto_stream/aes128ctr/portable/common.h +0 -771
- data/vendor/libsodium/src/libsodium/crypto_stream/aes128ctr/portable/consts.h +0 -28
- data/vendor/libsodium/src/libsodium/crypto_stream/aes128ctr/portable/consts_aes128ctr.c +0 -14
- data/vendor/libsodium/src/libsodium/crypto_stream/aes128ctr/portable/int128.h +0 -56
- data/vendor/libsodium/src/libsodium/crypto_stream/aes128ctr/portable/int128_aes128ctr.c +0 -131
- data/vendor/libsodium/src/libsodium/crypto_stream/aes128ctr/portable/stream_aes128ctr.c +0 -29
- data/vendor/libsodium/src/libsodium/crypto_stream/aes128ctr/portable/types.h +0 -10
- data/vendor/libsodium/src/libsodium/crypto_stream/aes128ctr/portable/xor_afternm_aes128ctr.c +0 -180
- data/vendor/libsodium/src/libsodium/crypto_stream/chacha20/ref/stream_chacha20_ref.h +0 -28
- data/vendor/libsodium/src/libsodium/crypto_stream/chacha20/vec/stream_chacha20_vec.c +0 -336
- data/vendor/libsodium/src/libsodium/crypto_stream/chacha20/vec/stream_chacha20_vec.h +0 -28
- data/vendor/libsodium/src/libsodium/crypto_stream/salsa20/ref/stream_salsa20_ref.c +0 -55
- data/vendor/libsodium/src/libsodium/crypto_stream/salsa20/ref/xor_salsa20_ref.c +0 -63
- data/vendor/libsodium/src/libsodium/crypto_stream/salsa20/stream_salsa20_api.c +0 -19
- data/vendor/libsodium/src/libsodium/crypto_stream/salsa2012/ref/stream_salsa2012.c +0 -51
- data/vendor/libsodium/src/libsodium/crypto_stream/salsa2012/ref/xor_salsa2012.c +0 -54
- data/vendor/libsodium/src/libsodium/crypto_stream/salsa2012/stream_salsa2012_api.c +0 -11
- data/vendor/libsodium/src/libsodium/crypto_stream/salsa208/ref/stream_salsa208.c +0 -51
- data/vendor/libsodium/src/libsodium/crypto_stream/salsa208/ref/xor_salsa208.c +0 -54
- data/vendor/libsodium/src/libsodium/crypto_stream/salsa208/stream_salsa208_api.c +0 -11
- data/vendor/libsodium/src/libsodium/crypto_stream/xsalsa20/ref/stream_xsalsa20.c +0 -24
- data/vendor/libsodium/src/libsodium/crypto_stream/xsalsa20/ref/xor_xsalsa20.c +0 -35
- data/vendor/libsodium/src/libsodium/crypto_stream/xsalsa20/stream_xsalsa20_api.c +0 -11
- data/vendor/libsodium/src/libsodium/crypto_verify/16/ref/verify_16.c +0 -17
- data/vendor/libsodium/src/libsodium/crypto_verify/16/verify_16_api.c +0 -6
- data/vendor/libsodium/src/libsodium/crypto_verify/32/ref/verify_32.c +0 -17
- data/vendor/libsodium/src/libsodium/crypto_verify/32/verify_32_api.c +0 -6
- data/vendor/libsodium/src/libsodium/crypto_verify/64/ref/verify_64.c +0 -17
- data/vendor/libsodium/src/libsodium/crypto_verify/64/verify_64_api.c +0 -6
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_int32.h +0 -8
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_int64.h +0 -8
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_uint16.h +0 -8
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_uint32.h +0 -8
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_uint64.h +0 -8
- data/vendor/libsodium/src/libsodium/include/sodium/crypto_uint8.h +0 -8
- data/vendor/libsodium/test-driver +0 -139
@@ -0,0 +1,476 @@
|
|
1
|
+
if (bytes >= 512) {
|
2
|
+
__m256i y0, y1, y2, y3, y4, y5, y6, y7, y8, y9, y10, y11, y12, y13, y14,
|
3
|
+
y15;
|
4
|
+
|
5
|
+
/* the naive way seems as fast (if not a bit faster) than the vector way */
|
6
|
+
__m256i z0 = _mm256_set1_epi32(x[0]);
|
7
|
+
__m256i z5 = _mm256_set1_epi32(x[1]);
|
8
|
+
__m256i z10 = _mm256_set1_epi32(x[2]);
|
9
|
+
__m256i z15 = _mm256_set1_epi32(x[3]);
|
10
|
+
__m256i z12 = _mm256_set1_epi32(x[4]);
|
11
|
+
__m256i z1 = _mm256_set1_epi32(x[5]);
|
12
|
+
__m256i z6 = _mm256_set1_epi32(x[6]);
|
13
|
+
__m256i z11 = _mm256_set1_epi32(x[7]);
|
14
|
+
__m256i z8; /* useless */
|
15
|
+
__m256i z13 = _mm256_set1_epi32(x[9]);
|
16
|
+
__m256i z2 = _mm256_set1_epi32(x[10]);
|
17
|
+
__m256i z7 = _mm256_set1_epi32(x[11]);
|
18
|
+
__m256i z4 = _mm256_set1_epi32(x[12]);
|
19
|
+
__m256i z9; /* useless */
|
20
|
+
__m256i z14 = _mm256_set1_epi32(x[14]);
|
21
|
+
__m256i z3 = _mm256_set1_epi32(x[15]);
|
22
|
+
|
23
|
+
__m256i orig0 = z0;
|
24
|
+
__m256i orig1 = z1;
|
25
|
+
__m256i orig2 = z2;
|
26
|
+
__m256i orig3 = z3;
|
27
|
+
__m256i orig4 = z4;
|
28
|
+
__m256i orig5 = z5;
|
29
|
+
__m256i orig6 = z6;
|
30
|
+
__m256i orig7 = z7;
|
31
|
+
__m256i orig8;
|
32
|
+
__m256i orig9;
|
33
|
+
__m256i orig10 = z10;
|
34
|
+
__m256i orig11 = z11;
|
35
|
+
__m256i orig12 = z12;
|
36
|
+
__m256i orig13 = z13;
|
37
|
+
__m256i orig14 = z14;
|
38
|
+
__m256i orig15 = z15;
|
39
|
+
|
40
|
+
uint32_t in8;
|
41
|
+
uint32_t in9;
|
42
|
+
int i;
|
43
|
+
|
44
|
+
while (bytes >= 512) {
|
45
|
+
/* vector implementation for z8 and z9 */
|
46
|
+
/* faster than the naive version for 8 blocks */
|
47
|
+
const __m256i addv8 = _mm256_set_epi64x(3, 2, 1, 0);
|
48
|
+
const __m256i addv9 = _mm256_set_epi64x(7, 6, 5, 4);
|
49
|
+
const __m256i permute = _mm256_set_epi32(7, 6, 3, 2, 5, 4, 1, 0);
|
50
|
+
|
51
|
+
__m256i t8, t9;
|
52
|
+
uint64_t in89;
|
53
|
+
|
54
|
+
in8 = x[8];
|
55
|
+
in9 = x[13]; /* see arrays above for the address translation */
|
56
|
+
in89 = ((uint64_t) in8) | (((uint64_t) in9) << 32);
|
57
|
+
|
58
|
+
z8 = z9 = _mm256_broadcastq_epi64(_mm_cvtsi64_si128(in89));
|
59
|
+
|
60
|
+
t8 = _mm256_add_epi64(addv8, z8);
|
61
|
+
t9 = _mm256_add_epi64(addv9, z9);
|
62
|
+
|
63
|
+
z8 = _mm256_unpacklo_epi32(t8, t9);
|
64
|
+
z9 = _mm256_unpackhi_epi32(t8, t9);
|
65
|
+
|
66
|
+
t8 = _mm256_unpacklo_epi32(z8, z9);
|
67
|
+
t9 = _mm256_unpackhi_epi32(z8, z9);
|
68
|
+
|
69
|
+
/* required because unpack* are intra-lane */
|
70
|
+
z8 = _mm256_permutevar8x32_epi32(t8, permute);
|
71
|
+
z9 = _mm256_permutevar8x32_epi32(t9, permute);
|
72
|
+
|
73
|
+
orig8 = z8;
|
74
|
+
orig9 = z9;
|
75
|
+
|
76
|
+
in89 += 8;
|
77
|
+
|
78
|
+
x[8] = in89 & 0xFFFFFFFF;
|
79
|
+
x[13] = (in89 >> 32) & 0xFFFFFFFF;
|
80
|
+
|
81
|
+
z5 = orig5;
|
82
|
+
z10 = orig10;
|
83
|
+
z15 = orig15;
|
84
|
+
z14 = orig14;
|
85
|
+
z3 = orig3;
|
86
|
+
z6 = orig6;
|
87
|
+
z11 = orig11;
|
88
|
+
z1 = orig1;
|
89
|
+
|
90
|
+
z7 = orig7;
|
91
|
+
z13 = orig13;
|
92
|
+
z2 = orig2;
|
93
|
+
z9 = orig9;
|
94
|
+
z0 = orig0;
|
95
|
+
z12 = orig12;
|
96
|
+
z4 = orig4;
|
97
|
+
z8 = orig8;
|
98
|
+
|
99
|
+
for (i = 0; i < 20; i += 2) {
|
100
|
+
/* the inner loop is a direct translation (regexp search/replace)
|
101
|
+
* from the amd64-xmm6 ASM */
|
102
|
+
__m256i r0, r1, r2, r3, r4, r5, r6, r7, r8, r9, r10, r11, r12, r13,
|
103
|
+
r14, r15;
|
104
|
+
|
105
|
+
y4 = z12;
|
106
|
+
y4 = _mm256_add_epi32(y4, z0);
|
107
|
+
r4 = y4;
|
108
|
+
y4 = _mm256_slli_epi32(y4, 7);
|
109
|
+
z4 = _mm256_xor_si256(z4, y4);
|
110
|
+
r4 = _mm256_srli_epi32(r4, 25);
|
111
|
+
z4 = _mm256_xor_si256(z4, r4);
|
112
|
+
|
113
|
+
y9 = z1;
|
114
|
+
y9 = _mm256_add_epi32(y9, z5);
|
115
|
+
r9 = y9;
|
116
|
+
y9 = _mm256_slli_epi32(y9, 7);
|
117
|
+
z9 = _mm256_xor_si256(z9, y9);
|
118
|
+
r9 = _mm256_srli_epi32(r9, 25);
|
119
|
+
z9 = _mm256_xor_si256(z9, r9);
|
120
|
+
|
121
|
+
y8 = z0;
|
122
|
+
y8 = _mm256_add_epi32(y8, z4);
|
123
|
+
r8 = y8;
|
124
|
+
y8 = _mm256_slli_epi32(y8, 9);
|
125
|
+
z8 = _mm256_xor_si256(z8, y8);
|
126
|
+
r8 = _mm256_srli_epi32(r8, 23);
|
127
|
+
z8 = _mm256_xor_si256(z8, r8);
|
128
|
+
|
129
|
+
y13 = z5;
|
130
|
+
y13 = _mm256_add_epi32(y13, z9);
|
131
|
+
r13 = y13;
|
132
|
+
y13 = _mm256_slli_epi32(y13, 9);
|
133
|
+
z13 = _mm256_xor_si256(z13, y13);
|
134
|
+
r13 = _mm256_srli_epi32(r13, 23);
|
135
|
+
z13 = _mm256_xor_si256(z13, r13);
|
136
|
+
|
137
|
+
y12 = z4;
|
138
|
+
y12 = _mm256_add_epi32(y12, z8);
|
139
|
+
r12 = y12;
|
140
|
+
y12 = _mm256_slli_epi32(y12, 13);
|
141
|
+
z12 = _mm256_xor_si256(z12, y12);
|
142
|
+
r12 = _mm256_srli_epi32(r12, 19);
|
143
|
+
z12 = _mm256_xor_si256(z12, r12);
|
144
|
+
|
145
|
+
y1 = z9;
|
146
|
+
y1 = _mm256_add_epi32(y1, z13);
|
147
|
+
r1 = y1;
|
148
|
+
y1 = _mm256_slli_epi32(y1, 13);
|
149
|
+
z1 = _mm256_xor_si256(z1, y1);
|
150
|
+
r1 = _mm256_srli_epi32(r1, 19);
|
151
|
+
z1 = _mm256_xor_si256(z1, r1);
|
152
|
+
|
153
|
+
y0 = z8;
|
154
|
+
y0 = _mm256_add_epi32(y0, z12);
|
155
|
+
r0 = y0;
|
156
|
+
y0 = _mm256_slli_epi32(y0, 18);
|
157
|
+
z0 = _mm256_xor_si256(z0, y0);
|
158
|
+
r0 = _mm256_srli_epi32(r0, 14);
|
159
|
+
z0 = _mm256_xor_si256(z0, r0);
|
160
|
+
|
161
|
+
y5 = z13;
|
162
|
+
y5 = _mm256_add_epi32(y5, z1);
|
163
|
+
r5 = y5;
|
164
|
+
y5 = _mm256_slli_epi32(y5, 18);
|
165
|
+
z5 = _mm256_xor_si256(z5, y5);
|
166
|
+
r5 = _mm256_srli_epi32(r5, 14);
|
167
|
+
z5 = _mm256_xor_si256(z5, r5);
|
168
|
+
|
169
|
+
y14 = z6;
|
170
|
+
y14 = _mm256_add_epi32(y14, z10);
|
171
|
+
r14 = y14;
|
172
|
+
y14 = _mm256_slli_epi32(y14, 7);
|
173
|
+
z14 = _mm256_xor_si256(z14, y14);
|
174
|
+
r14 = _mm256_srli_epi32(r14, 25);
|
175
|
+
z14 = _mm256_xor_si256(z14, r14);
|
176
|
+
|
177
|
+
y3 = z11;
|
178
|
+
y3 = _mm256_add_epi32(y3, z15);
|
179
|
+
r3 = y3;
|
180
|
+
y3 = _mm256_slli_epi32(y3, 7);
|
181
|
+
z3 = _mm256_xor_si256(z3, y3);
|
182
|
+
r3 = _mm256_srli_epi32(r3, 25);
|
183
|
+
z3 = _mm256_xor_si256(z3, r3);
|
184
|
+
|
185
|
+
y2 = z10;
|
186
|
+
y2 = _mm256_add_epi32(y2, z14);
|
187
|
+
r2 = y2;
|
188
|
+
y2 = _mm256_slli_epi32(y2, 9);
|
189
|
+
z2 = _mm256_xor_si256(z2, y2);
|
190
|
+
r2 = _mm256_srli_epi32(r2, 23);
|
191
|
+
z2 = _mm256_xor_si256(z2, r2);
|
192
|
+
|
193
|
+
y7 = z15;
|
194
|
+
y7 = _mm256_add_epi32(y7, z3);
|
195
|
+
r7 = y7;
|
196
|
+
y7 = _mm256_slli_epi32(y7, 9);
|
197
|
+
z7 = _mm256_xor_si256(z7, y7);
|
198
|
+
r7 = _mm256_srli_epi32(r7, 23);
|
199
|
+
z7 = _mm256_xor_si256(z7, r7);
|
200
|
+
|
201
|
+
y6 = z14;
|
202
|
+
y6 = _mm256_add_epi32(y6, z2);
|
203
|
+
r6 = y6;
|
204
|
+
y6 = _mm256_slli_epi32(y6, 13);
|
205
|
+
z6 = _mm256_xor_si256(z6, y6);
|
206
|
+
r6 = _mm256_srli_epi32(r6, 19);
|
207
|
+
z6 = _mm256_xor_si256(z6, r6);
|
208
|
+
|
209
|
+
y11 = z3;
|
210
|
+
y11 = _mm256_add_epi32(y11, z7);
|
211
|
+
r11 = y11;
|
212
|
+
y11 = _mm256_slli_epi32(y11, 13);
|
213
|
+
z11 = _mm256_xor_si256(z11, y11);
|
214
|
+
r11 = _mm256_srli_epi32(r11, 19);
|
215
|
+
z11 = _mm256_xor_si256(z11, r11);
|
216
|
+
|
217
|
+
y10 = z2;
|
218
|
+
y10 = _mm256_add_epi32(y10, z6);
|
219
|
+
r10 = y10;
|
220
|
+
y10 = _mm256_slli_epi32(y10, 18);
|
221
|
+
z10 = _mm256_xor_si256(z10, y10);
|
222
|
+
r10 = _mm256_srli_epi32(r10, 14);
|
223
|
+
z10 = _mm256_xor_si256(z10, r10);
|
224
|
+
|
225
|
+
y1 = z3;
|
226
|
+
y1 = _mm256_add_epi32(y1, z0);
|
227
|
+
r1 = y1;
|
228
|
+
y1 = _mm256_slli_epi32(y1, 7);
|
229
|
+
z1 = _mm256_xor_si256(z1, y1);
|
230
|
+
r1 = _mm256_srli_epi32(r1, 25);
|
231
|
+
z1 = _mm256_xor_si256(z1, r1);
|
232
|
+
|
233
|
+
y15 = z7;
|
234
|
+
y15 = _mm256_add_epi32(y15, z11);
|
235
|
+
r15 = y15;
|
236
|
+
y15 = _mm256_slli_epi32(y15, 18);
|
237
|
+
z15 = _mm256_xor_si256(z15, y15);
|
238
|
+
r15 = _mm256_srli_epi32(r15, 14);
|
239
|
+
z15 = _mm256_xor_si256(z15, r15);
|
240
|
+
|
241
|
+
y6 = z4;
|
242
|
+
y6 = _mm256_add_epi32(y6, z5);
|
243
|
+
r6 = y6;
|
244
|
+
y6 = _mm256_slli_epi32(y6, 7);
|
245
|
+
z6 = _mm256_xor_si256(z6, y6);
|
246
|
+
r6 = _mm256_srli_epi32(r6, 25);
|
247
|
+
z6 = _mm256_xor_si256(z6, r6);
|
248
|
+
|
249
|
+
y2 = z0;
|
250
|
+
y2 = _mm256_add_epi32(y2, z1);
|
251
|
+
r2 = y2;
|
252
|
+
y2 = _mm256_slli_epi32(y2, 9);
|
253
|
+
z2 = _mm256_xor_si256(z2, y2);
|
254
|
+
r2 = _mm256_srli_epi32(r2, 23);
|
255
|
+
z2 = _mm256_xor_si256(z2, r2);
|
256
|
+
|
257
|
+
y7 = z5;
|
258
|
+
y7 = _mm256_add_epi32(y7, z6);
|
259
|
+
r7 = y7;
|
260
|
+
y7 = _mm256_slli_epi32(y7, 9);
|
261
|
+
z7 = _mm256_xor_si256(z7, y7);
|
262
|
+
r7 = _mm256_srli_epi32(r7, 23);
|
263
|
+
z7 = _mm256_xor_si256(z7, r7);
|
264
|
+
|
265
|
+
y3 = z1;
|
266
|
+
y3 = _mm256_add_epi32(y3, z2);
|
267
|
+
r3 = y3;
|
268
|
+
y3 = _mm256_slli_epi32(y3, 13);
|
269
|
+
z3 = _mm256_xor_si256(z3, y3);
|
270
|
+
r3 = _mm256_srli_epi32(r3, 19);
|
271
|
+
z3 = _mm256_xor_si256(z3, r3);
|
272
|
+
|
273
|
+
y4 = z6;
|
274
|
+
y4 = _mm256_add_epi32(y4, z7);
|
275
|
+
r4 = y4;
|
276
|
+
y4 = _mm256_slli_epi32(y4, 13);
|
277
|
+
z4 = _mm256_xor_si256(z4, y4);
|
278
|
+
r4 = _mm256_srli_epi32(r4, 19);
|
279
|
+
z4 = _mm256_xor_si256(z4, r4);
|
280
|
+
|
281
|
+
y0 = z2;
|
282
|
+
y0 = _mm256_add_epi32(y0, z3);
|
283
|
+
r0 = y0;
|
284
|
+
y0 = _mm256_slli_epi32(y0, 18);
|
285
|
+
z0 = _mm256_xor_si256(z0, y0);
|
286
|
+
r0 = _mm256_srli_epi32(r0, 14);
|
287
|
+
z0 = _mm256_xor_si256(z0, r0);
|
288
|
+
|
289
|
+
y5 = z7;
|
290
|
+
y5 = _mm256_add_epi32(y5, z4);
|
291
|
+
r5 = y5;
|
292
|
+
y5 = _mm256_slli_epi32(y5, 18);
|
293
|
+
z5 = _mm256_xor_si256(z5, y5);
|
294
|
+
r5 = _mm256_srli_epi32(r5, 14);
|
295
|
+
z5 = _mm256_xor_si256(z5, r5);
|
296
|
+
|
297
|
+
y11 = z9;
|
298
|
+
y11 = _mm256_add_epi32(y11, z10);
|
299
|
+
r11 = y11;
|
300
|
+
y11 = _mm256_slli_epi32(y11, 7);
|
301
|
+
z11 = _mm256_xor_si256(z11, y11);
|
302
|
+
r11 = _mm256_srli_epi32(r11, 25);
|
303
|
+
z11 = _mm256_xor_si256(z11, r11);
|
304
|
+
|
305
|
+
y12 = z14;
|
306
|
+
y12 = _mm256_add_epi32(y12, z15);
|
307
|
+
r12 = y12;
|
308
|
+
y12 = _mm256_slli_epi32(y12, 7);
|
309
|
+
z12 = _mm256_xor_si256(z12, y12);
|
310
|
+
r12 = _mm256_srli_epi32(r12, 25);
|
311
|
+
z12 = _mm256_xor_si256(z12, r12);
|
312
|
+
|
313
|
+
y8 = z10;
|
314
|
+
y8 = _mm256_add_epi32(y8, z11);
|
315
|
+
r8 = y8;
|
316
|
+
y8 = _mm256_slli_epi32(y8, 9);
|
317
|
+
z8 = _mm256_xor_si256(z8, y8);
|
318
|
+
r8 = _mm256_srli_epi32(r8, 23);
|
319
|
+
z8 = _mm256_xor_si256(z8, r8);
|
320
|
+
|
321
|
+
y13 = z15;
|
322
|
+
y13 = _mm256_add_epi32(y13, z12);
|
323
|
+
r13 = y13;
|
324
|
+
y13 = _mm256_slli_epi32(y13, 9);
|
325
|
+
z13 = _mm256_xor_si256(z13, y13);
|
326
|
+
r13 = _mm256_srli_epi32(r13, 23);
|
327
|
+
z13 = _mm256_xor_si256(z13, r13);
|
328
|
+
|
329
|
+
y9 = z11;
|
330
|
+
y9 = _mm256_add_epi32(y9, z8);
|
331
|
+
r9 = y9;
|
332
|
+
y9 = _mm256_slli_epi32(y9, 13);
|
333
|
+
z9 = _mm256_xor_si256(z9, y9);
|
334
|
+
r9 = _mm256_srli_epi32(r9, 19);
|
335
|
+
z9 = _mm256_xor_si256(z9, r9);
|
336
|
+
|
337
|
+
y14 = z12;
|
338
|
+
y14 = _mm256_add_epi32(y14, z13);
|
339
|
+
r14 = y14;
|
340
|
+
y14 = _mm256_slli_epi32(y14, 13);
|
341
|
+
z14 = _mm256_xor_si256(z14, y14);
|
342
|
+
r14 = _mm256_srli_epi32(r14, 19);
|
343
|
+
z14 = _mm256_xor_si256(z14, r14);
|
344
|
+
|
345
|
+
y10 = z8;
|
346
|
+
y10 = _mm256_add_epi32(y10, z9);
|
347
|
+
r10 = y10;
|
348
|
+
y10 = _mm256_slli_epi32(y10, 18);
|
349
|
+
z10 = _mm256_xor_si256(z10, y10);
|
350
|
+
r10 = _mm256_srli_epi32(r10, 14);
|
351
|
+
z10 = _mm256_xor_si256(z10, r10);
|
352
|
+
|
353
|
+
y15 = z13;
|
354
|
+
y15 = _mm256_add_epi32(y15, z14);
|
355
|
+
r15 = y15;
|
356
|
+
y15 = _mm256_slli_epi32(y15, 18);
|
357
|
+
z15 = _mm256_xor_si256(z15, y15);
|
358
|
+
r15 = _mm256_srli_epi32(r15, 14);
|
359
|
+
z15 = _mm256_xor_si256(z15, r15);
|
360
|
+
}
|
361
|
+
|
362
|
+
/* store data ; this macro first transpose data in-registers, and then store
|
363
|
+
* them in memory. much faster with icc. */
|
364
|
+
#define ONEQUAD_TRANSPOSE(A, B, C, D) \
|
365
|
+
{ \
|
366
|
+
__m128i t0, t1, t2, t3; \
|
367
|
+
z##A = _mm256_add_epi32(z##A, orig##A); \
|
368
|
+
z##B = _mm256_add_epi32(z##B, orig##B); \
|
369
|
+
z##C = _mm256_add_epi32(z##C, orig##C); \
|
370
|
+
z##D = _mm256_add_epi32(z##D, orig##D); \
|
371
|
+
y##A = _mm256_unpacklo_epi32(z##A, z##B); \
|
372
|
+
y##B = _mm256_unpacklo_epi32(z##C, z##D); \
|
373
|
+
y##C = _mm256_unpackhi_epi32(z##A, z##B); \
|
374
|
+
y##D = _mm256_unpackhi_epi32(z##C, z##D); \
|
375
|
+
z##A = _mm256_unpacklo_epi64(y##A, y##B); \
|
376
|
+
z##B = _mm256_unpackhi_epi64(y##A, y##B); \
|
377
|
+
z##C = _mm256_unpacklo_epi64(y##C, y##D); \
|
378
|
+
z##D = _mm256_unpackhi_epi64(y##C, y##D); \
|
379
|
+
t0 = _mm_xor_si128(_mm256_extracti128_si256(z##A, 0), \
|
380
|
+
_mm_loadu_si128((__m128i*) (m + 0))); \
|
381
|
+
_mm_storeu_si128((__m128i*) (c + 0), t0); \
|
382
|
+
t1 = _mm_xor_si128(_mm256_extracti128_si256(z##B, 0), \
|
383
|
+
_mm_loadu_si128((__m128i*) (m + 64))); \
|
384
|
+
_mm_storeu_si128((__m128i*) (c + 64), t1); \
|
385
|
+
t2 = _mm_xor_si128(_mm256_extracti128_si256(z##C, 0), \
|
386
|
+
_mm_loadu_si128((__m128i*) (m + 128))); \
|
387
|
+
_mm_storeu_si128((__m128i*) (c + 128), t2); \
|
388
|
+
t3 = _mm_xor_si128(_mm256_extracti128_si256(z##D, 0), \
|
389
|
+
_mm_loadu_si128((__m128i*) (m + 192))); \
|
390
|
+
_mm_storeu_si128((__m128i*) (c + 192), t3); \
|
391
|
+
t0 = _mm_xor_si128(_mm256_extracti128_si256(z##A, 1), \
|
392
|
+
_mm_loadu_si128((__m128i*) (m + 256))); \
|
393
|
+
_mm_storeu_si128((__m128i*) (c + 256), t0); \
|
394
|
+
t1 = _mm_xor_si128(_mm256_extracti128_si256(z##B, 1), \
|
395
|
+
_mm_loadu_si128((__m128i*) (m + 320))); \
|
396
|
+
_mm_storeu_si128((__m128i*) (c + 320), t1); \
|
397
|
+
t2 = _mm_xor_si128(_mm256_extracti128_si256(z##C, 1), \
|
398
|
+
_mm_loadu_si128((__m128i*) (m + 384))); \
|
399
|
+
_mm_storeu_si128((__m128i*) (c + 384), t2); \
|
400
|
+
t3 = _mm_xor_si128(_mm256_extracti128_si256(z##D, 1), \
|
401
|
+
_mm_loadu_si128((__m128i*) (m + 448))); \
|
402
|
+
_mm_storeu_si128((__m128i*) (c + 448), t3); \
|
403
|
+
}
|
404
|
+
|
405
|
+
#define ONEQUAD(A, B, C, D) ONEQUAD_TRANSPOSE(A, B, C, D)
|
406
|
+
|
407
|
+
#define ONEQUAD_UNPCK(A, B, C, D) \
|
408
|
+
{ \
|
409
|
+
z##A = _mm256_add_epi32(z##A, orig##A); \
|
410
|
+
z##B = _mm256_add_epi32(z##B, orig##B); \
|
411
|
+
z##C = _mm256_add_epi32(z##C, orig##C); \
|
412
|
+
z##D = _mm256_add_epi32(z##D, orig##D); \
|
413
|
+
y##A = _mm256_unpacklo_epi32(z##A, z##B); \
|
414
|
+
y##B = _mm256_unpacklo_epi32(z##C, z##D); \
|
415
|
+
y##C = _mm256_unpackhi_epi32(z##A, z##B); \
|
416
|
+
y##D = _mm256_unpackhi_epi32(z##C, z##D); \
|
417
|
+
z##A = _mm256_unpacklo_epi64(y##A, y##B); \
|
418
|
+
z##B = _mm256_unpackhi_epi64(y##A, y##B); \
|
419
|
+
z##C = _mm256_unpacklo_epi64(y##C, y##D); \
|
420
|
+
z##D = _mm256_unpackhi_epi64(y##C, y##D); \
|
421
|
+
}
|
422
|
+
|
423
|
+
#define ONEOCTO(A, B, C, D, A2, B2, C2, D2) \
|
424
|
+
{ \
|
425
|
+
ONEQUAD_UNPCK(A, B, C, D); \
|
426
|
+
ONEQUAD_UNPCK(A2, B2, C2, D2); \
|
427
|
+
y##A = _mm256_permute2x128_si256(z##A, z##A2, 0x20); \
|
428
|
+
y##A2 = _mm256_permute2x128_si256(z##A, z##A2, 0x31); \
|
429
|
+
y##B = _mm256_permute2x128_si256(z##B, z##B2, 0x20); \
|
430
|
+
y##B2 = _mm256_permute2x128_si256(z##B, z##B2, 0x31); \
|
431
|
+
y##C = _mm256_permute2x128_si256(z##C, z##C2, 0x20); \
|
432
|
+
y##C2 = _mm256_permute2x128_si256(z##C, z##C2, 0x31); \
|
433
|
+
y##D = _mm256_permute2x128_si256(z##D, z##D2, 0x20); \
|
434
|
+
y##D2 = _mm256_permute2x128_si256(z##D, z##D2, 0x31); \
|
435
|
+
y##A = _mm256_xor_si256(y##A, _mm256_loadu_si256((__m256i*) (m + 0))); \
|
436
|
+
y##B = \
|
437
|
+
_mm256_xor_si256(y##B, _mm256_loadu_si256((__m256i*) (m + 64))); \
|
438
|
+
y##C = \
|
439
|
+
_mm256_xor_si256(y##C, _mm256_loadu_si256((__m256i*) (m + 128))); \
|
440
|
+
y##D = \
|
441
|
+
_mm256_xor_si256(y##D, _mm256_loadu_si256((__m256i*) (m + 192))); \
|
442
|
+
y##A2 = \
|
443
|
+
_mm256_xor_si256(y##A2, _mm256_loadu_si256((__m256i*) (m + 256))); \
|
444
|
+
y##B2 = \
|
445
|
+
_mm256_xor_si256(y##B2, _mm256_loadu_si256((__m256i*) (m + 320))); \
|
446
|
+
y##C2 = \
|
447
|
+
_mm256_xor_si256(y##C2, _mm256_loadu_si256((__m256i*) (m + 384))); \
|
448
|
+
y##D2 = \
|
449
|
+
_mm256_xor_si256(y##D2, _mm256_loadu_si256((__m256i*) (m + 448))); \
|
450
|
+
_mm256_storeu_si256((__m256i*) (c + 0), y##A); \
|
451
|
+
_mm256_storeu_si256((__m256i*) (c + 64), y##B); \
|
452
|
+
_mm256_storeu_si256((__m256i*) (c + 128), y##C); \
|
453
|
+
_mm256_storeu_si256((__m256i*) (c + 192), y##D); \
|
454
|
+
_mm256_storeu_si256((__m256i*) (c + 256), y##A2); \
|
455
|
+
_mm256_storeu_si256((__m256i*) (c + 320), y##B2); \
|
456
|
+
_mm256_storeu_si256((__m256i*) (c + 384), y##C2); \
|
457
|
+
_mm256_storeu_si256((__m256i*) (c + 448), y##D2); \
|
458
|
+
}
|
459
|
+
|
460
|
+
ONEOCTO(0, 1, 2, 3, 4, 5, 6, 7);
|
461
|
+
m += 32;
|
462
|
+
c += 32;
|
463
|
+
ONEOCTO(8, 9, 10, 11, 12, 13, 14, 15);
|
464
|
+
m -= 32;
|
465
|
+
c -= 32;
|
466
|
+
|
467
|
+
#undef ONEQUAD
|
468
|
+
#undef ONEQUAD_TRANSPOSE
|
469
|
+
#undef ONEQUAD_UNPCK
|
470
|
+
#undef ONEOCTO
|
471
|
+
|
472
|
+
bytes -= 512;
|
473
|
+
c += 512;
|
474
|
+
m += 512;
|
475
|
+
}
|
476
|
+
}
|