rbnacl-libsodium 1.0.10 → 1.0.11

Sign up to get free protection for your applications and to get access to all the features.
Files changed (124) hide show
  1. checksums.yaml +4 -4
  2. data/CHANGES.md +6 -2
  3. data/lib/rbnacl/libsodium/version.rb +1 -1
  4. data/vendor/libsodium/ChangeLog +24 -0
  5. data/vendor/libsodium/LICENSE +2 -0
  6. data/vendor/libsodium/Makefile.in +6 -1
  7. data/vendor/libsodium/aclocal.m4 +1 -0
  8. data/vendor/libsodium/autom4te.cache/output.1 +1896 -1136
  9. data/vendor/libsodium/autom4te.cache/output.7 +19837 -0
  10. data/vendor/libsodium/autom4te.cache/requests +1271 -1031
  11. data/vendor/libsodium/autom4te.cache/traces.1 +532 -491
  12. data/vendor/libsodium/autom4te.cache/traces.7 +3614 -0
  13. data/vendor/libsodium/builds/msvc/version.h +2 -2
  14. data/vendor/libsodium/builds/msvc/vs2010/libsodium/libsodium.vcxproj +22 -1
  15. data/vendor/libsodium/builds/msvc/vs2010/libsodium/libsodium.vcxproj.filters +23 -20
  16. data/vendor/libsodium/builds/msvc/vs2012/libsodium/libsodium.vcxproj +13 -2
  17. data/vendor/libsodium/builds/msvc/vs2012/libsodium/libsodium.vcxproj.filters +12 -9
  18. data/vendor/libsodium/builds/msvc/vs2013/libsodium/libsodium.vcxproj +12 -1
  19. data/vendor/libsodium/builds/msvc/vs2013/libsodium/libsodium.vcxproj.filters +3 -0
  20. data/vendor/libsodium/builds/msvc/vs2015/libsodium/libsodium.vcxproj +2 -1
  21. data/vendor/libsodium/builds/msvc/vs2015/libsodium/libsodium.vcxproj.filters +14 -11
  22. data/vendor/libsodium/configure +1887 -1127
  23. data/vendor/libsodium/configure.ac +44 -11
  24. data/vendor/libsodium/dist-build/Makefile.am +4 -2
  25. data/vendor/libsodium/dist-build/Makefile.in +9 -2
  26. data/vendor/libsodium/dist-build/android-armv8-a.sh +1 -1
  27. data/vendor/libsodium/dist-build/android-build.sh +40 -3
  28. data/vendor/libsodium/dist-build/android-mips64.sh +1 -1
  29. data/vendor/libsodium/dist-build/android-x86_64.sh +4 -0
  30. data/vendor/libsodium/dist-build/emscripten-symbols.def +25 -25
  31. data/vendor/libsodium/dist-build/emscripten.sh +69 -35
  32. data/vendor/libsodium/dist-build/msys2-win32.sh +8 -2
  33. data/vendor/libsodium/dist-build/msys2-win64.sh +8 -2
  34. data/vendor/libsodium/dist-build/{nativeclient.sh → nativeclient-pnacl.sh} +3 -4
  35. data/vendor/libsodium/dist-build/nativeclient-x86.sh +19 -0
  36. data/vendor/libsodium/dist-build/nativeclient-x86_64.sh +19 -0
  37. data/vendor/libsodium/logo.png +0 -0
  38. data/vendor/libsodium/m4/ax_pthread.m4 +485 -0
  39. data/vendor/libsodium/msvc-scripts/Makefile.in +5 -0
  40. data/vendor/libsodium/msvc-scripts/process.bat +2 -2
  41. data/vendor/libsodium/packaging/nuget/package.bat +3 -3
  42. data/vendor/libsodium/src/Makefile.in +5 -0
  43. data/vendor/libsodium/src/libsodium/Makefile.am +2 -1
  44. data/vendor/libsodium/src/libsodium/Makefile.in +13 -8
  45. data/vendor/libsodium/src/libsodium/crypto_aead/aes256gcm/aesni/aead_aes256gcm_aesni.c +70 -87
  46. data/vendor/libsodium/src/libsodium/crypto_aead/chacha20poly1305/sodium/aead_chacha20poly1305.c +6 -0
  47. data/vendor/libsodium/src/libsodium/crypto_generichash/blake2/ref/blake2b-compress-avx2.c +1 -1
  48. data/vendor/libsodium/src/libsodium/crypto_generichash/blake2/ref/blake2b-ref.c +9 -1
  49. data/vendor/libsodium/src/libsodium/crypto_hash/sha256/cp/hash_sha256.c +11 -4
  50. data/vendor/libsodium/src/libsodium/crypto_hash/sha512/cp/hash_sha512.c +14 -8
  51. data/vendor/libsodium/src/libsodium/crypto_pwhash/argon2/argon2-encoding.c +0 -1
  52. data/vendor/libsodium/src/libsodium/crypto_pwhash/argon2/argon2.c +10 -6
  53. data/vendor/libsodium/src/libsodium/crypto_pwhash/scryptsalsa208sha256/sse/pwhash_scryptsalsa208sha256_sse.c +2 -1
  54. data/vendor/libsodium/src/libsodium/crypto_scalarmult/curve25519/donna_c64/curve25519_donna_c64.c +1 -1
  55. data/vendor/libsodium/src/libsodium/crypto_scalarmult/curve25519/ref10/x25519_ref10.c +11 -11
  56. data/vendor/libsodium/src/libsodium/crypto_scalarmult/curve25519/ref10/x25519_ref10.h +2 -2
  57. data/vendor/libsodium/src/libsodium/crypto_scalarmult/curve25519/sandy2x/fe51_nsquare.S +3 -0
  58. data/vendor/libsodium/src/libsodium/crypto_scalarmult/curve25519/sandy2x/fe51_pack.S +3 -0
  59. data/vendor/libsodium/src/libsodium/crypto_scalarmult/curve25519/sandy2x/ladder.S +830 -826
  60. data/vendor/libsodium/src/libsodium/crypto_scalarmult/curve25519/sandy2x/ladder_base.S +732 -728
  61. data/vendor/libsodium/src/libsodium/crypto_secretbox/crypto_secretbox_easy.c +3 -0
  62. data/vendor/libsodium/src/libsodium/crypto_stream/aes128ctr/portable/int128.h +1 -1
  63. data/vendor/libsodium/src/libsodium/crypto_stream/salsa20/amd64_xmm6/stream_salsa20_amd64_xmm6.S +8 -0
  64. data/vendor/libsodium/src/libsodium/include/Makefile.in +5 -0
  65. data/vendor/libsodium/src/libsodium/include/sodium/crypto_aead_aes256gcm.h +1 -1
  66. data/vendor/libsodium/src/libsodium/include/sodium/crypto_aead_chacha20poly1305.h +1 -1
  67. data/vendor/libsodium/src/libsodium/include/sodium/crypto_auth.h +1 -1
  68. data/vendor/libsodium/src/libsodium/include/sodium/crypto_auth_hmacsha256.h +1 -1
  69. data/vendor/libsodium/src/libsodium/include/sodium/crypto_auth_hmacsha512.h +1 -1
  70. data/vendor/libsodium/src/libsodium/include/sodium/crypto_auth_hmacsha512256.h +1 -1
  71. data/vendor/libsodium/src/libsodium/include/sodium/crypto_box.h +3 -3
  72. data/vendor/libsodium/src/libsodium/include/sodium/crypto_box_curve25519xsalsa20poly1305.h +1 -1
  73. data/vendor/libsodium/src/libsodium/include/sodium/crypto_generichash.h +1 -1
  74. data/vendor/libsodium/src/libsodium/include/sodium/crypto_generichash_blake2b.h +1 -1
  75. data/vendor/libsodium/src/libsodium/include/sodium/crypto_hash.h +1 -1
  76. data/vendor/libsodium/src/libsodium/include/sodium/crypto_hash_sha256.h +1 -1
  77. data/vendor/libsodium/src/libsodium/include/sodium/crypto_hash_sha512.h +1 -1
  78. data/vendor/libsodium/src/libsodium/include/sodium/crypto_onetimeauth.h +1 -1
  79. data/vendor/libsodium/src/libsodium/include/sodium/crypto_onetimeauth_poly1305.h +1 -1
  80. data/vendor/libsodium/src/libsodium/include/sodium/crypto_pwhash.h +1 -1
  81. data/vendor/libsodium/src/libsodium/include/sodium/crypto_pwhash_argon2i.h +1 -1
  82. data/vendor/libsodium/src/libsodium/include/sodium/crypto_pwhash_scryptsalsa208sha256.h +1 -1
  83. data/vendor/libsodium/src/libsodium/include/sodium/crypto_secretbox.h +1 -1
  84. data/vendor/libsodium/src/libsodium/include/sodium/crypto_secretbox_xsalsa20poly1305.h +1 -1
  85. data/vendor/libsodium/src/libsodium/include/sodium/crypto_shorthash.h +1 -1
  86. data/vendor/libsodium/src/libsodium/include/sodium/crypto_shorthash_siphash24.h +1 -1
  87. data/vendor/libsodium/src/libsodium/include/sodium/crypto_sign.h +3 -3
  88. data/vendor/libsodium/src/libsodium/include/sodium/crypto_sign_ed25519.h +1 -1
  89. data/vendor/libsodium/src/libsodium/include/sodium/crypto_sign_edwards25519sha512batch.h +1 -1
  90. data/vendor/libsodium/src/libsodium/include/sodium/crypto_stream.h +1 -1
  91. data/vendor/libsodium/src/libsodium/include/sodium/crypto_stream_aes128ctr.h +1 -1
  92. data/vendor/libsodium/src/libsodium/include/sodium/crypto_stream_chacha20.h +1 -1
  93. data/vendor/libsodium/src/libsodium/include/sodium/crypto_stream_salsa20.h +1 -1
  94. data/vendor/libsodium/src/libsodium/include/sodium/crypto_stream_salsa2012.h +1 -1
  95. data/vendor/libsodium/src/libsodium/include/sodium/crypto_stream_salsa208.h +1 -1
  96. data/vendor/libsodium/src/libsodium/include/sodium/crypto_stream_xsalsa20.h +1 -1
  97. data/vendor/libsodium/src/libsodium/include/sodium/private/curve25519_ref10.h +2 -2
  98. data/vendor/libsodium/src/libsodium/include/sodium/private/mutex.h +7 -0
  99. data/vendor/libsodium/src/libsodium/include/sodium/randombytes.h +1 -1
  100. data/vendor/libsodium/src/libsodium/randombytes/nativeclient/randombytes_nativeclient.c +15 -4
  101. data/vendor/libsodium/src/libsodium/randombytes/randombytes.c +25 -15
  102. data/vendor/libsodium/src/libsodium/randombytes/salsa20/randombytes_salsa20_random.c +72 -15
  103. data/vendor/libsodium/src/libsodium/randombytes/sysrandom/randombytes_sysrandom.c +43 -4
  104. data/vendor/libsodium/src/libsodium/sodium/core.c +131 -2
  105. data/vendor/libsodium/src/libsodium/sodium/runtime.c +5 -2
  106. data/vendor/libsodium/src/libsodium/sodium/utils.c +16 -8
  107. data/vendor/libsodium/test/Makefile.in +5 -0
  108. data/vendor/libsodium/test/default/Makefile.in +5 -0
  109. data/vendor/libsodium/test/default/generichash2.c +8 -2
  110. data/vendor/libsodium/test/default/nacl-test-wrapper.sh +19 -17
  111. data/vendor/libsodium/test/default/randombytes.c +4 -2
  112. data/vendor/libsodium/test/quirks/quirks.h +23 -2
  113. metadata +11 -15
  114. data/vendor/libsodium/README +0 -1
  115. data/vendor/libsodium/dist-build/android-x86-64.sh +0 -4
  116. data/vendor/libsodium/examples/Makefile +0 -21
  117. data/vendor/libsodium/examples/auth.c +0 -68
  118. data/vendor/libsodium/examples/box.c +0 -135
  119. data/vendor/libsodium/examples/box_detached.c +0 -134
  120. data/vendor/libsodium/examples/generichash.c +0 -80
  121. data/vendor/libsodium/examples/generichash_stream.c +0 -58
  122. data/vendor/libsodium/examples/shorthash.c +0 -58
  123. data/vendor/libsodium/examples/sign.c +0 -78
  124. data/vendor/libsodium/examples/utils.h +0 -110
@@ -24,29 +24,29 @@ sub %r11,%rsp
24
24
  movq %r11,1536(%rsp)
25
25
  movq %r12,1544(%rsp)
26
26
  movq %r13,1552(%rsp)
27
- movdqa v0_0(%rip),%xmm0
28
- movdqa v1_0(%rip),%xmm1
29
- movdqa v9_0(%rip),%xmm2
30
- movdqa %xmm2,0(%rsp)
31
- movdqa %xmm0,16(%rsp)
32
- movdqa %xmm0,32(%rsp)
33
- movdqa %xmm0,48(%rsp)
34
- movdqa %xmm0,64(%rsp)
35
- movdqa %xmm1,80(%rsp)
36
- movdqa %xmm0,96(%rsp)
37
- movdqa %xmm0,112(%rsp)
38
- movdqa %xmm0,128(%rsp)
39
- movdqa %xmm0,144(%rsp)
40
- movdqa %xmm1,%xmm0
41
- pxor %xmm1,%xmm1
42
- pxor %xmm2,%xmm2
43
- pxor %xmm3,%xmm3
44
- pxor %xmm4,%xmm4
45
- pxor %xmm5,%xmm5
46
- pxor %xmm6,%xmm6
47
- pxor %xmm7,%xmm7
48
- pxor %xmm8,%xmm8
49
- pxor %xmm9,%xmm9
27
+ vmovdqa v0_0(%rip),%xmm0
28
+ vmovdqa v1_0(%rip),%xmm1
29
+ vmovdqa v9_0(%rip),%xmm2
30
+ vmovdqa %xmm2,0(%rsp)
31
+ vmovdqa %xmm0,16(%rsp)
32
+ vmovdqa %xmm0,32(%rsp)
33
+ vmovdqa %xmm0,48(%rsp)
34
+ vmovdqa %xmm0,64(%rsp)
35
+ vmovdqa %xmm1,80(%rsp)
36
+ vmovdqa %xmm0,96(%rsp)
37
+ vmovdqa %xmm0,112(%rsp)
38
+ vmovdqa %xmm0,128(%rsp)
39
+ vmovdqa %xmm0,144(%rsp)
40
+ vmovdqa %xmm1,%xmm0
41
+ vpxor %xmm1,%xmm1,%xmm1
42
+ vpxor %xmm2,%xmm2,%xmm2
43
+ vpxor %xmm3,%xmm3,%xmm3
44
+ vpxor %xmm4,%xmm4,%xmm4
45
+ vpxor %xmm5,%xmm5,%xmm5
46
+ vpxor %xmm6,%xmm6,%xmm6
47
+ vpxor %xmm7,%xmm7,%xmm7
48
+ vpxor %xmm8,%xmm8,%xmm8
49
+ vpxor %xmm9,%xmm9,%xmm9
50
50
  movq 0(%rsi),%rdx
51
51
  movq 8(%rsi),%rcx
52
52
  movq 16(%rsi),%r8
@@ -61,6 +61,8 @@ xorq 16(%rsi),%r8
61
61
  xorq 24(%rsi),%r9
62
62
  leaq 512(%rsp),%rsi
63
63
  mov $64,%rax
64
+
65
+ .p2align 4
64
66
  ._ladder_base_small_loop:
65
67
  mov %rdx,%r10
66
68
  mov %rcx,%r11
@@ -87,1179 +89,1181 @@ sub $1,%rax
87
89
  jne ._ladder_base_small_loop
88
90
  mov $255,%rdx
89
91
  add $760,%rsi
92
+
93
+ .p2align 4
90
94
  ._ladder_base_loop:
91
95
  sub $1,%rdx
92
96
  vbroadcastss 0(%rsi),%xmm10
93
97
  sub $4,%rsi
94
- movdqa 0(%rsp),%xmm11
95
- movdqa 80(%rsp),%xmm12
98
+ vmovdqa 0(%rsp),%xmm11
99
+ vmovdqa 80(%rsp),%xmm12
96
100
  vpxor %xmm11,%xmm0,%xmm13
97
- pand %xmm10,%xmm13
98
- pxor %xmm13,%xmm0
99
- pxor %xmm13,%xmm11
101
+ vpand %xmm10,%xmm13,%xmm13
102
+ vpxor %xmm13,%xmm0,%xmm0
103
+ vpxor %xmm13,%xmm11,%xmm11
100
104
  vpxor %xmm12,%xmm1,%xmm13
101
- pand %xmm10,%xmm13
102
- pxor %xmm13,%xmm1
103
- pxor %xmm13,%xmm12
104
- movdqa 16(%rsp),%xmm13
105
- movdqa 96(%rsp),%xmm14
105
+ vpand %xmm10,%xmm13,%xmm13
106
+ vpxor %xmm13,%xmm1,%xmm1
107
+ vpxor %xmm13,%xmm12,%xmm12
108
+ vmovdqa 16(%rsp),%xmm13
109
+ vmovdqa 96(%rsp),%xmm14
106
110
  vpxor %xmm13,%xmm2,%xmm15
107
- pand %xmm10,%xmm15
108
- pxor %xmm15,%xmm2
109
- pxor %xmm15,%xmm13
111
+ vpand %xmm10,%xmm15,%xmm15
112
+ vpxor %xmm15,%xmm2,%xmm2
113
+ vpxor %xmm15,%xmm13,%xmm13
110
114
  vpxor %xmm14,%xmm3,%xmm15
111
- pand %xmm10,%xmm15
112
- pxor %xmm15,%xmm3
113
- pxor %xmm15,%xmm14
114
- movdqa %xmm13,0(%rsp)
115
- movdqa %xmm14,16(%rsp)
116
- movdqa 32(%rsp),%xmm13
117
- movdqa 112(%rsp),%xmm14
115
+ vpand %xmm10,%xmm15,%xmm15
116
+ vpxor %xmm15,%xmm3,%xmm3
117
+ vpxor %xmm15,%xmm14,%xmm14
118
+ vmovdqa %xmm13,0(%rsp)
119
+ vmovdqa %xmm14,16(%rsp)
120
+ vmovdqa 32(%rsp),%xmm13
121
+ vmovdqa 112(%rsp),%xmm14
118
122
  vpxor %xmm13,%xmm4,%xmm15
119
- pand %xmm10,%xmm15
120
- pxor %xmm15,%xmm4
121
- pxor %xmm15,%xmm13
123
+ vpand %xmm10,%xmm15,%xmm15
124
+ vpxor %xmm15,%xmm4,%xmm4
125
+ vpxor %xmm15,%xmm13,%xmm13
122
126
  vpxor %xmm14,%xmm5,%xmm15
123
- pand %xmm10,%xmm15
124
- pxor %xmm15,%xmm5
125
- pxor %xmm15,%xmm14
126
- movdqa %xmm13,32(%rsp)
127
- movdqa %xmm14,80(%rsp)
128
- movdqa 48(%rsp),%xmm13
129
- movdqa 128(%rsp),%xmm14
127
+ vpand %xmm10,%xmm15,%xmm15
128
+ vpxor %xmm15,%xmm5,%xmm5
129
+ vpxor %xmm15,%xmm14,%xmm14
130
+ vmovdqa %xmm13,32(%rsp)
131
+ vmovdqa %xmm14,80(%rsp)
132
+ vmovdqa 48(%rsp),%xmm13
133
+ vmovdqa 128(%rsp),%xmm14
130
134
  vpxor %xmm13,%xmm6,%xmm15
131
- pand %xmm10,%xmm15
132
- pxor %xmm15,%xmm6
133
- pxor %xmm15,%xmm13
135
+ vpand %xmm10,%xmm15,%xmm15
136
+ vpxor %xmm15,%xmm6,%xmm6
137
+ vpxor %xmm15,%xmm13,%xmm13
134
138
  vpxor %xmm14,%xmm7,%xmm15
135
- pand %xmm10,%xmm15
136
- pxor %xmm15,%xmm7
137
- pxor %xmm15,%xmm14
138
- movdqa %xmm13,48(%rsp)
139
- movdqa %xmm14,96(%rsp)
140
- movdqa 64(%rsp),%xmm13
141
- movdqa 144(%rsp),%xmm14
139
+ vpand %xmm10,%xmm15,%xmm15
140
+ vpxor %xmm15,%xmm7,%xmm7
141
+ vpxor %xmm15,%xmm14,%xmm14
142
+ vmovdqa %xmm13,48(%rsp)
143
+ vmovdqa %xmm14,96(%rsp)
144
+ vmovdqa 64(%rsp),%xmm13
145
+ vmovdqa 144(%rsp),%xmm14
142
146
  vpxor %xmm13,%xmm8,%xmm15
143
- pand %xmm10,%xmm15
144
- pxor %xmm15,%xmm8
145
- pxor %xmm15,%xmm13
147
+ vpand %xmm10,%xmm15,%xmm15
148
+ vpxor %xmm15,%xmm8,%xmm8
149
+ vpxor %xmm15,%xmm13,%xmm13
146
150
  vpxor %xmm14,%xmm9,%xmm15
147
- pand %xmm10,%xmm15
148
- pxor %xmm15,%xmm9
149
- pxor %xmm15,%xmm14
150
- movdqa %xmm13,64(%rsp)
151
- movdqa %xmm14,112(%rsp)
151
+ vpand %xmm10,%xmm15,%xmm15
152
+ vpxor %xmm15,%xmm9,%xmm9
153
+ vpxor %xmm15,%xmm14,%xmm14
154
+ vmovdqa %xmm13,64(%rsp)
155
+ vmovdqa %xmm14,112(%rsp)
152
156
  vpaddq subc0(%rip),%xmm11,%xmm10
153
- psubq %xmm12,%xmm10
154
- paddq %xmm12,%xmm11
157
+ vpsubq %xmm12,%xmm10,%xmm10
158
+ vpaddq %xmm12,%xmm11,%xmm11
155
159
  vpunpckhqdq %xmm10,%xmm11,%xmm12
156
160
  vpunpcklqdq %xmm10,%xmm11,%xmm10
157
161
  vpaddq %xmm1,%xmm0,%xmm11
158
- paddq subc0(%rip),%xmm0
159
- psubq %xmm1,%xmm0
162
+ vpaddq subc0(%rip),%xmm0,%xmm0
163
+ vpsubq %xmm1,%xmm0,%xmm0
160
164
  vpunpckhqdq %xmm11,%xmm0,%xmm1
161
165
  vpunpcklqdq %xmm11,%xmm0,%xmm0
162
166
  vpmuludq %xmm0,%xmm10,%xmm11
163
167
  vpmuludq %xmm1,%xmm10,%xmm13
164
- movdqa %xmm1,128(%rsp)
165
- paddq %xmm1,%xmm1
168
+ vmovdqa %xmm1,128(%rsp)
169
+ vpaddq %xmm1,%xmm1,%xmm1
166
170
  vpmuludq %xmm0,%xmm12,%xmm14
167
- movdqa %xmm0,144(%rsp)
168
- paddq %xmm14,%xmm13
171
+ vmovdqa %xmm0,144(%rsp)
172
+ vpaddq %xmm14,%xmm13,%xmm13
169
173
  vpmuludq %xmm1,%xmm12,%xmm0
170
- movdqa %xmm1,160(%rsp)
174
+ vmovdqa %xmm1,160(%rsp)
171
175
  vpaddq %xmm3,%xmm2,%xmm1
172
- paddq subc2(%rip),%xmm2
173
- psubq %xmm3,%xmm2
176
+ vpaddq subc2(%rip),%xmm2,%xmm2
177
+ vpsubq %xmm3,%xmm2,%xmm2
174
178
  vpunpckhqdq %xmm1,%xmm2,%xmm3
175
179
  vpunpcklqdq %xmm1,%xmm2,%xmm1
176
180
  vpmuludq %xmm1,%xmm10,%xmm2
177
- paddq %xmm2,%xmm0
181
+ vpaddq %xmm2,%xmm0,%xmm0
178
182
  vpmuludq %xmm3,%xmm10,%xmm2
179
- movdqa %xmm3,176(%rsp)
180
- paddq %xmm3,%xmm3
183
+ vmovdqa %xmm3,176(%rsp)
184
+ vpaddq %xmm3,%xmm3,%xmm3
181
185
  vpmuludq %xmm1,%xmm12,%xmm14
182
- movdqa %xmm1,192(%rsp)
183
- paddq %xmm14,%xmm2
186
+ vmovdqa %xmm1,192(%rsp)
187
+ vpaddq %xmm14,%xmm2,%xmm2
184
188
  vpmuludq %xmm3,%xmm12,%xmm1
185
- movdqa %xmm3,208(%rsp)
189
+ vmovdqa %xmm3,208(%rsp)
186
190
  vpaddq %xmm5,%xmm4,%xmm3
187
- paddq subc2(%rip),%xmm4
188
- psubq %xmm5,%xmm4
191
+ vpaddq subc2(%rip),%xmm4,%xmm4
192
+ vpsubq %xmm5,%xmm4,%xmm4
189
193
  vpunpckhqdq %xmm3,%xmm4,%xmm5
190
194
  vpunpcklqdq %xmm3,%xmm4,%xmm3
191
195
  vpmuludq %xmm3,%xmm10,%xmm4
192
- paddq %xmm4,%xmm1
196
+ vpaddq %xmm4,%xmm1,%xmm1
193
197
  vpmuludq %xmm5,%xmm10,%xmm4
194
- movdqa %xmm5,224(%rsp)
195
- paddq %xmm5,%xmm5
198
+ vmovdqa %xmm5,224(%rsp)
199
+ vpaddq %xmm5,%xmm5,%xmm5
196
200
  vpmuludq %xmm3,%xmm12,%xmm14
197
- movdqa %xmm3,240(%rsp)
198
- paddq %xmm14,%xmm4
201
+ vmovdqa %xmm3,240(%rsp)
202
+ vpaddq %xmm14,%xmm4,%xmm4
199
203
  vpaddq %xmm7,%xmm6,%xmm3
200
- paddq subc2(%rip),%xmm6
201
- psubq %xmm7,%xmm6
204
+ vpaddq subc2(%rip),%xmm6,%xmm6
205
+ vpsubq %xmm7,%xmm6,%xmm6
202
206
  vpunpckhqdq %xmm3,%xmm6,%xmm7
203
207
  vpunpcklqdq %xmm3,%xmm6,%xmm3
204
208
  vpmuludq %xmm3,%xmm10,%xmm6
205
209
  vpmuludq %xmm5,%xmm12,%xmm14
206
- movdqa %xmm5,256(%rsp)
207
- pmuludq v19_19(%rip),%xmm5
208
- movdqa %xmm5,272(%rsp)
209
- paddq %xmm14,%xmm6
210
+ vmovdqa %xmm5,256(%rsp)
211
+ vpmuludq v19_19(%rip),%xmm5,%xmm5
212
+ vmovdqa %xmm5,272(%rsp)
213
+ vpaddq %xmm14,%xmm6,%xmm6
210
214
  vpmuludq %xmm7,%xmm10,%xmm5
211
- movdqa %xmm7,288(%rsp)
212
- paddq %xmm7,%xmm7
215
+ vmovdqa %xmm7,288(%rsp)
216
+ vpaddq %xmm7,%xmm7,%xmm7
213
217
  vpmuludq %xmm3,%xmm12,%xmm14
214
- movdqa %xmm3,304(%rsp)
215
- paddq %xmm14,%xmm5
216
- pmuludq v19_19(%rip),%xmm3
217
- movdqa %xmm3,320(%rsp)
218
+ vmovdqa %xmm3,304(%rsp)
219
+ vpaddq %xmm14,%xmm5,%xmm5
220
+ vpmuludq v19_19(%rip),%xmm3,%xmm3
221
+ vmovdqa %xmm3,320(%rsp)
218
222
  vpaddq %xmm9,%xmm8,%xmm3
219
- paddq subc2(%rip),%xmm8
220
- psubq %xmm9,%xmm8
223
+ vpaddq subc2(%rip),%xmm8,%xmm8
224
+ vpsubq %xmm9,%xmm8,%xmm8
221
225
  vpunpckhqdq %xmm3,%xmm8,%xmm9
222
226
  vpunpcklqdq %xmm3,%xmm8,%xmm3
223
- movdqa %xmm3,336(%rsp)
227
+ vmovdqa %xmm3,336(%rsp)
224
228
  vpmuludq %xmm7,%xmm12,%xmm8
225
- movdqa %xmm7,352(%rsp)
226
- pmuludq v19_19(%rip),%xmm7
227
- movdqa %xmm7,368(%rsp)
229
+ vmovdqa %xmm7,352(%rsp)
230
+ vpmuludq v19_19(%rip),%xmm7,%xmm7
231
+ vmovdqa %xmm7,368(%rsp)
228
232
  vpmuludq %xmm3,%xmm10,%xmm7
229
- paddq %xmm7,%xmm8
233
+ vpaddq %xmm7,%xmm8,%xmm8
230
234
  vpmuludq %xmm9,%xmm10,%xmm7
231
- movdqa %xmm9,384(%rsp)
232
- paddq %xmm9,%xmm9
235
+ vmovdqa %xmm9,384(%rsp)
236
+ vpaddq %xmm9,%xmm9,%xmm9
233
237
  vpmuludq %xmm3,%xmm12,%xmm10
234
- paddq %xmm10,%xmm7
235
- pmuludq v19_19(%rip),%xmm3
236
- movdqa %xmm3,400(%rsp)
237
- pmuludq v19_19(%rip),%xmm12
238
+ vpaddq %xmm10,%xmm7,%xmm7
239
+ vpmuludq v19_19(%rip),%xmm3,%xmm3
240
+ vmovdqa %xmm3,400(%rsp)
241
+ vpmuludq v19_19(%rip),%xmm12,%xmm12
238
242
  vpmuludq %xmm9,%xmm12,%xmm3
239
- movdqa %xmm9,416(%rsp)
240
- paddq %xmm3,%xmm11
241
- movdqa 0(%rsp),%xmm3
242
- movdqa 16(%rsp),%xmm9
243
+ vmovdqa %xmm9,416(%rsp)
244
+ vpaddq %xmm3,%xmm11,%xmm11
245
+ vmovdqa 0(%rsp),%xmm3
246
+ vmovdqa 16(%rsp),%xmm9
243
247
  vpaddq subc2(%rip),%xmm3,%xmm10
244
- psubq %xmm9,%xmm10
245
- paddq %xmm9,%xmm3
248
+ vpsubq %xmm9,%xmm10,%xmm10
249
+ vpaddq %xmm9,%xmm3,%xmm3
246
250
  vpunpckhqdq %xmm10,%xmm3,%xmm9
247
251
  vpunpcklqdq %xmm10,%xmm3,%xmm3
248
252
  vpmuludq 144(%rsp),%xmm3,%xmm10
249
- paddq %xmm10,%xmm0
253
+ vpaddq %xmm10,%xmm0,%xmm0
250
254
  vpmuludq 128(%rsp),%xmm3,%xmm10
251
- paddq %xmm10,%xmm2
255
+ vpaddq %xmm10,%xmm2,%xmm2
252
256
  vpmuludq 192(%rsp),%xmm3,%xmm10
253
- paddq %xmm10,%xmm1
257
+ vpaddq %xmm10,%xmm1,%xmm1
254
258
  vpmuludq 176(%rsp),%xmm3,%xmm10
255
- paddq %xmm10,%xmm4
259
+ vpaddq %xmm10,%xmm4,%xmm4
256
260
  vpmuludq 240(%rsp),%xmm3,%xmm10
257
- paddq %xmm10,%xmm6
261
+ vpaddq %xmm10,%xmm6,%xmm6
258
262
  vpmuludq 224(%rsp),%xmm3,%xmm10
259
- paddq %xmm10,%xmm5
263
+ vpaddq %xmm10,%xmm5,%xmm5
260
264
  vpmuludq 304(%rsp),%xmm3,%xmm10
261
- paddq %xmm10,%xmm8
265
+ vpaddq %xmm10,%xmm8,%xmm8
262
266
  vpmuludq 288(%rsp),%xmm3,%xmm10
263
- paddq %xmm10,%xmm7
264
- pmuludq v19_19(%rip),%xmm3
267
+ vpaddq %xmm10,%xmm7,%xmm7
268
+ vpmuludq v19_19(%rip),%xmm3,%xmm3
265
269
  vpmuludq 336(%rsp),%xmm3,%xmm10
266
- paddq %xmm10,%xmm11
267
- pmuludq 384(%rsp),%xmm3
268
- paddq %xmm3,%xmm13
270
+ vpaddq %xmm10,%xmm11,%xmm11
271
+ vpmuludq 384(%rsp),%xmm3,%xmm3
272
+ vpaddq %xmm3,%xmm13,%xmm13
269
273
  vpmuludq 144(%rsp),%xmm9,%xmm3
270
- paddq %xmm3,%xmm2
274
+ vpaddq %xmm3,%xmm2,%xmm2
271
275
  vpmuludq 160(%rsp),%xmm9,%xmm3
272
- paddq %xmm3,%xmm1
276
+ vpaddq %xmm3,%xmm1,%xmm1
273
277
  vpmuludq 192(%rsp),%xmm9,%xmm3
274
- paddq %xmm3,%xmm4
278
+ vpaddq %xmm3,%xmm4,%xmm4
275
279
  vpmuludq 208(%rsp),%xmm9,%xmm3
276
- paddq %xmm3,%xmm6
280
+ vpaddq %xmm3,%xmm6,%xmm6
277
281
  vpmuludq 240(%rsp),%xmm9,%xmm3
278
- paddq %xmm3,%xmm5
282
+ vpaddq %xmm3,%xmm5,%xmm5
279
283
  vpmuludq 256(%rsp),%xmm9,%xmm3
280
- paddq %xmm3,%xmm8
284
+ vpaddq %xmm3,%xmm8,%xmm8
281
285
  vpmuludq 304(%rsp),%xmm9,%xmm3
282
- paddq %xmm3,%xmm7
283
- pmuludq v19_19(%rip),%xmm9
286
+ vpaddq %xmm3,%xmm7,%xmm7
287
+ vpmuludq v19_19(%rip),%xmm9,%xmm9
284
288
  vpmuludq 352(%rsp),%xmm9,%xmm3
285
- paddq %xmm3,%xmm11
289
+ vpaddq %xmm3,%xmm11,%xmm11
286
290
  vpmuludq 336(%rsp),%xmm9,%xmm3
287
- paddq %xmm3,%xmm13
288
- pmuludq 416(%rsp),%xmm9
289
- paddq %xmm9,%xmm0
290
- movdqa 32(%rsp),%xmm3
291
- movdqa 80(%rsp),%xmm9
291
+ vpaddq %xmm3,%xmm13,%xmm13
292
+ vpmuludq 416(%rsp),%xmm9,%xmm9
293
+ vpaddq %xmm9,%xmm0,%xmm0
294
+ vmovdqa 32(%rsp),%xmm3
295
+ vmovdqa 80(%rsp),%xmm9
292
296
  vpaddq subc2(%rip),%xmm3,%xmm10
293
- psubq %xmm9,%xmm10
294
- paddq %xmm9,%xmm3
297
+ vpsubq %xmm9,%xmm10,%xmm10
298
+ vpaddq %xmm9,%xmm3,%xmm3
295
299
  vpunpckhqdq %xmm10,%xmm3,%xmm9
296
300
  vpunpcklqdq %xmm10,%xmm3,%xmm3
297
301
  vpmuludq 144(%rsp),%xmm3,%xmm10
298
- paddq %xmm10,%xmm1
302
+ vpaddq %xmm10,%xmm1,%xmm1
299
303
  vpmuludq 128(%rsp),%xmm3,%xmm10
300
- paddq %xmm10,%xmm4
304
+ vpaddq %xmm10,%xmm4,%xmm4
301
305
  vpmuludq 192(%rsp),%xmm3,%xmm10
302
- paddq %xmm10,%xmm6
306
+ vpaddq %xmm10,%xmm6,%xmm6
303
307
  vpmuludq 176(%rsp),%xmm3,%xmm10
304
- paddq %xmm10,%xmm5
308
+ vpaddq %xmm10,%xmm5,%xmm5
305
309
  vpmuludq 240(%rsp),%xmm3,%xmm10
306
- paddq %xmm10,%xmm8
310
+ vpaddq %xmm10,%xmm8,%xmm8
307
311
  vpmuludq 224(%rsp),%xmm3,%xmm10
308
- paddq %xmm10,%xmm7
309
- pmuludq v19_19(%rip),%xmm3
312
+ vpaddq %xmm10,%xmm7,%xmm7
313
+ vpmuludq v19_19(%rip),%xmm3,%xmm3
310
314
  vpmuludq 304(%rsp),%xmm3,%xmm10
311
- paddq %xmm10,%xmm11
315
+ vpaddq %xmm10,%xmm11,%xmm11
312
316
  vpmuludq 288(%rsp),%xmm3,%xmm10
313
- paddq %xmm10,%xmm13
317
+ vpaddq %xmm10,%xmm13,%xmm13
314
318
  vpmuludq 336(%rsp),%xmm3,%xmm10
315
- paddq %xmm10,%xmm0
316
- pmuludq 384(%rsp),%xmm3
317
- paddq %xmm3,%xmm2
319
+ vpaddq %xmm10,%xmm0,%xmm0
320
+ vpmuludq 384(%rsp),%xmm3,%xmm3
321
+ vpaddq %xmm3,%xmm2,%xmm2
318
322
  vpmuludq 144(%rsp),%xmm9,%xmm3
319
- paddq %xmm3,%xmm4
323
+ vpaddq %xmm3,%xmm4,%xmm4
320
324
  vpmuludq 160(%rsp),%xmm9,%xmm3
321
- paddq %xmm3,%xmm6
325
+ vpaddq %xmm3,%xmm6,%xmm6
322
326
  vpmuludq 192(%rsp),%xmm9,%xmm3
323
- paddq %xmm3,%xmm5
327
+ vpaddq %xmm3,%xmm5,%xmm5
324
328
  vpmuludq 208(%rsp),%xmm9,%xmm3
325
- paddq %xmm3,%xmm8
329
+ vpaddq %xmm3,%xmm8,%xmm8
326
330
  vpmuludq 240(%rsp),%xmm9,%xmm3
327
- paddq %xmm3,%xmm7
328
- pmuludq v19_19(%rip),%xmm9
331
+ vpaddq %xmm3,%xmm7,%xmm7
332
+ vpmuludq v19_19(%rip),%xmm9,%xmm9
329
333
  vpmuludq 256(%rsp),%xmm9,%xmm3
330
- paddq %xmm3,%xmm11
334
+ vpaddq %xmm3,%xmm11,%xmm11
331
335
  vpmuludq 304(%rsp),%xmm9,%xmm3
332
- paddq %xmm3,%xmm13
336
+ vpaddq %xmm3,%xmm13,%xmm13
333
337
  vpmuludq 352(%rsp),%xmm9,%xmm3
334
- paddq %xmm3,%xmm0
338
+ vpaddq %xmm3,%xmm0,%xmm0
335
339
  vpmuludq 336(%rsp),%xmm9,%xmm3
336
- paddq %xmm3,%xmm2
337
- pmuludq 416(%rsp),%xmm9
338
- paddq %xmm9,%xmm1
339
- movdqa 48(%rsp),%xmm3
340
- movdqa 96(%rsp),%xmm9
340
+ vpaddq %xmm3,%xmm2,%xmm2
341
+ vpmuludq 416(%rsp),%xmm9,%xmm9
342
+ vpaddq %xmm9,%xmm1,%xmm1
343
+ vmovdqa 48(%rsp),%xmm3
344
+ vmovdqa 96(%rsp),%xmm9
341
345
  vpaddq subc2(%rip),%xmm3,%xmm10
342
- psubq %xmm9,%xmm10
343
- paddq %xmm9,%xmm3
346
+ vpsubq %xmm9,%xmm10,%xmm10
347
+ vpaddq %xmm9,%xmm3,%xmm3
344
348
  vpunpckhqdq %xmm10,%xmm3,%xmm9
345
349
  vpunpcklqdq %xmm10,%xmm3,%xmm3
346
350
  vpmuludq 144(%rsp),%xmm3,%xmm10
347
- paddq %xmm10,%xmm6
351
+ vpaddq %xmm10,%xmm6,%xmm6
348
352
  vpmuludq 128(%rsp),%xmm3,%xmm10
349
- paddq %xmm10,%xmm5
353
+ vpaddq %xmm10,%xmm5,%xmm5
350
354
  vpmuludq 192(%rsp),%xmm3,%xmm10
351
- paddq %xmm10,%xmm8
355
+ vpaddq %xmm10,%xmm8,%xmm8
352
356
  vpmuludq 176(%rsp),%xmm3,%xmm10
353
- paddq %xmm10,%xmm7
354
- pmuludq v19_19(%rip),%xmm3
357
+ vpaddq %xmm10,%xmm7,%xmm7
358
+ vpmuludq v19_19(%rip),%xmm3,%xmm3
355
359
  vpmuludq 240(%rsp),%xmm3,%xmm10
356
- paddq %xmm10,%xmm11
360
+ vpaddq %xmm10,%xmm11,%xmm11
357
361
  vpmuludq 224(%rsp),%xmm3,%xmm10
358
- paddq %xmm10,%xmm13
362
+ vpaddq %xmm10,%xmm13,%xmm13
359
363
  vpmuludq 304(%rsp),%xmm3,%xmm10
360
- paddq %xmm10,%xmm0
364
+ vpaddq %xmm10,%xmm0,%xmm0
361
365
  vpmuludq 288(%rsp),%xmm3,%xmm10
362
- paddq %xmm10,%xmm2
366
+ vpaddq %xmm10,%xmm2,%xmm2
363
367
  vpmuludq 336(%rsp),%xmm3,%xmm10
364
- paddq %xmm10,%xmm1
365
- pmuludq 384(%rsp),%xmm3
366
- paddq %xmm3,%xmm4
368
+ vpaddq %xmm10,%xmm1,%xmm1
369
+ vpmuludq 384(%rsp),%xmm3,%xmm3
370
+ vpaddq %xmm3,%xmm4,%xmm4
367
371
  vpmuludq 144(%rsp),%xmm9,%xmm3
368
- paddq %xmm3,%xmm5
372
+ vpaddq %xmm3,%xmm5,%xmm5
369
373
  vpmuludq 160(%rsp),%xmm9,%xmm3
370
- paddq %xmm3,%xmm8
374
+ vpaddq %xmm3,%xmm8,%xmm8
371
375
  vpmuludq 192(%rsp),%xmm9,%xmm3
372
- paddq %xmm3,%xmm7
373
- pmuludq v19_19(%rip),%xmm9
376
+ vpaddq %xmm3,%xmm7,%xmm7
377
+ vpmuludq v19_19(%rip),%xmm9,%xmm9
374
378
  vpmuludq 208(%rsp),%xmm9,%xmm3
375
- paddq %xmm3,%xmm11
379
+ vpaddq %xmm3,%xmm11,%xmm11
376
380
  vpmuludq 240(%rsp),%xmm9,%xmm3
377
- paddq %xmm3,%xmm13
381
+ vpaddq %xmm3,%xmm13,%xmm13
378
382
  vpmuludq 256(%rsp),%xmm9,%xmm3
379
- paddq %xmm3,%xmm0
383
+ vpaddq %xmm3,%xmm0,%xmm0
380
384
  vpmuludq 304(%rsp),%xmm9,%xmm3
381
- paddq %xmm3,%xmm2
385
+ vpaddq %xmm3,%xmm2,%xmm2
382
386
  vpmuludq 352(%rsp),%xmm9,%xmm3
383
- paddq %xmm3,%xmm1
387
+ vpaddq %xmm3,%xmm1,%xmm1
384
388
  vpmuludq 336(%rsp),%xmm9,%xmm3
385
- paddq %xmm3,%xmm4
386
- pmuludq 416(%rsp),%xmm9
387
- paddq %xmm9,%xmm6
388
- movdqa 64(%rsp),%xmm3
389
- movdqa 112(%rsp),%xmm9
389
+ vpaddq %xmm3,%xmm4,%xmm4
390
+ vpmuludq 416(%rsp),%xmm9,%xmm9
391
+ vpaddq %xmm9,%xmm6,%xmm6
392
+ vmovdqa 64(%rsp),%xmm3
393
+ vmovdqa 112(%rsp),%xmm9
390
394
  vpaddq subc2(%rip),%xmm3,%xmm10
391
- psubq %xmm9,%xmm10
392
- paddq %xmm9,%xmm3
395
+ vpsubq %xmm9,%xmm10,%xmm10
396
+ vpaddq %xmm9,%xmm3,%xmm3
393
397
  vpunpckhqdq %xmm10,%xmm3,%xmm9
394
398
  vpunpcklqdq %xmm10,%xmm3,%xmm3
395
399
  vpmuludq 144(%rsp),%xmm3,%xmm10
396
- paddq %xmm10,%xmm8
400
+ vpaddq %xmm10,%xmm8,%xmm8
397
401
  vpmuludq 128(%rsp),%xmm3,%xmm10
398
- paddq %xmm10,%xmm7
399
- pmuludq v19_19(%rip),%xmm3
402
+ vpaddq %xmm10,%xmm7,%xmm7
403
+ vpmuludq v19_19(%rip),%xmm3,%xmm3
400
404
  vpmuludq 192(%rsp),%xmm3,%xmm10
401
- paddq %xmm10,%xmm11
405
+ vpaddq %xmm10,%xmm11,%xmm11
402
406
  vpmuludq 176(%rsp),%xmm3,%xmm10
403
- paddq %xmm10,%xmm13
407
+ vpaddq %xmm10,%xmm13,%xmm13
404
408
  vpmuludq 240(%rsp),%xmm3,%xmm10
405
- paddq %xmm10,%xmm0
409
+ vpaddq %xmm10,%xmm0,%xmm0
406
410
  vpmuludq 224(%rsp),%xmm3,%xmm10
407
- paddq %xmm10,%xmm2
411
+ vpaddq %xmm10,%xmm2,%xmm2
408
412
  vpmuludq 304(%rsp),%xmm3,%xmm10
409
- paddq %xmm10,%xmm1
413
+ vpaddq %xmm10,%xmm1,%xmm1
410
414
  vpmuludq 288(%rsp),%xmm3,%xmm10
411
- paddq %xmm10,%xmm4
415
+ vpaddq %xmm10,%xmm4,%xmm4
412
416
  vpmuludq 336(%rsp),%xmm3,%xmm10
413
- paddq %xmm10,%xmm6
414
- pmuludq 384(%rsp),%xmm3
415
- paddq %xmm3,%xmm5
417
+ vpaddq %xmm10,%xmm6,%xmm6
418
+ vpmuludq 384(%rsp),%xmm3,%xmm3
419
+ vpaddq %xmm3,%xmm5,%xmm5
416
420
  vpmuludq 144(%rsp),%xmm9,%xmm3
417
- paddq %xmm3,%xmm7
418
- pmuludq v19_19(%rip),%xmm9
421
+ vpaddq %xmm3,%xmm7,%xmm7
422
+ vpmuludq v19_19(%rip),%xmm9,%xmm9
419
423
  vpmuludq 160(%rsp),%xmm9,%xmm3
420
- paddq %xmm3,%xmm11
424
+ vpaddq %xmm3,%xmm11,%xmm11
421
425
  vpmuludq 192(%rsp),%xmm9,%xmm3
422
- paddq %xmm3,%xmm13
426
+ vpaddq %xmm3,%xmm13,%xmm13
423
427
  vpmuludq 208(%rsp),%xmm9,%xmm3
424
- paddq %xmm3,%xmm0
428
+ vpaddq %xmm3,%xmm0,%xmm0
425
429
  vpmuludq 240(%rsp),%xmm9,%xmm3
426
- paddq %xmm3,%xmm2
430
+ vpaddq %xmm3,%xmm2,%xmm2
427
431
  vpmuludq 256(%rsp),%xmm9,%xmm3
428
- paddq %xmm3,%xmm1
432
+ vpaddq %xmm3,%xmm1,%xmm1
429
433
  vpmuludq 304(%rsp),%xmm9,%xmm3
430
- paddq %xmm3,%xmm4
434
+ vpaddq %xmm3,%xmm4,%xmm4
431
435
  vpmuludq 352(%rsp),%xmm9,%xmm3
432
- paddq %xmm3,%xmm6
436
+ vpaddq %xmm3,%xmm6,%xmm6
433
437
  vpmuludq 336(%rsp),%xmm9,%xmm3
434
- paddq %xmm3,%xmm5
435
- pmuludq 416(%rsp),%xmm9
436
- paddq %xmm9,%xmm8
438
+ vpaddq %xmm3,%xmm5,%xmm5
439
+ vpmuludq 416(%rsp),%xmm9,%xmm9
440
+ vpaddq %xmm9,%xmm8,%xmm8
437
441
  vpsrlq $25,%xmm4,%xmm3
438
- paddq %xmm3,%xmm6
439
- pand m25(%rip),%xmm4
442
+ vpaddq %xmm3,%xmm6,%xmm6
443
+ vpand m25(%rip),%xmm4,%xmm4
440
444
  vpsrlq $26,%xmm11,%xmm3
441
- paddq %xmm3,%xmm13
442
- pand m26(%rip),%xmm11
445
+ vpaddq %xmm3,%xmm13,%xmm13
446
+ vpand m26(%rip),%xmm11,%xmm11
443
447
  vpsrlq $26,%xmm6,%xmm3
444
- paddq %xmm3,%xmm5
445
- pand m26(%rip),%xmm6
448
+ vpaddq %xmm3,%xmm5,%xmm5
449
+ vpand m26(%rip),%xmm6,%xmm6
446
450
  vpsrlq $25,%xmm13,%xmm3
447
- paddq %xmm3,%xmm0
448
- pand m25(%rip),%xmm13
451
+ vpaddq %xmm3,%xmm0,%xmm0
452
+ vpand m25(%rip),%xmm13,%xmm13
449
453
  vpsrlq $25,%xmm5,%xmm3
450
- paddq %xmm3,%xmm8
451
- pand m25(%rip),%xmm5
454
+ vpaddq %xmm3,%xmm8,%xmm8
455
+ vpand m25(%rip),%xmm5,%xmm5
452
456
  vpsrlq $26,%xmm0,%xmm3
453
- paddq %xmm3,%xmm2
454
- pand m26(%rip),%xmm0
457
+ vpaddq %xmm3,%xmm2,%xmm2
458
+ vpand m26(%rip),%xmm0,%xmm0
455
459
  vpsrlq $26,%xmm8,%xmm3
456
- paddq %xmm3,%xmm7
457
- pand m26(%rip),%xmm8
460
+ vpaddq %xmm3,%xmm7,%xmm7
461
+ vpand m26(%rip),%xmm8,%xmm8
458
462
  vpsrlq $25,%xmm2,%xmm3
459
- paddq %xmm3,%xmm1
460
- pand m25(%rip),%xmm2
463
+ vpaddq %xmm3,%xmm1,%xmm1
464
+ vpand m25(%rip),%xmm2,%xmm2
461
465
  vpsrlq $25,%xmm7,%xmm3
462
466
  vpsllq $4,%xmm3,%xmm9
463
- paddq %xmm3,%xmm11
464
- psllq $1,%xmm3
465
- paddq %xmm3,%xmm9
466
- paddq %xmm9,%xmm11
467
- pand m25(%rip),%xmm7
467
+ vpaddq %xmm3,%xmm11,%xmm11
468
+ vpsllq $1,%xmm3,%xmm3
469
+ vpaddq %xmm3,%xmm9,%xmm9
470
+ vpaddq %xmm9,%xmm11,%xmm11
471
+ vpand m25(%rip),%xmm7,%xmm7
468
472
  vpsrlq $26,%xmm1,%xmm3
469
- paddq %xmm3,%xmm4
470
- pand m26(%rip),%xmm1
473
+ vpaddq %xmm3,%xmm4,%xmm4
474
+ vpand m26(%rip),%xmm1,%xmm1
471
475
  vpsrlq $26,%xmm11,%xmm3
472
- paddq %xmm3,%xmm13
473
- pand m26(%rip),%xmm11
476
+ vpaddq %xmm3,%xmm13,%xmm13
477
+ vpand m26(%rip),%xmm11,%xmm11
474
478
  vpsrlq $25,%xmm4,%xmm3
475
- paddq %xmm3,%xmm6
476
- pand m25(%rip),%xmm4
479
+ vpaddq %xmm3,%xmm6,%xmm6
480
+ vpand m25(%rip),%xmm4,%xmm4
477
481
  vpunpcklqdq %xmm13,%xmm11,%xmm3
478
482
  vpunpckhqdq %xmm13,%xmm11,%xmm9
479
483
  vpaddq subc0(%rip),%xmm9,%xmm10
480
- psubq %xmm3,%xmm10
481
- paddq %xmm9,%xmm3
484
+ vpsubq %xmm3,%xmm10,%xmm10
485
+ vpaddq %xmm9,%xmm3,%xmm3
482
486
  vpunpckhqdq %xmm3,%xmm10,%xmm9
483
- punpcklqdq %xmm3,%xmm10
487
+ vpunpcklqdq %xmm3,%xmm10,%xmm10
484
488
  vpmuludq %xmm10,%xmm10,%xmm3
485
- paddq %xmm10,%xmm10
489
+ vpaddq %xmm10,%xmm10,%xmm10
486
490
  vpmuludq %xmm9,%xmm10,%xmm11
487
491
  vpunpcklqdq %xmm2,%xmm0,%xmm12
488
492
  vpunpckhqdq %xmm2,%xmm0,%xmm0
489
493
  vpaddq subc2(%rip),%xmm0,%xmm2
490
- psubq %xmm12,%xmm2
491
- paddq %xmm0,%xmm12
494
+ vpsubq %xmm12,%xmm2,%xmm2
495
+ vpaddq %xmm0,%xmm12,%xmm12
492
496
  vpunpckhqdq %xmm12,%xmm2,%xmm0
493
- punpcklqdq %xmm12,%xmm2
497
+ vpunpcklqdq %xmm12,%xmm2,%xmm2
494
498
  vpmuludq %xmm2,%xmm10,%xmm12
495
499
  vpaddq %xmm9,%xmm9,%xmm13
496
500
  vpmuludq %xmm13,%xmm9,%xmm9
497
- paddq %xmm9,%xmm12
501
+ vpaddq %xmm9,%xmm12,%xmm12
498
502
  vpmuludq %xmm0,%xmm10,%xmm9
499
503
  vpmuludq %xmm2,%xmm13,%xmm14
500
- paddq %xmm14,%xmm9
504
+ vpaddq %xmm14,%xmm9,%xmm9
501
505
  vpunpcklqdq %xmm4,%xmm1,%xmm14
502
506
  vpunpckhqdq %xmm4,%xmm1,%xmm1
503
507
  vpaddq subc2(%rip),%xmm1,%xmm4
504
- psubq %xmm14,%xmm4
505
- paddq %xmm1,%xmm14
508
+ vpsubq %xmm14,%xmm4,%xmm4
509
+ vpaddq %xmm1,%xmm14,%xmm14
506
510
  vpunpckhqdq %xmm14,%xmm4,%xmm1
507
- punpcklqdq %xmm14,%xmm4
508
- movdqa %xmm1,0(%rsp)
509
- paddq %xmm1,%xmm1
510
- movdqa %xmm1,16(%rsp)
511
- pmuludq v19_19(%rip),%xmm1
512
- movdqa %xmm1,32(%rsp)
511
+ vpunpcklqdq %xmm14,%xmm4,%xmm4
512
+ vmovdqa %xmm1,0(%rsp)
513
+ vpaddq %xmm1,%xmm1,%xmm1
514
+ vmovdqa %xmm1,16(%rsp)
515
+ vpmuludq v19_19(%rip),%xmm1,%xmm1
516
+ vmovdqa %xmm1,32(%rsp)
513
517
  vpmuludq %xmm4,%xmm10,%xmm1
514
518
  vpmuludq %xmm2,%xmm2,%xmm14
515
- paddq %xmm14,%xmm1
519
+ vpaddq %xmm14,%xmm1,%xmm1
516
520
  vpmuludq 0(%rsp),%xmm10,%xmm14
517
521
  vpmuludq %xmm4,%xmm13,%xmm15
518
- paddq %xmm15,%xmm14
522
+ vpaddq %xmm15,%xmm14,%xmm14
519
523
  vpunpcklqdq %xmm5,%xmm6,%xmm15
520
524
  vpunpckhqdq %xmm5,%xmm6,%xmm5
521
525
  vpaddq subc2(%rip),%xmm5,%xmm6
522
- psubq %xmm15,%xmm6
523
- paddq %xmm5,%xmm15
526
+ vpsubq %xmm15,%xmm6,%xmm6
527
+ vpaddq %xmm5,%xmm15,%xmm15
524
528
  vpunpckhqdq %xmm15,%xmm6,%xmm5
525
- punpcklqdq %xmm15,%xmm6
526
- movdqa %xmm6,48(%rsp)
527
- pmuludq v19_19(%rip),%xmm6
528
- movdqa %xmm6,64(%rsp)
529
- movdqa %xmm5,80(%rsp)
530
- pmuludq v38_38(%rip),%xmm5
531
- movdqa %xmm5,96(%rsp)
529
+ vpunpcklqdq %xmm15,%xmm6,%xmm6
530
+ vmovdqa %xmm6,48(%rsp)
531
+ vpmuludq v19_19(%rip),%xmm6,%xmm6
532
+ vmovdqa %xmm6,64(%rsp)
533
+ vmovdqa %xmm5,80(%rsp)
534
+ vpmuludq v38_38(%rip),%xmm5,%xmm5
535
+ vmovdqa %xmm5,96(%rsp)
532
536
  vpmuludq 48(%rsp),%xmm10,%xmm5
533
537
  vpaddq %xmm0,%xmm0,%xmm6
534
538
  vpmuludq %xmm6,%xmm0,%xmm0
535
- paddq %xmm0,%xmm5
539
+ vpaddq %xmm0,%xmm5,%xmm5
536
540
  vpmuludq 80(%rsp),%xmm10,%xmm0
537
541
  vpmuludq %xmm4,%xmm6,%xmm15
538
- paddq %xmm15,%xmm0
542
+ vpaddq %xmm15,%xmm0,%xmm0
539
543
  vpmuludq %xmm6,%xmm13,%xmm15
540
- paddq %xmm15,%xmm1
544
+ vpaddq %xmm15,%xmm1,%xmm1
541
545
  vpmuludq %xmm6,%xmm2,%xmm15
542
- paddq %xmm15,%xmm14
546
+ vpaddq %xmm15,%xmm14,%xmm14
543
547
  vpunpcklqdq %xmm7,%xmm8,%xmm15
544
548
  vpunpckhqdq %xmm7,%xmm8,%xmm7
545
549
  vpaddq subc2(%rip),%xmm7,%xmm8
546
- psubq %xmm15,%xmm8
547
- paddq %xmm7,%xmm15
550
+ vpsubq %xmm15,%xmm8,%xmm8
551
+ vpaddq %xmm7,%xmm15,%xmm15
548
552
  vpunpckhqdq %xmm15,%xmm8,%xmm7
549
- punpcklqdq %xmm15,%xmm8
550
- movdqa %xmm8,112(%rsp)
551
- pmuludq v19_19(%rip),%xmm8
552
- movdqa %xmm8,160(%rsp)
553
+ vpunpcklqdq %xmm15,%xmm8,%xmm8
554
+ vmovdqa %xmm8,112(%rsp)
555
+ vpmuludq v19_19(%rip),%xmm8,%xmm8
556
+ vmovdqa %xmm8,160(%rsp)
553
557
  vpmuludq 112(%rsp),%xmm10,%xmm8
554
558
  vpmuludq %xmm7,%xmm10,%xmm10
555
559
  vpmuludq v38_38(%rip),%xmm7,%xmm15
556
560
  vpmuludq %xmm15,%xmm7,%xmm7
557
- paddq %xmm7,%xmm8
561
+ vpaddq %xmm7,%xmm8,%xmm8
558
562
  vpmuludq %xmm15,%xmm13,%xmm7
559
- paddq %xmm7,%xmm3
563
+ vpaddq %xmm7,%xmm3,%xmm3
560
564
  vpmuludq %xmm15,%xmm2,%xmm7
561
- paddq %xmm7,%xmm11
565
+ vpaddq %xmm7,%xmm11,%xmm11
562
566
  vpmuludq 80(%rsp),%xmm13,%xmm7
563
- paddq %xmm7,%xmm7
564
- paddq %xmm7,%xmm8
567
+ vpaddq %xmm7,%xmm7,%xmm7
568
+ vpaddq %xmm7,%xmm8,%xmm8
565
569
  vpmuludq 16(%rsp),%xmm13,%xmm7
566
- paddq %xmm7,%xmm5
570
+ vpaddq %xmm7,%xmm5,%xmm5
567
571
  vpmuludq 48(%rsp),%xmm13,%xmm7
568
- paddq %xmm7,%xmm0
572
+ vpaddq %xmm7,%xmm0,%xmm0
569
573
  vpmuludq 112(%rsp),%xmm13,%xmm7
570
- paddq %xmm7,%xmm10
574
+ vpaddq %xmm7,%xmm10,%xmm10
571
575
  vpmuludq %xmm15,%xmm6,%xmm7
572
- paddq %xmm7,%xmm12
576
+ vpaddq %xmm7,%xmm12,%xmm12
573
577
  vpmuludq %xmm15,%xmm4,%xmm7
574
- paddq %xmm7,%xmm9
578
+ vpaddq %xmm7,%xmm9,%xmm9
575
579
  vpaddq %xmm2,%xmm2,%xmm2
576
580
  vpmuludq %xmm4,%xmm2,%xmm7
577
- paddq %xmm7,%xmm5
581
+ vpaddq %xmm7,%xmm5,%xmm5
578
582
  vpmuludq 160(%rsp),%xmm2,%xmm7
579
- paddq %xmm7,%xmm3
583
+ vpaddq %xmm7,%xmm3,%xmm3
580
584
  vpmuludq 160(%rsp),%xmm6,%xmm7
581
- paddq %xmm7,%xmm11
585
+ vpaddq %xmm7,%xmm11,%xmm11
582
586
  vpmuludq 0(%rsp),%xmm2,%xmm7
583
- paddq %xmm7,%xmm0
587
+ vpaddq %xmm7,%xmm0,%xmm0
584
588
  vpmuludq 48(%rsp),%xmm2,%xmm7
585
- paddq %xmm7,%xmm8
589
+ vpaddq %xmm7,%xmm8,%xmm8
586
590
  vpmuludq 80(%rsp),%xmm2,%xmm2
587
- paddq %xmm2,%xmm10
591
+ vpaddq %xmm2,%xmm10,%xmm10
588
592
  vpmuludq 96(%rsp),%xmm4,%xmm2
589
- paddq %xmm2,%xmm11
593
+ vpaddq %xmm2,%xmm11,%xmm11
590
594
  vpmuludq %xmm4,%xmm4,%xmm2
591
- paddq %xmm2,%xmm8
595
+ vpaddq %xmm2,%xmm8,%xmm8
592
596
  vpaddq %xmm4,%xmm4,%xmm2
593
597
  vpmuludq 160(%rsp),%xmm2,%xmm4
594
- paddq %xmm4,%xmm12
598
+ vpaddq %xmm4,%xmm12,%xmm12
595
599
  vpmuludq 16(%rsp),%xmm15,%xmm4
596
- paddq %xmm4,%xmm1
600
+ vpaddq %xmm4,%xmm1,%xmm1
597
601
  vpmuludq 48(%rsp),%xmm15,%xmm4
598
- paddq %xmm4,%xmm14
602
+ vpaddq %xmm4,%xmm14,%xmm14
599
603
  vpmuludq 96(%rsp),%xmm6,%xmm4
600
- paddq %xmm4,%xmm3
601
- movdqa 16(%rsp),%xmm4
602
- pmuludq 160(%rsp),%xmm4
603
- paddq %xmm4,%xmm9
604
+ vpaddq %xmm4,%xmm3,%xmm3
605
+ vmovdqa 16(%rsp),%xmm4
606
+ vpmuludq 160(%rsp),%xmm4,%xmm4
607
+ vpaddq %xmm4,%xmm9,%xmm9
604
608
  vpmuludq 16(%rsp),%xmm6,%xmm4
605
- paddq %xmm4,%xmm8
609
+ vpaddq %xmm4,%xmm8,%xmm8
606
610
  vpmuludq 48(%rsp),%xmm6,%xmm4
607
- paddq %xmm4,%xmm10
611
+ vpaddq %xmm4,%xmm10,%xmm10
608
612
  vpmuludq 80(%rsp),%xmm15,%xmm4
609
- paddq %xmm4,%xmm4
610
- paddq %xmm4,%xmm5
613
+ vpaddq %xmm4,%xmm4,%xmm4
614
+ vpaddq %xmm4,%xmm5,%xmm5
611
615
  vpmuludq 112(%rsp),%xmm15,%xmm4
612
- paddq %xmm4,%xmm0
613
- movdqa 48(%rsp),%xmm4
614
- paddq %xmm4,%xmm4
615
- pmuludq 160(%rsp),%xmm4
616
- paddq %xmm4,%xmm1
617
- movdqa 80(%rsp),%xmm4
618
- paddq %xmm4,%xmm4
619
- pmuludq 160(%rsp),%xmm4
620
- paddq %xmm4,%xmm14
616
+ vpaddq %xmm4,%xmm0,%xmm0
617
+ vmovdqa 48(%rsp),%xmm4
618
+ vpaddq %xmm4,%xmm4,%xmm4
619
+ vpmuludq 160(%rsp),%xmm4,%xmm4
620
+ vpaddq %xmm4,%xmm1,%xmm1
621
+ vmovdqa 80(%rsp),%xmm4
622
+ vpaddq %xmm4,%xmm4,%xmm4
623
+ vpmuludq 160(%rsp),%xmm4,%xmm4
624
+ vpaddq %xmm4,%xmm14,%xmm14
621
625
  vpmuludq 64(%rsp),%xmm2,%xmm4
622
- paddq %xmm4,%xmm3
623
- movdqa 16(%rsp),%xmm4
624
- pmuludq 64(%rsp),%xmm4
625
- paddq %xmm4,%xmm11
626
- movdqa 16(%rsp),%xmm4
627
- pmuludq 96(%rsp),%xmm4
628
- paddq %xmm4,%xmm12
629
- movdqa 48(%rsp),%xmm4
630
- pmuludq 96(%rsp),%xmm4
631
- paddq %xmm4,%xmm9
626
+ vpaddq %xmm4,%xmm3,%xmm3
627
+ vmovdqa 16(%rsp),%xmm4
628
+ vpmuludq 64(%rsp),%xmm4,%xmm4
629
+ vpaddq %xmm4,%xmm11,%xmm11
630
+ vmovdqa 16(%rsp),%xmm4
631
+ vpmuludq 96(%rsp),%xmm4,%xmm4
632
+ vpaddq %xmm4,%xmm12,%xmm12
633
+ vmovdqa 48(%rsp),%xmm4
634
+ vpmuludq 96(%rsp),%xmm4,%xmm4
635
+ vpaddq %xmm4,%xmm9,%xmm9
636
+ vpmuludq 0(%rsp),%xmm2,%xmm2
637
+ vpaddq %xmm2,%xmm10,%xmm10
638
+ vmovdqa 32(%rsp),%xmm2
632
639
  vpmuludq 0(%rsp),%xmm2,%xmm2
633
- paddq %xmm2,%xmm10
634
- movdqa 32(%rsp),%xmm2
635
- pmuludq 0(%rsp),%xmm2
636
- paddq %xmm2,%xmm3
637
- movdqa 64(%rsp),%xmm2
638
- pmuludq 48(%rsp),%xmm2
639
- paddq %xmm2,%xmm12
640
- movdqa 96(%rsp),%xmm2
641
- pmuludq 80(%rsp),%xmm2
642
- paddq %xmm2,%xmm1
643
- movdqa 160(%rsp),%xmm2
644
- pmuludq 112(%rsp),%xmm2
645
- paddq %xmm2,%xmm5
640
+ vpaddq %xmm2,%xmm3,%xmm3
641
+ vmovdqa 64(%rsp),%xmm2
642
+ vpmuludq 48(%rsp),%xmm2,%xmm2
643
+ vpaddq %xmm2,%xmm12,%xmm12
644
+ vmovdqa 96(%rsp),%xmm2
645
+ vpmuludq 80(%rsp),%xmm2,%xmm2
646
+ vpaddq %xmm2,%xmm1,%xmm1
647
+ vmovdqa 160(%rsp),%xmm2
648
+ vpmuludq 112(%rsp),%xmm2,%xmm2
649
+ vpaddq %xmm2,%xmm5,%xmm5
646
650
  vpsrlq $26,%xmm3,%xmm2
647
- paddq %xmm2,%xmm11
648
- pand m26(%rip),%xmm3
651
+ vpaddq %xmm2,%xmm11,%xmm11
652
+ vpand m26(%rip),%xmm3,%xmm3
649
653
  vpsrlq $25,%xmm14,%xmm2
650
- paddq %xmm2,%xmm5
651
- pand m25(%rip),%xmm14
654
+ vpaddq %xmm2,%xmm5,%xmm5
655
+ vpand m25(%rip),%xmm14,%xmm14
652
656
  vpsrlq $25,%xmm11,%xmm2
653
- paddq %xmm2,%xmm12
654
- pand m25(%rip),%xmm11
657
+ vpaddq %xmm2,%xmm12,%xmm12
658
+ vpand m25(%rip),%xmm11,%xmm11
655
659
  vpsrlq $26,%xmm5,%xmm2
656
- paddq %xmm2,%xmm0
657
- pand m26(%rip),%xmm5
660
+ vpaddq %xmm2,%xmm0,%xmm0
661
+ vpand m26(%rip),%xmm5,%xmm5
658
662
  vpsrlq $26,%xmm12,%xmm2
659
- paddq %xmm2,%xmm9
660
- pand m26(%rip),%xmm12
663
+ vpaddq %xmm2,%xmm9,%xmm9
664
+ vpand m26(%rip),%xmm12,%xmm12
661
665
  vpsrlq $25,%xmm0,%xmm2
662
- paddq %xmm2,%xmm8
663
- pand m25(%rip),%xmm0
666
+ vpaddq %xmm2,%xmm8,%xmm8
667
+ vpand m25(%rip),%xmm0,%xmm0
664
668
  vpsrlq $25,%xmm9,%xmm2
665
- paddq %xmm2,%xmm1
666
- pand m25(%rip),%xmm9
669
+ vpaddq %xmm2,%xmm1,%xmm1
670
+ vpand m25(%rip),%xmm9,%xmm9
667
671
  vpsrlq $26,%xmm8,%xmm2
668
- paddq %xmm2,%xmm10
669
- pand m26(%rip),%xmm8
672
+ vpaddq %xmm2,%xmm10,%xmm10
673
+ vpand m26(%rip),%xmm8,%xmm8
670
674
  vpsrlq $26,%xmm1,%xmm2
671
- paddq %xmm2,%xmm14
672
- pand m26(%rip),%xmm1
675
+ vpaddq %xmm2,%xmm14,%xmm14
676
+ vpand m26(%rip),%xmm1,%xmm1
673
677
  vpsrlq $25,%xmm10,%xmm2
674
678
  vpsllq $4,%xmm2,%xmm4
675
- paddq %xmm2,%xmm3
676
- psllq $1,%xmm2
677
- paddq %xmm2,%xmm4
678
- paddq %xmm4,%xmm3
679
- pand m25(%rip),%xmm10
679
+ vpaddq %xmm2,%xmm3,%xmm3
680
+ vpsllq $1,%xmm2,%xmm2
681
+ vpaddq %xmm2,%xmm4,%xmm4
682
+ vpaddq %xmm4,%xmm3,%xmm3
683
+ vpand m25(%rip),%xmm10,%xmm10
680
684
  vpsrlq $25,%xmm14,%xmm2
681
- paddq %xmm2,%xmm5
682
- pand m25(%rip),%xmm14
685
+ vpaddq %xmm2,%xmm5,%xmm5
686
+ vpand m25(%rip),%xmm14,%xmm14
683
687
  vpsrlq $26,%xmm3,%xmm2
684
- paddq %xmm2,%xmm11
685
- pand m26(%rip),%xmm3
688
+ vpaddq %xmm2,%xmm11,%xmm11
689
+ vpand m26(%rip),%xmm3,%xmm3
686
690
  vpunpckhqdq %xmm11,%xmm3,%xmm2
687
- movdqa %xmm2,0(%rsp)
691
+ vmovdqa %xmm2,0(%rsp)
688
692
  vpunpcklqdq %xmm11,%xmm3,%xmm2
689
- pmuludq v9_9(%rip),%xmm2
690
- movdqa %xmm2,80(%rsp)
693
+ vpmuludq v9_9(%rip),%xmm2,%xmm2
694
+ vmovdqa %xmm2,80(%rsp)
691
695
  vpunpckhqdq %xmm9,%xmm12,%xmm2
692
- movdqa %xmm2,16(%rsp)
696
+ vmovdqa %xmm2,16(%rsp)
693
697
  vpunpcklqdq %xmm9,%xmm12,%xmm2
694
- pmuludq v9_9(%rip),%xmm2
695
- movdqa %xmm2,96(%rsp)
698
+ vpmuludq v9_9(%rip),%xmm2,%xmm2
699
+ vmovdqa %xmm2,96(%rsp)
696
700
  vpunpckhqdq %xmm14,%xmm1,%xmm2
697
- movdqa %xmm2,32(%rsp)
701
+ vmovdqa %xmm2,32(%rsp)
698
702
  vpunpcklqdq %xmm14,%xmm1,%xmm1
699
- pmuludq v9_9(%rip),%xmm1
700
- movdqa %xmm1,112(%rsp)
703
+ vpmuludq v9_9(%rip),%xmm1,%xmm1
704
+ vmovdqa %xmm1,112(%rsp)
701
705
  vpunpckhqdq %xmm0,%xmm5,%xmm1
702
- movdqa %xmm1,48(%rsp)
706
+ vmovdqa %xmm1,48(%rsp)
703
707
  vpunpcklqdq %xmm0,%xmm5,%xmm0
704
- pmuludq v9_9(%rip),%xmm0
705
- movdqa %xmm0,160(%rsp)
708
+ vpmuludq v9_9(%rip),%xmm0,%xmm0
709
+ vmovdqa %xmm0,160(%rsp)
706
710
  vpunpckhqdq %xmm10,%xmm8,%xmm0
707
- movdqa %xmm0,64(%rsp)
711
+ vmovdqa %xmm0,64(%rsp)
708
712
  vpunpcklqdq %xmm10,%xmm8,%xmm0
709
- pmuludq v9_9(%rip),%xmm0
710
- movdqa %xmm0,208(%rsp)
711
- movdqa 144(%rsp),%xmm0
713
+ vpmuludq v9_9(%rip),%xmm0,%xmm0
714
+ vmovdqa %xmm0,208(%rsp)
715
+ vmovdqa 144(%rsp),%xmm0
712
716
  vpmuludq %xmm0,%xmm0,%xmm1
713
- paddq %xmm0,%xmm0
714
- movdqa 128(%rsp),%xmm2
717
+ vpaddq %xmm0,%xmm0,%xmm0
718
+ vmovdqa 128(%rsp),%xmm2
715
719
  vpmuludq %xmm2,%xmm0,%xmm3
716
- movdqa 192(%rsp),%xmm4
720
+ vmovdqa 192(%rsp),%xmm4
717
721
  vpmuludq %xmm4,%xmm0,%xmm5
718
- movdqa 176(%rsp),%xmm6
722
+ vmovdqa 176(%rsp),%xmm6
719
723
  vpmuludq %xmm6,%xmm0,%xmm7
720
- movdqa 240(%rsp),%xmm8
724
+ vmovdqa 240(%rsp),%xmm8
721
725
  vpmuludq %xmm8,%xmm0,%xmm9
722
726
  vpmuludq 224(%rsp),%xmm0,%xmm10
723
727
  vpmuludq 304(%rsp),%xmm0,%xmm11
724
728
  vpmuludq 288(%rsp),%xmm0,%xmm12
725
729
  vpmuludq 336(%rsp),%xmm0,%xmm13
726
- movdqa 384(%rsp),%xmm14
730
+ vmovdqa 384(%rsp),%xmm14
727
731
  vpmuludq %xmm14,%xmm0,%xmm0
728
732
  vpmuludq v38_38(%rip),%xmm14,%xmm15
729
733
  vpmuludq %xmm15,%xmm14,%xmm14
730
- paddq %xmm14,%xmm13
734
+ vpaddq %xmm14,%xmm13,%xmm13
731
735
  vpaddq %xmm6,%xmm6,%xmm14
732
736
  vpmuludq %xmm14,%xmm6,%xmm6
733
- paddq %xmm6,%xmm11
737
+ vpaddq %xmm6,%xmm11,%xmm11
734
738
  vpaddq %xmm2,%xmm2,%xmm6
735
739
  vpmuludq %xmm6,%xmm2,%xmm2
736
- paddq %xmm2,%xmm5
740
+ vpaddq %xmm2,%xmm5,%xmm5
737
741
  vpmuludq %xmm15,%xmm6,%xmm2
738
- paddq %xmm2,%xmm1
742
+ vpaddq %xmm2,%xmm1,%xmm1
739
743
  vpmuludq %xmm15,%xmm4,%xmm2
740
- paddq %xmm2,%xmm3
744
+ vpaddq %xmm2,%xmm3,%xmm3
741
745
  vpmuludq 256(%rsp),%xmm6,%xmm2
742
- paddq %xmm2,%xmm11
746
+ vpaddq %xmm2,%xmm11,%xmm11
743
747
  vpmuludq 304(%rsp),%xmm6,%xmm2
744
- paddq %xmm2,%xmm12
748
+ vpaddq %xmm2,%xmm12,%xmm12
745
749
  vpmuludq 352(%rsp),%xmm6,%xmm2
746
- paddq %xmm2,%xmm13
750
+ vpaddq %xmm2,%xmm13,%xmm13
747
751
  vpmuludq 336(%rsp),%xmm6,%xmm2
748
- paddq %xmm2,%xmm0
752
+ vpaddq %xmm2,%xmm0,%xmm0
749
753
  vpmuludq %xmm4,%xmm6,%xmm2
750
- paddq %xmm2,%xmm7
754
+ vpaddq %xmm2,%xmm7,%xmm7
751
755
  vpmuludq %xmm14,%xmm6,%xmm2
752
- paddq %xmm2,%xmm9
756
+ vpaddq %xmm2,%xmm9,%xmm9
753
757
  vpmuludq %xmm8,%xmm6,%xmm2
754
- paddq %xmm2,%xmm10
758
+ vpaddq %xmm2,%xmm10,%xmm10
755
759
  vpmuludq %xmm15,%xmm14,%xmm2
756
- paddq %xmm2,%xmm5
760
+ vpaddq %xmm2,%xmm5,%xmm5
757
761
  vpmuludq %xmm15,%xmm8,%xmm2
758
- paddq %xmm2,%xmm7
762
+ vpaddq %xmm2,%xmm7,%xmm7
759
763
  vpmuludq %xmm4,%xmm4,%xmm2
760
- paddq %xmm2,%xmm9
764
+ vpaddq %xmm2,%xmm9,%xmm9
761
765
  vpmuludq %xmm14,%xmm4,%xmm2
762
- paddq %xmm2,%xmm10
766
+ vpaddq %xmm2,%xmm10,%xmm10
763
767
  vpaddq %xmm4,%xmm4,%xmm2
764
768
  vpmuludq %xmm8,%xmm2,%xmm4
765
- paddq %xmm4,%xmm11
769
+ vpaddq %xmm4,%xmm11,%xmm11
766
770
  vpmuludq 400(%rsp),%xmm2,%xmm4
767
- paddq %xmm4,%xmm1
771
+ vpaddq %xmm4,%xmm1,%xmm1
768
772
  vpmuludq 400(%rsp),%xmm14,%xmm4
769
- paddq %xmm4,%xmm3
773
+ vpaddq %xmm4,%xmm3,%xmm3
770
774
  vpmuludq 224(%rsp),%xmm2,%xmm4
771
- paddq %xmm4,%xmm12
775
+ vpaddq %xmm4,%xmm12,%xmm12
772
776
  vpmuludq 304(%rsp),%xmm2,%xmm4
773
- paddq %xmm4,%xmm13
777
+ vpaddq %xmm4,%xmm13,%xmm13
774
778
  vpmuludq 288(%rsp),%xmm2,%xmm2
775
- paddq %xmm2,%xmm0
779
+ vpaddq %xmm2,%xmm0,%xmm0
776
780
  vpmuludq 368(%rsp),%xmm8,%xmm2
777
- paddq %xmm2,%xmm3
781
+ vpaddq %xmm2,%xmm3,%xmm3
778
782
  vpmuludq %xmm8,%xmm14,%xmm2
779
- paddq %xmm2,%xmm12
783
+ vpaddq %xmm2,%xmm12,%xmm12
780
784
  vpmuludq %xmm8,%xmm8,%xmm2
781
- paddq %xmm2,%xmm13
785
+ vpaddq %xmm2,%xmm13,%xmm13
782
786
  vpaddq %xmm8,%xmm8,%xmm2
783
787
  vpmuludq 400(%rsp),%xmm2,%xmm4
784
- paddq %xmm4,%xmm5
788
+ vpaddq %xmm4,%xmm5,%xmm5
785
789
  vpmuludq 256(%rsp),%xmm15,%xmm4
786
- paddq %xmm4,%xmm9
790
+ vpaddq %xmm4,%xmm9,%xmm9
787
791
  vpmuludq 304(%rsp),%xmm15,%xmm4
788
- paddq %xmm4,%xmm10
792
+ vpaddq %xmm4,%xmm10,%xmm10
789
793
  vpmuludq 368(%rsp),%xmm14,%xmm4
790
- paddq %xmm4,%xmm1
791
- movdqa 256(%rsp),%xmm4
792
- pmuludq 400(%rsp),%xmm4
793
- paddq %xmm4,%xmm7
794
+ vpaddq %xmm4,%xmm1,%xmm1
795
+ vmovdqa 256(%rsp),%xmm4
796
+ vpmuludq 400(%rsp),%xmm4,%xmm4
797
+ vpaddq %xmm4,%xmm7,%xmm7
794
798
  vpmuludq 256(%rsp),%xmm14,%xmm4
795
- paddq %xmm4,%xmm13
799
+ vpaddq %xmm4,%xmm13,%xmm13
796
800
  vpmuludq 304(%rsp),%xmm14,%xmm4
797
- paddq %xmm4,%xmm0
801
+ vpaddq %xmm4,%xmm0,%xmm0
798
802
  vpmuludq 352(%rsp),%xmm15,%xmm4
799
- paddq %xmm4,%xmm11
803
+ vpaddq %xmm4,%xmm11,%xmm11
800
804
  vpmuludq 336(%rsp),%xmm15,%xmm4
801
- paddq %xmm4,%xmm12
802
- movdqa 304(%rsp),%xmm4
803
- paddq %xmm4,%xmm4
804
- pmuludq 400(%rsp),%xmm4
805
- paddq %xmm4,%xmm9
805
+ vpaddq %xmm4,%xmm12,%xmm12
806
+ vmovdqa 304(%rsp),%xmm4
807
+ vpaddq %xmm4,%xmm4,%xmm4
808
+ vpmuludq 400(%rsp),%xmm4,%xmm4
809
+ vpaddq %xmm4,%xmm9,%xmm9
806
810
  vpmuludq 320(%rsp),%xmm2,%xmm4
807
- paddq %xmm4,%xmm1
808
- movdqa 256(%rsp),%xmm4
809
- pmuludq 320(%rsp),%xmm4
810
- paddq %xmm4,%xmm3
811
- movdqa 256(%rsp),%xmm4
812
- pmuludq 368(%rsp),%xmm4
813
- paddq %xmm4,%xmm5
814
- movdqa 304(%rsp),%xmm4
815
- pmuludq 368(%rsp),%xmm4
816
- paddq %xmm4,%xmm7
817
- movdqa 352(%rsp),%xmm4
818
- pmuludq 400(%rsp),%xmm4
819
- paddq %xmm4,%xmm10
811
+ vpaddq %xmm4,%xmm1,%xmm1
812
+ vmovdqa 256(%rsp),%xmm4
813
+ vpmuludq 320(%rsp),%xmm4,%xmm4
814
+ vpaddq %xmm4,%xmm3,%xmm3
815
+ vmovdqa 256(%rsp),%xmm4
816
+ vpmuludq 368(%rsp),%xmm4,%xmm4
817
+ vpaddq %xmm4,%xmm5,%xmm5
818
+ vmovdqa 304(%rsp),%xmm4
819
+ vpmuludq 368(%rsp),%xmm4,%xmm4
820
+ vpaddq %xmm4,%xmm7,%xmm7
821
+ vmovdqa 352(%rsp),%xmm4
822
+ vpmuludq 400(%rsp),%xmm4,%xmm4
823
+ vpaddq %xmm4,%xmm10,%xmm10
824
+ vpmuludq 224(%rsp),%xmm2,%xmm2
825
+ vpaddq %xmm2,%xmm0,%xmm0
826
+ vmovdqa 272(%rsp),%xmm2
820
827
  vpmuludq 224(%rsp),%xmm2,%xmm2
821
- paddq %xmm2,%xmm0
822
- movdqa 272(%rsp),%xmm2
823
- pmuludq 224(%rsp),%xmm2
824
- paddq %xmm2,%xmm1
825
- movdqa 320(%rsp),%xmm2
826
- pmuludq 304(%rsp),%xmm2
827
- paddq %xmm2,%xmm5
828
- movdqa 368(%rsp),%xmm2
829
- pmuludq 288(%rsp),%xmm2
830
- paddq %xmm2,%xmm9
831
- movdqa 400(%rsp),%xmm2
832
- pmuludq 336(%rsp),%xmm2
833
- paddq %xmm2,%xmm11
828
+ vpaddq %xmm2,%xmm1,%xmm1
829
+ vmovdqa 320(%rsp),%xmm2
830
+ vpmuludq 304(%rsp),%xmm2,%xmm2
831
+ vpaddq %xmm2,%xmm5,%xmm5
832
+ vmovdqa 368(%rsp),%xmm2
833
+ vpmuludq 288(%rsp),%xmm2,%xmm2
834
+ vpaddq %xmm2,%xmm9,%xmm9
835
+ vmovdqa 400(%rsp),%xmm2
836
+ vpmuludq 336(%rsp),%xmm2,%xmm2
837
+ vpaddq %xmm2,%xmm11,%xmm11
834
838
  vpsrlq $26,%xmm1,%xmm2
835
- paddq %xmm2,%xmm3
836
- pand m26(%rip),%xmm1
839
+ vpaddq %xmm2,%xmm3,%xmm3
840
+ vpand m26(%rip),%xmm1,%xmm1
837
841
  vpsrlq $25,%xmm10,%xmm2
838
- paddq %xmm2,%xmm11
839
- pand m25(%rip),%xmm10
842
+ vpaddq %xmm2,%xmm11,%xmm11
843
+ vpand m25(%rip),%xmm10,%xmm10
840
844
  vpsrlq $25,%xmm3,%xmm2
841
- paddq %xmm2,%xmm5
842
- pand m25(%rip),%xmm3
845
+ vpaddq %xmm2,%xmm5,%xmm5
846
+ vpand m25(%rip),%xmm3,%xmm3
843
847
  vpsrlq $26,%xmm11,%xmm2
844
- paddq %xmm2,%xmm12
845
- pand m26(%rip),%xmm11
848
+ vpaddq %xmm2,%xmm12,%xmm12
849
+ vpand m26(%rip),%xmm11,%xmm11
846
850
  vpsrlq $26,%xmm5,%xmm2
847
- paddq %xmm2,%xmm7
848
- pand m26(%rip),%xmm5
851
+ vpaddq %xmm2,%xmm7,%xmm7
852
+ vpand m26(%rip),%xmm5,%xmm5
849
853
  vpsrlq $25,%xmm12,%xmm2
850
- paddq %xmm2,%xmm13
851
- pand m25(%rip),%xmm12
854
+ vpaddq %xmm2,%xmm13,%xmm13
855
+ vpand m25(%rip),%xmm12,%xmm12
852
856
  vpsrlq $25,%xmm7,%xmm2
853
- paddq %xmm2,%xmm9
854
- pand m25(%rip),%xmm7
857
+ vpaddq %xmm2,%xmm9,%xmm9
858
+ vpand m25(%rip),%xmm7,%xmm7
855
859
  vpsrlq $26,%xmm13,%xmm2
856
- paddq %xmm2,%xmm0
857
- pand m26(%rip),%xmm13
860
+ vpaddq %xmm2,%xmm0,%xmm0
861
+ vpand m26(%rip),%xmm13,%xmm13
858
862
  vpsrlq $26,%xmm9,%xmm2
859
- paddq %xmm2,%xmm10
860
- pand m26(%rip),%xmm9
863
+ vpaddq %xmm2,%xmm10,%xmm10
864
+ vpand m26(%rip),%xmm9,%xmm9
861
865
  vpsrlq $25,%xmm0,%xmm2
862
866
  vpsllq $4,%xmm2,%xmm4
863
- paddq %xmm2,%xmm1
864
- psllq $1,%xmm2
865
- paddq %xmm2,%xmm4
866
- paddq %xmm4,%xmm1
867
- pand m25(%rip),%xmm0
867
+ vpaddq %xmm2,%xmm1,%xmm1
868
+ vpsllq $1,%xmm2,%xmm2
869
+ vpaddq %xmm2,%xmm4,%xmm4
870
+ vpaddq %xmm4,%xmm1,%xmm1
871
+ vpand m25(%rip),%xmm0,%xmm0
868
872
  vpsrlq $25,%xmm10,%xmm2
869
- paddq %xmm2,%xmm11
870
- pand m25(%rip),%xmm10
873
+ vpaddq %xmm2,%xmm11,%xmm11
874
+ vpand m25(%rip),%xmm10,%xmm10
871
875
  vpsrlq $26,%xmm1,%xmm2
872
- paddq %xmm2,%xmm3
873
- pand m26(%rip),%xmm1
876
+ vpaddq %xmm2,%xmm3,%xmm3
877
+ vpand m26(%rip),%xmm1,%xmm1
874
878
  vpunpckhqdq %xmm3,%xmm1,%xmm2
875
879
  vpunpcklqdq %xmm3,%xmm1,%xmm1
876
- movdqa %xmm1,176(%rsp)
880
+ vmovdqa %xmm1,176(%rsp)
877
881
  vpaddq subc0(%rip),%xmm2,%xmm3
878
- psubq %xmm1,%xmm3
882
+ vpsubq %xmm1,%xmm3,%xmm3
879
883
  vpunpckhqdq %xmm3,%xmm2,%xmm1
880
884
  vpunpcklqdq %xmm3,%xmm2,%xmm2
881
- movdqa %xmm2,192(%rsp)
882
- movdqa %xmm1,224(%rsp)
883
- psllq $1,%xmm1
884
- movdqa %xmm1,240(%rsp)
885
- pmuludq v121666_121666(%rip),%xmm3
886
- movdqa 80(%rsp),%xmm1
885
+ vmovdqa %xmm2,192(%rsp)
886
+ vmovdqa %xmm1,224(%rsp)
887
+ vpsllq $1,%xmm1,%xmm1
888
+ vmovdqa %xmm1,240(%rsp)
889
+ vpmuludq v121666_121666(%rip),%xmm3,%xmm3
890
+ vmovdqa 80(%rsp),%xmm1
887
891
  vpunpcklqdq %xmm1,%xmm3,%xmm2
888
892
  vpunpckhqdq %xmm1,%xmm3,%xmm1
889
893
  vpunpckhqdq %xmm7,%xmm5,%xmm3
890
894
  vpunpcklqdq %xmm7,%xmm5,%xmm4
891
- movdqa %xmm4,256(%rsp)
895
+ vmovdqa %xmm4,256(%rsp)
892
896
  vpaddq subc2(%rip),%xmm3,%xmm5
893
- psubq %xmm4,%xmm5
897
+ vpsubq %xmm4,%xmm5,%xmm5
894
898
  vpunpckhqdq %xmm5,%xmm3,%xmm4
895
899
  vpunpcklqdq %xmm5,%xmm3,%xmm3
896
- movdqa %xmm3,272(%rsp)
897
- movdqa %xmm4,288(%rsp)
898
- psllq $1,%xmm4
899
- movdqa %xmm4,304(%rsp)
900
- pmuludq v121666_121666(%rip),%xmm5
901
- movdqa 96(%rsp),%xmm3
900
+ vmovdqa %xmm3,272(%rsp)
901
+ vmovdqa %xmm4,288(%rsp)
902
+ vpsllq $1,%xmm4,%xmm4
903
+ vmovdqa %xmm4,304(%rsp)
904
+ vpmuludq v121666_121666(%rip),%xmm5,%xmm5
905
+ vmovdqa 96(%rsp),%xmm3
902
906
  vpunpcklqdq %xmm3,%xmm5,%xmm4
903
907
  vpunpckhqdq %xmm3,%xmm5,%xmm3
904
908
  vpunpckhqdq %xmm10,%xmm9,%xmm5
905
909
  vpunpcklqdq %xmm10,%xmm9,%xmm6
906
- movdqa %xmm6,320(%rsp)
910
+ vmovdqa %xmm6,320(%rsp)
907
911
  vpaddq subc2(%rip),%xmm5,%xmm7
908
- psubq %xmm6,%xmm7
912
+ vpsubq %xmm6,%xmm7,%xmm7
909
913
  vpunpckhqdq %xmm7,%xmm5,%xmm6
910
914
  vpunpcklqdq %xmm7,%xmm5,%xmm5
911
- movdqa %xmm5,336(%rsp)
912
- movdqa %xmm6,352(%rsp)
913
- psllq $1,%xmm6
914
- movdqa %xmm6,368(%rsp)
915
- pmuludq v121666_121666(%rip),%xmm7
916
- movdqa 112(%rsp),%xmm5
915
+ vmovdqa %xmm5,336(%rsp)
916
+ vmovdqa %xmm6,352(%rsp)
917
+ vpsllq $1,%xmm6,%xmm6
918
+ vmovdqa %xmm6,368(%rsp)
919
+ vpmuludq v121666_121666(%rip),%xmm7,%xmm7
920
+ vmovdqa 112(%rsp),%xmm5
917
921
  vpunpcklqdq %xmm5,%xmm7,%xmm6
918
922
  vpunpckhqdq %xmm5,%xmm7,%xmm5
919
923
  vpunpckhqdq %xmm12,%xmm11,%xmm7
920
924
  vpunpcklqdq %xmm12,%xmm11,%xmm8
921
- movdqa %xmm8,384(%rsp)
925
+ vmovdqa %xmm8,384(%rsp)
922
926
  vpaddq subc2(%rip),%xmm7,%xmm9
923
- psubq %xmm8,%xmm9
927
+ vpsubq %xmm8,%xmm9,%xmm9
924
928
  vpunpckhqdq %xmm9,%xmm7,%xmm8
925
929
  vpunpcklqdq %xmm9,%xmm7,%xmm7
926
- movdqa %xmm7,400(%rsp)
927
- movdqa %xmm8,416(%rsp)
928
- psllq $1,%xmm8
929
- movdqa %xmm8,432(%rsp)
930
- pmuludq v121666_121666(%rip),%xmm9
931
- movdqa 160(%rsp),%xmm7
930
+ vmovdqa %xmm7,400(%rsp)
931
+ vmovdqa %xmm8,416(%rsp)
932
+ vpsllq $1,%xmm8,%xmm8
933
+ vmovdqa %xmm8,432(%rsp)
934
+ vpmuludq v121666_121666(%rip),%xmm9,%xmm9
935
+ vmovdqa 160(%rsp),%xmm7
932
936
  vpunpcklqdq %xmm7,%xmm9,%xmm8
933
937
  vpunpckhqdq %xmm7,%xmm9,%xmm7
934
938
  vpunpckhqdq %xmm0,%xmm13,%xmm9
935
939
  vpunpcklqdq %xmm0,%xmm13,%xmm0
936
- movdqa %xmm0,160(%rsp)
940
+ vmovdqa %xmm0,160(%rsp)
937
941
  vpaddq subc2(%rip),%xmm9,%xmm10
938
- psubq %xmm0,%xmm10
942
+ vpsubq %xmm0,%xmm10,%xmm10
939
943
  vpunpckhqdq %xmm10,%xmm9,%xmm0
940
944
  vpunpcklqdq %xmm10,%xmm9,%xmm9
941
- movdqa %xmm9,448(%rsp)
942
- movdqa %xmm0,464(%rsp)
943
- psllq $1,%xmm0
944
- movdqa %xmm0,480(%rsp)
945
- pmuludq v121666_121666(%rip),%xmm10
946
- movdqa 208(%rsp),%xmm0
945
+ vmovdqa %xmm9,448(%rsp)
946
+ vmovdqa %xmm0,464(%rsp)
947
+ vpsllq $1,%xmm0,%xmm0
948
+ vmovdqa %xmm0,480(%rsp)
949
+ vpmuludq v121666_121666(%rip),%xmm10,%xmm10
950
+ vmovdqa 208(%rsp),%xmm0
947
951
  vpunpcklqdq %xmm0,%xmm10,%xmm9
948
952
  vpunpckhqdq %xmm0,%xmm10,%xmm0
949
953
  vpsrlq $26,%xmm2,%xmm10
950
- paddq %xmm10,%xmm1
951
- pand m26(%rip),%xmm2
954
+ vpaddq %xmm10,%xmm1,%xmm1
955
+ vpand m26(%rip),%xmm2,%xmm2
952
956
  vpsrlq $25,%xmm5,%xmm10
953
- paddq %xmm10,%xmm8
954
- pand m25(%rip),%xmm5
957
+ vpaddq %xmm10,%xmm8,%xmm8
958
+ vpand m25(%rip),%xmm5,%xmm5
955
959
  vpsrlq $25,%xmm1,%xmm10
956
- paddq %xmm10,%xmm4
957
- pand m25(%rip),%xmm1
960
+ vpaddq %xmm10,%xmm4,%xmm4
961
+ vpand m25(%rip),%xmm1,%xmm1
958
962
  vpsrlq $26,%xmm8,%xmm10
959
- paddq %xmm10,%xmm7
960
- pand m26(%rip),%xmm8
963
+ vpaddq %xmm10,%xmm7,%xmm7
964
+ vpand m26(%rip),%xmm8,%xmm8
961
965
  vpsrlq $26,%xmm4,%xmm10
962
- paddq %xmm10,%xmm3
963
- pand m26(%rip),%xmm4
966
+ vpaddq %xmm10,%xmm3,%xmm3
967
+ vpand m26(%rip),%xmm4,%xmm4
964
968
  vpsrlq $25,%xmm7,%xmm10
965
- paddq %xmm10,%xmm9
966
- pand m25(%rip),%xmm7
969
+ vpaddq %xmm10,%xmm9,%xmm9
970
+ vpand m25(%rip),%xmm7,%xmm7
967
971
  vpsrlq $25,%xmm3,%xmm10
968
- paddq %xmm10,%xmm6
969
- pand m25(%rip),%xmm3
972
+ vpaddq %xmm10,%xmm6,%xmm6
973
+ vpand m25(%rip),%xmm3,%xmm3
970
974
  vpsrlq $26,%xmm9,%xmm10
971
- paddq %xmm10,%xmm0
972
- pand m26(%rip),%xmm9
975
+ vpaddq %xmm10,%xmm0,%xmm0
976
+ vpand m26(%rip),%xmm9,%xmm9
973
977
  vpsrlq $26,%xmm6,%xmm10
974
- paddq %xmm10,%xmm5
975
- pand m26(%rip),%xmm6
978
+ vpaddq %xmm10,%xmm5,%xmm5
979
+ vpand m26(%rip),%xmm6,%xmm6
976
980
  vpsrlq $25,%xmm0,%xmm10
977
981
  vpsllq $4,%xmm10,%xmm11
978
- paddq %xmm10,%xmm2
979
- psllq $1,%xmm10
980
- paddq %xmm10,%xmm11
981
- paddq %xmm11,%xmm2
982
- pand m25(%rip),%xmm0
982
+ vpaddq %xmm10,%xmm2,%xmm2
983
+ vpsllq $1,%xmm10,%xmm10
984
+ vpaddq %xmm10,%xmm11,%xmm11
985
+ vpaddq %xmm11,%xmm2,%xmm2
986
+ vpand m25(%rip),%xmm0,%xmm0
983
987
  vpsrlq $25,%xmm5,%xmm10
984
- paddq %xmm10,%xmm8
985
- pand m25(%rip),%xmm5
988
+ vpaddq %xmm10,%xmm8,%xmm8
989
+ vpand m25(%rip),%xmm5,%xmm5
986
990
  vpsrlq $26,%xmm2,%xmm10
987
- paddq %xmm10,%xmm1
988
- pand m26(%rip),%xmm2
991
+ vpaddq %xmm10,%xmm1,%xmm1
992
+ vpand m26(%rip),%xmm2,%xmm2
989
993
  vpunpckhqdq %xmm1,%xmm2,%xmm10
990
- movdqa %xmm10,80(%rsp)
994
+ vmovdqa %xmm10,80(%rsp)
991
995
  vpunpcklqdq %xmm1,%xmm2,%xmm1
992
996
  vpunpckhqdq %xmm3,%xmm4,%xmm2
993
- movdqa %xmm2,96(%rsp)
997
+ vmovdqa %xmm2,96(%rsp)
994
998
  vpunpcklqdq %xmm3,%xmm4,%xmm2
995
999
  vpunpckhqdq %xmm5,%xmm6,%xmm3
996
- movdqa %xmm3,112(%rsp)
1000
+ vmovdqa %xmm3,112(%rsp)
997
1001
  vpunpcklqdq %xmm5,%xmm6,%xmm3
998
1002
  vpunpckhqdq %xmm7,%xmm8,%xmm4
999
- movdqa %xmm4,128(%rsp)
1003
+ vmovdqa %xmm4,128(%rsp)
1000
1004
  vpunpcklqdq %xmm7,%xmm8,%xmm4
1001
1005
  vpunpckhqdq %xmm0,%xmm9,%xmm5
1002
- movdqa %xmm5,144(%rsp)
1006
+ vmovdqa %xmm5,144(%rsp)
1003
1007
  vpunpcklqdq %xmm0,%xmm9,%xmm0
1004
- movdqa 176(%rsp),%xmm5
1005
- paddq %xmm5,%xmm1
1008
+ vmovdqa 176(%rsp),%xmm5
1009
+ vpaddq %xmm5,%xmm1,%xmm1
1006
1010
  vpunpcklqdq %xmm1,%xmm5,%xmm6
1007
1011
  vpunpckhqdq %xmm1,%xmm5,%xmm1
1008
1012
  vpmuludq 224(%rsp),%xmm6,%xmm5
1009
1013
  vpmuludq 192(%rsp),%xmm1,%xmm7
1010
- paddq %xmm7,%xmm5
1014
+ vpaddq %xmm7,%xmm5,%xmm5
1011
1015
  vpmuludq 272(%rsp),%xmm6,%xmm7
1012
1016
  vpmuludq 240(%rsp),%xmm1,%xmm8
1013
- paddq %xmm8,%xmm7
1017
+ vpaddq %xmm8,%xmm7,%xmm7
1014
1018
  vpmuludq 288(%rsp),%xmm6,%xmm8
1015
1019
  vpmuludq 272(%rsp),%xmm1,%xmm9
1016
- paddq %xmm9,%xmm8
1020
+ vpaddq %xmm9,%xmm8,%xmm8
1017
1021
  vpmuludq 336(%rsp),%xmm6,%xmm9
1018
1022
  vpmuludq 304(%rsp),%xmm1,%xmm10
1019
- paddq %xmm10,%xmm9
1023
+ vpaddq %xmm10,%xmm9,%xmm9
1020
1024
  vpmuludq 352(%rsp),%xmm6,%xmm10
1021
1025
  vpmuludq 336(%rsp),%xmm1,%xmm11
1022
- paddq %xmm11,%xmm10
1026
+ vpaddq %xmm11,%xmm10,%xmm10
1023
1027
  vpmuludq 400(%rsp),%xmm6,%xmm11
1024
1028
  vpmuludq 368(%rsp),%xmm1,%xmm12
1025
- paddq %xmm12,%xmm11
1029
+ vpaddq %xmm12,%xmm11,%xmm11
1026
1030
  vpmuludq 416(%rsp),%xmm6,%xmm12
1027
1031
  vpmuludq 400(%rsp),%xmm1,%xmm13
1028
- paddq %xmm13,%xmm12
1032
+ vpaddq %xmm13,%xmm12,%xmm12
1029
1033
  vpmuludq 448(%rsp),%xmm6,%xmm13
1030
1034
  vpmuludq 432(%rsp),%xmm1,%xmm14
1031
- paddq %xmm14,%xmm13
1035
+ vpaddq %xmm14,%xmm13,%xmm13
1032
1036
  vpmuludq 464(%rsp),%xmm6,%xmm14
1033
1037
  vpmuludq 448(%rsp),%xmm1,%xmm15
1034
- paddq %xmm15,%xmm14
1038
+ vpaddq %xmm15,%xmm14,%xmm14
1035
1039
  vpmuludq 192(%rsp),%xmm6,%xmm6
1036
- pmuludq v19_19(%rip),%xmm1
1040
+ vpmuludq v19_19(%rip),%xmm1,%xmm1
1037
1041
  vpmuludq 480(%rsp),%xmm1,%xmm1
1038
- paddq %xmm1,%xmm6
1039
- movdqa 256(%rsp),%xmm1
1040
- paddq %xmm1,%xmm2
1042
+ vpaddq %xmm1,%xmm6,%xmm6
1043
+ vmovdqa 256(%rsp),%xmm1
1044
+ vpaddq %xmm1,%xmm2,%xmm2
1041
1045
  vpunpcklqdq %xmm2,%xmm1,%xmm15
1042
1046
  vpunpckhqdq %xmm2,%xmm1,%xmm1
1043
1047
  vpmuludq 192(%rsp),%xmm15,%xmm2
1044
- paddq %xmm2,%xmm7
1048
+ vpaddq %xmm2,%xmm7,%xmm7
1045
1049
  vpmuludq 224(%rsp),%xmm15,%xmm2
1046
- paddq %xmm2,%xmm8
1050
+ vpaddq %xmm2,%xmm8,%xmm8
1047
1051
  vpmuludq 272(%rsp),%xmm15,%xmm2
1048
- paddq %xmm2,%xmm9
1052
+ vpaddq %xmm2,%xmm9,%xmm9
1049
1053
  vpmuludq 288(%rsp),%xmm15,%xmm2
1050
- paddq %xmm2,%xmm10
1054
+ vpaddq %xmm2,%xmm10,%xmm10
1051
1055
  vpmuludq 336(%rsp),%xmm15,%xmm2
1052
- paddq %xmm2,%xmm11
1056
+ vpaddq %xmm2,%xmm11,%xmm11
1053
1057
  vpmuludq 352(%rsp),%xmm15,%xmm2
1054
- paddq %xmm2,%xmm12
1058
+ vpaddq %xmm2,%xmm12,%xmm12
1055
1059
  vpmuludq 400(%rsp),%xmm15,%xmm2
1056
- paddq %xmm2,%xmm13
1060
+ vpaddq %xmm2,%xmm13,%xmm13
1057
1061
  vpmuludq 416(%rsp),%xmm15,%xmm2
1058
- paddq %xmm2,%xmm14
1059
- pmuludq v19_19(%rip),%xmm15
1062
+ vpaddq %xmm2,%xmm14,%xmm14
1063
+ vpmuludq v19_19(%rip),%xmm15,%xmm15
1060
1064
  vpmuludq 448(%rsp),%xmm15,%xmm2
1061
- paddq %xmm2,%xmm6
1062
- pmuludq 464(%rsp),%xmm15
1063
- paddq %xmm15,%xmm5
1065
+ vpaddq %xmm2,%xmm6,%xmm6
1066
+ vpmuludq 464(%rsp),%xmm15,%xmm15
1067
+ vpaddq %xmm15,%xmm5,%xmm5
1064
1068
  vpmuludq 192(%rsp),%xmm1,%xmm2
1065
- paddq %xmm2,%xmm8
1069
+ vpaddq %xmm2,%xmm8,%xmm8
1066
1070
  vpmuludq 240(%rsp),%xmm1,%xmm2
1067
- paddq %xmm2,%xmm9
1071
+ vpaddq %xmm2,%xmm9,%xmm9
1068
1072
  vpmuludq 272(%rsp),%xmm1,%xmm2
1069
- paddq %xmm2,%xmm10
1073
+ vpaddq %xmm2,%xmm10,%xmm10
1070
1074
  vpmuludq 304(%rsp),%xmm1,%xmm2
1071
- paddq %xmm2,%xmm11
1075
+ vpaddq %xmm2,%xmm11,%xmm11
1072
1076
  vpmuludq 336(%rsp),%xmm1,%xmm2
1073
- paddq %xmm2,%xmm12
1077
+ vpaddq %xmm2,%xmm12,%xmm12
1074
1078
  vpmuludq 368(%rsp),%xmm1,%xmm2
1075
- paddq %xmm2,%xmm13
1079
+ vpaddq %xmm2,%xmm13,%xmm13
1076
1080
  vpmuludq 400(%rsp),%xmm1,%xmm2
1077
- paddq %xmm2,%xmm14
1078
- pmuludq v19_19(%rip),%xmm1
1081
+ vpaddq %xmm2,%xmm14,%xmm14
1082
+ vpmuludq v19_19(%rip),%xmm1,%xmm1
1079
1083
  vpmuludq 432(%rsp),%xmm1,%xmm2
1080
- paddq %xmm2,%xmm6
1084
+ vpaddq %xmm2,%xmm6,%xmm6
1081
1085
  vpmuludq 448(%rsp),%xmm1,%xmm2
1082
- paddq %xmm2,%xmm5
1083
- pmuludq 480(%rsp),%xmm1
1084
- paddq %xmm1,%xmm7
1085
- movdqa 320(%rsp),%xmm1
1086
- paddq %xmm1,%xmm3
1086
+ vpaddq %xmm2,%xmm5,%xmm5
1087
+ vpmuludq 480(%rsp),%xmm1,%xmm1
1088
+ vpaddq %xmm1,%xmm7,%xmm7
1089
+ vmovdqa 320(%rsp),%xmm1
1090
+ vpaddq %xmm1,%xmm3,%xmm3
1087
1091
  vpunpcklqdq %xmm3,%xmm1,%xmm2
1088
1092
  vpunpckhqdq %xmm3,%xmm1,%xmm1
1089
1093
  vpmuludq 192(%rsp),%xmm2,%xmm3
1090
- paddq %xmm3,%xmm9
1094
+ vpaddq %xmm3,%xmm9,%xmm9
1091
1095
  vpmuludq 224(%rsp),%xmm2,%xmm3
1092
- paddq %xmm3,%xmm10
1096
+ vpaddq %xmm3,%xmm10,%xmm10
1093
1097
  vpmuludq 272(%rsp),%xmm2,%xmm3
1094
- paddq %xmm3,%xmm11
1098
+ vpaddq %xmm3,%xmm11,%xmm11
1095
1099
  vpmuludq 288(%rsp),%xmm2,%xmm3
1096
- paddq %xmm3,%xmm12
1100
+ vpaddq %xmm3,%xmm12,%xmm12
1097
1101
  vpmuludq 336(%rsp),%xmm2,%xmm3
1098
- paddq %xmm3,%xmm13
1102
+ vpaddq %xmm3,%xmm13,%xmm13
1099
1103
  vpmuludq 352(%rsp),%xmm2,%xmm3
1100
- paddq %xmm3,%xmm14
1101
- pmuludq v19_19(%rip),%xmm2
1104
+ vpaddq %xmm3,%xmm14,%xmm14
1105
+ vpmuludq v19_19(%rip),%xmm2,%xmm2
1102
1106
  vpmuludq 400(%rsp),%xmm2,%xmm3
1103
- paddq %xmm3,%xmm6
1107
+ vpaddq %xmm3,%xmm6,%xmm6
1104
1108
  vpmuludq 416(%rsp),%xmm2,%xmm3
1105
- paddq %xmm3,%xmm5
1109
+ vpaddq %xmm3,%xmm5,%xmm5
1106
1110
  vpmuludq 448(%rsp),%xmm2,%xmm3
1107
- paddq %xmm3,%xmm7
1108
- pmuludq 464(%rsp),%xmm2
1109
- paddq %xmm2,%xmm8
1111
+ vpaddq %xmm3,%xmm7,%xmm7
1112
+ vpmuludq 464(%rsp),%xmm2,%xmm2
1113
+ vpaddq %xmm2,%xmm8,%xmm8
1110
1114
  vpmuludq 192(%rsp),%xmm1,%xmm2
1111
- paddq %xmm2,%xmm10
1115
+ vpaddq %xmm2,%xmm10,%xmm10
1112
1116
  vpmuludq 240(%rsp),%xmm1,%xmm2
1113
- paddq %xmm2,%xmm11
1117
+ vpaddq %xmm2,%xmm11,%xmm11
1114
1118
  vpmuludq 272(%rsp),%xmm1,%xmm2
1115
- paddq %xmm2,%xmm12
1119
+ vpaddq %xmm2,%xmm12,%xmm12
1116
1120
  vpmuludq 304(%rsp),%xmm1,%xmm2
1117
- paddq %xmm2,%xmm13
1121
+ vpaddq %xmm2,%xmm13,%xmm13
1118
1122
  vpmuludq 336(%rsp),%xmm1,%xmm2
1119
- paddq %xmm2,%xmm14
1120
- pmuludq v19_19(%rip),%xmm1
1123
+ vpaddq %xmm2,%xmm14,%xmm14
1124
+ vpmuludq v19_19(%rip),%xmm1,%xmm1
1121
1125
  vpmuludq 368(%rsp),%xmm1,%xmm2
1122
- paddq %xmm2,%xmm6
1126
+ vpaddq %xmm2,%xmm6,%xmm6
1123
1127
  vpmuludq 400(%rsp),%xmm1,%xmm2
1124
- paddq %xmm2,%xmm5
1128
+ vpaddq %xmm2,%xmm5,%xmm5
1125
1129
  vpmuludq 432(%rsp),%xmm1,%xmm2
1126
- paddq %xmm2,%xmm7
1130
+ vpaddq %xmm2,%xmm7,%xmm7
1127
1131
  vpmuludq 448(%rsp),%xmm1,%xmm2
1128
- paddq %xmm2,%xmm8
1129
- pmuludq 480(%rsp),%xmm1
1130
- paddq %xmm1,%xmm9
1131
- movdqa 384(%rsp),%xmm1
1132
- paddq %xmm1,%xmm4
1132
+ vpaddq %xmm2,%xmm8,%xmm8
1133
+ vpmuludq 480(%rsp),%xmm1,%xmm1
1134
+ vpaddq %xmm1,%xmm9,%xmm9
1135
+ vmovdqa 384(%rsp),%xmm1
1136
+ vpaddq %xmm1,%xmm4,%xmm4
1133
1137
  vpunpcklqdq %xmm4,%xmm1,%xmm2
1134
1138
  vpunpckhqdq %xmm4,%xmm1,%xmm1
1135
1139
  vpmuludq 192(%rsp),%xmm2,%xmm3
1136
- paddq %xmm3,%xmm11
1140
+ vpaddq %xmm3,%xmm11,%xmm11
1137
1141
  vpmuludq 224(%rsp),%xmm2,%xmm3
1138
- paddq %xmm3,%xmm12
1142
+ vpaddq %xmm3,%xmm12,%xmm12
1139
1143
  vpmuludq 272(%rsp),%xmm2,%xmm3
1140
- paddq %xmm3,%xmm13
1144
+ vpaddq %xmm3,%xmm13,%xmm13
1141
1145
  vpmuludq 288(%rsp),%xmm2,%xmm3
1142
- paddq %xmm3,%xmm14
1143
- pmuludq v19_19(%rip),%xmm2
1146
+ vpaddq %xmm3,%xmm14,%xmm14
1147
+ vpmuludq v19_19(%rip),%xmm2,%xmm2
1144
1148
  vpmuludq 336(%rsp),%xmm2,%xmm3
1145
- paddq %xmm3,%xmm6
1149
+ vpaddq %xmm3,%xmm6,%xmm6
1146
1150
  vpmuludq 352(%rsp),%xmm2,%xmm3
1147
- paddq %xmm3,%xmm5
1151
+ vpaddq %xmm3,%xmm5,%xmm5
1148
1152
  vpmuludq 400(%rsp),%xmm2,%xmm3
1149
- paddq %xmm3,%xmm7
1153
+ vpaddq %xmm3,%xmm7,%xmm7
1150
1154
  vpmuludq 416(%rsp),%xmm2,%xmm3
1151
- paddq %xmm3,%xmm8
1155
+ vpaddq %xmm3,%xmm8,%xmm8
1152
1156
  vpmuludq 448(%rsp),%xmm2,%xmm3
1153
- paddq %xmm3,%xmm9
1154
- pmuludq 464(%rsp),%xmm2
1155
- paddq %xmm2,%xmm10
1157
+ vpaddq %xmm3,%xmm9,%xmm9
1158
+ vpmuludq 464(%rsp),%xmm2,%xmm2
1159
+ vpaddq %xmm2,%xmm10,%xmm10
1156
1160
  vpmuludq 192(%rsp),%xmm1,%xmm2
1157
- paddq %xmm2,%xmm12
1161
+ vpaddq %xmm2,%xmm12,%xmm12
1158
1162
  vpmuludq 240(%rsp),%xmm1,%xmm2
1159
- paddq %xmm2,%xmm13
1163
+ vpaddq %xmm2,%xmm13,%xmm13
1160
1164
  vpmuludq 272(%rsp),%xmm1,%xmm2
1161
- paddq %xmm2,%xmm14
1162
- pmuludq v19_19(%rip),%xmm1
1165
+ vpaddq %xmm2,%xmm14,%xmm14
1166
+ vpmuludq v19_19(%rip),%xmm1,%xmm1
1163
1167
  vpmuludq 304(%rsp),%xmm1,%xmm2
1164
- paddq %xmm2,%xmm6
1168
+ vpaddq %xmm2,%xmm6,%xmm6
1165
1169
  vpmuludq 336(%rsp),%xmm1,%xmm2
1166
- paddq %xmm2,%xmm5
1170
+ vpaddq %xmm2,%xmm5,%xmm5
1167
1171
  vpmuludq 368(%rsp),%xmm1,%xmm2
1168
- paddq %xmm2,%xmm7
1172
+ vpaddq %xmm2,%xmm7,%xmm7
1169
1173
  vpmuludq 400(%rsp),%xmm1,%xmm2
1170
- paddq %xmm2,%xmm8
1174
+ vpaddq %xmm2,%xmm8,%xmm8
1171
1175
  vpmuludq 432(%rsp),%xmm1,%xmm2
1172
- paddq %xmm2,%xmm9
1176
+ vpaddq %xmm2,%xmm9,%xmm9
1173
1177
  vpmuludq 448(%rsp),%xmm1,%xmm2
1174
- paddq %xmm2,%xmm10
1175
- pmuludq 480(%rsp),%xmm1
1176
- paddq %xmm1,%xmm11
1177
- movdqa 160(%rsp),%xmm1
1178
- paddq %xmm1,%xmm0
1178
+ vpaddq %xmm2,%xmm10,%xmm10
1179
+ vpmuludq 480(%rsp),%xmm1,%xmm1
1180
+ vpaddq %xmm1,%xmm11,%xmm11
1181
+ vmovdqa 160(%rsp),%xmm1
1182
+ vpaddq %xmm1,%xmm0,%xmm0
1179
1183
  vpunpcklqdq %xmm0,%xmm1,%xmm2
1180
1184
  vpunpckhqdq %xmm0,%xmm1,%xmm0
1181
1185
  vpmuludq 192(%rsp),%xmm2,%xmm1
1182
- paddq %xmm1,%xmm13
1186
+ vpaddq %xmm1,%xmm13,%xmm13
1183
1187
  vpmuludq 224(%rsp),%xmm2,%xmm1
1184
- paddq %xmm1,%xmm14
1185
- pmuludq v19_19(%rip),%xmm2
1188
+ vpaddq %xmm1,%xmm14,%xmm14
1189
+ vpmuludq v19_19(%rip),%xmm2,%xmm2
1186
1190
  vpmuludq 272(%rsp),%xmm2,%xmm1
1187
- paddq %xmm1,%xmm6
1191
+ vpaddq %xmm1,%xmm6,%xmm6
1188
1192
  vpmuludq 288(%rsp),%xmm2,%xmm1
1189
- paddq %xmm1,%xmm5
1193
+ vpaddq %xmm1,%xmm5,%xmm5
1190
1194
  vpmuludq 336(%rsp),%xmm2,%xmm1
1191
- paddq %xmm1,%xmm7
1195
+ vpaddq %xmm1,%xmm7,%xmm7
1192
1196
  vpmuludq 352(%rsp),%xmm2,%xmm1
1193
- paddq %xmm1,%xmm8
1197
+ vpaddq %xmm1,%xmm8,%xmm8
1194
1198
  vpmuludq 400(%rsp),%xmm2,%xmm1
1195
- paddq %xmm1,%xmm9
1199
+ vpaddq %xmm1,%xmm9,%xmm9
1196
1200
  vpmuludq 416(%rsp),%xmm2,%xmm1
1197
- paddq %xmm1,%xmm10
1201
+ vpaddq %xmm1,%xmm10,%xmm10
1198
1202
  vpmuludq 448(%rsp),%xmm2,%xmm1
1199
- paddq %xmm1,%xmm11
1200
- pmuludq 464(%rsp),%xmm2
1201
- paddq %xmm2,%xmm12
1203
+ vpaddq %xmm1,%xmm11,%xmm11
1204
+ vpmuludq 464(%rsp),%xmm2,%xmm2
1205
+ vpaddq %xmm2,%xmm12,%xmm12
1202
1206
  vpmuludq 192(%rsp),%xmm0,%xmm1
1203
- paddq %xmm1,%xmm14
1204
- pmuludq v19_19(%rip),%xmm0
1207
+ vpaddq %xmm1,%xmm14,%xmm14
1208
+ vpmuludq v19_19(%rip),%xmm0,%xmm0
1205
1209
  vpmuludq 240(%rsp),%xmm0,%xmm1
1206
- paddq %xmm1,%xmm6
1210
+ vpaddq %xmm1,%xmm6,%xmm6
1207
1211
  vpmuludq 272(%rsp),%xmm0,%xmm1
1208
- paddq %xmm1,%xmm5
1212
+ vpaddq %xmm1,%xmm5,%xmm5
1209
1213
  vpmuludq 304(%rsp),%xmm0,%xmm1
1210
- paddq %xmm1,%xmm7
1214
+ vpaddq %xmm1,%xmm7,%xmm7
1211
1215
  vpmuludq 336(%rsp),%xmm0,%xmm1
1212
- paddq %xmm1,%xmm8
1216
+ vpaddq %xmm1,%xmm8,%xmm8
1213
1217
  vpmuludq 368(%rsp),%xmm0,%xmm1
1214
- paddq %xmm1,%xmm9
1218
+ vpaddq %xmm1,%xmm9,%xmm9
1215
1219
  vpmuludq 400(%rsp),%xmm0,%xmm1
1216
- paddq %xmm1,%xmm10
1220
+ vpaddq %xmm1,%xmm10,%xmm10
1217
1221
  vpmuludq 432(%rsp),%xmm0,%xmm1
1218
- paddq %xmm1,%xmm11
1222
+ vpaddq %xmm1,%xmm11,%xmm11
1219
1223
  vpmuludq 448(%rsp),%xmm0,%xmm1
1220
- paddq %xmm1,%xmm12
1221
- pmuludq 480(%rsp),%xmm0
1222
- paddq %xmm0,%xmm13
1224
+ vpaddq %xmm1,%xmm12,%xmm12
1225
+ vpmuludq 480(%rsp),%xmm0,%xmm0
1226
+ vpaddq %xmm0,%xmm13,%xmm13
1223
1227
  vpsrlq $26,%xmm6,%xmm0
1224
- paddq %xmm0,%xmm5
1225
- pand m26(%rip),%xmm6
1228
+ vpaddq %xmm0,%xmm5,%xmm5
1229
+ vpand m26(%rip),%xmm6,%xmm6
1226
1230
  vpsrlq $25,%xmm10,%xmm0
1227
- paddq %xmm0,%xmm11
1228
- pand m25(%rip),%xmm10
1231
+ vpaddq %xmm0,%xmm11,%xmm11
1232
+ vpand m25(%rip),%xmm10,%xmm10
1229
1233
  vpsrlq $25,%xmm5,%xmm0
1230
- paddq %xmm0,%xmm7
1231
- pand m25(%rip),%xmm5
1234
+ vpaddq %xmm0,%xmm7,%xmm7
1235
+ vpand m25(%rip),%xmm5,%xmm5
1232
1236
  vpsrlq $26,%xmm11,%xmm0
1233
- paddq %xmm0,%xmm12
1234
- pand m26(%rip),%xmm11
1237
+ vpaddq %xmm0,%xmm12,%xmm12
1238
+ vpand m26(%rip),%xmm11,%xmm11
1235
1239
  vpsrlq $26,%xmm7,%xmm0
1236
- paddq %xmm0,%xmm8
1237
- pand m26(%rip),%xmm7
1240
+ vpaddq %xmm0,%xmm8,%xmm8
1241
+ vpand m26(%rip),%xmm7,%xmm7
1238
1242
  vpsrlq $25,%xmm12,%xmm0
1239
- paddq %xmm0,%xmm13
1240
- pand m25(%rip),%xmm12
1243
+ vpaddq %xmm0,%xmm13,%xmm13
1244
+ vpand m25(%rip),%xmm12,%xmm12
1241
1245
  vpsrlq $25,%xmm8,%xmm0
1242
- paddq %xmm0,%xmm9
1243
- pand m25(%rip),%xmm8
1246
+ vpaddq %xmm0,%xmm9,%xmm9
1247
+ vpand m25(%rip),%xmm8,%xmm8
1244
1248
  vpsrlq $26,%xmm13,%xmm0
1245
- paddq %xmm0,%xmm14
1246
- pand m26(%rip),%xmm13
1249
+ vpaddq %xmm0,%xmm14,%xmm14
1250
+ vpand m26(%rip),%xmm13,%xmm13
1247
1251
  vpsrlq $26,%xmm9,%xmm0
1248
- paddq %xmm0,%xmm10
1249
- pand m26(%rip),%xmm9
1252
+ vpaddq %xmm0,%xmm10,%xmm10
1253
+ vpand m26(%rip),%xmm9,%xmm9
1250
1254
  vpsrlq $25,%xmm14,%xmm0
1251
1255
  vpsllq $4,%xmm0,%xmm1
1252
- paddq %xmm0,%xmm6
1253
- psllq $1,%xmm0
1254
- paddq %xmm0,%xmm1
1255
- paddq %xmm1,%xmm6
1256
- pand m25(%rip),%xmm14
1256
+ vpaddq %xmm0,%xmm6,%xmm6
1257
+ vpsllq $1,%xmm0,%xmm0
1258
+ vpaddq %xmm0,%xmm1,%xmm1
1259
+ vpaddq %xmm1,%xmm6,%xmm6
1260
+ vpand m25(%rip),%xmm14,%xmm14
1257
1261
  vpsrlq $25,%xmm10,%xmm0
1258
- paddq %xmm0,%xmm11
1259
- pand m25(%rip),%xmm10
1262
+ vpaddq %xmm0,%xmm11,%xmm11
1263
+ vpand m25(%rip),%xmm10,%xmm10
1260
1264
  vpsrlq $26,%xmm6,%xmm0
1261
- paddq %xmm0,%xmm5
1262
- pand m26(%rip),%xmm6
1265
+ vpaddq %xmm0,%xmm5,%xmm5
1266
+ vpand m26(%rip),%xmm6,%xmm6
1263
1267
  vpunpckhqdq %xmm5,%xmm6,%xmm1
1264
1268
  vpunpcklqdq %xmm5,%xmm6,%xmm0
1265
1269
  vpunpckhqdq %xmm8,%xmm7,%xmm3
@@ -1272,16 +1276,16 @@ vpunpckhqdq %xmm14,%xmm13,%xmm9
1272
1276
  vpunpcklqdq %xmm14,%xmm13,%xmm8
1273
1277
  cmp $0,%rdx
1274
1278
  jne ._ladder_base_loop
1275
- movdqu %xmm1,80(%rdi)
1276
- movdqu %xmm0,0(%rdi)
1277
- movdqu %xmm3,96(%rdi)
1278
- movdqu %xmm2,16(%rdi)
1279
- movdqu %xmm5,112(%rdi)
1280
- movdqu %xmm4,32(%rdi)
1281
- movdqu %xmm7,128(%rdi)
1282
- movdqu %xmm6,48(%rdi)
1283
- movdqu %xmm9,144(%rdi)
1284
- movdqu %xmm8,64(%rdi)
1279
+ vmovdqu %xmm1,80(%rdi)
1280
+ vmovdqu %xmm0,0(%rdi)
1281
+ vmovdqu %xmm3,96(%rdi)
1282
+ vmovdqu %xmm2,16(%rdi)
1283
+ vmovdqu %xmm5,112(%rdi)
1284
+ vmovdqu %xmm4,32(%rdi)
1285
+ vmovdqu %xmm7,128(%rdi)
1286
+ vmovdqu %xmm6,48(%rdi)
1287
+ vmovdqu %xmm9,144(%rdi)
1288
+ vmovdqu %xmm8,64(%rdi)
1285
1289
  movq 1536(%rsp),%r11
1286
1290
  movq 1544(%rsp),%r12
1287
1291
  movq 1552(%rsp),%r13