minimap2 0.2.25.0 → 0.2.25.1
Sign up to get free protection for your applications and to get access to all the features.
- checksums.yaml +4 -4
- data/README.md +2 -3
- data/ext/minimap2/Makefile +6 -2
- data/ext/minimap2/NEWS.md +38 -0
- data/ext/minimap2/README.md +9 -3
- data/ext/minimap2/align.c +5 -3
- data/ext/minimap2/cookbook.md +2 -2
- data/ext/minimap2/format.c +7 -4
- data/ext/minimap2/kalloc.c +20 -1
- data/ext/minimap2/kalloc.h +13 -2
- data/ext/minimap2/ksw2.h +1 -0
- data/ext/minimap2/ksw2_extd2_sse.c +1 -1
- data/ext/minimap2/ksw2_exts2_sse.c +79 -40
- data/ext/minimap2/ksw2_extz2_sse.c +1 -1
- data/ext/minimap2/lchain.c +15 -16
- data/ext/minimap2/lib/simde/CONTRIBUTING.md +114 -0
- data/ext/minimap2/lib/simde/COPYING +20 -0
- data/ext/minimap2/lib/simde/README.md +333 -0
- data/ext/minimap2/lib/simde/amalgamate.py +58 -0
- data/ext/minimap2/lib/simde/meson.build +33 -0
- data/ext/minimap2/lib/simde/netlify.toml +20 -0
- data/ext/minimap2/lib/simde/simde/arm/neon/float32x2.h +140 -0
- data/ext/minimap2/lib/simde/simde/arm/neon/float32x4.h +137 -0
- data/ext/minimap2/lib/simde/simde/arm/neon/float64x1.h +142 -0
- data/ext/minimap2/lib/simde/simde/arm/neon/float64x2.h +145 -0
- data/ext/minimap2/lib/simde/simde/arm/neon/int16x4.h +140 -0
- data/ext/minimap2/lib/simde/simde/arm/neon/int16x8.h +145 -0
- data/ext/minimap2/lib/simde/simde/arm/neon/int32x2.h +140 -0
- data/ext/minimap2/lib/simde/simde/arm/neon/int32x4.h +143 -0
- data/ext/minimap2/lib/simde/simde/arm/neon/int64x1.h +137 -0
- data/ext/minimap2/lib/simde/simde/arm/neon/int64x2.h +141 -0
- data/ext/minimap2/lib/simde/simde/arm/neon/int8x16.h +147 -0
- data/ext/minimap2/lib/simde/simde/arm/neon/int8x8.h +141 -0
- data/ext/minimap2/lib/simde/simde/arm/neon/uint16x4.h +134 -0
- data/ext/minimap2/lib/simde/simde/arm/neon/uint16x8.h +138 -0
- data/ext/minimap2/lib/simde/simde/arm/neon/uint32x2.h +134 -0
- data/ext/minimap2/lib/simde/simde/arm/neon/uint32x4.h +137 -0
- data/ext/minimap2/lib/simde/simde/arm/neon/uint64x1.h +131 -0
- data/ext/minimap2/lib/simde/simde/arm/neon/uint64x2.h +135 -0
- data/ext/minimap2/lib/simde/simde/arm/neon/uint8x16.h +141 -0
- data/ext/minimap2/lib/simde/simde/arm/neon/uint8x8.h +135 -0
- data/ext/minimap2/lib/simde/simde/arm/neon.h +97 -0
- data/ext/minimap2/lib/simde/simde/check.h +267 -0
- data/ext/minimap2/lib/simde/simde/debug-trap.h +83 -0
- data/ext/minimap2/lib/simde/simde/hedley.h +1899 -0
- data/ext/minimap2/lib/simde/simde/simde-arch.h +445 -0
- data/ext/minimap2/lib/simde/simde/simde-common.h +697 -0
- data/ext/minimap2/lib/simde/simde/x86/avx.h +5385 -0
- data/ext/minimap2/lib/simde/simde/x86/avx2.h +2402 -0
- data/ext/minimap2/lib/simde/simde/x86/avx512bw.h +391 -0
- data/ext/minimap2/lib/simde/simde/x86/avx512f.h +3389 -0
- data/ext/minimap2/lib/simde/simde/x86/avx512vl.h +112 -0
- data/ext/minimap2/lib/simde/simde/x86/fma.h +659 -0
- data/ext/minimap2/lib/simde/simde/x86/mmx.h +2210 -0
- data/ext/minimap2/lib/simde/simde/x86/sse.h +3696 -0
- data/ext/minimap2/lib/simde/simde/x86/sse2.h +5991 -0
- data/ext/minimap2/lib/simde/simde/x86/sse3.h +343 -0
- data/ext/minimap2/lib/simde/simde/x86/sse4.1.h +1783 -0
- data/ext/minimap2/lib/simde/simde/x86/sse4.2.h +105 -0
- data/ext/minimap2/lib/simde/simde/x86/ssse3.h +1053 -0
- data/ext/minimap2/lib/simde/simde/x86/svml.h +543 -0
- data/ext/minimap2/lib/simde/test/CMakeLists.txt +166 -0
- data/ext/minimap2/lib/simde/test/arm/meson.build +4 -0
- data/ext/minimap2/lib/simde/test/arm/neon/meson.build +23 -0
- data/ext/minimap2/lib/simde/test/arm/neon/skel.c +871 -0
- data/ext/minimap2/lib/simde/test/arm/neon/test-neon-internal.h +134 -0
- data/ext/minimap2/lib/simde/test/arm/neon/test-neon.c +39 -0
- data/ext/minimap2/lib/simde/test/arm/neon/test-neon.h +10 -0
- data/ext/minimap2/lib/simde/test/arm/neon/vadd.c +1260 -0
- data/ext/minimap2/lib/simde/test/arm/neon/vdup_n.c +873 -0
- data/ext/minimap2/lib/simde/test/arm/neon/vmul.c +1084 -0
- data/ext/minimap2/lib/simde/test/arm/neon/vsub.c +1260 -0
- data/ext/minimap2/lib/simde/test/arm/test-arm-internal.h +18 -0
- data/ext/minimap2/lib/simde/test/arm/test-arm.c +20 -0
- data/ext/minimap2/lib/simde/test/arm/test-arm.h +8 -0
- data/ext/minimap2/lib/simde/test/cmake/AddCompilerFlags.cmake +171 -0
- data/ext/minimap2/lib/simde/test/cmake/ExtraWarningFlags.cmake +68 -0
- data/ext/minimap2/lib/simde/test/meson.build +64 -0
- data/ext/minimap2/lib/simde/test/munit/COPYING +21 -0
- data/ext/minimap2/lib/simde/test/munit/Makefile +55 -0
- data/ext/minimap2/lib/simde/test/munit/README.md +54 -0
- data/ext/minimap2/lib/simde/test/munit/example.c +351 -0
- data/ext/minimap2/lib/simde/test/munit/meson.build +37 -0
- data/ext/minimap2/lib/simde/test/munit/munit.c +2055 -0
- data/ext/minimap2/lib/simde/test/munit/munit.h +535 -0
- data/ext/minimap2/lib/simde/test/run-tests.c +20 -0
- data/ext/minimap2/lib/simde/test/run-tests.h +260 -0
- data/ext/minimap2/lib/simde/test/x86/avx.c +13752 -0
- data/ext/minimap2/lib/simde/test/x86/avx2.c +9977 -0
- data/ext/minimap2/lib/simde/test/x86/avx512bw.c +2664 -0
- data/ext/minimap2/lib/simde/test/x86/avx512f.c +10416 -0
- data/ext/minimap2/lib/simde/test/x86/avx512vl.c +210 -0
- data/ext/minimap2/lib/simde/test/x86/fma.c +2557 -0
- data/ext/minimap2/lib/simde/test/x86/meson.build +33 -0
- data/ext/minimap2/lib/simde/test/x86/mmx.c +2878 -0
- data/ext/minimap2/lib/simde/test/x86/skel.c +2984 -0
- data/ext/minimap2/lib/simde/test/x86/sse.c +5121 -0
- data/ext/minimap2/lib/simde/test/x86/sse2.c +9860 -0
- data/ext/minimap2/lib/simde/test/x86/sse3.c +486 -0
- data/ext/minimap2/lib/simde/test/x86/sse4.1.c +3446 -0
- data/ext/minimap2/lib/simde/test/x86/sse4.2.c +101 -0
- data/ext/minimap2/lib/simde/test/x86/ssse3.c +2084 -0
- data/ext/minimap2/lib/simde/test/x86/svml.c +1545 -0
- data/ext/minimap2/lib/simde/test/x86/test-avx.h +16 -0
- data/ext/minimap2/lib/simde/test/x86/test-avx512.h +25 -0
- data/ext/minimap2/lib/simde/test/x86/test-mmx.h +13 -0
- data/ext/minimap2/lib/simde/test/x86/test-sse.h +13 -0
- data/ext/minimap2/lib/simde/test/x86/test-sse2.h +13 -0
- data/ext/minimap2/lib/simde/test/x86/test-x86-internal.h +196 -0
- data/ext/minimap2/lib/simde/test/x86/test-x86.c +48 -0
- data/ext/minimap2/lib/simde/test/x86/test-x86.h +8 -0
- data/ext/minimap2/main.c +13 -6
- data/ext/minimap2/map.c +0 -5
- data/ext/minimap2/minimap.h +40 -31
- data/ext/minimap2/minimap2.1 +19 -5
- data/ext/minimap2/misc/paftools.js +545 -24
- data/ext/minimap2/options.c +1 -1
- data/ext/minimap2/pyproject.toml +2 -0
- data/ext/minimap2/python/mappy.pyx +3 -1
- data/ext/minimap2/seed.c +1 -1
- data/ext/minimap2/setup.py +32 -22
- data/lib/minimap2/version.rb +1 -1
- metadata +100 -3
@@ -0,0 +1,2664 @@
|
|
1
|
+
/* Copyright (c) 2018, 2019 Evan Nemerson <evan@nemerson.com>
|
2
|
+
*
|
3
|
+
* Permission is hereby granted, free of charge, to any person
|
4
|
+
* obtaining a copy of this software and associated documentation
|
5
|
+
* files (the "Software"), to deal in the Software without
|
6
|
+
* restriction, including without limitation the rights to use, copy,
|
7
|
+
* modify, merge, publish, distribute, sublicense, and/or sell copies
|
8
|
+
* of the Software, and to permit persons to whom the Software is
|
9
|
+
* furnished to do so, subject to the following conditions:
|
10
|
+
*
|
11
|
+
* The above copyright notice and this permission notice shall be
|
12
|
+
* included in all copies or substantial portions of the Software.
|
13
|
+
*
|
14
|
+
* THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND,
|
15
|
+
* EXPRESS OR IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF
|
16
|
+
* MERCHANTABILITY, FITNESS FOR A PARTICULAR PURPOSE AND
|
17
|
+
* NONINFRINGEMENT. IN NO EVENT SHALL THE AUTHORS OR COPYRIGHT HOLDERS
|
18
|
+
* BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER LIABILITY, WHETHER IN AN
|
19
|
+
* ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM, OUT OF OR IN
|
20
|
+
* CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE
|
21
|
+
* SOFTWARE.
|
22
|
+
*/
|
23
|
+
|
24
|
+
#define SIMDE_TESTS_CURRENT_ISAX avx512bw
|
25
|
+
#include <simde/x86/avx512bw.h>
|
26
|
+
#include <test/x86/test-avx512.h>
|
27
|
+
|
28
|
+
#if defined(SIMDE_AVX512BW_NATIVE) || defined(SIMDE_NO_NATIVE) || defined(SIMDE_ALWAYS_BUILD_NATIVE_TESTS)
|
29
|
+
|
30
|
+
static MunitResult
|
31
|
+
test_simde_mm512_add_epi32(const MunitParameter params[], void* data) {
|
32
|
+
(void) params;
|
33
|
+
(void) data;
|
34
|
+
|
35
|
+
const struct {
|
36
|
+
simde__m512i a;
|
37
|
+
simde__m512i b;
|
38
|
+
simde__m512i r;
|
39
|
+
} test_vec[8] = {
|
40
|
+
{ simde_mm512_set_epi32(INT32_C( -620437579), INT32_C( -723756998), INT32_C( 2089862132), INT32_C( 928615324),
|
41
|
+
INT32_C( 1352582940), INT32_C( 1412449807), INT32_C( -180438223), INT32_C( 1987031180),
|
42
|
+
INT32_C( -515955035), INT32_C( 1724776466), INT32_C( 534751449), INT32_C( -23608579),
|
43
|
+
INT32_C(-1857730421), INT32_C(-2108373984), INT32_C(-2047745621), INT32_C(-1616522706)),
|
44
|
+
simde_mm512_set_epi32(INT32_C(-1828719907), INT32_C(-1665857743), INT32_C( 633675792), INT32_C( -87619707),
|
45
|
+
INT32_C( 206282352), INT32_C(-1301173823), INT32_C(-1377624366), INT32_C(-1722858856),
|
46
|
+
INT32_C(-1747195587), INT32_C(-1421499089), INT32_C(-1466275595), INT32_C( 1005942821),
|
47
|
+
INT32_C( 653597122), INT32_C( 1511265780), INT32_C(-1057049813), INT32_C( 988582315)),
|
48
|
+
simde_mm512_set_epi32(INT32_C( 1845809810), INT32_C( 1905352555), INT32_C(-1571429372), INT32_C( 840995617),
|
49
|
+
INT32_C( 1558865292), INT32_C( 111275984), INT32_C(-1558062589), INT32_C( 264172324),
|
50
|
+
INT32_C( 2031816674), INT32_C( 303277377), INT32_C( -931524146), INT32_C( 982334242),
|
51
|
+
INT32_C(-1204133299), INT32_C( -597108204), INT32_C( 1190171862), INT32_C( -627940391)) },
|
52
|
+
{ simde_mm512_set_epi32(INT32_C(-1937590036), INT32_C( -332801366), INT32_C( -471964647), INT32_C(-1821490876),
|
53
|
+
INT32_C( -730720612), INT32_C( -212155491), INT32_C( 557730573), INT32_C( 1419303203),
|
54
|
+
INT32_C( -649726768), INT32_C(-1343949182), INT32_C( 543388357), INT32_C( 2016683828),
|
55
|
+
INT32_C(-1787609785), INT32_C( 1170714264), INT32_C( 1838698095), INT32_C( -610530733)),
|
56
|
+
simde_mm512_set_epi32(INT32_C( -78760490), INT32_C(-1762700896), INT32_C( 743846170), INT32_C( 2011763261),
|
57
|
+
INT32_C( -319606822), INT32_C( -887822109), INT32_C( 843030788), INT32_C( 1100063012),
|
58
|
+
INT32_C( 1306201477), INT32_C( -328092402), INT32_C( 760791953), INT32_C( 1607075963),
|
59
|
+
INT32_C(-2029269339), INT32_C(-1246855319), INT32_C( 373846974), INT32_C(-2039859469)),
|
60
|
+
simde_mm512_set_epi32(INT32_C(-2016350526), INT32_C(-2095502262), INT32_C( 271881523), INT32_C( 190272385),
|
61
|
+
INT32_C(-1050327434), INT32_C(-1099977600), INT32_C( 1400761361), INT32_C(-1775601081),
|
62
|
+
INT32_C( 656474709), INT32_C(-1672041584), INT32_C( 1304180310), INT32_C( -671207505),
|
63
|
+
INT32_C( 478088172), INT32_C( -76141055), INT32_C(-2082422227), INT32_C( 1644577094)) },
|
64
|
+
{ simde_mm512_set_epi32(INT32_C( 57776624), INT32_C( 1788183002), INT32_C(-1974433832), INT32_C(-1794133389),
|
65
|
+
INT32_C(-1069162986), INT32_C(-1427272558), INT32_C(-1253805688), INT32_C( -660872028),
|
66
|
+
INT32_C(-1129884149), INT32_C( 173413635), INT32_C( 2028757327), INT32_C( 1565906228),
|
67
|
+
INT32_C(-2137992833), INT32_C(-1203890748), INT32_C( 706474135), INT32_C(-1778193688)),
|
68
|
+
simde_mm512_set_epi32(INT32_C( -515592024), INT32_C( -146353312), INT32_C( 242268084), INT32_C( -988968038),
|
69
|
+
INT32_C(-2038559805), INT32_C( 54811004), INT32_C( 1173402348), INT32_C( 422621509),
|
70
|
+
INT32_C( 566804477), INT32_C( 1847170418), INT32_C( -922088165), INT32_C( -324583669),
|
71
|
+
INT32_C( 2069465832), INT32_C(-1437889074), INT32_C( 238343196), INT32_C( 1745183762)),
|
72
|
+
simde_mm512_set_epi32(INT32_C( -457815400), INT32_C( 1641829690), INT32_C(-1732165748), INT32_C( 1511865869),
|
73
|
+
INT32_C( 1187244505), INT32_C(-1372461554), INT32_C( -80403340), INT32_C( -238250519),
|
74
|
+
INT32_C( -563079672), INT32_C( 2020584053), INT32_C( 1106669162), INT32_C( 1241322559),
|
75
|
+
INT32_C( -68527001), INT32_C( 1653187474), INT32_C( 944817331), INT32_C( -33009926)) },
|
76
|
+
{ simde_mm512_set_epi32(INT32_C( 1004166983), INT32_C(-2037237484), INT32_C( 975969300), INT32_C( 221374965),
|
77
|
+
INT32_C( -878025387), INT32_C( 1166912453), INT32_C( 1981901973), INT32_C( 976355918),
|
78
|
+
INT32_C( 1384872269), INT32_C( -15473064), INT32_C( -289026084), INT32_C( 1652811113),
|
79
|
+
INT32_C( 2056881111), INT32_C( 1621101202), INT32_C( 1517253606), INT32_C( 1625264348)),
|
80
|
+
simde_mm512_set_epi32(INT32_C(-1184683174), INT32_C( 619504240), INT32_C(-1150416788), INT32_C(-1085597388),
|
81
|
+
INT32_C( 1766693029), INT32_C( 1152891465), INT32_C(-2035468310), INT32_C( 1319983622),
|
82
|
+
INT32_C(-1615386348), INT32_C( 261012444), INT32_C( 223560144), INT32_C( 331591481),
|
83
|
+
INT32_C( -33325842), INT32_C( -398184636), INT32_C( 1301281245), INT32_C(-1280622867)),
|
84
|
+
simde_mm512_set_epi32(INT32_C( -180516191), INT32_C(-1417733244), INT32_C( -174447488), INT32_C( -864222423),
|
85
|
+
INT32_C( 888667642), INT32_C(-1975163378), INT32_C( -53566337), INT32_C(-1998627756),
|
86
|
+
INT32_C( -230514079), INT32_C( 245539380), INT32_C( -65465940), INT32_C( 1984402594),
|
87
|
+
INT32_C( 2023555269), INT32_C( 1222916566), INT32_C(-1476432445), INT32_C( 344641481)) },
|
88
|
+
{ simde_mm512_set_epi32(INT32_C( -99917228), INT32_C( 209251690), INT32_C( 108789393), INT32_C(-1056574639),
|
89
|
+
INT32_C( 178125384), INT32_C( 1688380363), INT32_C( -910324723), INT32_C( 1731780669),
|
90
|
+
INT32_C( 1989188149), INT32_C( 999202624), INT32_C( 198474190), INT32_C( 1270934715),
|
91
|
+
INT32_C( -715363116), INT32_C( 1839116730), INT32_C( -53141198), INT32_C( -590771199)),
|
92
|
+
simde_mm512_set_epi32(INT32_C( -77041932), INT32_C( 927171423), INT32_C( -178390373), INT32_C(-1958045464),
|
93
|
+
INT32_C( 1172980373), INT32_C(-1805733723), INT32_C( -859792119), INT32_C( 1334306095),
|
94
|
+
INT32_C(-1717931855), INT32_C( -244574814), INT32_C( 1638507066), INT32_C( -551865858),
|
95
|
+
INT32_C( -152534880), INT32_C(-1198583052), INT32_C( -869344314), INT32_C(-1920653371)),
|
96
|
+
simde_mm512_set_epi32(INT32_C( -176959160), INT32_C( 1136423113), INT32_C( -69600980), INT32_C( 1280347193),
|
97
|
+
INT32_C( 1351105757), INT32_C( -117353360), INT32_C(-1770116842), INT32_C(-1228880532),
|
98
|
+
INT32_C( 271256294), INT32_C( 754627810), INT32_C( 1836981256), INT32_C( 719068857),
|
99
|
+
INT32_C( -867897996), INT32_C( 640533678), INT32_C( -922485512), INT32_C( 1783542726)) },
|
100
|
+
{ simde_mm512_set_epi32(INT32_C(-1801907952), INT32_C( 126986794), INT32_C( 2099256067), INT32_C( 915807861),
|
101
|
+
INT32_C( -313053214), INT32_C( 1205934161), INT32_C( 25151882), INT32_C( -823105542),
|
102
|
+
INT32_C(-1390117486), INT32_C( 385956806), INT32_C( 1986964939), INT32_C( 56415632),
|
103
|
+
INT32_C(-1186749471), INT32_C( 1048153466), INT32_C( 1387660497), INT32_C( 2108528480)),
|
104
|
+
simde_mm512_set_epi32(INT32_C(-1572695910), INT32_C( 592114445), INT32_C( -85836842), INT32_C(-1721616170),
|
105
|
+
INT32_C( 222979620), INT32_C( -376092888), INT32_C( 405576062), INT32_C( 902804532),
|
106
|
+
INT32_C( 2135373993), INT32_C( 1677980182), INT32_C(-1127993042), INT32_C( -771911734),
|
107
|
+
INT32_C( -41719457), INT32_C(-1772059837), INT32_C(-1722167164), INT32_C( 812561930)),
|
108
|
+
simde_mm512_set_epi32(INT32_C( 920363434), INT32_C( 719101239), INT32_C( 2013419225), INT32_C( -805808309),
|
109
|
+
INT32_C( -90073594), INT32_C( 829841273), INT32_C( 430727944), INT32_C( 79698990),
|
110
|
+
INT32_C( 745256507), INT32_C( 2063936988), INT32_C( 858971897), INT32_C( -715496102),
|
111
|
+
INT32_C(-1228468928), INT32_C( -723906371), INT32_C( -334506667), INT32_C(-1373876886)) },
|
112
|
+
{ simde_mm512_set_epi32(INT32_C( -87552733), INT32_C( -497247153), INT32_C( 1468487386), INT32_C( 1003068863),
|
113
|
+
INT32_C( 1747861143), INT32_C( -646367560), INT32_C( -755743025), INT32_C( 683078293),
|
114
|
+
INT32_C( 1090643160), INT32_C( 1972147188), INT32_C(-2077095609), INT32_C( 731411049),
|
115
|
+
INT32_C( -484220816), INT32_C( -672982839), INT32_C( -64061145), INT32_C(-1731914804)),
|
116
|
+
simde_mm512_set_epi32(INT32_C( 1287212577), INT32_C( 799931806), INT32_C( 620076827), INT32_C( 806976960),
|
117
|
+
INT32_C(-1787684636), INT32_C( -68422538), INT32_C( 591651588), INT32_C( 2136172897),
|
118
|
+
INT32_C( 538232126), INT32_C( 1910632119), INT32_C( 280273419), INT32_C( 1179224181),
|
119
|
+
INT32_C( -178809858), INT32_C(-1741617588), INT32_C(-2045147428), INT32_C( 1639562384)),
|
120
|
+
simde_mm512_set_epi32(INT32_C( 1199659844), INT32_C( 302684653), INT32_C( 2088564213), INT32_C( 1810045823),
|
121
|
+
INT32_C( -39823493), INT32_C( -714790098), INT32_C( -164091437), INT32_C(-1475716106),
|
122
|
+
INT32_C( 1628875286), INT32_C( -412187989), INT32_C(-1796822190), INT32_C( 1910635230),
|
123
|
+
INT32_C( -663030674), INT32_C( 1880366869), INT32_C(-2109208573), INT32_C( -92352420)) },
|
124
|
+
{ simde_mm512_set_epi32(INT32_C( 446376492), INT32_C( 1910481415), INT32_C( 625332216), INT32_C( 541212187),
|
125
|
+
INT32_C( 298536203), INT32_C(-1502376568), INT32_C( -699613431), INT32_C( -125340207),
|
126
|
+
INT32_C( -849753035), INT32_C( -538074567), INT32_C( 1356067945), INT32_C( 1088886620),
|
127
|
+
INT32_C(-1643178888), INT32_C( 855336737), INT32_C( 1638140255), INT32_C(-2120465324)),
|
128
|
+
simde_mm512_set_epi32(INT32_C( 1091209248), INT32_C(-1950373665), INT32_C(-2108427702), INT32_C( 969460626),
|
129
|
+
INT32_C( 438255242), INT32_C( -807569468), INT32_C( -746566484), INT32_C( 1685713375),
|
130
|
+
INT32_C( 93210471), INT32_C( 1249365881), INT32_C( 945726578), INT32_C( 1471824111),
|
131
|
+
INT32_C( 1944720672), INT32_C(-1780061567), INT32_C( 1132193802), INT32_C( 151873348)),
|
132
|
+
simde_mm512_set_epi32(INT32_C( 1537585740), INT32_C( -39892250), INT32_C(-1483095486), INT32_C( 1510672813),
|
133
|
+
INT32_C( 736791445), INT32_C( 1985021260), INT32_C(-1446179915), INT32_C( 1560373168),
|
134
|
+
INT32_C( -756542564), INT32_C( 711291314), INT32_C(-1993172773), INT32_C(-1734256565),
|
135
|
+
INT32_C( 301541784), INT32_C( -924724830), INT32_C(-1524633239), INT32_C(-1968591976)) }
|
136
|
+
};
|
137
|
+
|
138
|
+
for (size_t i = 0 ; i < (sizeof(test_vec) / sizeof(test_vec[0])); i++) {
|
139
|
+
simde__m512i r = simde_mm512_add_epi32(test_vec[i].a, test_vec[i].b);
|
140
|
+
simde_assert_m512i_i32(r, ==, test_vec[i].r);
|
141
|
+
}
|
142
|
+
|
143
|
+
return MUNIT_OK;
|
144
|
+
}
|
145
|
+
|
146
|
+
static MunitResult
|
147
|
+
test_simde_mm512_add_epi64(const MunitParameter params[], void* data) {
|
148
|
+
(void) params;
|
149
|
+
(void) data;
|
150
|
+
|
151
|
+
const struct {
|
152
|
+
simde__m512i a;
|
153
|
+
simde__m512i b;
|
154
|
+
simde__m512i r;
|
155
|
+
} test_vec[8] = {
|
156
|
+
{ simde_mm512_set_epi64(INT64_C(-1142113623186190173), INT64_C( 2669401519388559587),
|
157
|
+
INT64_C(-4041526363448340541), INT64_C( 8890984525115992605),
|
158
|
+
INT64_C( 3710059072002351182), INT64_C( -8844419669430530),
|
159
|
+
INT64_C( -583435793687448962), INT64_C(-3776976191330287246)),
|
160
|
+
simde_mm512_set_epi64(INT64_C(-2572258444501888207), INT64_C( 8010943607820280661),
|
161
|
+
INT64_C(-7896534424393030159), INT64_C( 8282192647960665352),
|
162
|
+
INT64_C( 811312670062340262), INT64_C(-8174776120225966748),
|
163
|
+
INT64_C( 4815827375621462801), INT64_C(-4343109153599957409)),
|
164
|
+
simde_mm512_set_epi64(INT64_C(-3714372067688078380), INT64_C(-7766398946500711368),
|
165
|
+
INT64_C( 6508683285868180916), INT64_C(-1273566900632893659),
|
166
|
+
INT64_C( 4521371742064691444), INT64_C(-8183620539895397278),
|
167
|
+
INT64_C( 4232391581934013839), INT64_C(-8120085344930244655)) },
|
168
|
+
{ simde_mm512_set_epi64(INT64_C(-8907763853043432709), INT64_C(-7664489506315516041),
|
169
|
+
INT64_C( 7881121837601630619), INT64_C(-1123258072002783793),
|
170
|
+
INT64_C( 6852591379280896525), INT64_C(-3366432558441729450),
|
171
|
+
INT64_C(-5990500579016281828), INT64_C( 7624785959951223888)),
|
172
|
+
simde_mm512_set_epi64(INT64_C( 530774369540308193), INT64_C( 4966843317235809520),
|
173
|
+
INT64_C(-4575853019860390176), INT64_C(-5468596229394507748),
|
174
|
+
INT64_C( 5016860099104730248), INT64_C(-4030848910458752721),
|
175
|
+
INT64_C(-5726415349997053878), INT64_C(-2689606844288066445)),
|
176
|
+
simde_mm512_set_epi64(INT64_C(-8376989483503124516), INT64_C(-2697646189079706521),
|
177
|
+
INT64_C( 3305268817741240443), INT64_C(-6591854301397291541),
|
178
|
+
INT64_C(-6577292595323924843), INT64_C(-7397281468900482171),
|
179
|
+
INT64_C( 6729828144696215910), INT64_C( 4935179115663157443)) },
|
180
|
+
{ simde_mm512_set_epi64(INT64_C(-1147603065405303411), INT64_C(-7360179338648948250),
|
181
|
+
INT64_C( 8522846282553983063), INT64_C(-6411739365277986684),
|
182
|
+
INT64_C( 2565410720902708591), INT64_C(-6999797153964411090),
|
183
|
+
INT64_C(-4638909294820957529), INT64_C(-6689250119856274996)),
|
184
|
+
simde_mm512_set_epi64(INT64_C( 5073596640780038992), INT64_C( 9103358253828460511),
|
185
|
+
INT64_C( -705008066916281166), INT64_C(-6536611133780086738),
|
186
|
+
INT64_C( 8265445360104219638), INT64_C( 3801153343625786085),
|
187
|
+
INT64_C( 2669262289718667251), INT64_C( 5656097673759919545)),
|
188
|
+
simde_mm512_set_epi64(INT64_C( 3925993575374735581), INT64_C( 1743178915179512261),
|
189
|
+
INT64_C( 7817838215637701897), INT64_C( 5498393574651478194),
|
190
|
+
INT64_C(-7615887992702623387), INT64_C(-3198643810338625005),
|
191
|
+
INT64_C(-1969647005102290278), INT64_C(-1033152446096355451)) },
|
192
|
+
{ simde_mm512_set_epi64(INT64_C( 4726294533983517199), INT64_C(-3194102718522779616),
|
193
|
+
INT64_C( 7968557550946485055), INT64_C( 3231249301417879275),
|
194
|
+
INT64_C( 2730855362291069772), INT64_C(-7006805907158396614),
|
195
|
+
INT64_C( 7013656719434070104), INT64_C(-5111614041831206337)),
|
196
|
+
simde_mm512_set_epi64(INT64_C( 8077331611956864824), INT64_C( 9219505211765165401),
|
197
|
+
INT64_C( -526170803618465025), INT64_C(-6117963664293386621),
|
198
|
+
INT64_C( 8138058063794249913), INT64_C(-6512904449490940829),
|
199
|
+
INT64_C( 474025353181411678), INT64_C(-7774133174508991700)),
|
200
|
+
simde_mm512_set_epi64(INT64_C(-5643117927769169593), INT64_C( 6025402493242385785),
|
201
|
+
INT64_C( 7442386747328020030), INT64_C(-2886714362875507346),
|
202
|
+
INT64_C(-7577830647624231931), INT64_C( 4927033717060214173),
|
203
|
+
INT64_C( 7487682072615481782), INT64_C( 5560996857369353579)) },
|
204
|
+
{ simde_mm512_set_epi64(INT64_C( 193050968130854053), INT64_C( 8259941741302086974),
|
205
|
+
INT64_C( -453186687001595332), INT64_C( 7712011730228920808),
|
206
|
+
INT64_C(-6104336988767299426), INT64_C( 5308601606176372502),
|
207
|
+
INT64_C(-2287583704165123047), INT64_C( 5680091922249770976)),
|
208
|
+
simde_mm512_set_epi64(INT64_C(-4961468284661849310), INT64_C( 9060485449513062801),
|
209
|
+
INT64_C( 6632655590889112567), INT64_C( 7501604346789135910),
|
210
|
+
INT64_C(-7298384925887684809), INT64_C( 2881824411969821346),
|
211
|
+
INT64_C(-8132400455203655002), INT64_C( 4133962836264448240)),
|
212
|
+
simde_mm512_set_epi64(INT64_C(-4768417316530995257), INT64_C(-1126316882894401841),
|
213
|
+
INT64_C( 6179468903887517235), INT64_C(-3233127996691494898),
|
214
|
+
INT64_C( 5044022159054567381), INT64_C( 8190426018146193848),
|
215
|
+
INT64_C( 8026759914340773567), INT64_C(-8632689315195332400)) },
|
216
|
+
{ simde_mm512_set_epi64(INT64_C( 8956245117105388401), INT64_C(-1279259458875765791),
|
217
|
+
INT64_C(-4844132309560126483), INT64_C( 8020518294074851688),
|
218
|
+
INT64_C(-5641381585453289469), INT64_C(-7336114943591686134),
|
219
|
+
INT64_C( 7396026256462185783), INT64_C(-7159923149096431079)),
|
220
|
+
simde_mm512_set_epi64(INT64_C( 7681308578881334632), INT64_C( 6762384852768739876),
|
221
|
+
INT64_C(-6630226433339556438), INT64_C( 895229301334345958),
|
222
|
+
INT64_C( 8748757877138934431), INT64_C(-3406024454166778034),
|
223
|
+
INT64_C(-1971110785327035786), INT64_C( 5257409320594533793)),
|
224
|
+
simde_mm512_set_epi64(INT64_C(-1809190377722828583), INT64_C( 5483125393892974085),
|
225
|
+
INT64_C( 6972385330809868695), INT64_C( 8915747595409197646),
|
226
|
+
INT64_C( 3107376291685644962), INT64_C( 7704604675951087448),
|
227
|
+
INT64_C( 5424915471135149997), INT64_C(-1902513828501897286)) },
|
228
|
+
{ simde_mm512_set_epi64(INT64_C(-6379556098233125245), INT64_C(-7036815414983308437),
|
229
|
+
INT64_C( 6449458293699998062), INT64_C(-8662596582560742605),
|
230
|
+
INT64_C( 8559396047271930933), INT64_C( 8319158628050257118),
|
231
|
+
INT64_C( 2671429253434382084), INT64_C(-3771778240982532322)),
|
232
|
+
simde_mm512_set_epi64(INT64_C( 4847839000068024729), INT64_C( 7410858097550413452),
|
233
|
+
INT64_C( -481636656067004168), INT64_C( 273087245529831397),
|
234
|
+
INT64_C( 2014413537357415871), INT64_C(-3897516487309028112),
|
235
|
+
INT64_C( 4133432427690444225), INT64_C(-7762159775807857014)),
|
236
|
+
simde_mm512_set_epi64(INT64_C(-1531717098165100516), INT64_C( 374042682567105015),
|
237
|
+
INT64_C( 5967821637632993894), INT64_C(-8389509337030911208),
|
238
|
+
INT64_C(-7872934489080204812), INT64_C( 4421642140741229006),
|
239
|
+
INT64_C( 6804861681124826309), INT64_C( 6912806056919162280)) },
|
240
|
+
{ simde_mm512_set_epi64(INT64_C( 7044617451253925485), INT64_C( 8554512071902279421),
|
241
|
+
INT64_C(-5774887429267945902), INT64_C( 8744694126758591835),
|
242
|
+
INT64_C( 6726346195930174353), INT64_C(-3624175965481610004),
|
243
|
+
INT64_C(-2980185457068069894), INT64_C(-1599338563378690807)),
|
244
|
+
simde_mm512_set_epi64(INT64_C( 7457111512897216818), INT64_C(-2685664891179263207),
|
245
|
+
INT64_C( 3286698240604454682), INT64_C( 1197616399803304076),
|
246
|
+
INT64_C(-5755426011606503746), INT64_C(-7010024580994263662),
|
247
|
+
INT64_C(-1798652028950367168), INT64_C( 1422740686196608462)),
|
248
|
+
simde_mm512_set_epi64(INT64_C(-3945015109558409313), INT64_C( 5868847180723016214),
|
249
|
+
INT64_C(-2488189188663491220), INT64_C(-8504433547147655705),
|
250
|
+
INT64_C( 970920184323670607), INT64_C( 7812543527233677950),
|
251
|
+
INT64_C(-4778837486018437062), INT64_C( -176597877182082345)) }
|
252
|
+
};
|
253
|
+
|
254
|
+
for (size_t i = 0 ; i < (sizeof(test_vec) / sizeof(test_vec[0])); i++) {
|
255
|
+
simde__m512i r = simde_mm512_add_epi64(test_vec[i].a, test_vec[i].b);
|
256
|
+
simde_assert_m512i_i64(r, ==, test_vec[i].r);
|
257
|
+
}
|
258
|
+
|
259
|
+
return MUNIT_OK;
|
260
|
+
}
|
261
|
+
|
262
|
+
static MunitResult
|
263
|
+
test_simde_mm512_adds_epi8(const MunitParameter params[], void* data) {
|
264
|
+
(void) params;
|
265
|
+
(void) data;
|
266
|
+
|
267
|
+
const struct {
|
268
|
+
simde__m512i a;
|
269
|
+
simde__m512i b;
|
270
|
+
simde__m512i r;
|
271
|
+
} test_vec[8] = {
|
272
|
+
{ simde_mm512_set_epi8(INT8_C( -30), INT8_C( -16), INT8_C( -64), INT8_C( 113),
|
273
|
+
INT8_C( 51), INT8_C(-115), INT8_C( 19), INT8_C( -80),
|
274
|
+
INT8_C(-110), INT8_C( -62), INT8_C( -91), INT8_C( 8),
|
275
|
+
INT8_C( 11), INT8_C( -49), INT8_C( -43), INT8_C(-101),
|
276
|
+
INT8_C( 16), INT8_C( 61), INT8_C( -2), INT8_C(-100),
|
277
|
+
INT8_C( 1), INT8_C( -80), INT8_C( 127), INT8_C(-105),
|
278
|
+
INT8_C( -74), INT8_C(-126), INT8_C( 122), INT8_C( 30),
|
279
|
+
INT8_C( -73), INT8_C( 48), INT8_C( -33), INT8_C( 2),
|
280
|
+
INT8_C( -82), INT8_C( -10), INT8_C( 33), INT8_C( 20),
|
281
|
+
INT8_C(-120), INT8_C(-120), INT8_C( -46), INT8_C( -54),
|
282
|
+
INT8_C( -43), INT8_C( 63), INT8_C( 81), INT8_C( 103),
|
283
|
+
INT8_C( 118), INT8_C( -84), INT8_C( 76), INT8_C( 47),
|
284
|
+
INT8_C( 101), INT8_C( -83), INT8_C( 15), INT8_C( 23),
|
285
|
+
INT8_C( 36), INT8_C(-116), INT8_C( -88), INT8_C( -45),
|
286
|
+
INT8_C( -6), INT8_C( 86), INT8_C( 20), INT8_C( 39),
|
287
|
+
INT8_C( 117), INT8_C( 80), INT8_C( 97), INT8_C( 41)),
|
288
|
+
simde_mm512_set_epi8(INT8_C( 122), INT8_C( 43), INT8_C( 38), INT8_C( 97),
|
289
|
+
INT8_C( 38), INT8_C( 68), INT8_C( 88), INT8_C( 56),
|
290
|
+
INT8_C( -39), INT8_C( 61), INT8_C( -57), INT8_C( -66),
|
291
|
+
INT8_C(-121), INT8_C( 29), INT8_C( 110), INT8_C( 127),
|
292
|
+
INT8_C(-115), INT8_C( 16), INT8_C( -46), INT8_C( 65),
|
293
|
+
INT8_C( -36), INT8_C( 26), INT8_C( 12), INT8_C( -79),
|
294
|
+
INT8_C( -66), INT8_C( -28), INT8_C( -67), INT8_C( -79),
|
295
|
+
INT8_C( -60), INT8_C( -13), INT8_C( 74), INT8_C( 25),
|
296
|
+
INT8_C( 46), INT8_C( 8), INT8_C( 70), INT8_C( 106),
|
297
|
+
INT8_C(-119), INT8_C( 0), INT8_C( -96), INT8_C( -51),
|
298
|
+
INT8_C( -50), INT8_C( 93), INT8_C( 92), INT8_C( 65),
|
299
|
+
INT8_C( -96), INT8_C(-126), INT8_C( 4), INT8_C( 9),
|
300
|
+
INT8_C( 26), INT8_C(-119), INT8_C( 93), INT8_C( 15),
|
301
|
+
INT8_C(-115), INT8_C( 77), INT8_C( 125), INT8_C( -62),
|
302
|
+
INT8_C( 77), INT8_C( -22), INT8_C( 101), INT8_C( 83),
|
303
|
+
INT8_C( 45), INT8_C( -68), INT8_C( 97), INT8_C( -19)),
|
304
|
+
simde_mm512_set_epi8(INT8_C( 92), INT8_C( 27), INT8_C( -26), INT8_C( 127),
|
305
|
+
INT8_C( 89), INT8_C( -47), INT8_C( 107), INT8_C( -24),
|
306
|
+
INT8_C(-128), INT8_C( -1), INT8_C(-128), INT8_C( -58),
|
307
|
+
INT8_C(-110), INT8_C( -20), INT8_C( 67), INT8_C( 26),
|
308
|
+
INT8_C( -99), INT8_C( 77), INT8_C( -48), INT8_C( -35),
|
309
|
+
INT8_C( -35), INT8_C( -54), INT8_C( 127), INT8_C(-128),
|
310
|
+
INT8_C(-128), INT8_C(-128), INT8_C( 55), INT8_C( -49),
|
311
|
+
INT8_C(-128), INT8_C( 35), INT8_C( 41), INT8_C( 27),
|
312
|
+
INT8_C( -36), INT8_C( -2), INT8_C( 103), INT8_C( 126),
|
313
|
+
INT8_C(-128), INT8_C(-120), INT8_C(-128), INT8_C(-105),
|
314
|
+
INT8_C( -93), INT8_C( 127), INT8_C( 127), INT8_C( 127),
|
315
|
+
INT8_C( 22), INT8_C(-128), INT8_C( 80), INT8_C( 56),
|
316
|
+
INT8_C( 127), INT8_C(-128), INT8_C( 108), INT8_C( 38),
|
317
|
+
INT8_C( -79), INT8_C( -39), INT8_C( 37), INT8_C(-107),
|
318
|
+
INT8_C( 71), INT8_C( 64), INT8_C( 121), INT8_C( 122),
|
319
|
+
INT8_C( 127), INT8_C( 12), INT8_C( 127), INT8_C( 22)) },
|
320
|
+
{ simde_mm512_set_epi8(INT8_C( 60), INT8_C( 96), INT8_C(-106), INT8_C(-115),
|
321
|
+
INT8_C( 31), INT8_C(-108), INT8_C( 15), INT8_C( 63),
|
322
|
+
INT8_C( -77), INT8_C( 125), INT8_C( 41), INT8_C( -80),
|
323
|
+
INT8_C( 36), INT8_C(-118), INT8_C(-116), INT8_C( -63),
|
324
|
+
INT8_C( -44), INT8_C( 70), INT8_C( 99), INT8_C( 48),
|
325
|
+
INT8_C( 67), INT8_C( 43), INT8_C( 83), INT8_C( 53),
|
326
|
+
INT8_C( 60), INT8_C( 57), INT8_C(-118), INT8_C( 55),
|
327
|
+
INT8_C( -62), INT8_C( -42), INT8_C( 19), INT8_C( 52),
|
328
|
+
INT8_C( -37), INT8_C( -32), INT8_C( 33), INT8_C(-114),
|
329
|
+
INT8_C( -96), INT8_C( 53), INT8_C( 18), INT8_C( -37),
|
330
|
+
INT8_C( 6), INT8_C( -87), INT8_C( -11), INT8_C( -10),
|
331
|
+
INT8_C( -4), INT8_C( 84), INT8_C( 104), INT8_C( 55),
|
332
|
+
INT8_C( 92), INT8_C( 117), INT8_C( 16), INT8_C( 115),
|
333
|
+
INT8_C( 83), INT8_C( 80), INT8_C(-125), INT8_C( 64),
|
334
|
+
INT8_C( 74), INT8_C( -9), INT8_C( -62), INT8_C( 67),
|
335
|
+
INT8_C( 102), INT8_C( 66), INT8_C( -86), INT8_C(-112)),
|
336
|
+
simde_mm512_set_epi8(INT8_C( -97), INT8_C( 52), INT8_C( -91), INT8_C( 7),
|
337
|
+
INT8_C( -1), INT8_C( -19), INT8_C( 38), INT8_C( 15),
|
338
|
+
INT8_C( 76), INT8_C( 63), INT8_C( 10), INT8_C( 18),
|
339
|
+
INT8_C( 54), INT8_C( 73), INT8_C( 15), INT8_C( -54),
|
340
|
+
INT8_C(-114), INT8_C( 63), INT8_C( 44), INT8_C( 4),
|
341
|
+
INT8_C( 41), INT8_C( 90), INT8_C( -78), INT8_C( -67),
|
342
|
+
INT8_C( 95), INT8_C( -14), INT8_C( -10), INT8_C( -44),
|
343
|
+
INT8_C( 53), INT8_C( 102), INT8_C( 127), INT8_C( 120),
|
344
|
+
INT8_C( -89), INT8_C( 10), INT8_C( -36), INT8_C( -50),
|
345
|
+
INT8_C( 118), INT8_C(-106), INT8_C( -52), INT8_C( 76),
|
346
|
+
INT8_C( 66), INT8_C( -36), INT8_C( -79), INT8_C( 91),
|
347
|
+
INT8_C( 14), INT8_C( 103), INT8_C( -73), INT8_C(-123),
|
348
|
+
INT8_C( 68), INT8_C( -54), INT8_C(-103), INT8_C( 38),
|
349
|
+
INT8_C( 58), INT8_C( 0), INT8_C( -62), INT8_C( -76),
|
350
|
+
INT8_C( 93), INT8_C( 119), INT8_C( 14), INT8_C( 84),
|
351
|
+
INT8_C( -83), INT8_C( 76), INT8_C( -47), INT8_C( -53)),
|
352
|
+
simde_mm512_set_epi8(INT8_C( -37), INT8_C( 127), INT8_C(-128), INT8_C(-108),
|
353
|
+
INT8_C( 30), INT8_C(-127), INT8_C( 53), INT8_C( 78),
|
354
|
+
INT8_C( -1), INT8_C( 127), INT8_C( 51), INT8_C( -62),
|
355
|
+
INT8_C( 90), INT8_C( -45), INT8_C(-101), INT8_C(-117),
|
356
|
+
INT8_C(-128), INT8_C( 127), INT8_C( 127), INT8_C( 52),
|
357
|
+
INT8_C( 108), INT8_C( 127), INT8_C( 5), INT8_C( -14),
|
358
|
+
INT8_C( 127), INT8_C( 43), INT8_C(-128), INT8_C( 11),
|
359
|
+
INT8_C( -9), INT8_C( 60), INT8_C( 127), INT8_C( 127),
|
360
|
+
INT8_C(-126), INT8_C( -22), INT8_C( -3), INT8_C(-128),
|
361
|
+
INT8_C( 22), INT8_C( -53), INT8_C( -34), INT8_C( 39),
|
362
|
+
INT8_C( 72), INT8_C(-123), INT8_C( -90), INT8_C( 81),
|
363
|
+
INT8_C( 10), INT8_C( 127), INT8_C( 31), INT8_C( -68),
|
364
|
+
INT8_C( 127), INT8_C( 63), INT8_C( -87), INT8_C( 127),
|
365
|
+
INT8_C( 127), INT8_C( 80), INT8_C(-128), INT8_C( -12),
|
366
|
+
INT8_C( 127), INT8_C( 110), INT8_C( -48), INT8_C( 127),
|
367
|
+
INT8_C( 19), INT8_C( 127), INT8_C(-128), INT8_C(-128)) },
|
368
|
+
{ simde_mm512_set_epi8(INT8_C( -80), INT8_C( 122), INT8_C(-100), INT8_C( 123),
|
369
|
+
INT8_C( 82), INT8_C(-107), INT8_C( 95), INT8_C( -80),
|
370
|
+
INT8_C(-115), INT8_C(-109), INT8_C( 60), INT8_C( 72),
|
371
|
+
INT8_C( 57), INT8_C( 99), INT8_C( -30), INT8_C(-115),
|
372
|
+
INT8_C( 69), INT8_C( 18), INT8_C( -5), INT8_C( -6),
|
373
|
+
INT8_C( -90), INT8_C( -20), INT8_C( 17), INT8_C( 121),
|
374
|
+
INT8_C(-100), INT8_C( -55), INT8_C( 90), INT8_C( -42),
|
375
|
+
INT8_C(-113), INT8_C( 119), INT8_C( 44), INT8_C(-123),
|
376
|
+
INT8_C( -39), INT8_C( 114), INT8_C( 37), INT8_C( -84),
|
377
|
+
INT8_C( -88), INT8_C( 15), INT8_C( 23), INT8_C( 114),
|
378
|
+
INT8_C( 63), INT8_C( -61), INT8_C( 22), INT8_C( 8),
|
379
|
+
INT8_C( 54), INT8_C( 19), INT8_C( -34), INT8_C( 18),
|
380
|
+
INT8_C( -36), INT8_C( 104), INT8_C( 1), INT8_C( 5),
|
381
|
+
INT8_C(-116), INT8_C( 79), INT8_C( -20), INT8_C( -4),
|
382
|
+
INT8_C( 95), INT8_C( 103), INT8_C( 3), INT8_C( 64),
|
383
|
+
INT8_C( 34), INT8_C( -49), INT8_C( -27), INT8_C( 41)),
|
384
|
+
simde_mm512_set_epi8(INT8_C( 97), INT8_C(-116), INT8_C( -44), INT8_C( -44),
|
385
|
+
INT8_C( 67), INT8_C( -66), INT8_C( 77), INT8_C( 60),
|
386
|
+
INT8_C( 74), INT8_C( -19), INT8_C(-123), INT8_C( -81),
|
387
|
+
INT8_C( -74), INT8_C( -21), INT8_C( -32), INT8_C(-122),
|
388
|
+
INT8_C(-110), INT8_C( 116), INT8_C( 115), INT8_C( 99),
|
389
|
+
INT8_C( 29), INT8_C( 50), INT8_C(-119), INT8_C(-126),
|
390
|
+
INT8_C( -53), INT8_C( 68), INT8_C( -37), INT8_C( 84),
|
391
|
+
INT8_C( 23), INT8_C( -10), INT8_C( 15), INT8_C( 37),
|
392
|
+
INT8_C( -93), INT8_C( 57), INT8_C( 28), INT8_C(-116),
|
393
|
+
INT8_C( 56), INT8_C(-124), INT8_C( -93), INT8_C( -67),
|
394
|
+
INT8_C( 27), INT8_C( -1), INT8_C( -70), INT8_C( -30),
|
395
|
+
INT8_C( -39), INT8_C( 59), INT8_C( 76), INT8_C( 108),
|
396
|
+
INT8_C( 13), INT8_C( -29), INT8_C( 60), INT8_C( 106),
|
397
|
+
INT8_C( 106), INT8_C( -77), INT8_C(-102), INT8_C( 3),
|
398
|
+
INT8_C( -18), INT8_C( 23), INT8_C( 113), INT8_C( -97),
|
399
|
+
INT8_C( 109), INT8_C( 81), INT8_C( 42), INT8_C( 93)),
|
400
|
+
simde_mm512_set_epi8(INT8_C( 17), INT8_C( 6), INT8_C(-128), INT8_C( 79),
|
401
|
+
INT8_C( 127), INT8_C(-128), INT8_C( 127), INT8_C( -20),
|
402
|
+
INT8_C( -41), INT8_C(-128), INT8_C( -63), INT8_C( -9),
|
403
|
+
INT8_C( -17), INT8_C( 78), INT8_C( -62), INT8_C(-128),
|
404
|
+
INT8_C( -41), INT8_C( 127), INT8_C( 110), INT8_C( 93),
|
405
|
+
INT8_C( -61), INT8_C( 30), INT8_C(-102), INT8_C( -5),
|
406
|
+
INT8_C(-128), INT8_C( 13), INT8_C( 53), INT8_C( 42),
|
407
|
+
INT8_C( -90), INT8_C( 109), INT8_C( 59), INT8_C( -86),
|
408
|
+
INT8_C(-128), INT8_C( 127), INT8_C( 65), INT8_C(-128),
|
409
|
+
INT8_C( -32), INT8_C(-109), INT8_C( -70), INT8_C( 47),
|
410
|
+
INT8_C( 90), INT8_C( -62), INT8_C( -48), INT8_C( -22),
|
411
|
+
INT8_C( 15), INT8_C( 78), INT8_C( 42), INT8_C( 126),
|
412
|
+
INT8_C( -23), INT8_C( 75), INT8_C( 61), INT8_C( 111),
|
413
|
+
INT8_C( -10), INT8_C( 2), INT8_C(-122), INT8_C( -1),
|
414
|
+
INT8_C( 77), INT8_C( 126), INT8_C( 116), INT8_C( -33),
|
415
|
+
INT8_C( 127), INT8_C( 32), INT8_C( 15), INT8_C( 127)) },
|
416
|
+
{ simde_mm512_set_epi8(INT8_C( -94), INT8_C( 96), INT8_C( -77), INT8_C( -55),
|
417
|
+
INT8_C( 18), INT8_C( 12), INT8_C( 78), INT8_C( -17),
|
418
|
+
INT8_C( -94), INT8_C( 83), INT8_C( -20), INT8_C(-101),
|
419
|
+
INT8_C( -62), INT8_C( -62), INT8_C( -77), INT8_C( 21),
|
420
|
+
INT8_C( 21), INT8_C( -49), INT8_C(-127), INT8_C( -47),
|
421
|
+
INT8_C( -26), INT8_C( 62), INT8_C( -51), INT8_C( -34),
|
422
|
+
INT8_C( 9), INT8_C( -56), INT8_C( 63), INT8_C( 4),
|
423
|
+
INT8_C( 64), INT8_C( 46), INT8_C( 68), INT8_C( -18),
|
424
|
+
INT8_C(-110), INT8_C( 103), INT8_C(-101), INT8_C( 45),
|
425
|
+
INT8_C( -81), INT8_C( 125), INT8_C( 8), INT8_C( 72),
|
426
|
+
INT8_C( -48), INT8_C( -28), INT8_C( 102), INT8_C( -90),
|
427
|
+
INT8_C(-101), INT8_C( -40), INT8_C( -94), INT8_C(-127),
|
428
|
+
INT8_C( -36), INT8_C( -32), INT8_C( 34), INT8_C( -39),
|
429
|
+
INT8_C( -64), INT8_C( 111), INT8_C( 36), INT8_C( 91),
|
430
|
+
INT8_C( 90), INT8_C( -10), INT8_C( 88), INT8_C(-117),
|
431
|
+
INT8_C( 117), INT8_C(-111), INT8_C(-128), INT8_C( -35)),
|
432
|
+
simde_mm512_set_epi8(INT8_C( 65), INT8_C( -2), INT8_C( 4), INT8_C( -77),
|
433
|
+
INT8_C( 33), INT8_C(-119), INT8_C( -36), INT8_C( 95),
|
434
|
+
INT8_C( -54), INT8_C( 57), INT8_C( -15), INT8_C( 20),
|
435
|
+
INT8_C( 119), INT8_C( -56), INT8_C( -57), INT8_C( 22),
|
436
|
+
INT8_C( -23), INT8_C( -56), INT8_C( -77), INT8_C( 114),
|
437
|
+
INT8_C( -25), INT8_C( 85), INT8_C( 65), INT8_C( 124),
|
438
|
+
INT8_C( 80), INT8_C( 94), INT8_C( -6), INT8_C(-128),
|
439
|
+
INT8_C( 25), INT8_C( -80), INT8_C( 31), INT8_C( -23),
|
440
|
+
INT8_C( 123), INT8_C(-123), INT8_C( -56), INT8_C( 34),
|
441
|
+
INT8_C( 72), INT8_C( -39), INT8_C( -17), INT8_C( 39),
|
442
|
+
INT8_C( 29), INT8_C( -88), INT8_C( 65), INT8_C( 81),
|
443
|
+
INT8_C(-120), INT8_C( 80), INT8_C( -76), INT8_C( -59),
|
444
|
+
INT8_C( 48), INT8_C( -90), INT8_C( -85), INT8_C( 82),
|
445
|
+
INT8_C( 115), INT8_C(-114), INT8_C( 84), INT8_C( -40),
|
446
|
+
INT8_C( -69), INT8_C( -11), INT8_C(-118), INT8_C( 39),
|
447
|
+
INT8_C( -17), INT8_C( -23), INT8_C( 4), INT8_C( -37)),
|
448
|
+
simde_mm512_set_epi8(INT8_C( -29), INT8_C( 94), INT8_C( -73), INT8_C(-128),
|
449
|
+
INT8_C( 51), INT8_C(-107), INT8_C( 42), INT8_C( 78),
|
450
|
+
INT8_C(-128), INT8_C( 127), INT8_C( -35), INT8_C( -81),
|
451
|
+
INT8_C( 57), INT8_C(-118), INT8_C(-128), INT8_C( 43),
|
452
|
+
INT8_C( -2), INT8_C(-105), INT8_C(-128), INT8_C( 67),
|
453
|
+
INT8_C( -51), INT8_C( 127), INT8_C( 14), INT8_C( 90),
|
454
|
+
INT8_C( 89), INT8_C( 38), INT8_C( 57), INT8_C(-124),
|
455
|
+
INT8_C( 89), INT8_C( -34), INT8_C( 99), INT8_C( -41),
|
456
|
+
INT8_C( 13), INT8_C( -20), INT8_C(-128), INT8_C( 79),
|
457
|
+
INT8_C( -9), INT8_C( 86), INT8_C( -9), INT8_C( 111),
|
458
|
+
INT8_C( -19), INT8_C(-116), INT8_C( 127), INT8_C( -9),
|
459
|
+
INT8_C(-128), INT8_C( 40), INT8_C(-128), INT8_C(-128),
|
460
|
+
INT8_C( 12), INT8_C(-122), INT8_C( -51), INT8_C( 43),
|
461
|
+
INT8_C( 51), INT8_C( -3), INT8_C( 120), INT8_C( 51),
|
462
|
+
INT8_C( 21), INT8_C( -21), INT8_C( -30), INT8_C( -78),
|
463
|
+
INT8_C( 100), INT8_C(-128), INT8_C(-124), INT8_C( -72)) },
|
464
|
+
{ simde_mm512_set_epi8(INT8_C( 31), INT8_C( -81), INT8_C( 115), INT8_C( 18),
|
465
|
+
INT8_C( 20), INT8_C( -33), INT8_C(-125), INT8_C( -45),
|
466
|
+
INT8_C( 54), INT8_C( 82), INT8_C( 61), INT8_C( 81),
|
467
|
+
INT8_C( 123), INT8_C( 18), INT8_C( 89), INT8_C( 34),
|
468
|
+
INT8_C( 10), INT8_C( -54), INT8_C( -24), INT8_C( 54),
|
469
|
+
INT8_C( 49), INT8_C( -70), INT8_C( 7), INT8_C( -12),
|
470
|
+
INT8_C( 110), INT8_C( -16), INT8_C( -10), INT8_C( 4),
|
471
|
+
INT8_C( 3), INT8_C( -17), INT8_C( -46), INT8_C( -29),
|
472
|
+
INT8_C( 26), INT8_C( -38), INT8_C(-107), INT8_C( -25),
|
473
|
+
INT8_C( 61), INT8_C( -4), INT8_C( -21), INT8_C( -11),
|
474
|
+
INT8_C( -29), INT8_C( 62), INT8_C( 120), INT8_C( 84),
|
475
|
+
INT8_C( -48), INT8_C( -42), INT8_C( -15), INT8_C( -64),
|
476
|
+
INT8_C( -90), INT8_C( 111), INT8_C(-123), INT8_C( 61),
|
477
|
+
INT8_C( 22), INT8_C( -48), INT8_C(-107), INT8_C( 122),
|
478
|
+
INT8_C( 27), INT8_C( 119), INT8_C( -63), INT8_C( -61),
|
479
|
+
INT8_C( -69), INT8_C( 46), INT8_C( 34), INT8_C(-101)),
|
480
|
+
simde_mm512_set_epi8(INT8_C( 44), INT8_C( 101), INT8_C( -48), INT8_C( -49),
|
481
|
+
INT8_C( 63), INT8_C( 93), INT8_C( -48), INT8_C(-122),
|
482
|
+
INT8_C( -67), INT8_C( 27), INT8_C( 1), INT8_C( -55),
|
483
|
+
INT8_C( -79), INT8_C( -44), INT8_C(-115), INT8_C(-126),
|
484
|
+
INT8_C( -42), INT8_C( 29), INT8_C( 66), INT8_C( -83),
|
485
|
+
INT8_C( 108), INT8_C( -1), INT8_C( -47), INT8_C(-104),
|
486
|
+
INT8_C( 62), INT8_C( 29), INT8_C( 4), INT8_C( -47),
|
487
|
+
INT8_C( 98), INT8_C(-109), INT8_C( -23), INT8_C( 69),
|
488
|
+
INT8_C(-110), INT8_C( -47), INT8_C( 48), INT8_C(-101),
|
489
|
+
INT8_C( -80), INT8_C(-110), INT8_C( -55), INT8_C( 25),
|
490
|
+
INT8_C( 39), INT8_C( 58), INT8_C( 4), INT8_C(-108),
|
491
|
+
INT8_C( -23), INT8_C( -79), INT8_C( 124), INT8_C( 36),
|
492
|
+
INT8_C( 113), INT8_C( 110), INT8_C( 105), INT8_C( 113),
|
493
|
+
INT8_C( -54), INT8_C( -63), INT8_C( 50), INT8_C( -99),
|
494
|
+
INT8_C( -8), INT8_C( -76), INT8_C( 102), INT8_C( 51),
|
495
|
+
INT8_C( 58), INT8_C( 16), INT8_C( -94), INT8_C( -93)),
|
496
|
+
simde_mm512_set_epi8(INT8_C( 75), INT8_C( 20), INT8_C( 67), INT8_C( -31),
|
497
|
+
INT8_C( 83), INT8_C( 60), INT8_C(-128), INT8_C(-128),
|
498
|
+
INT8_C( -13), INT8_C( 109), INT8_C( 62), INT8_C( 26),
|
499
|
+
INT8_C( 44), INT8_C( -26), INT8_C( -26), INT8_C( -92),
|
500
|
+
INT8_C( -32), INT8_C( -25), INT8_C( 42), INT8_C( -29),
|
501
|
+
INT8_C( 127), INT8_C( -71), INT8_C( -40), INT8_C(-116),
|
502
|
+
INT8_C( 127), INT8_C( 13), INT8_C( -6), INT8_C( -43),
|
503
|
+
INT8_C( 101), INT8_C(-126), INT8_C( -69), INT8_C( 40),
|
504
|
+
INT8_C( -84), INT8_C( -85), INT8_C( -59), INT8_C(-126),
|
505
|
+
INT8_C( -19), INT8_C(-114), INT8_C( -76), INT8_C( 14),
|
506
|
+
INT8_C( 10), INT8_C( 120), INT8_C( 124), INT8_C( -24),
|
507
|
+
INT8_C( -71), INT8_C(-121), INT8_C( 109), INT8_C( -28),
|
508
|
+
INT8_C( 23), INT8_C( 127), INT8_C( -18), INT8_C( 127),
|
509
|
+
INT8_C( -32), INT8_C(-111), INT8_C( -57), INT8_C( 23),
|
510
|
+
INT8_C( 19), INT8_C( 43), INT8_C( 39), INT8_C( -10),
|
511
|
+
INT8_C( -11), INT8_C( 62), INT8_C( -60), INT8_C(-128)) },
|
512
|
+
{ simde_mm512_set_epi8(INT8_C( 64), INT8_C( 55), INT8_C( 97), INT8_C( -61),
|
513
|
+
INT8_C( 89), INT8_C( 120), INT8_C( 49), INT8_C( 124),
|
514
|
+
INT8_C( 16), INT8_C( 113), INT8_C( 48), INT8_C( 70),
|
515
|
+
INT8_C( 60), INT8_C( -11), INT8_C( 98), INT8_C( 70),
|
516
|
+
INT8_C( 111), INT8_C( 55), INT8_C( -50), INT8_C( -21),
|
517
|
+
INT8_C(-102), INT8_C( 3), INT8_C( 75), INT8_C( -9),
|
518
|
+
INT8_C( 34), INT8_C( 96), INT8_C(-104), INT8_C( 37),
|
519
|
+
INT8_C( 74), INT8_C( 22), INT8_C( 13), INT8_C( 82),
|
520
|
+
INT8_C(-108), INT8_C(-112), INT8_C( 49), INT8_C( -58),
|
521
|
+
INT8_C( 116), INT8_C( 58), INT8_C( -29), INT8_C( 60),
|
522
|
+
INT8_C( 125), INT8_C( 105), INT8_C( -20), INT8_C( -4),
|
523
|
+
INT8_C(-106), INT8_C(-111), INT8_C( -29), INT8_C( -32),
|
524
|
+
INT8_C( -43), INT8_C(-103), INT8_C( 84), INT8_C( 40),
|
525
|
+
INT8_C( 63), INT8_C( 88), INT8_C( -74), INT8_C( -49),
|
526
|
+
INT8_C( 10), INT8_C( 50), INT8_C( 38), INT8_C( 108),
|
527
|
+
INT8_C( 42), INT8_C( -40), INT8_C( -81), INT8_C( 31)),
|
528
|
+
simde_mm512_set_epi8(INT8_C(-107), INT8_C( 105), INT8_C( -15), INT8_C( -49),
|
529
|
+
INT8_C( 74), INT8_C( -31), INT8_C( -49), INT8_C( 112),
|
530
|
+
INT8_C(-103), INT8_C( 69), INT8_C( -55), INT8_C(-115),
|
531
|
+
INT8_C( -48), INT8_C( 96), INT8_C( -8), INT8_C( -35),
|
532
|
+
INT8_C( -24), INT8_C( 101), INT8_C( 70), INT8_C( -69),
|
533
|
+
INT8_C(-105), INT8_C( -28), INT8_C( -38), INT8_C( -85),
|
534
|
+
INT8_C( -94), INT8_C(-122), INT8_C( -80), INT8_C( 95),
|
535
|
+
INT8_C( -1), INT8_C( 87), INT8_C( 21), INT8_C( 6),
|
536
|
+
INT8_C(-103), INT8_C( 38), INT8_C( 15), INT8_C( -98),
|
537
|
+
INT8_C( -27), INT8_C( 57), INT8_C( -76), INT8_C(-112),
|
538
|
+
INT8_C( 77), INT8_C( -3), INT8_C( 57), INT8_C( 3),
|
539
|
+
INT8_C( 123), INT8_C( -18), INT8_C( -90), INT8_C(-119),
|
540
|
+
INT8_C( 112), INT8_C( 61), INT8_C( -48), INT8_C( -16),
|
541
|
+
INT8_C( -36), INT8_C(-125), INT8_C( -10), INT8_C( 77),
|
542
|
+
INT8_C( 106), INT8_C( 72), INT8_C( 62), INT8_C( -24),
|
543
|
+
INT8_C( -65), INT8_C( 102), INT8_C(-122), INT8_C( 19)),
|
544
|
+
simde_mm512_set_epi8(INT8_C( -43), INT8_C( 127), INT8_C( 82), INT8_C(-110),
|
545
|
+
INT8_C( 127), INT8_C( 89), INT8_C( 0), INT8_C( 127),
|
546
|
+
INT8_C( -87), INT8_C( 127), INT8_C( -7), INT8_C( -45),
|
547
|
+
INT8_C( 12), INT8_C( 85), INT8_C( 90), INT8_C( 35),
|
548
|
+
INT8_C( 87), INT8_C( 127), INT8_C( 20), INT8_C( -90),
|
549
|
+
INT8_C(-128), INT8_C( -25), INT8_C( 37), INT8_C( -94),
|
550
|
+
INT8_C( -60), INT8_C( -26), INT8_C(-128), INT8_C( 127),
|
551
|
+
INT8_C( 73), INT8_C( 109), INT8_C( 34), INT8_C( 88),
|
552
|
+
INT8_C(-128), INT8_C( -74), INT8_C( 64), INT8_C(-128),
|
553
|
+
INT8_C( 89), INT8_C( 115), INT8_C(-105), INT8_C( -52),
|
554
|
+
INT8_C( 127), INT8_C( 102), INT8_C( 37), INT8_C( -1),
|
555
|
+
INT8_C( 17), INT8_C(-128), INT8_C(-119), INT8_C(-128),
|
556
|
+
INT8_C( 69), INT8_C( -42), INT8_C( 36), INT8_C( 24),
|
557
|
+
INT8_C( 27), INT8_C( -37), INT8_C( -84), INT8_C( 28),
|
558
|
+
INT8_C( 116), INT8_C( 122), INT8_C( 100), INT8_C( 84),
|
559
|
+
INT8_C( -23), INT8_C( 62), INT8_C(-128), INT8_C( 50)) },
|
560
|
+
{ simde_mm512_set_epi8(INT8_C( 90), INT8_C(-125), INT8_C( -5), INT8_C( -69),
|
561
|
+
INT8_C( 103), INT8_C( -40), INT8_C( 35), INT8_C( -38),
|
562
|
+
INT8_C( 107), INT8_C(-117), INT8_C( -80), INT8_C( 123),
|
563
|
+
INT8_C( 57), INT8_C( -70), INT8_C( -34), INT8_C( 38),
|
564
|
+
INT8_C( 114), INT8_C(-126), INT8_C( 20), INT8_C( -93),
|
565
|
+
INT8_C( 17), INT8_C(-128), INT8_C( 2), INT8_C( 15),
|
566
|
+
INT8_C(-122), INT8_C( -10), INT8_C( -2), INT8_C( 84),
|
567
|
+
INT8_C( 93), INT8_C( 89), INT8_C( 57), INT8_C( -50),
|
568
|
+
INT8_C( 4), INT8_C( -63), INT8_C( 118), INT8_C( 19),
|
569
|
+
INT8_C( -68), INT8_C( -29), INT8_C( -16), INT8_C( -30),
|
570
|
+
INT8_C( -76), INT8_C(-110), INT8_C( 121), INT8_C( 87),
|
571
|
+
INT8_C(-117), INT8_C(-113), INT8_C( -94), INT8_C( 61),
|
572
|
+
INT8_C( -29), INT8_C( 43), INT8_C( -69), INT8_C( 123),
|
573
|
+
INT8_C( 79), INT8_C(-101), INT8_C( 40), INT8_C( 64),
|
574
|
+
INT8_C( 34), INT8_C(-102), INT8_C( 77), INT8_C( 114),
|
575
|
+
INT8_C( -49), INT8_C( -31), INT8_C( 103), INT8_C( 81)),
|
576
|
+
simde_mm512_set_epi8(INT8_C( 34), INT8_C(-125), INT8_C( -96), INT8_C(-111),
|
577
|
+
INT8_C( 23), INT8_C( 58), INT8_C( -5), INT8_C( -22),
|
578
|
+
INT8_C( -80), INT8_C( -90), INT8_C( -33), INT8_C( -65),
|
579
|
+
INT8_C( -34), INT8_C( 100), INT8_C( -10), INT8_C( -57),
|
580
|
+
INT8_C( 37), INT8_C( -9), INT8_C( -29), INT8_C(-114),
|
581
|
+
INT8_C(-102), INT8_C( 53), INT8_C( 107), INT8_C( 124),
|
582
|
+
INT8_C( -12), INT8_C( -57), INT8_C( -57), INT8_C( -37),
|
583
|
+
INT8_C( 50), INT8_C( 22), INT8_C( -71), INT8_C( -2),
|
584
|
+
INT8_C( -31), INT8_C( 60), INT8_C( 62), INT8_C( 19),
|
585
|
+
INT8_C( 117), INT8_C( 1), INT8_C( -26), INT8_C(-100),
|
586
|
+
INT8_C( 29), INT8_C( -6), INT8_C( 7), INT8_C(-100),
|
587
|
+
INT8_C(-120), INT8_C( -33), INT8_C( 17), INT8_C(-103),
|
588
|
+
INT8_C( 10), INT8_C( -45), INT8_C( -76), INT8_C( 10),
|
589
|
+
INT8_C( -10), INT8_C( 15), INT8_C( 36), INT8_C( 2),
|
590
|
+
INT8_C( 74), INT8_C( 44), INT8_C( -16), INT8_C( 122),
|
591
|
+
INT8_C( -4), INT8_C( 15), INT8_C( -27), INT8_C( -15)),
|
592
|
+
simde_mm512_set_epi8(INT8_C( 124), INT8_C(-128), INT8_C(-101), INT8_C(-128),
|
593
|
+
INT8_C( 126), INT8_C( 18), INT8_C( 30), INT8_C( -60),
|
594
|
+
INT8_C( 27), INT8_C(-128), INT8_C(-113), INT8_C( 58),
|
595
|
+
INT8_C( 23), INT8_C( 30), INT8_C( -44), INT8_C( -19),
|
596
|
+
INT8_C( 127), INT8_C(-128), INT8_C( -9), INT8_C(-128),
|
597
|
+
INT8_C( -85), INT8_C( -75), INT8_C( 109), INT8_C( 127),
|
598
|
+
INT8_C(-128), INT8_C( -67), INT8_C( -59), INT8_C( 47),
|
599
|
+
INT8_C( 127), INT8_C( 111), INT8_C( -14), INT8_C( -52),
|
600
|
+
INT8_C( -27), INT8_C( -3), INT8_C( 127), INT8_C( 38),
|
601
|
+
INT8_C( 49), INT8_C( -28), INT8_C( -42), INT8_C(-128),
|
602
|
+
INT8_C( -47), INT8_C(-116), INT8_C( 127), INT8_C( -13),
|
603
|
+
INT8_C(-128), INT8_C(-128), INT8_C( -77), INT8_C( -42),
|
604
|
+
INT8_C( -19), INT8_C( -2), INT8_C(-128), INT8_C( 127),
|
605
|
+
INT8_C( 69), INT8_C( -86), INT8_C( 76), INT8_C( 66),
|
606
|
+
INT8_C( 108), INT8_C( -58), INT8_C( 61), INT8_C( 127),
|
607
|
+
INT8_C( -53), INT8_C( -16), INT8_C( 76), INT8_C( 66)) },
|
608
|
+
{ simde_mm512_set_epi8(INT8_C( -52), INT8_C(-111), INT8_C( 67), INT8_C( -14),
|
609
|
+
INT8_C( 11), INT8_C( -63), INT8_C( -35), INT8_C( -86),
|
610
|
+
INT8_C(-114), INT8_C( -97), INT8_C( 124), INT8_C( -30),
|
611
|
+
INT8_C( -1), INT8_C( 55), INT8_C( 84), INT8_C( 12),
|
612
|
+
INT8_C( 86), INT8_C( -43), INT8_C( 81), INT8_C( -30),
|
613
|
+
INT8_C( -25), INT8_C( 74), INT8_C(-105), INT8_C( 11),
|
614
|
+
INT8_C( -97), INT8_C( 0), INT8_C( 98), INT8_C( 106),
|
615
|
+
INT8_C( -83), INT8_C( -89), INT8_C( 16), INT8_C( -42),
|
616
|
+
INT8_C( 81), INT8_C( 35), INT8_C(-127), INT8_C(-127),
|
617
|
+
INT8_C( -38), INT8_C( 51), INT8_C( -75), INT8_C( 24),
|
618
|
+
INT8_C( 86), INT8_C( -37), INT8_C( 97), INT8_C( -82),
|
619
|
+
INT8_C( 109), INT8_C( 21), INT8_C( 127), INT8_C( 16),
|
620
|
+
INT8_C( 101), INT8_C( -69), INT8_C( 95), INT8_C(-121),
|
621
|
+
INT8_C( -66), INT8_C( 39), INT8_C( 104), INT8_C(-109),
|
622
|
+
INT8_C( -1), INT8_C( 35), INT8_C( 68), INT8_C( 93),
|
623
|
+
INT8_C( -25), INT8_C( 120), INT8_C( -19), INT8_C( 84)),
|
624
|
+
simde_mm512_set_epi8(INT8_C(-111), INT8_C(-108), INT8_C( 102), INT8_C( -40),
|
625
|
+
INT8_C(-124), INT8_C( -61), INT8_C( 80), INT8_C( 102),
|
626
|
+
INT8_C( -35), INT8_C( 3), INT8_C( -76), INT8_C( 98),
|
627
|
+
INT8_C( 9), INT8_C( -39), INT8_C( -24), INT8_C( -92),
|
628
|
+
INT8_C( -73), INT8_C( -19), INT8_C(-103), INT8_C( -41),
|
629
|
+
INT8_C( -32), INT8_C( -8), INT8_C( 126), INT8_C( 75),
|
630
|
+
INT8_C( -64), INT8_C( -26), INT8_C( -15), INT8_C( -35),
|
631
|
+
INT8_C( -20), INT8_C( -6), INT8_C( 86), INT8_C( -56),
|
632
|
+
INT8_C( -56), INT8_C( 67), INT8_C( 59), INT8_C( -73),
|
633
|
+
INT8_C( 35), INT8_C( -67), INT8_C( 92), INT8_C( 34),
|
634
|
+
INT8_C( 16), INT8_C( -12), INT8_C( 44), INT8_C( -59),
|
635
|
+
INT8_C( -82), INT8_C(-102), INT8_C( 93), INT8_C( -43),
|
636
|
+
INT8_C( 79), INT8_C( -19), INT8_C( -45), INT8_C( -87),
|
637
|
+
INT8_C( -50), INT8_C( -23), INT8_C( -17), INT8_C( 110),
|
638
|
+
INT8_C( 102), INT8_C( -59), INT8_C(-117), INT8_C( 84),
|
639
|
+
INT8_C( -75), INT8_C( 87), INT8_C( 69), INT8_C( -6)),
|
640
|
+
simde_mm512_set_epi8(INT8_C(-128), INT8_C(-128), INT8_C( 127), INT8_C( -54),
|
641
|
+
INT8_C(-113), INT8_C(-124), INT8_C( 45), INT8_C( 16),
|
642
|
+
INT8_C(-128), INT8_C( -94), INT8_C( 48), INT8_C( 68),
|
643
|
+
INT8_C( 8), INT8_C( 16), INT8_C( 60), INT8_C( -80),
|
644
|
+
INT8_C( 13), INT8_C( -62), INT8_C( -22), INT8_C( -71),
|
645
|
+
INT8_C( -57), INT8_C( 66), INT8_C( 21), INT8_C( 86),
|
646
|
+
INT8_C(-128), INT8_C( -26), INT8_C( 83), INT8_C( 71),
|
647
|
+
INT8_C(-103), INT8_C( -95), INT8_C( 102), INT8_C( -98),
|
648
|
+
INT8_C( 25), INT8_C( 102), INT8_C( -68), INT8_C(-128),
|
649
|
+
INT8_C( -3), INT8_C( -16), INT8_C( 17), INT8_C( 58),
|
650
|
+
INT8_C( 102), INT8_C( -49), INT8_C( 127), INT8_C(-128),
|
651
|
+
INT8_C( 27), INT8_C( -81), INT8_C( 127), INT8_C( -27),
|
652
|
+
INT8_C( 127), INT8_C( -88), INT8_C( 50), INT8_C(-128),
|
653
|
+
INT8_C(-116), INT8_C( 16), INT8_C( 87), INT8_C( 1),
|
654
|
+
INT8_C( 101), INT8_C( -24), INT8_C( -49), INT8_C( 127),
|
655
|
+
INT8_C(-100), INT8_C( 127), INT8_C( 50), INT8_C( 78)) }
|
656
|
+
};
|
657
|
+
|
658
|
+
for (size_t i = 0 ; i < (sizeof(test_vec) / sizeof(test_vec[0])); i++) {
|
659
|
+
simde__m512i r = simde_mm512_adds_epi8(test_vec[i].a, test_vec[i].b);
|
660
|
+
simde_assert_m512i_i8(r, ==, test_vec[i].r);
|
661
|
+
}
|
662
|
+
|
663
|
+
return MUNIT_OK;
|
664
|
+
}
|
665
|
+
|
666
|
+
static MunitResult
|
667
|
+
test_simde_mm512_adds_epi16(const MunitParameter params[], void* data) {
|
668
|
+
(void) params;
|
669
|
+
(void) data;
|
670
|
+
|
671
|
+
const struct {
|
672
|
+
simde__m512i a;
|
673
|
+
simde__m512i b;
|
674
|
+
simde__m512i r;
|
675
|
+
} test_vec[8] = {
|
676
|
+
{ simde_mm512_set_epi16(INT16_C( 5952), INT16_C(-21138), INT16_C( 23605), INT16_C( -3799),
|
677
|
+
INT16_C( 1987), INT16_C( 29254), INT16_C( -4184), INT16_C( 13346),
|
678
|
+
INT16_C( 26203), INT16_C(-24373), INT16_C( 15487), INT16_C( 15569),
|
679
|
+
INT16_C( 13821), INT16_C( -3315), INT16_C( 30667), INT16_C( 9811),
|
680
|
+
INT16_C( 22769), INT16_C( 21964), INT16_C( -315), INT16_C(-15723),
|
681
|
+
INT16_C( -9658), INT16_C(-27088), INT16_C( 18289), INT16_C( 13213),
|
682
|
+
INT16_C(-12712), INT16_C( 23293), INT16_C( 12497), INT16_C( 16576),
|
683
|
+
INT16_C(-19358), INT16_C(-11263), INT16_C( -3745), INT16_C( 7925)),
|
684
|
+
simde_mm512_set_epi16(INT16_C(-22600), INT16_C( 9825), INT16_C( 27347), INT16_C( -4649),
|
685
|
+
INT16_C( 4812), INT16_C( 27489), INT16_C( 14729), INT16_C(-20872),
|
686
|
+
INT16_C(-24487), INT16_C( 23053), INT16_C( 28966), INT16_C(-23890),
|
687
|
+
INT16_C( -9737), INT16_C(-24021), INT16_C( 12009), INT16_C(-16892),
|
688
|
+
INT16_C(-11018), INT16_C( -7664), INT16_C( 22598), INT16_C( 9112),
|
689
|
+
INT16_C( -468), INT16_C(-16246), INT16_C( 11633), INT16_C( 3402),
|
690
|
+
INT16_C( 12940), INT16_C(-18453), INT16_C(-10463), INT16_C(-24372),
|
691
|
+
INT16_C( 9722), INT16_C( 4912), INT16_C( 14086), INT16_C( -2976)),
|
692
|
+
simde_mm512_set_epi16(INT16_C(-16648), INT16_C(-11313), INT16_C( 32767), INT16_C( -8448),
|
693
|
+
INT16_C( 6799), INT16_C( 32767), INT16_C( 10545), INT16_C( -7526),
|
694
|
+
INT16_C( 1716), INT16_C( -1320), INT16_C( 32767), INT16_C( -8321),
|
695
|
+
INT16_C( 4084), INT16_C(-27336), INT16_C( 32767), INT16_C( -7081),
|
696
|
+
INT16_C( 11751), INT16_C( 14300), INT16_C( 22283), INT16_C( -6611),
|
697
|
+
INT16_C(-10126), INT16_C(-32768), INT16_C( 29922), INT16_C( 16615),
|
698
|
+
INT16_C( 228), INT16_C( 4840), INT16_C( 2034), INT16_C( -7796),
|
699
|
+
INT16_C( -9636), INT16_C( -6351), INT16_C( 10341), INT16_C( 4949)) },
|
700
|
+
{ simde_mm512_set_epi16(INT16_C(-21870), INT16_C( -1966), INT16_C(-26101), INT16_C( 8905),
|
701
|
+
INT16_C(-13069), INT16_C( 13555), INT16_C(-23554), INT16_C(-12947),
|
702
|
+
INT16_C( 31779), INT16_C( 21013), INT16_C( 32688), INT16_C( 12512),
|
703
|
+
INT16_C(-26721), INT16_C( 7598), INT16_C( 21566), INT16_C(-11203),
|
704
|
+
INT16_C( 27021), INT16_C( -8539), INT16_C( -532), INT16_C(-17200),
|
705
|
+
INT16_C(-18609), INT16_C(-30604), INT16_C( 6829), INT16_C(-13538),
|
706
|
+
INT16_C( 21529), INT16_C( 29340), INT16_C( 23176), INT16_C( 10860),
|
707
|
+
INT16_C( 31408), INT16_C( 3656), INT16_C(-30572), INT16_C( -4393)),
|
708
|
+
simde_mm512_set_epi16(INT16_C( 29137), INT16_C( 29112), INT16_C(-21893), INT16_C( 14830),
|
709
|
+
INT16_C( 28350), INT16_C( 21222), INT16_C( 26922), INT16_C( 26197),
|
710
|
+
INT16_C(-25881), INT16_C( 28163), INT16_C(-19268), INT16_C( 10158),
|
711
|
+
INT16_C(-29245), INT16_C( 16103), INT16_C(-23323), INT16_C( 12478),
|
712
|
+
INT16_C( -6515), INT16_C( 24007), INT16_C(-28366), INT16_C(-32677),
|
713
|
+
INT16_C(-27350), INT16_C(-26916), INT16_C(-11979), INT16_C( 13820),
|
714
|
+
INT16_C(-22393), INT16_C(-20903), INT16_C( -9892), INT16_C(-22447),
|
715
|
+
INT16_C(-14286), INT16_C( 3532), INT16_C( 19664), INT16_C(-26842)),
|
716
|
+
simde_mm512_set_epi16(INT16_C( 7267), INT16_C( 27146), INT16_C(-32768), INT16_C( 23735),
|
717
|
+
INT16_C( 15281), INT16_C( 32767), INT16_C( 3368), INT16_C( 13250),
|
718
|
+
INT16_C( 5898), INT16_C( 32767), INT16_C( 13420), INT16_C( 22670),
|
719
|
+
INT16_C(-32768), INT16_C( 23701), INT16_C( -1757), INT16_C( 1275),
|
720
|
+
INT16_C( 20506), INT16_C( 15468), INT16_C(-28898), INT16_C(-32768),
|
721
|
+
INT16_C(-32768), INT16_C(-32768), INT16_C( -5150), INT16_C( 282),
|
722
|
+
INT16_C( -864), INT16_C( 8437), INT16_C( 13284), INT16_C(-11587),
|
723
|
+
INT16_C( 17122), INT16_C( 7188), INT16_C(-10908), INT16_C(-31235)) },
|
724
|
+
{ simde_mm512_set_epi16(INT16_C(-22689), INT16_C( 25207), INT16_C( -9300), INT16_C( 28977),
|
725
|
+
INT16_C( 2270), INT16_C(-32394), INT16_C( 26182), INT16_C( 23367),
|
726
|
+
INT16_C( 31661), INT16_C( 9636), INT16_C(-18580), INT16_C(-28875),
|
727
|
+
INT16_C(-25943), INT16_C( 14067), INT16_C( 10599), INT16_C( 30831),
|
728
|
+
INT16_C(-23557), INT16_C( 11377), INT16_C( -4608), INT16_C( 14955),
|
729
|
+
INT16_C( 11781), INT16_C(-12602), INT16_C( -3223), INT16_C( 11440),
|
730
|
+
INT16_C( -2896), INT16_C(-24304), INT16_C( 29156), INT16_C( -4347),
|
731
|
+
INT16_C( -2421), INT16_C( 31033), INT16_C( -3132), INT16_C(-19324)),
|
732
|
+
simde_mm512_set_epi16(INT16_C( -2724), INT16_C( 4704), INT16_C( 23772), INT16_C(-20368),
|
733
|
+
INT16_C(-30374), INT16_C( 15838), INT16_C( 19402), INT16_C( 16976),
|
734
|
+
INT16_C(-28476), INT16_C( -2715), INT16_C(-27679), INT16_C( -8608),
|
735
|
+
INT16_C(-20120), INT16_C( 29206), INT16_C( -1643), INT16_C(-29856),
|
736
|
+
INT16_C( 18656), INT16_C( -9660), INT16_C( -4660), INT16_C(-30272),
|
737
|
+
INT16_C( 610), INT16_C( -3787), INT16_C( 22038), INT16_C(-29446),
|
738
|
+
INT16_C(-26504), INT16_C(-28984), INT16_C(-21830), INT16_C(-27507),
|
739
|
+
INT16_C( 24148), INT16_C(-12945), INT16_C( 24529), INT16_C( 7913)),
|
740
|
+
simde_mm512_set_epi16(INT16_C(-25413), INT16_C( 29911), INT16_C( 14472), INT16_C( 8609),
|
741
|
+
INT16_C(-28104), INT16_C(-16556), INT16_C( 32767), INT16_C( 32767),
|
742
|
+
INT16_C( 3185), INT16_C( 6921), INT16_C(-32768), INT16_C(-32768),
|
743
|
+
INT16_C(-32768), INT16_C( 32767), INT16_C( 8956), INT16_C( 975),
|
744
|
+
INT16_C( -4901), INT16_C( 1717), INT16_C( -9268), INT16_C(-15317),
|
745
|
+
INT16_C( 12391), INT16_C(-16389), INT16_C( 18815), INT16_C(-18006),
|
746
|
+
INT16_C(-29400), INT16_C(-32768), INT16_C( 7326), INT16_C(-31854),
|
747
|
+
INT16_C( 21727), INT16_C( 18088), INT16_C( 21397), INT16_C(-11411)) },
|
748
|
+
{ simde_mm512_set_epi16(INT16_C(-18069), INT16_C( 21685), INT16_C( -5808), INT16_C( 24672),
|
749
|
+
INT16_C( -8190), INT16_C( -2830), INT16_C(-23214), INT16_C( 1083),
|
750
|
+
INT16_C( 6699), INT16_C( 871), INT16_C(-14072), INT16_C( -2337),
|
751
|
+
INT16_C( 13356), INT16_C( 7260), INT16_C(-23788), INT16_C(-19723),
|
752
|
+
INT16_C( 13480), INT16_C(-15429), INT16_C(-20153), INT16_C( 18680),
|
753
|
+
INT16_C(-26180), INT16_C( 27923), INT16_C(-14099), INT16_C( 25829),
|
754
|
+
INT16_C(-27481), INT16_C( 21639), INT16_C( 16654), INT16_C( 19972),
|
755
|
+
INT16_C( 15776), INT16_C( 23126), INT16_C( 30799), INT16_C(-14043)),
|
756
|
+
simde_mm512_set_epi16(INT16_C( 16111), INT16_C(-26103), INT16_C( -8800), INT16_C(-24747),
|
757
|
+
INT16_C( 27941), INT16_C( 603), INT16_C( -8112), INT16_C(-28325),
|
758
|
+
INT16_C( -6110), INT16_C(-15530), INT16_C( -938), INT16_C(-26515),
|
759
|
+
INT16_C( -2492), INT16_C( 16124), INT16_C(-27181), INT16_C( -3573),
|
760
|
+
INT16_C( 11652), INT16_C( 11646), INT16_C( 6964), INT16_C( 27675),
|
761
|
+
INT16_C( 13103), INT16_C( -2742), INT16_C( 27906), INT16_C( -1077),
|
762
|
+
INT16_C(-30636), INT16_C(-23050), INT16_C( 8363), INT16_C( 31350),
|
763
|
+
INT16_C( -4750), INT16_C( -220), INT16_C( -8954), INT16_C( 15617)),
|
764
|
+
simde_mm512_set_epi16(INT16_C( -1958), INT16_C( -4418), INT16_C(-14608), INT16_C( -75),
|
765
|
+
INT16_C( 19751), INT16_C( -2227), INT16_C(-31326), INT16_C(-27242),
|
766
|
+
INT16_C( 589), INT16_C(-14659), INT16_C(-15010), INT16_C(-28852),
|
767
|
+
INT16_C( 10864), INT16_C( 23384), INT16_C(-32768), INT16_C(-23296),
|
768
|
+
INT16_C( 25132), INT16_C( -3783), INT16_C(-13189), INT16_C( 32767),
|
769
|
+
INT16_C(-13077), INT16_C( 25181), INT16_C( 13807), INT16_C( 24752),
|
770
|
+
INT16_C(-32768), INT16_C( -1411), INT16_C( 25017), INT16_C( 32767),
|
771
|
+
INT16_C( 11026), INT16_C( 22906), INT16_C( 21845), INT16_C( 1574)) },
|
772
|
+
{ simde_mm512_set_epi16(INT16_C( 25180), INT16_C(-32332), INT16_C(-18604), INT16_C(-25763),
|
773
|
+
INT16_C( 28237), INT16_C(-22027), INT16_C( 18301), INT16_C( 27599),
|
774
|
+
INT16_C( 11815), INT16_C(-14839), INT16_C(-13552), INT16_C( -6300),
|
775
|
+
INT16_C(-30211), INT16_C(-25552), INT16_C( 7375), INT16_C( 5267),
|
776
|
+
INT16_C(-14761), INT16_C(-28375), INT16_C(-32756), INT16_C( 13128),
|
777
|
+
INT16_C( 17683), INT16_C( -4430), INT16_C( -1805), INT16_C(-17763),
|
778
|
+
INT16_C( 206), INT16_C( 15851), INT16_C( 1078), INT16_C( 27402),
|
779
|
+
INT16_C(-15177), INT16_C( 5068), INT16_C(-15079), INT16_C(-13584)),
|
780
|
+
simde_mm512_set_epi16(INT16_C( -3533), INT16_C( -3885), INT16_C( 789), INT16_C( -3755),
|
781
|
+
INT16_C( 3668), INT16_C( 19955), INT16_C(-22356), INT16_C( 8403),
|
782
|
+
INT16_C(-16920), INT16_C( 15195), INT16_C( -1853), INT16_C(-12121),
|
783
|
+
INT16_C( 5095), INT16_C( -9909), INT16_C( 574), INT16_C( 31911),
|
784
|
+
INT16_C( -1319), INT16_C( -2880), INT16_C(-31000), INT16_C(-30829),
|
785
|
+
INT16_C(-12917), INT16_C( 21541), INT16_C( 27413), INT16_C(-28040),
|
786
|
+
INT16_C(-19236), INT16_C(-24178), INT16_C(-29369), INT16_C( -3607),
|
787
|
+
INT16_C( -2666), INT16_C(-13470), INT16_C( 4416), INT16_C( 23850)),
|
788
|
+
simde_mm512_set_epi16(INT16_C( 21647), INT16_C(-32768), INT16_C(-17815), INT16_C(-29518),
|
789
|
+
INT16_C( 31905), INT16_C( -2072), INT16_C( -4055), INT16_C( 32767),
|
790
|
+
INT16_C( -5105), INT16_C( 356), INT16_C(-15405), INT16_C(-18421),
|
791
|
+
INT16_C(-25116), INT16_C(-32768), INT16_C( 7949), INT16_C( 32767),
|
792
|
+
INT16_C(-16080), INT16_C(-31255), INT16_C(-32768), INT16_C(-17701),
|
793
|
+
INT16_C( 4766), INT16_C( 17111), INT16_C( 25608), INT16_C(-32768),
|
794
|
+
INT16_C(-19030), INT16_C( -8327), INT16_C(-28291), INT16_C( 23795),
|
795
|
+
INT16_C(-17843), INT16_C( -8402), INT16_C(-10663), INT16_C( 10266)) },
|
796
|
+
{ simde_mm512_set_epi16(INT16_C( 11424), INT16_C( 29699), INT16_C( 29618), INT16_C(-29898),
|
797
|
+
INT16_C(-23079), INT16_C( -6822), INT16_C( -7340), INT16_C(-12296),
|
798
|
+
INT16_C( 17833), INT16_C( -2043), INT16_C(-29766), INT16_C( 30776),
|
799
|
+
INT16_C(-18161), INT16_C(-32768), INT16_C(-31882), INT16_C( 3163),
|
800
|
+
INT16_C( 20808), INT16_C(-24577), INT16_C( 7685), INT16_C( 6279),
|
801
|
+
INT16_C(-27880), INT16_C( 27718), INT16_C(-18275), INT16_C( 24470),
|
802
|
+
INT16_C( 8834), INT16_C( 20594), INT16_C( 23052), INT16_C(-18860),
|
803
|
+
INT16_C( 7784), INT16_C(-16668), INT16_C(-30440), INT16_C( 6387)),
|
804
|
+
simde_mm512_set_epi16(INT16_C( 15054), INT16_C(-23448), INT16_C( 866), INT16_C(-23509),
|
805
|
+
INT16_C( -2), INT16_C( 6267), INT16_C(-15891), INT16_C(-24685),
|
806
|
+
INT16_C( 17511), INT16_C( 7218), INT16_C(-13659), INT16_C(-27162),
|
807
|
+
INT16_C( 10378), INT16_C(-16488), INT16_C(-11578), INT16_C(-27832),
|
808
|
+
INT16_C(-17566), INT16_C(-29377), INT16_C( -2221), INT16_C( 18656),
|
809
|
+
INT16_C( 7516), INT16_C(-30776), INT16_C(-19010), INT16_C( 26269),
|
810
|
+
INT16_C(-18451), INT16_C( 31467), INT16_C(-22066), INT16_C( 30155),
|
811
|
+
INT16_C( -3394), INT16_C( -6131), INT16_C( 13533), INT16_C( 21770)),
|
812
|
+
simde_mm512_set_epi16(INT16_C( 26478), INT16_C( 6251), INT16_C( 30484), INT16_C(-32768),
|
813
|
+
INT16_C(-23081), INT16_C( -555), INT16_C(-23231), INT16_C(-32768),
|
814
|
+
INT16_C( 32767), INT16_C( 5175), INT16_C(-32768), INT16_C( 3614),
|
815
|
+
INT16_C( -7783), INT16_C(-32768), INT16_C(-32768), INT16_C(-24669),
|
816
|
+
INT16_C( 3242), INT16_C(-32768), INT16_C( 5464), INT16_C( 24935),
|
817
|
+
INT16_C(-20364), INT16_C( -3058), INT16_C(-32768), INT16_C( 32767),
|
818
|
+
INT16_C( -9617), INT16_C( 32767), INT16_C( 986), INT16_C( 11295),
|
819
|
+
INT16_C( 4390), INT16_C(-22799), INT16_C(-16907), INT16_C( 28157)) },
|
820
|
+
{ simde_mm512_set_epi16(INT16_C( 11108), INT16_C( 5360), INT16_C( 8246), INT16_C( 2034),
|
821
|
+
INT16_C( 1485), INT16_C( 28421), INT16_C( 17428), INT16_C(-13900),
|
822
|
+
INT16_C( 4889), INT16_C( 17148), INT16_C( 13806), INT16_C(-26968),
|
823
|
+
INT16_C( -7783), INT16_C( 11345), INT16_C( 17472), INT16_C( 26483),
|
824
|
+
INT16_C(-10340), INT16_C( -7816), INT16_C( 22407), INT16_C( 32028),
|
825
|
+
INT16_C( 18301), INT16_C(-30148), INT16_C( -4736), INT16_C(-10574),
|
826
|
+
INT16_C( 10686), INT16_C( -5463), INT16_C( 19858), INT16_C( -4320),
|
827
|
+
INT16_C(-28154), INT16_C( 8984), INT16_C( 32741), INT16_C( 29052)),
|
828
|
+
simde_mm512_set_epi16(INT16_C(-22772), INT16_C(-14596), INT16_C( -9458), INT16_C( 2054),
|
829
|
+
INT16_C(-24090), INT16_C( 1808), INT16_C( 9897), INT16_C( 20003),
|
830
|
+
INT16_C( 21444), INT16_C( 8548), INT16_C( -1773), INT16_C( 8905),
|
831
|
+
INT16_C( 14811), INT16_C( 5752), INT16_C(-17876), INT16_C( -7032),
|
832
|
+
INT16_C(-19669), INT16_C(-30631), INT16_C(-19220), INT16_C( 18906),
|
833
|
+
INT16_C( 15935), INT16_C( 2767), INT16_C(-30937), INT16_C( 13780),
|
834
|
+
INT16_C( 28270), INT16_C( 29263), INT16_C( 11106), INT16_C( 19546),
|
835
|
+
INT16_C( 16947), INT16_C(-29470), INT16_C( -1882), INT16_C(-19990)),
|
836
|
+
simde_mm512_set_epi16(INT16_C(-11664), INT16_C( -9236), INT16_C( -1212), INT16_C( 4088),
|
837
|
+
INT16_C(-22605), INT16_C( 30229), INT16_C( 27325), INT16_C( 6103),
|
838
|
+
INT16_C( 26333), INT16_C( 25696), INT16_C( 12033), INT16_C(-18063),
|
839
|
+
INT16_C( 7028), INT16_C( 17097), INT16_C( -404), INT16_C( 19451),
|
840
|
+
INT16_C(-30009), INT16_C(-32768), INT16_C( 3187), INT16_C( 32767),
|
841
|
+
INT16_C( 32767), INT16_C(-27381), INT16_C(-32768), INT16_C( 3206),
|
842
|
+
INT16_C( 32767), INT16_C( 23800), INT16_C( 30964), INT16_C( 15226),
|
843
|
+
INT16_C(-11207), INT16_C(-20486), INT16_C( 30859), INT16_C( 9062)) },
|
844
|
+
{ simde_mm512_set_epi16(INT16_C(-30561), INT16_C( -5745), INT16_C( 32288), INT16_C( 11324),
|
845
|
+
INT16_C(-18220), INT16_C(-24874), INT16_C(-10154), INT16_C( 15837),
|
846
|
+
INT16_C( 22748), INT16_C( 6197), INT16_C( 23429), INT16_C(-23495),
|
847
|
+
INT16_C( -9809), INT16_C(-19367), INT16_C(-10631), INT16_C( -3845),
|
848
|
+
INT16_C( -5637), INT16_C(-22436), INT16_C( 6126), INT16_C( 16975),
|
849
|
+
INT16_C( 5830), INT16_C( 26963), INT16_C(-12238), INT16_C( 18631),
|
850
|
+
INT16_C(-23641), INT16_C(-17151), INT16_C(-13103), INT16_C( 5981),
|
851
|
+
INT16_C( 25710), INT16_C( 32081), INT16_C(-26911), INT16_C(-20494)),
|
852
|
+
simde_mm512_set_epi16(INT16_C( 30869), INT16_C(-18069), INT16_C( 6380), INT16_C(-23760),
|
853
|
+
INT16_C( -6614), INT16_C( 32014), INT16_C( -2152), INT16_C( 25253),
|
854
|
+
INT16_C( -8172), INT16_C(-22416), INT16_C( 2949), INT16_C( 5712),
|
855
|
+
INT16_C( 30074), INT16_C( 20521), INT16_C( 28471), INT16_C( -3867),
|
856
|
+
INT16_C( -3892), INT16_C( 21304), INT16_C( 2611), INT16_C( 5827),
|
857
|
+
INT16_C(-30009), INT16_C( 31479), INT16_C(-19390), INT16_C( 1047),
|
858
|
+
INT16_C(-19967), INT16_C( 11404), INT16_C( 25909), INT16_C( 6741),
|
859
|
+
INT16_C( 1933), INT16_C(-26599), INT16_C(-25469), INT16_C(-30351)),
|
860
|
+
simde_mm512_set_epi16(INT16_C( 308), INT16_C(-23814), INT16_C( 32767), INT16_C(-12436),
|
861
|
+
INT16_C(-24834), INT16_C( 7140), INT16_C(-12306), INT16_C( 32767),
|
862
|
+
INT16_C( 14576), INT16_C(-16219), INT16_C( 26378), INT16_C(-17783),
|
863
|
+
INT16_C( 20265), INT16_C( 1154), INT16_C( 17840), INT16_C( -7712),
|
864
|
+
INT16_C( -9529), INT16_C( -1132), INT16_C( 8737), INT16_C( 22802),
|
865
|
+
INT16_C(-24179), INT16_C( 32767), INT16_C(-31628), INT16_C( 19678),
|
866
|
+
INT16_C(-32768), INT16_C( -5747), INT16_C( 12806), INT16_C( 12722),
|
867
|
+
INT16_C( 27643), INT16_C( 5482), INT16_C(-32768), INT16_C(-32768)) }
|
868
|
+
};
|
869
|
+
|
870
|
+
for (size_t i = 0 ; i < (sizeof(test_vec) / sizeof(test_vec[0])); i++) {
|
871
|
+
simde__m512i r = simde_mm512_adds_epi16(test_vec[i].a, test_vec[i].b);
|
872
|
+
simde_assert_m512i_i16(r, ==, test_vec[i].r);
|
873
|
+
}
|
874
|
+
|
875
|
+
return MUNIT_OK;
|
876
|
+
}
|
877
|
+
|
878
|
+
static MunitResult
|
879
|
+
test_simde_mm512_adds_epu8(const MunitParameter params[], void* data) {
|
880
|
+
(void) params;
|
881
|
+
(void) data;
|
882
|
+
|
883
|
+
const struct {
|
884
|
+
simde__m512i a;
|
885
|
+
simde__m512i b;
|
886
|
+
simde__m512i r;
|
887
|
+
} test_vec[8] = {
|
888
|
+
{ simde_x_mm512_set_epu8(UINT8_C( 52), UINT8_C( 29), UINT8_C( 31), UINT8_C(206),
|
889
|
+
UINT8_C( 40), UINT8_C(160), UINT8_C(244), UINT8_C( 85),
|
890
|
+
UINT8_C( 47), UINT8_C(153), UINT8_C(218), UINT8_C(226),
|
891
|
+
UINT8_C( 99), UINT8_C(129), UINT8_C( 68), UINT8_C(218),
|
892
|
+
UINT8_C(122), UINT8_C( 56), UINT8_C(240), UINT8_C( 10),
|
893
|
+
UINT8_C(228), UINT8_C( 40), UINT8_C( 70), UINT8_C( 14),
|
894
|
+
UINT8_C( 67), UINT8_C( 37), UINT8_C( 87), UINT8_C(131),
|
895
|
+
UINT8_C( 29), UINT8_C(175), UINT8_C(167), UINT8_C(223),
|
896
|
+
UINT8_C(170), UINT8_C( 76), UINT8_C( 39), UINT8_C(254),
|
897
|
+
UINT8_C(222), UINT8_C(105), UINT8_C(193), UINT8_C(144),
|
898
|
+
UINT8_C(182), UINT8_C(106), UINT8_C(199), UINT8_C(161),
|
899
|
+
UINT8_C(173), UINT8_C( 65), UINT8_C( 54), UINT8_C(148),
|
900
|
+
UINT8_C(222), UINT8_C( 9), UINT8_C(237), UINT8_C( 76),
|
901
|
+
UINT8_C(149), UINT8_C(196), UINT8_C(194), UINT8_C(114),
|
902
|
+
UINT8_C(167), UINT8_C( 47), UINT8_C(174), UINT8_C(135),
|
903
|
+
UINT8_C(170), UINT8_C( 1), UINT8_C( 40), UINT8_C( 68)),
|
904
|
+
simde_x_mm512_set_epu8(UINT8_C(183), UINT8_C(129), UINT8_C(214), UINT8_C( 34),
|
905
|
+
UINT8_C(187), UINT8_C(142), UINT8_C(238), UINT8_C(248),
|
906
|
+
UINT8_C(175), UINT8_C(127), UINT8_C(231), UINT8_C(164),
|
907
|
+
UINT8_C( 16), UINT8_C(128), UINT8_C( 32), UINT8_C( 28),
|
908
|
+
UINT8_C(111), UINT8_C( 40), UINT8_C( 8), UINT8_C(160),
|
909
|
+
UINT8_C( 37), UINT8_C(193), UINT8_C(195), UINT8_C(135),
|
910
|
+
UINT8_C(102), UINT8_C( 87), UINT8_C(146), UINT8_C(206),
|
911
|
+
UINT8_C( 94), UINT8_C(109), UINT8_C(112), UINT8_C( 83),
|
912
|
+
UINT8_C( 63), UINT8_C(215), UINT8_C( 46), UINT8_C( 55),
|
913
|
+
UINT8_C( 78), UINT8_C(211), UINT8_C(175), UINT8_C(210),
|
914
|
+
UINT8_C( 60), UINT8_C(205), UINT8_C(118), UINT8_C(142),
|
915
|
+
UINT8_C(109), UINT8_C( 48), UINT8_C( 54), UINT8_C( 54),
|
916
|
+
UINT8_C( 99), UINT8_C(248), UINT8_C(120), UINT8_C(165),
|
917
|
+
UINT8_C(189), UINT8_C(132), UINT8_C(130), UINT8_C( 16),
|
918
|
+
UINT8_C( 6), UINT8_C(104), UINT8_C(176), UINT8_C(111),
|
919
|
+
UINT8_C(254), UINT8_C(193), UINT8_C(106), UINT8_C( 5)),
|
920
|
+
simde_x_mm512_set_epu8(UINT8_C(235), UINT8_C(158), UINT8_C(245), UINT8_C(240),
|
921
|
+
UINT8_C(227), UINT8_C(255), UINT8_C(255), UINT8_C(255),
|
922
|
+
UINT8_C(222), UINT8_C(255), UINT8_C(255), UINT8_C(255),
|
923
|
+
UINT8_C(115), UINT8_C(255), UINT8_C(100), UINT8_C(246),
|
924
|
+
UINT8_C(233), UINT8_C( 96), UINT8_C(248), UINT8_C(170),
|
925
|
+
UINT8_C(255), UINT8_C(233), UINT8_C(255), UINT8_C(149),
|
926
|
+
UINT8_C(169), UINT8_C(124), UINT8_C(233), UINT8_C(255),
|
927
|
+
UINT8_C(123), UINT8_C(255), UINT8_C(255), UINT8_C(255),
|
928
|
+
UINT8_C(233), UINT8_C(255), UINT8_C( 85), UINT8_C(255),
|
929
|
+
UINT8_C(255), UINT8_C(255), UINT8_C(255), UINT8_C(255),
|
930
|
+
UINT8_C(242), UINT8_C(255), UINT8_C(255), UINT8_C(255),
|
931
|
+
UINT8_C(255), UINT8_C(113), UINT8_C(108), UINT8_C(202),
|
932
|
+
UINT8_C(255), UINT8_C(255), UINT8_C(255), UINT8_C(241),
|
933
|
+
UINT8_C(255), UINT8_C(255), UINT8_C(255), UINT8_C(130),
|
934
|
+
UINT8_C(173), UINT8_C(151), UINT8_C(255), UINT8_C(246),
|
935
|
+
UINT8_C(255), UINT8_C(194), UINT8_C(146), UINT8_C( 73)) },
|
936
|
+
{ simde_x_mm512_set_epu8(UINT8_C( 38), UINT8_C(254), UINT8_C(204), UINT8_C( 72),
|
937
|
+
UINT8_C(177), UINT8_C( 63), UINT8_C( 67), UINT8_C( 50),
|
938
|
+
UINT8_C( 71), UINT8_C(226), UINT8_C(146), UINT8_C( 4),
|
939
|
+
UINT8_C(134), UINT8_C( 91), UINT8_C(195), UINT8_C(148),
|
940
|
+
UINT8_C( 28), UINT8_C(158), UINT8_C(223), UINT8_C(181),
|
941
|
+
UINT8_C(218), UINT8_C(114), UINT8_C(200), UINT8_C(243),
|
942
|
+
UINT8_C(255), UINT8_C( 48), UINT8_C(233), UINT8_C( 82),
|
943
|
+
UINT8_C( 22), UINT8_C( 26), UINT8_C(128), UINT8_C(166),
|
944
|
+
UINT8_C( 79), UINT8_C(206), UINT8_C(109), UINT8_C(113),
|
945
|
+
UINT8_C( 86), UINT8_C(112), UINT8_C(215), UINT8_C(187),
|
946
|
+
UINT8_C(174), UINT8_C(250), UINT8_C(225), UINT8_C(206),
|
947
|
+
UINT8_C(242), UINT8_C(141), UINT8_C(197), UINT8_C(179),
|
948
|
+
UINT8_C( 88), UINT8_C(237), UINT8_C(191), UINT8_C(149),
|
949
|
+
UINT8_C(130), UINT8_C( 63), UINT8_C( 54), UINT8_C(129),
|
950
|
+
UINT8_C(126), UINT8_C( 18), UINT8_C( 43), UINT8_C(251),
|
951
|
+
UINT8_C(214), UINT8_C(155), UINT8_C( 61), UINT8_C(138)),
|
952
|
+
simde_x_mm512_set_epu8(UINT8_C(142), UINT8_C( 33), UINT8_C( 51), UINT8_C(244),
|
953
|
+
UINT8_C( 33), UINT8_C(106), UINT8_C( 75), UINT8_C(210),
|
954
|
+
UINT8_C(121), UINT8_C( 52), UINT8_C(233), UINT8_C(109),
|
955
|
+
UINT8_C(205), UINT8_C(175), UINT8_C(230), UINT8_C( 70),
|
956
|
+
UINT8_C( 28), UINT8_C(216), UINT8_C( 76), UINT8_C(137),
|
957
|
+
UINT8_C(129), UINT8_C( 5), UINT8_C(149), UINT8_C(132),
|
958
|
+
UINT8_C(159), UINT8_C( 55), UINT8_C( 47), UINT8_C(212),
|
959
|
+
UINT8_C(202), UINT8_C( 26), UINT8_C(247), UINT8_C( 19),
|
960
|
+
UINT8_C(109), UINT8_C( 59), UINT8_C( 49), UINT8_C(175),
|
961
|
+
UINT8_C( 15), UINT8_C(240), UINT8_C(155), UINT8_C( 20),
|
962
|
+
UINT8_C( 85), UINT8_C( 57), UINT8_C( 91), UINT8_C(177),
|
963
|
+
UINT8_C(179), UINT8_C(200), UINT8_C( 26), UINT8_C( 99),
|
964
|
+
UINT8_C( 9), UINT8_C(177), UINT8_C(151), UINT8_C(246),
|
965
|
+
UINT8_C(116), UINT8_C(162), UINT8_C(144), UINT8_C( 44),
|
966
|
+
UINT8_C(240), UINT8_C(226), UINT8_C(215), UINT8_C(206),
|
967
|
+
UINT8_C(114), UINT8_C(250), UINT8_C(170), UINT8_C(220)),
|
968
|
+
simde_x_mm512_set_epu8(UINT8_C(180), UINT8_C(255), UINT8_C(255), UINT8_C(255),
|
969
|
+
UINT8_C(210), UINT8_C(169), UINT8_C(142), UINT8_C(255),
|
970
|
+
UINT8_C(192), UINT8_C(255), UINT8_C(255), UINT8_C(113),
|
971
|
+
UINT8_C(255), UINT8_C(255), UINT8_C(255), UINT8_C(218),
|
972
|
+
UINT8_C( 56), UINT8_C(255), UINT8_C(255), UINT8_C(255),
|
973
|
+
UINT8_C(255), UINT8_C(119), UINT8_C(255), UINT8_C(255),
|
974
|
+
UINT8_C(255), UINT8_C(103), UINT8_C(255), UINT8_C(255),
|
975
|
+
UINT8_C(224), UINT8_C( 52), UINT8_C(255), UINT8_C(185),
|
976
|
+
UINT8_C(188), UINT8_C(255), UINT8_C(158), UINT8_C(255),
|
977
|
+
UINT8_C(101), UINT8_C(255), UINT8_C(255), UINT8_C(207),
|
978
|
+
UINT8_C(255), UINT8_C(255), UINT8_C(255), UINT8_C(255),
|
979
|
+
UINT8_C(255), UINT8_C(255), UINT8_C(223), UINT8_C(255),
|
980
|
+
UINT8_C( 97), UINT8_C(255), UINT8_C(255), UINT8_C(255),
|
981
|
+
UINT8_C(246), UINT8_C(225), UINT8_C(198), UINT8_C(173),
|
982
|
+
UINT8_C(255), UINT8_C(244), UINT8_C(255), UINT8_C(255),
|
983
|
+
UINT8_C(255), UINT8_C(255), UINT8_C(231), UINT8_C(255)) },
|
984
|
+
{ simde_x_mm512_set_epu8(UINT8_C(103), UINT8_C(253), UINT8_C( 31), UINT8_C(185),
|
985
|
+
UINT8_C(101), UINT8_C(201), UINT8_C( 20), UINT8_C( 77),
|
986
|
+
UINT8_C(110), UINT8_C(116), UINT8_C(226), UINT8_C( 37),
|
987
|
+
UINT8_C(155), UINT8_C( 44), UINT8_C(198), UINT8_C(182),
|
988
|
+
UINT8_C(132), UINT8_C( 61), UINT8_C(104), UINT8_C(181),
|
989
|
+
UINT8_C( 77), UINT8_C(161), UINT8_C(154), UINT8_C(195),
|
990
|
+
UINT8_C(148), UINT8_C(239), UINT8_C(178), UINT8_C(165),
|
991
|
+
UINT8_C( 6), UINT8_C(251), UINT8_C( 97), UINT8_C(247),
|
992
|
+
UINT8_C( 8), UINT8_C( 52), UINT8_C( 96), UINT8_C( 34),
|
993
|
+
UINT8_C(233), UINT8_C( 1), UINT8_C( 7), UINT8_C(254),
|
994
|
+
UINT8_C( 3), UINT8_C( 8), UINT8_C(168), UINT8_C(221),
|
995
|
+
UINT8_C(238), UINT8_C(144), UINT8_C( 18), UINT8_C(245),
|
996
|
+
UINT8_C(216), UINT8_C(239), UINT8_C(128), UINT8_C(174),
|
997
|
+
UINT8_C(108), UINT8_C(236), UINT8_C(204), UINT8_C(151),
|
998
|
+
UINT8_C( 83), UINT8_C(224), UINT8_C(253), UINT8_C( 94),
|
999
|
+
UINT8_C( 40), UINT8_C( 10), UINT8_C(195), UINT8_C( 72)),
|
1000
|
+
simde_x_mm512_set_epu8(UINT8_C(196), UINT8_C(220), UINT8_C(209), UINT8_C(146),
|
1001
|
+
UINT8_C( 66), UINT8_C(240), UINT8_C(160), UINT8_C( 58),
|
1002
|
+
UINT8_C(206), UINT8_C(157), UINT8_C(225), UINT8_C(238),
|
1003
|
+
UINT8_C(235), UINT8_C( 53), UINT8_C( 91), UINT8_C( 97),
|
1004
|
+
UINT8_C(175), UINT8_C( 22), UINT8_C( 33), UINT8_C(101),
|
1005
|
+
UINT8_C(189), UINT8_C(131), UINT8_C(219), UINT8_C( 30),
|
1006
|
+
UINT8_C( 36), UINT8_C( 11), UINT8_C(180), UINT8_C( 46),
|
1007
|
+
UINT8_C(126), UINT8_C(239), UINT8_C(135), UINT8_C( 44),
|
1008
|
+
UINT8_C(198), UINT8_C(149), UINT8_C(235), UINT8_C( 72),
|
1009
|
+
UINT8_C( 18), UINT8_C(214), UINT8_C( 92), UINT8_C(199),
|
1010
|
+
UINT8_C( 79), UINT8_C( 28), UINT8_C(156), UINT8_C( 37),
|
1011
|
+
UINT8_C(212), UINT8_C(167), UINT8_C( 62), UINT8_C(201),
|
1012
|
+
UINT8_C(139), UINT8_C(215), UINT8_C( 68), UINT8_C(117),
|
1013
|
+
UINT8_C( 83), UINT8_C(105), UINT8_C(232), UINT8_C(251),
|
1014
|
+
UINT8_C( 6), UINT8_C(165), UINT8_C(199), UINT8_C(183),
|
1015
|
+
UINT8_C(254), UINT8_C( 55), UINT8_C(167), UINT8_C(238)),
|
1016
|
+
simde_x_mm512_set_epu8(UINT8_C(255), UINT8_C(255), UINT8_C(240), UINT8_C(255),
|
1017
|
+
UINT8_C(167), UINT8_C(255), UINT8_C(180), UINT8_C(135),
|
1018
|
+
UINT8_C(255), UINT8_C(255), UINT8_C(255), UINT8_C(255),
|
1019
|
+
UINT8_C(255), UINT8_C( 97), UINT8_C(255), UINT8_C(255),
|
1020
|
+
UINT8_C(255), UINT8_C( 83), UINT8_C(137), UINT8_C(255),
|
1021
|
+
UINT8_C(255), UINT8_C(255), UINT8_C(255), UINT8_C(225),
|
1022
|
+
UINT8_C(184), UINT8_C(250), UINT8_C(255), UINT8_C(211),
|
1023
|
+
UINT8_C(132), UINT8_C(255), UINT8_C(232), UINT8_C(255),
|
1024
|
+
UINT8_C(206), UINT8_C(201), UINT8_C(255), UINT8_C(106),
|
1025
|
+
UINT8_C(251), UINT8_C(215), UINT8_C( 99), UINT8_C(255),
|
1026
|
+
UINT8_C( 82), UINT8_C( 36), UINT8_C(255), UINT8_C(255),
|
1027
|
+
UINT8_C(255), UINT8_C(255), UINT8_C( 80), UINT8_C(255),
|
1028
|
+
UINT8_C(255), UINT8_C(255), UINT8_C(196), UINT8_C(255),
|
1029
|
+
UINT8_C(191), UINT8_C(255), UINT8_C(255), UINT8_C(255),
|
1030
|
+
UINT8_C( 89), UINT8_C(255), UINT8_C(255), UINT8_C(255),
|
1031
|
+
UINT8_C(255), UINT8_C( 65), UINT8_C(255), UINT8_C(255)) },
|
1032
|
+
{ simde_x_mm512_set_epu8(UINT8_C( 7), UINT8_C( 99), UINT8_C(210), UINT8_C(110),
|
1033
|
+
UINT8_C(202), UINT8_C( 10), UINT8_C(247), UINT8_C( 68),
|
1034
|
+
UINT8_C(177), UINT8_C(186), UINT8_C(247), UINT8_C( 36),
|
1035
|
+
UINT8_C(212), UINT8_C(146), UINT8_C(251), UINT8_C( 66),
|
1036
|
+
UINT8_C( 0), UINT8_C( 8), UINT8_C(116), UINT8_C(102),
|
1037
|
+
UINT8_C(175), UINT8_C(223), UINT8_C( 15), UINT8_C(232),
|
1038
|
+
UINT8_C(127), UINT8_C( 63), UINT8_C( 84), UINT8_C(165),
|
1039
|
+
UINT8_C( 18), UINT8_C(250), UINT8_C( 71), UINT8_C( 18),
|
1040
|
+
UINT8_C(132), UINT8_C(155), UINT8_C(102), UINT8_C( 18),
|
1041
|
+
UINT8_C(177), UINT8_C(146), UINT8_C(169), UINT8_C(139),
|
1042
|
+
UINT8_C( 21), UINT8_C( 79), UINT8_C( 4), UINT8_C(129),
|
1043
|
+
UINT8_C(168), UINT8_C( 42), UINT8_C( 9), UINT8_C(184),
|
1044
|
+
UINT8_C( 46), UINT8_C( 53), UINT8_C(243), UINT8_C(140),
|
1045
|
+
UINT8_C(158), UINT8_C(112), UINT8_C( 35), UINT8_C( 49),
|
1046
|
+
UINT8_C(253), UINT8_C(233), UINT8_C( 33), UINT8_C(178),
|
1047
|
+
UINT8_C(117), UINT8_C(161), UINT8_C(168), UINT8_C( 39)),
|
1048
|
+
simde_x_mm512_set_epu8(UINT8_C( 75), UINT8_C(218), UINT8_C(162), UINT8_C( 30),
|
1049
|
+
UINT8_C(119), UINT8_C(231), UINT8_C(193), UINT8_C(230),
|
1050
|
+
UINT8_C(151), UINT8_C( 49), UINT8_C(234), UINT8_C( 78),
|
1051
|
+
UINT8_C( 76), UINT8_C( 37), UINT8_C(174), UINT8_C(105),
|
1052
|
+
UINT8_C(224), UINT8_C(210), UINT8_C(188), UINT8_C(142),
|
1053
|
+
UINT8_C(116), UINT8_C(129), UINT8_C( 93), UINT8_C(124),
|
1054
|
+
UINT8_C(248), UINT8_C(145), UINT8_C(230), UINT8_C( 41),
|
1055
|
+
UINT8_C( 66), UINT8_C(115), UINT8_C(180), UINT8_C( 47),
|
1056
|
+
UINT8_C( 55), UINT8_C(104), UINT8_C(123), UINT8_C(150),
|
1057
|
+
UINT8_C(165), UINT8_C( 22), UINT8_C( 0), UINT8_C(101),
|
1058
|
+
UINT8_C( 55), UINT8_C( 23), UINT8_C( 90), UINT8_C( 64),
|
1059
|
+
UINT8_C( 52), UINT8_C(254), UINT8_C(116), UINT8_C(243),
|
1060
|
+
UINT8_C( 4), UINT8_C( 84), UINT8_C( 82), UINT8_C(103),
|
1061
|
+
UINT8_C( 43), UINT8_C(237), UINT8_C( 7), UINT8_C( 76),
|
1062
|
+
UINT8_C( 88), UINT8_C(212), UINT8_C( 63), UINT8_C(146),
|
1063
|
+
UINT8_C(224), UINT8_C(223), UINT8_C(207), UINT8_C(220)),
|
1064
|
+
simde_x_mm512_set_epu8(UINT8_C( 82), UINT8_C(255), UINT8_C(255), UINT8_C(140),
|
1065
|
+
UINT8_C(255), UINT8_C(241), UINT8_C(255), UINT8_C(255),
|
1066
|
+
UINT8_C(255), UINT8_C(235), UINT8_C(255), UINT8_C(114),
|
1067
|
+
UINT8_C(255), UINT8_C(183), UINT8_C(255), UINT8_C(171),
|
1068
|
+
UINT8_C(224), UINT8_C(218), UINT8_C(255), UINT8_C(244),
|
1069
|
+
UINT8_C(255), UINT8_C(255), UINT8_C(108), UINT8_C(255),
|
1070
|
+
UINT8_C(255), UINT8_C(208), UINT8_C(255), UINT8_C(206),
|
1071
|
+
UINT8_C( 84), UINT8_C(255), UINT8_C(251), UINT8_C( 65),
|
1072
|
+
UINT8_C(187), UINT8_C(255), UINT8_C(225), UINT8_C(168),
|
1073
|
+
UINT8_C(255), UINT8_C(168), UINT8_C(169), UINT8_C(240),
|
1074
|
+
UINT8_C( 76), UINT8_C(102), UINT8_C( 94), UINT8_C(193),
|
1075
|
+
UINT8_C(220), UINT8_C(255), UINT8_C(125), UINT8_C(255),
|
1076
|
+
UINT8_C( 50), UINT8_C(137), UINT8_C(255), UINT8_C(243),
|
1077
|
+
UINT8_C(201), UINT8_C(255), UINT8_C( 42), UINT8_C(125),
|
1078
|
+
UINT8_C(255), UINT8_C(255), UINT8_C( 96), UINT8_C(255),
|
1079
|
+
UINT8_C(255), UINT8_C(255), UINT8_C(255), UINT8_C(255)) },
|
1080
|
+
{ simde_x_mm512_set_epu8(UINT8_C(233), UINT8_C(112), UINT8_C( 62), UINT8_C( 65),
|
1081
|
+
UINT8_C( 37), UINT8_C(247), UINT8_C(105), UINT8_C( 54),
|
1082
|
+
UINT8_C(214), UINT8_C(255), UINT8_C(145), UINT8_C( 18),
|
1083
|
+
UINT8_C(160), UINT8_C( 92), UINT8_C( 29), UINT8_C(253),
|
1084
|
+
UINT8_C(230), UINT8_C( 83), UINT8_C(176), UINT8_C( 43),
|
1085
|
+
UINT8_C( 78), UINT8_C( 31), UINT8_C(113), UINT8_C(239),
|
1086
|
+
UINT8_C( 38), UINT8_C(192), UINT8_C(127), UINT8_C( 44),
|
1087
|
+
UINT8_C(218), UINT8_C(134), UINT8_C(224), UINT8_C( 35),
|
1088
|
+
UINT8_C(155), UINT8_C(171), UINT8_C( 44), UINT8_C( 53),
|
1089
|
+
UINT8_C(101), UINT8_C(234), UINT8_C(121), UINT8_C( 95),
|
1090
|
+
UINT8_C(232), UINT8_C(104), UINT8_C( 20), UINT8_C( 52),
|
1091
|
+
UINT8_C( 59), UINT8_C( 62), UINT8_C( 55), UINT8_C( 43),
|
1092
|
+
UINT8_C(246), UINT8_C( 36), UINT8_C( 25), UINT8_C( 98),
|
1093
|
+
UINT8_C(155), UINT8_C(231), UINT8_C( 43), UINT8_C(203),
|
1094
|
+
UINT8_C( 77), UINT8_C( 43), UINT8_C( 80), UINT8_C( 85),
|
1095
|
+
UINT8_C(227), UINT8_C( 34), UINT8_C( 77), UINT8_C(179)),
|
1096
|
+
simde_x_mm512_set_epu8(UINT8_C( 68), UINT8_C(183), UINT8_C(190), UINT8_C(248),
|
1097
|
+
UINT8_C( 54), UINT8_C(194), UINT8_C( 0), UINT8_C(190),
|
1098
|
+
UINT8_C(102), UINT8_C(185), UINT8_C( 5), UINT8_C(238),
|
1099
|
+
UINT8_C(188), UINT8_C(104), UINT8_C(139), UINT8_C(163),
|
1100
|
+
UINT8_C(242), UINT8_C( 94), UINT8_C(181), UINT8_C(214),
|
1101
|
+
UINT8_C(170), UINT8_C(182), UINT8_C(139), UINT8_C( 96),
|
1102
|
+
UINT8_C( 80), UINT8_C( 38), UINT8_C(151), UINT8_C(132),
|
1103
|
+
UINT8_C(243), UINT8_C( 37), UINT8_C(120), UINT8_C( 30),
|
1104
|
+
UINT8_C(115), UINT8_C( 34), UINT8_C(222), UINT8_C(121),
|
1105
|
+
UINT8_C(112), UINT8_C(205), UINT8_C(161), UINT8_C( 52),
|
1106
|
+
UINT8_C(142), UINT8_C(118), UINT8_C(195), UINT8_C(200),
|
1107
|
+
UINT8_C( 59), UINT8_C( 6), UINT8_C(115), UINT8_C(109),
|
1108
|
+
UINT8_C( 93), UINT8_C(174), UINT8_C(200), UINT8_C(190),
|
1109
|
+
UINT8_C(151), UINT8_C(126), UINT8_C(210), UINT8_C(200),
|
1110
|
+
UINT8_C( 79), UINT8_C( 43), UINT8_C( 20), UINT8_C(239),
|
1111
|
+
UINT8_C(149), UINT8_C(119), UINT8_C( 96), UINT8_C(120)),
|
1112
|
+
simde_x_mm512_set_epu8(UINT8_C(255), UINT8_C(255), UINT8_C(252), UINT8_C(255),
|
1113
|
+
UINT8_C( 91), UINT8_C(255), UINT8_C(105), UINT8_C(244),
|
1114
|
+
UINT8_C(255), UINT8_C(255), UINT8_C(150), UINT8_C(255),
|
1115
|
+
UINT8_C(255), UINT8_C(196), UINT8_C(168), UINT8_C(255),
|
1116
|
+
UINT8_C(255), UINT8_C(177), UINT8_C(255), UINT8_C(255),
|
1117
|
+
UINT8_C(248), UINT8_C(213), UINT8_C(252), UINT8_C(255),
|
1118
|
+
UINT8_C(118), UINT8_C(230), UINT8_C(255), UINT8_C(176),
|
1119
|
+
UINT8_C(255), UINT8_C(171), UINT8_C(255), UINT8_C( 65),
|
1120
|
+
UINT8_C(255), UINT8_C(205), UINT8_C(255), UINT8_C(174),
|
1121
|
+
UINT8_C(213), UINT8_C(255), UINT8_C(255), UINT8_C(147),
|
1122
|
+
UINT8_C(255), UINT8_C(222), UINT8_C(215), UINT8_C(252),
|
1123
|
+
UINT8_C(118), UINT8_C( 68), UINT8_C(170), UINT8_C(152),
|
1124
|
+
UINT8_C(255), UINT8_C(210), UINT8_C(225), UINT8_C(255),
|
1125
|
+
UINT8_C(255), UINT8_C(255), UINT8_C(253), UINT8_C(255),
|
1126
|
+
UINT8_C(156), UINT8_C( 86), UINT8_C(100), UINT8_C(255),
|
1127
|
+
UINT8_C(255), UINT8_C(153), UINT8_C(173), UINT8_C(255)) },
|
1128
|
+
{ simde_x_mm512_set_epu8(UINT8_C(150), UINT8_C(150), UINT8_C(146), UINT8_C(157),
|
1129
|
+
UINT8_C(103), UINT8_C( 31), UINT8_C(236), UINT8_C(192),
|
1130
|
+
UINT8_C(155), UINT8_C( 46), UINT8_C(170), UINT8_C(176),
|
1131
|
+
UINT8_C(189), UINT8_C( 74), UINT8_C(246), UINT8_C( 0),
|
1132
|
+
UINT8_C( 85), UINT8_C( 30), UINT8_C(190), UINT8_C( 12),
|
1133
|
+
UINT8_C(117), UINT8_C( 74), UINT8_C(194), UINT8_C( 97),
|
1134
|
+
UINT8_C(132), UINT8_C( 63), UINT8_C(227), UINT8_C( 21),
|
1135
|
+
UINT8_C(244), UINT8_C(229), UINT8_C(176), UINT8_C(122),
|
1136
|
+
UINT8_C(159), UINT8_C( 35), UINT8_C(115), UINT8_C(240),
|
1137
|
+
UINT8_C( 88), UINT8_C(151), UINT8_C(101), UINT8_C(194),
|
1138
|
+
UINT8_C( 49), UINT8_C(128), UINT8_C( 87), UINT8_C(152),
|
1139
|
+
UINT8_C(173), UINT8_C(242), UINT8_C(150), UINT8_C( 26),
|
1140
|
+
UINT8_C(183), UINT8_C( 56), UINT8_C(181), UINT8_C(193),
|
1141
|
+
UINT8_C(231), UINT8_C(135), UINT8_C(190), UINT8_C( 42),
|
1142
|
+
UINT8_C( 33), UINT8_C(174), UINT8_C( 57), UINT8_C(232),
|
1143
|
+
UINT8_C(176), UINT8_C(125), UINT8_C( 87), UINT8_C( 79)),
|
1144
|
+
simde_x_mm512_set_epu8(UINT8_C( 68), UINT8_C( 1), UINT8_C(208), UINT8_C( 74),
|
1145
|
+
UINT8_C(102), UINT8_C(168), UINT8_C( 41), UINT8_C( 41),
|
1146
|
+
UINT8_C( 83), UINT8_C( 95), UINT8_C(152), UINT8_C(131),
|
1147
|
+
UINT8_C(230), UINT8_C( 27), UINT8_C(126), UINT8_C(230),
|
1148
|
+
UINT8_C(128), UINT8_C(133), UINT8_C(107), UINT8_C(197),
|
1149
|
+
UINT8_C( 23), UINT8_C( 2), UINT8_C(108), UINT8_C(207),
|
1150
|
+
UINT8_C( 82), UINT8_C(175), UINT8_C(247), UINT8_C(180),
|
1151
|
+
UINT8_C( 57), UINT8_C( 31), UINT8_C(124), UINT8_C(203),
|
1152
|
+
UINT8_C(246), UINT8_C(195), UINT8_C(173), UINT8_C(161),
|
1153
|
+
UINT8_C(132), UINT8_C(162), UINT8_C( 13), UINT8_C(205),
|
1154
|
+
UINT8_C(225), UINT8_C( 25), UINT8_C( 39), UINT8_C(181),
|
1155
|
+
UINT8_C(149), UINT8_C(149), UINT8_C(138), UINT8_C(158),
|
1156
|
+
UINT8_C(215), UINT8_C(147), UINT8_C( 0), UINT8_C( 87),
|
1157
|
+
UINT8_C(244), UINT8_C( 10), UINT8_C( 1), UINT8_C( 19),
|
1158
|
+
UINT8_C(173), UINT8_C(221), UINT8_C(118), UINT8_C( 51),
|
1159
|
+
UINT8_C( 98), UINT8_C(183), UINT8_C(125), UINT8_C( 92)),
|
1160
|
+
simde_x_mm512_set_epu8(UINT8_C(218), UINT8_C(151), UINT8_C(255), UINT8_C(231),
|
1161
|
+
UINT8_C(205), UINT8_C(199), UINT8_C(255), UINT8_C(233),
|
1162
|
+
UINT8_C(238), UINT8_C(141), UINT8_C(255), UINT8_C(255),
|
1163
|
+
UINT8_C(255), UINT8_C(101), UINT8_C(255), UINT8_C(230),
|
1164
|
+
UINT8_C(213), UINT8_C(163), UINT8_C(255), UINT8_C(209),
|
1165
|
+
UINT8_C(140), UINT8_C( 76), UINT8_C(255), UINT8_C(255),
|
1166
|
+
UINT8_C(214), UINT8_C(238), UINT8_C(255), UINT8_C(201),
|
1167
|
+
UINT8_C(255), UINT8_C(255), UINT8_C(255), UINT8_C(255),
|
1168
|
+
UINT8_C(255), UINT8_C(230), UINT8_C(255), UINT8_C(255),
|
1169
|
+
UINT8_C(220), UINT8_C(255), UINT8_C(114), UINT8_C(255),
|
1170
|
+
UINT8_C(255), UINT8_C(153), UINT8_C(126), UINT8_C(255),
|
1171
|
+
UINT8_C(255), UINT8_C(255), UINT8_C(255), UINT8_C(184),
|
1172
|
+
UINT8_C(255), UINT8_C(203), UINT8_C(181), UINT8_C(255),
|
1173
|
+
UINT8_C(255), UINT8_C(145), UINT8_C(191), UINT8_C( 61),
|
1174
|
+
UINT8_C(206), UINT8_C(255), UINT8_C(175), UINT8_C(255),
|
1175
|
+
UINT8_C(255), UINT8_C(255), UINT8_C(212), UINT8_C(171)) },
|
1176
|
+
{ simde_x_mm512_set_epu8(UINT8_C(166), UINT8_C(112), UINT8_C( 16), UINT8_C( 20),
|
1177
|
+
UINT8_C(189), UINT8_C( 23), UINT8_C( 28), UINT8_C(226),
|
1178
|
+
UINT8_C( 92), UINT8_C(105), UINT8_C(249), UINT8_C( 71),
|
1179
|
+
UINT8_C( 22), UINT8_C(153), UINT8_C( 38), UINT8_C( 58),
|
1180
|
+
UINT8_C( 86), UINT8_C(191), UINT8_C( 97), UINT8_C(186),
|
1181
|
+
UINT8_C(117), UINT8_C( 93), UINT8_C( 63), UINT8_C(142),
|
1182
|
+
UINT8_C( 82), UINT8_C(123), UINT8_C(210), UINT8_C(159),
|
1183
|
+
UINT8_C(175), UINT8_C(187), UINT8_C( 33), UINT8_C(134),
|
1184
|
+
UINT8_C(156), UINT8_C(243), UINT8_C(191), UINT8_C(139),
|
1185
|
+
UINT8_C(173), UINT8_C( 70), UINT8_C(113), UINT8_C( 30),
|
1186
|
+
UINT8_C(184), UINT8_C( 82), UINT8_C(234), UINT8_C(177),
|
1187
|
+
UINT8_C(234), UINT8_C(131), UINT8_C(180), UINT8_C( 12),
|
1188
|
+
UINT8_C( 47), UINT8_C(213), UINT8_C( 54), UINT8_C(222),
|
1189
|
+
UINT8_C(114), UINT8_C(251), UINT8_C(236), UINT8_C( 57),
|
1190
|
+
UINT8_C(205), UINT8_C(187), UINT8_C( 48), UINT8_C(112),
|
1191
|
+
UINT8_C( 34), UINT8_C( 49), UINT8_C( 95), UINT8_C(198)),
|
1192
|
+
simde_x_mm512_set_epu8(UINT8_C(116), UINT8_C(101), UINT8_C(212), UINT8_C(199),
|
1193
|
+
UINT8_C( 88), UINT8_C(165), UINT8_C(253), UINT8_C( 88),
|
1194
|
+
UINT8_C(138), UINT8_C( 27), UINT8_C(153), UINT8_C(155),
|
1195
|
+
UINT8_C(248), UINT8_C(175), UINT8_C(152), UINT8_C(246),
|
1196
|
+
UINT8_C( 17), UINT8_C(224), UINT8_C( 49), UINT8_C(127),
|
1197
|
+
UINT8_C(200), UINT8_C( 46), UINT8_C( 58), UINT8_C(159),
|
1198
|
+
UINT8_C(177), UINT8_C( 24), UINT8_C(139), UINT8_C(240),
|
1199
|
+
UINT8_C( 45), UINT8_C(115), UINT8_C(179), UINT8_C(230),
|
1200
|
+
UINT8_C(249), UINT8_C(217), UINT8_C(202), UINT8_C( 21),
|
1201
|
+
UINT8_C(134), UINT8_C(111), UINT8_C( 79), UINT8_C(153),
|
1202
|
+
UINT8_C(130), UINT8_C( 83), UINT8_C(196), UINT8_C(101),
|
1203
|
+
UINT8_C(151), UINT8_C(117), UINT8_C(152), UINT8_C(155),
|
1204
|
+
UINT8_C(116), UINT8_C(201), UINT8_C(241), UINT8_C( 71),
|
1205
|
+
UINT8_C( 24), UINT8_C(105), UINT8_C(212), UINT8_C(191),
|
1206
|
+
UINT8_C( 1), UINT8_C(252), UINT8_C( 15), UINT8_C( 49),
|
1207
|
+
UINT8_C(105), UINT8_C(159), UINT8_C(109), UINT8_C( 31)),
|
1208
|
+
simde_x_mm512_set_epu8(UINT8_C(255), UINT8_C(213), UINT8_C(228), UINT8_C(219),
|
1209
|
+
UINT8_C(255), UINT8_C(188), UINT8_C(255), UINT8_C(255),
|
1210
|
+
UINT8_C(230), UINT8_C(132), UINT8_C(255), UINT8_C(226),
|
1211
|
+
UINT8_C(255), UINT8_C(255), UINT8_C(190), UINT8_C(255),
|
1212
|
+
UINT8_C(103), UINT8_C(255), UINT8_C(146), UINT8_C(255),
|
1213
|
+
UINT8_C(255), UINT8_C(139), UINT8_C(121), UINT8_C(255),
|
1214
|
+
UINT8_C(255), UINT8_C(147), UINT8_C(255), UINT8_C(255),
|
1215
|
+
UINT8_C(220), UINT8_C(255), UINT8_C(212), UINT8_C(255),
|
1216
|
+
UINT8_C(255), UINT8_C(255), UINT8_C(255), UINT8_C(160),
|
1217
|
+
UINT8_C(255), UINT8_C(181), UINT8_C(192), UINT8_C(183),
|
1218
|
+
UINT8_C(255), UINT8_C(165), UINT8_C(255), UINT8_C(255),
|
1219
|
+
UINT8_C(255), UINT8_C(248), UINT8_C(255), UINT8_C(167),
|
1220
|
+
UINT8_C(163), UINT8_C(255), UINT8_C(255), UINT8_C(255),
|
1221
|
+
UINT8_C(138), UINT8_C(255), UINT8_C(255), UINT8_C(248),
|
1222
|
+
UINT8_C(206), UINT8_C(255), UINT8_C( 63), UINT8_C(161),
|
1223
|
+
UINT8_C(139), UINT8_C(208), UINT8_C(204), UINT8_C(229)) },
|
1224
|
+
{ simde_x_mm512_set_epu8(UINT8_C(239), UINT8_C(174), UINT8_C( 81), UINT8_C( 89),
|
1225
|
+
UINT8_C( 63), UINT8_C(160), UINT8_C(219), UINT8_C(204),
|
1226
|
+
UINT8_C(161), UINT8_C( 4), UINT8_C(134), UINT8_C(137),
|
1227
|
+
UINT8_C( 48), UINT8_C( 33), UINT8_C(178), UINT8_C(122),
|
1228
|
+
UINT8_C( 99), UINT8_C(167), UINT8_C( 95), UINT8_C(109),
|
1229
|
+
UINT8_C( 38), UINT8_C(191), UINT8_C( 3), UINT8_C( 48),
|
1230
|
+
UINT8_C(143), UINT8_C( 51), UINT8_C( 81), UINT8_C( 76),
|
1231
|
+
UINT8_C(251), UINT8_C(204), UINT8_C(198), UINT8_C( 1),
|
1232
|
+
UINT8_C(175), UINT8_C(123), UINT8_C( 24), UINT8_C(237),
|
1233
|
+
UINT8_C(190), UINT8_C( 62), UINT8_C( 87), UINT8_C(255),
|
1234
|
+
UINT8_C(119), UINT8_C(202), UINT8_C( 4), UINT8_C( 40),
|
1235
|
+
UINT8_C(152), UINT8_C(128), UINT8_C(116), UINT8_C( 72),
|
1236
|
+
UINT8_C(245), UINT8_C(148), UINT8_C( 39), UINT8_C(106),
|
1237
|
+
UINT8_C(195), UINT8_C(186), UINT8_C(241), UINT8_C(178),
|
1238
|
+
UINT8_C( 68), UINT8_C(210), UINT8_C( 61), UINT8_C(218),
|
1239
|
+
UINT8_C(116), UINT8_C( 98), UINT8_C( 41), UINT8_C( 22)),
|
1240
|
+
simde_x_mm512_set_epu8(UINT8_C( 3), UINT8_C(245), UINT8_C( 8), UINT8_C(179),
|
1241
|
+
UINT8_C(242), UINT8_C( 19), UINT8_C(107), UINT8_C(170),
|
1242
|
+
UINT8_C(178), UINT8_C(175), UINT8_C(174), UINT8_C(170),
|
1243
|
+
UINT8_C( 72), UINT8_C(195), UINT8_C(199), UINT8_C( 66),
|
1244
|
+
UINT8_C(182), UINT8_C(183), UINT8_C( 58), UINT8_C(245),
|
1245
|
+
UINT8_C( 62), UINT8_C( 31), UINT8_C( 93), UINT8_C( 74),
|
1246
|
+
UINT8_C(114), UINT8_C( 92), UINT8_C(199), UINT8_C( 53),
|
1247
|
+
UINT8_C( 94), UINT8_C(185), UINT8_C(107), UINT8_C(124),
|
1248
|
+
UINT8_C(160), UINT8_C(193), UINT8_C( 17), UINT8_C( 65),
|
1249
|
+
UINT8_C(242), UINT8_C( 55), UINT8_C(163), UINT8_C(102),
|
1250
|
+
UINT8_C( 59), UINT8_C(173), UINT8_C(244), UINT8_C(232),
|
1251
|
+
UINT8_C(182), UINT8_C(139), UINT8_C(254), UINT8_C( 81),
|
1252
|
+
UINT8_C(228), UINT8_C(175), UINT8_C(104), UINT8_C(167),
|
1253
|
+
UINT8_C( 38), UINT8_C(114), UINT8_C(184), UINT8_C(118),
|
1254
|
+
UINT8_C(167), UINT8_C( 58), UINT8_C(153), UINT8_C(103),
|
1255
|
+
UINT8_C(204), UINT8_C(126), UINT8_C(111), UINT8_C( 63)),
|
1256
|
+
simde_x_mm512_set_epu8(UINT8_C(242), UINT8_C(255), UINT8_C( 89), UINT8_C(255),
|
1257
|
+
UINT8_C(255), UINT8_C(179), UINT8_C(255), UINT8_C(255),
|
1258
|
+
UINT8_C(255), UINT8_C(179), UINT8_C(255), UINT8_C(255),
|
1259
|
+
UINT8_C(120), UINT8_C(228), UINT8_C(255), UINT8_C(188),
|
1260
|
+
UINT8_C(255), UINT8_C(255), UINT8_C(153), UINT8_C(255),
|
1261
|
+
UINT8_C(100), UINT8_C(222), UINT8_C( 96), UINT8_C(122),
|
1262
|
+
UINT8_C(255), UINT8_C(143), UINT8_C(255), UINT8_C(129),
|
1263
|
+
UINT8_C(255), UINT8_C(255), UINT8_C(255), UINT8_C(125),
|
1264
|
+
UINT8_C(255), UINT8_C(255), UINT8_C( 41), UINT8_C(255),
|
1265
|
+
UINT8_C(255), UINT8_C(117), UINT8_C(250), UINT8_C(255),
|
1266
|
+
UINT8_C(178), UINT8_C(255), UINT8_C(248), UINT8_C(255),
|
1267
|
+
UINT8_C(255), UINT8_C(255), UINT8_C(255), UINT8_C(153),
|
1268
|
+
UINT8_C(255), UINT8_C(255), UINT8_C(143), UINT8_C(255),
|
1269
|
+
UINT8_C(233), UINT8_C(255), UINT8_C(255), UINT8_C(255),
|
1270
|
+
UINT8_C(235), UINT8_C(255), UINT8_C(214), UINT8_C(255),
|
1271
|
+
UINT8_C(255), UINT8_C(224), UINT8_C(152), UINT8_C( 85)) }
|
1272
|
+
};
|
1273
|
+
|
1274
|
+
for (size_t i = 0 ; i < (sizeof(test_vec) / sizeof(test_vec[0])); i++) {
|
1275
|
+
simde__m512i r = simde_mm512_adds_epu8(test_vec[i].a, test_vec[i].b);
|
1276
|
+
simde_assert_m512i_u8(r, ==, test_vec[i].r);
|
1277
|
+
}
|
1278
|
+
|
1279
|
+
return MUNIT_OK;
|
1280
|
+
}
|
1281
|
+
|
1282
|
+
static MunitResult
|
1283
|
+
test_simde_mm512_adds_epu16(const MunitParameter params[], void* data) {
|
1284
|
+
(void) params;
|
1285
|
+
(void) data;
|
1286
|
+
|
1287
|
+
const struct {
|
1288
|
+
simde__m512i a;
|
1289
|
+
simde__m512i b;
|
1290
|
+
simde__m512i r;
|
1291
|
+
} test_vec[8] = {
|
1292
|
+
{ simde_x_mm512_set_epu16(UINT16_C( 57245), UINT16_C( 31803), UINT16_C( 9053), UINT16_C( 21282),
|
1293
|
+
UINT16_C( 45515), UINT16_C( 57894), UINT16_C( 50445), UINT16_C( 50583),
|
1294
|
+
UINT16_C( 54723), UINT16_C( 52144), UINT16_C( 13347), UINT16_C( 57624),
|
1295
|
+
UINT16_C( 20975), UINT16_C( 65317), UINT16_C( 16493), UINT16_C( 47193),
|
1296
|
+
UINT16_C( 8805), UINT16_C( 17012), UINT16_C( 15383), UINT16_C( 5484),
|
1297
|
+
UINT16_C( 64480), UINT16_C( 10898), UINT16_C( 37488), UINT16_C( 8763),
|
1298
|
+
UINT16_C( 45480), UINT16_C( 3307), UINT16_C( 9193), UINT16_C( 26229),
|
1299
|
+
UINT16_C( 20008), UINT16_C( 59713), UINT16_C( 53564), UINT16_C( 62675)),
|
1300
|
+
simde_x_mm512_set_epu16(UINT16_C( 56619), UINT16_C( 61703), UINT16_C( 3086), UINT16_C( 41224),
|
1301
|
+
UINT16_C( 8421), UINT16_C( 52766), UINT16_C( 7424), UINT16_C( 48822),
|
1302
|
+
UINT16_C( 41975), UINT16_C( 22918), UINT16_C( 59915), UINT16_C( 26727),
|
1303
|
+
UINT16_C( 53323), UINT16_C( 34707), UINT16_C( 14572), UINT16_C( 716),
|
1304
|
+
UINT16_C( 56087), UINT16_C( 9094), UINT16_C( 20814), UINT16_C( 56962),
|
1305
|
+
UINT16_C( 14110), UINT16_C( 52082), UINT16_C( 8468), UINT16_C( 11854),
|
1306
|
+
UINT16_C( 1576), UINT16_C( 12690), UINT16_C( 32737), UINT16_C( 51663),
|
1307
|
+
UINT16_C( 37115), UINT16_C( 18115), UINT16_C( 50682), UINT16_C( 1653)),
|
1308
|
+
simde_x_mm512_set_epu16(UINT16_C( 65535), UINT16_C( 65535), UINT16_C( 12139), UINT16_C( 62506),
|
1309
|
+
UINT16_C( 53936), UINT16_C( 65535), UINT16_C( 57869), UINT16_C( 65535),
|
1310
|
+
UINT16_C( 65535), UINT16_C( 65535), UINT16_C( 65535), UINT16_C( 65535),
|
1311
|
+
UINT16_C( 65535), UINT16_C( 65535), UINT16_C( 31065), UINT16_C( 47909),
|
1312
|
+
UINT16_C( 64892), UINT16_C( 26106), UINT16_C( 36197), UINT16_C( 62446),
|
1313
|
+
UINT16_C( 65535), UINT16_C( 62980), UINT16_C( 45956), UINT16_C( 20617),
|
1314
|
+
UINT16_C( 47056), UINT16_C( 15997), UINT16_C( 41930), UINT16_C( 65535),
|
1315
|
+
UINT16_C( 57123), UINT16_C( 65535), UINT16_C( 65535), UINT16_C( 64328)) },
|
1316
|
+
{ simde_x_mm512_set_epu16(UINT16_C( 1128), UINT16_C( 14143), UINT16_C( 19763), UINT16_C( 47819),
|
1317
|
+
UINT16_C( 62972), UINT16_C( 13428), UINT16_C( 18537), UINT16_C( 38297),
|
1318
|
+
UINT16_C( 21721), UINT16_C( 58861), UINT16_C( 42577), UINT16_C( 39379),
|
1319
|
+
UINT16_C( 55643), UINT16_C( 20439), UINT16_C( 34514), UINT16_C( 49721),
|
1320
|
+
UINT16_C( 18526), UINT16_C( 46886), UINT16_C( 20377), UINT16_C( 31658),
|
1321
|
+
UINT16_C( 32537), UINT16_C( 50044), UINT16_C( 28503), UINT16_C( 5895),
|
1322
|
+
UINT16_C( 1666), UINT16_C( 50137), UINT16_C( 30976), UINT16_C( 4047),
|
1323
|
+
UINT16_C( 24589), UINT16_C( 29183), UINT16_C( 13128), UINT16_C( 3541)),
|
1324
|
+
simde_x_mm512_set_epu16(UINT16_C( 38521), UINT16_C( 64382), UINT16_C( 35873), UINT16_C( 42497),
|
1325
|
+
UINT16_C( 46178), UINT16_C( 38904), UINT16_C( 15657), UINT16_C( 6453),
|
1326
|
+
UINT16_C( 15377), UINT16_C( 45418), UINT16_C( 38208), UINT16_C( 44948),
|
1327
|
+
UINT16_C( 17985), UINT16_C( 28923), UINT16_C( 11094), UINT16_C( 61254),
|
1328
|
+
UINT16_C( 41028), UINT16_C( 4939), UINT16_C( 61438), UINT16_C( 34821),
|
1329
|
+
UINT16_C( 9578), UINT16_C( 46329), UINT16_C( 53213), UINT16_C( 42297),
|
1330
|
+
UINT16_C( 42846), UINT16_C( 12973), UINT16_C( 32628), UINT16_C( 10992),
|
1331
|
+
UINT16_C( 56871), UINT16_C( 37695), UINT16_C( 16317), UINT16_C( 4356)),
|
1332
|
+
simde_x_mm512_set_epu16(UINT16_C( 39649), UINT16_C( 65535), UINT16_C( 55636), UINT16_C( 65535),
|
1333
|
+
UINT16_C( 65535), UINT16_C( 52332), UINT16_C( 34194), UINT16_C( 44750),
|
1334
|
+
UINT16_C( 37098), UINT16_C( 65535), UINT16_C( 65535), UINT16_C( 65535),
|
1335
|
+
UINT16_C( 65535), UINT16_C( 49362), UINT16_C( 45608), UINT16_C( 65535),
|
1336
|
+
UINT16_C( 59554), UINT16_C( 51825), UINT16_C( 65535), UINT16_C( 65535),
|
1337
|
+
UINT16_C( 42115), UINT16_C( 65535), UINT16_C( 65535), UINT16_C( 48192),
|
1338
|
+
UINT16_C( 44512), UINT16_C( 63110), UINT16_C( 63604), UINT16_C( 15039),
|
1339
|
+
UINT16_C( 65535), UINT16_C( 65535), UINT16_C( 29445), UINT16_C( 7897)) },
|
1340
|
+
{ simde_x_mm512_set_epu16(UINT16_C( 14747), UINT16_C( 30570), UINT16_C( 56275), UINT16_C( 58793),
|
1341
|
+
UINT16_C( 48636), UINT16_C( 11396), UINT16_C( 12142), UINT16_C( 25883),
|
1342
|
+
UINT16_C( 48137), UINT16_C( 31445), UINT16_C( 15524), UINT16_C( 49322),
|
1343
|
+
UINT16_C( 6761), UINT16_C( 42681), UINT16_C( 8586), UINT16_C( 53309),
|
1344
|
+
UINT16_C( 48898), UINT16_C( 23142), UINT16_C( 17912), UINT16_C( 20578),
|
1345
|
+
UINT16_C( 42157), UINT16_C( 25705), UINT16_C( 39154), UINT16_C( 32521),
|
1346
|
+
UINT16_C( 7302), UINT16_C( 65263), UINT16_C( 7623), UINT16_C( 47267),
|
1347
|
+
UINT16_C( 41612), UINT16_C( 7723), UINT16_C( 51815), UINT16_C( 23273)),
|
1348
|
+
simde_x_mm512_set_epu16(UINT16_C( 29783), UINT16_C( 35133), UINT16_C( 18722), UINT16_C( 24788),
|
1349
|
+
UINT16_C( 4507), UINT16_C( 64908), UINT16_C( 18120), UINT16_C( 53792),
|
1350
|
+
UINT16_C( 40447), UINT16_C( 2013), UINT16_C( 19329), UINT16_C( 18474),
|
1351
|
+
UINT16_C( 45067), UINT16_C( 37105), UINT16_C( 40003), UINT16_C( 11523),
|
1352
|
+
UINT16_C( 28865), UINT16_C( 9988), UINT16_C( 16394), UINT16_C( 60605),
|
1353
|
+
UINT16_C( 29530), UINT16_C( 612), UINT16_C( 21547), UINT16_C( 12463),
|
1354
|
+
UINT16_C( 46586), UINT16_C( 6619), UINT16_C( 39845), UINT16_C( 4328),
|
1355
|
+
UINT16_C( 31818), UINT16_C( 16334), UINT16_C( 57400), UINT16_C( 58095)),
|
1356
|
+
simde_x_mm512_set_epu16(UINT16_C( 44530), UINT16_C( 65535), UINT16_C( 65535), UINT16_C( 65535),
|
1357
|
+
UINT16_C( 53143), UINT16_C( 65535), UINT16_C( 30262), UINT16_C( 65535),
|
1358
|
+
UINT16_C( 65535), UINT16_C( 33458), UINT16_C( 34853), UINT16_C( 65535),
|
1359
|
+
UINT16_C( 51828), UINT16_C( 65535), UINT16_C( 48589), UINT16_C( 64832),
|
1360
|
+
UINT16_C( 65535), UINT16_C( 33130), UINT16_C( 34306), UINT16_C( 65535),
|
1361
|
+
UINT16_C( 65535), UINT16_C( 26317), UINT16_C( 60701), UINT16_C( 44984),
|
1362
|
+
UINT16_C( 53888), UINT16_C( 65535), UINT16_C( 47468), UINT16_C( 51595),
|
1363
|
+
UINT16_C( 65535), UINT16_C( 24057), UINT16_C( 65535), UINT16_C( 65535)) },
|
1364
|
+
{ simde_x_mm512_set_epu16(UINT16_C( 30682), UINT16_C( 30851), UINT16_C( 8660), UINT16_C( 19219),
|
1365
|
+
UINT16_C( 10963), UINT16_C( 474), UINT16_C( 23728), UINT16_C( 46528),
|
1366
|
+
UINT16_C( 63120), UINT16_C( 45881), UINT16_C( 63086), UINT16_C( 25197),
|
1367
|
+
UINT16_C( 2704), UINT16_C( 4513), UINT16_C( 59294), UINT16_C( 60752),
|
1368
|
+
UINT16_C( 50954), UINT16_C( 23266), UINT16_C( 27902), UINT16_C( 8814),
|
1369
|
+
UINT16_C( 4863), UINT16_C( 1260), UINT16_C( 11681), UINT16_C( 46962),
|
1370
|
+
UINT16_C( 62057), UINT16_C( 1167), UINT16_C( 44133), UINT16_C( 29723),
|
1371
|
+
UINT16_C( 20503), UINT16_C( 47951), UINT16_C( 6645), UINT16_C( 27511)),
|
1372
|
+
simde_x_mm512_set_epu16(UINT16_C( 15286), UINT16_C( 5686), UINT16_C( 62529), UINT16_C( 52414),
|
1373
|
+
UINT16_C( 64942), UINT16_C( 55157), UINT16_C( 1921), UINT16_C( 414),
|
1374
|
+
UINT16_C( 57075), UINT16_C( 38949), UINT16_C( 49837), UINT16_C( 16574),
|
1375
|
+
UINT16_C( 63519), UINT16_C( 21815), UINT16_C( 16534), UINT16_C( 5264),
|
1376
|
+
UINT16_C( 40611), UINT16_C( 7582), UINT16_C( 27508), UINT16_C( 40060),
|
1377
|
+
UINT16_C( 17332), UINT16_C( 48486), UINT16_C( 46457), UINT16_C( 3074),
|
1378
|
+
UINT16_C( 49520), UINT16_C( 35694), UINT16_C( 14820), UINT16_C( 26739),
|
1379
|
+
UINT16_C( 52931), UINT16_C( 30426), UINT16_C( 34639), UINT16_C( 60126)),
|
1380
|
+
simde_x_mm512_set_epu16(UINT16_C( 45968), UINT16_C( 36537), UINT16_C( 65535), UINT16_C( 65535),
|
1381
|
+
UINT16_C( 65535), UINT16_C( 55631), UINT16_C( 25649), UINT16_C( 46942),
|
1382
|
+
UINT16_C( 65535), UINT16_C( 65535), UINT16_C( 65535), UINT16_C( 41771),
|
1383
|
+
UINT16_C( 65535), UINT16_C( 26328), UINT16_C( 65535), UINT16_C( 65535),
|
1384
|
+
UINT16_C( 65535), UINT16_C( 30848), UINT16_C( 55410), UINT16_C( 48874),
|
1385
|
+
UINT16_C( 22195), UINT16_C( 49746), UINT16_C( 58138), UINT16_C( 50036),
|
1386
|
+
UINT16_C( 65535), UINT16_C( 36861), UINT16_C( 58953), UINT16_C( 56462),
|
1387
|
+
UINT16_C( 65535), UINT16_C( 65535), UINT16_C( 41284), UINT16_C( 65535)) },
|
1388
|
+
{ simde_x_mm512_set_epu16(UINT16_C( 20277), UINT16_C( 2901), UINT16_C( 9119), UINT16_C( 39166),
|
1389
|
+
UINT16_C( 42714), UINT16_C( 26596), UINT16_C( 65466), UINT16_C( 41724),
|
1390
|
+
UINT16_C( 43509), UINT16_C( 36161), UINT16_C( 14559), UINT16_C( 39814),
|
1391
|
+
UINT16_C( 39598), UINT16_C( 35810), UINT16_C( 32670), UINT16_C( 2206),
|
1392
|
+
UINT16_C( 28889), UINT16_C( 41636), UINT16_C( 48990), UINT16_C( 37294),
|
1393
|
+
UINT16_C( 39242), UINT16_C( 39778), UINT16_C( 6979), UINT16_C( 54232),
|
1394
|
+
UINT16_C( 47738), UINT16_C( 57923), UINT16_C( 37900), UINT16_C( 45798),
|
1395
|
+
UINT16_C( 44781), UINT16_C( 27960), UINT16_C( 1998), UINT16_C( 61149)),
|
1396
|
+
simde_x_mm512_set_epu16(UINT16_C( 20730), UINT16_C( 18080), UINT16_C( 51364), UINT16_C( 27968),
|
1397
|
+
UINT16_C( 47873), UINT16_C( 51993), UINT16_C( 18829), UINT16_C( 15054),
|
1398
|
+
UINT16_C( 50771), UINT16_C( 37023), UINT16_C( 39205), UINT16_C( 18252),
|
1399
|
+
UINT16_C( 53613), UINT16_C( 36736), UINT16_C( 53958), UINT16_C( 13137),
|
1400
|
+
UINT16_C( 43763), UINT16_C( 19789), UINT16_C( 2934), UINT16_C( 22986),
|
1401
|
+
UINT16_C( 46964), UINT16_C( 64986), UINT16_C( 13395), UINT16_C( 61287),
|
1402
|
+
UINT16_C( 61677), UINT16_C( 22301), UINT16_C( 41322), UINT16_C( 35063),
|
1403
|
+
UINT16_C( 22663), UINT16_C( 28062), UINT16_C( 45351), UINT16_C( 21097)),
|
1404
|
+
simde_x_mm512_set_epu16(UINT16_C( 41007), UINT16_C( 20981), UINT16_C( 60483), UINT16_C( 65535),
|
1405
|
+
UINT16_C( 65535), UINT16_C( 65535), UINT16_C( 65535), UINT16_C( 56778),
|
1406
|
+
UINT16_C( 65535), UINT16_C( 65535), UINT16_C( 53764), UINT16_C( 58066),
|
1407
|
+
UINT16_C( 65535), UINT16_C( 65535), UINT16_C( 65535), UINT16_C( 15343),
|
1408
|
+
UINT16_C( 65535), UINT16_C( 61425), UINT16_C( 51924), UINT16_C( 60280),
|
1409
|
+
UINT16_C( 65535), UINT16_C( 65535), UINT16_C( 20374), UINT16_C( 65535),
|
1410
|
+
UINT16_C( 65535), UINT16_C( 65535), UINT16_C( 65535), UINT16_C( 65535),
|
1411
|
+
UINT16_C( 65535), UINT16_C( 56022), UINT16_C( 47349), UINT16_C( 65535)) },
|
1412
|
+
{ simde_x_mm512_set_epu16(UINT16_C( 29192), UINT16_C( 8654), UINT16_C( 22850), UINT16_C( 62764),
|
1413
|
+
UINT16_C( 24193), UINT16_C( 41054), UINT16_C( 47201), UINT16_C( 29473),
|
1414
|
+
UINT16_C( 7514), UINT16_C( 21604), UINT16_C( 55170), UINT16_C( 17089),
|
1415
|
+
UINT16_C( 58910), UINT16_C( 18576), UINT16_C( 50942), UINT16_C( 19375),
|
1416
|
+
UINT16_C( 32394), UINT16_C( 6670), UINT16_C( 34291), UINT16_C( 10597),
|
1417
|
+
UINT16_C( 63848), UINT16_C( 24622), UINT16_C( 55141), UINT16_C( 33399),
|
1418
|
+
UINT16_C( 17676), UINT16_C( 53111), UINT16_C( 57678), UINT16_C( 53869),
|
1419
|
+
UINT16_C( 1069), UINT16_C( 35377), UINT16_C( 20392), UINT16_C( 6033)),
|
1420
|
+
simde_x_mm512_set_epu16(UINT16_C( 30110), UINT16_C( 5765), UINT16_C( 21533), UINT16_C( 32154),
|
1421
|
+
UINT16_C( 47788), UINT16_C( 4708), UINT16_C( 49450), UINT16_C( 15569),
|
1422
|
+
UINT16_C( 11433), UINT16_C( 48528), UINT16_C( 18868), UINT16_C( 49914),
|
1423
|
+
UINT16_C( 29591), UINT16_C( 10234), UINT16_C( 18676), UINT16_C( 18833),
|
1424
|
+
UINT16_C( 53298), UINT16_C( 44056), UINT16_C( 163), UINT16_C( 14043),
|
1425
|
+
UINT16_C( 52308), UINT16_C( 55462), UINT16_C( 1379), UINT16_C( 56593),
|
1426
|
+
UINT16_C( 40649), UINT16_C( 10209), UINT16_C( 62181), UINT16_C( 6865),
|
1427
|
+
UINT16_C( 33659), UINT16_C( 12643), UINT16_C( 58853), UINT16_C( 27590)),
|
1428
|
+
simde_x_mm512_set_epu16(UINT16_C( 59302), UINT16_C( 14419), UINT16_C( 44383), UINT16_C( 65535),
|
1429
|
+
UINT16_C( 65535), UINT16_C( 45762), UINT16_C( 65535), UINT16_C( 45042),
|
1430
|
+
UINT16_C( 18947), UINT16_C( 65535), UINT16_C( 65535), UINT16_C( 65535),
|
1431
|
+
UINT16_C( 65535), UINT16_C( 28810), UINT16_C( 65535), UINT16_C( 38208),
|
1432
|
+
UINT16_C( 65535), UINT16_C( 50726), UINT16_C( 34454), UINT16_C( 24640),
|
1433
|
+
UINT16_C( 65535), UINT16_C( 65535), UINT16_C( 56520), UINT16_C( 65535),
|
1434
|
+
UINT16_C( 58325), UINT16_C( 63320), UINT16_C( 65535), UINT16_C( 60734),
|
1435
|
+
UINT16_C( 34728), UINT16_C( 48020), UINT16_C( 65535), UINT16_C( 33623)) },
|
1436
|
+
{ simde_x_mm512_set_epu16(UINT16_C( 54408), UINT16_C( 44486), UINT16_C( 24517), UINT16_C( 51207),
|
1437
|
+
UINT16_C( 2791), UINT16_C( 45592), UINT16_C( 48586), UINT16_C( 36784),
|
1438
|
+
UINT16_C( 53369), UINT16_C( 43811), UINT16_C( 65046), UINT16_C( 44235),
|
1439
|
+
UINT16_C( 48681), UINT16_C( 21401), UINT16_C( 55417), UINT16_C( 5581),
|
1440
|
+
UINT16_C( 56410), UINT16_C( 42092), UINT16_C( 49678), UINT16_C( 22777),
|
1441
|
+
UINT16_C( 15839), UINT16_C( 59069), UINT16_C( 3836), UINT16_C( 55877),
|
1442
|
+
UINT16_C( 35316), UINT16_C( 40611), UINT16_C( 30925), UINT16_C( 38925),
|
1443
|
+
UINT16_C( 44290), UINT16_C( 48844), UINT16_C( 41388), UINT16_C( 24135)),
|
1444
|
+
simde_x_mm512_set_epu16(UINT16_C( 7663), UINT16_C( 4305), UINT16_C( 48670), UINT16_C( 39779),
|
1445
|
+
UINT16_C( 2052), UINT16_C( 40026), UINT16_C( 47264), UINT16_C( 7297),
|
1446
|
+
UINT16_C( 11022), UINT16_C( 64822), UINT16_C( 63292), UINT16_C( 56921),
|
1447
|
+
UINT16_C( 8160), UINT16_C( 61766), UINT16_C( 22014), UINT16_C( 41597),
|
1448
|
+
UINT16_C( 60919), UINT16_C( 45399), UINT16_C( 45462), UINT16_C( 35135),
|
1449
|
+
UINT16_C( 13486), UINT16_C( 42127), UINT16_C( 6466), UINT16_C( 5931),
|
1450
|
+
UINT16_C( 30448), UINT16_C( 27493), UINT16_C( 24921), UINT16_C( 23842),
|
1451
|
+
UINT16_C( 21170), UINT16_C( 62954), UINT16_C( 7914), UINT16_C( 35527)),
|
1452
|
+
simde_x_mm512_set_epu16(UINT16_C( 62071), UINT16_C( 48791), UINT16_C( 65535), UINT16_C( 65535),
|
1453
|
+
UINT16_C( 4843), UINT16_C( 65535), UINT16_C( 65535), UINT16_C( 44081),
|
1454
|
+
UINT16_C( 64391), UINT16_C( 65535), UINT16_C( 65535), UINT16_C( 65535),
|
1455
|
+
UINT16_C( 56841), UINT16_C( 65535), UINT16_C( 65535), UINT16_C( 47178),
|
1456
|
+
UINT16_C( 65535), UINT16_C( 65535), UINT16_C( 65535), UINT16_C( 57912),
|
1457
|
+
UINT16_C( 29325), UINT16_C( 65535), UINT16_C( 10302), UINT16_C( 61808),
|
1458
|
+
UINT16_C( 65535), UINT16_C( 65535), UINT16_C( 55846), UINT16_C( 62767),
|
1459
|
+
UINT16_C( 65460), UINT16_C( 65535), UINT16_C( 49302), UINT16_C( 59662)) },
|
1460
|
+
{ simde_x_mm512_set_epu16(UINT16_C( 61865), UINT16_C( 23426), UINT16_C( 1768), UINT16_C( 58636),
|
1461
|
+
UINT16_C( 57533), UINT16_C( 19108), UINT16_C( 59802), UINT16_C( 30792),
|
1462
|
+
UINT16_C( 61240), UINT16_C( 6209), UINT16_C( 32476), UINT16_C( 14300),
|
1463
|
+
UINT16_C( 7420), UINT16_C( 1985), UINT16_C( 25770), UINT16_C( 58800),
|
1464
|
+
UINT16_C( 51482), UINT16_C( 20894), UINT16_C( 680), UINT16_C( 29487),
|
1465
|
+
UINT16_C( 45202), UINT16_C( 20181), UINT16_C( 14712), UINT16_C( 17612),
|
1466
|
+
UINT16_C( 16683), UINT16_C( 1453), UINT16_C( 15990), UINT16_C( 36509),
|
1467
|
+
UINT16_C( 51737), UINT16_C( 56324), UINT16_C( 34493), UINT16_C( 17761)),
|
1468
|
+
simde_x_mm512_set_epu16(UINT16_C( 37550), UINT16_C( 51250), UINT16_C( 42874), UINT16_C( 8384),
|
1469
|
+
UINT16_C( 13698), UINT16_C( 33689), UINT16_C( 64372), UINT16_C( 20393),
|
1470
|
+
UINT16_C( 17692), UINT16_C( 65383), UINT16_C( 545), UINT16_C( 27220),
|
1471
|
+
UINT16_C( 18321), UINT16_C( 26532), UINT16_C( 40835), UINT16_C( 14036),
|
1472
|
+
UINT16_C( 3666), UINT16_C( 2040), UINT16_C( 61839), UINT16_C( 38748),
|
1473
|
+
UINT16_C( 62699), UINT16_C( 55831), UINT16_C( 23293), UINT16_C( 13208),
|
1474
|
+
UINT16_C( 60975), UINT16_C( 12632), UINT16_C( 13392), UINT16_C( 63703),
|
1475
|
+
UINT16_C( 41286), UINT16_C( 6117), UINT16_C( 32645), UINT16_C( 56152)),
|
1476
|
+
simde_x_mm512_set_epu16(UINT16_C( 65535), UINT16_C( 65535), UINT16_C( 44642), UINT16_C( 65535),
|
1477
|
+
UINT16_C( 65535), UINT16_C( 52797), UINT16_C( 65535), UINT16_C( 51185),
|
1478
|
+
UINT16_C( 65535), UINT16_C( 65535), UINT16_C( 33021), UINT16_C( 41520),
|
1479
|
+
UINT16_C( 25741), UINT16_C( 28517), UINT16_C( 65535), UINT16_C( 65535),
|
1480
|
+
UINT16_C( 55148), UINT16_C( 22934), UINT16_C( 62519), UINT16_C( 65535),
|
1481
|
+
UINT16_C( 65535), UINT16_C( 65535), UINT16_C( 38005), UINT16_C( 30820),
|
1482
|
+
UINT16_C( 65535), UINT16_C( 14085), UINT16_C( 29382), UINT16_C( 65535),
|
1483
|
+
UINT16_C( 65535), UINT16_C( 62441), UINT16_C( 65535), UINT16_C( 65535)) }
|
1484
|
+
};
|
1485
|
+
|
1486
|
+
for (size_t i = 0 ; i < (sizeof(test_vec) / sizeof(test_vec[0])); i++) {
|
1487
|
+
simde__m512i r = simde_mm512_adds_epu16(test_vec[i].a, test_vec[i].b);
|
1488
|
+
simde_assert_m512i_u16(r, ==, test_vec[i].r);
|
1489
|
+
}
|
1490
|
+
|
1491
|
+
return MUNIT_OK;
|
1492
|
+
}
|
1493
|
+
|
1494
|
+
static MunitResult
|
1495
|
+
test_simde_mm512_shuffle_epi8(const MunitParameter params[], void* data) {
|
1496
|
+
(void) params;
|
1497
|
+
(void) data;
|
1498
|
+
|
1499
|
+
const struct {
|
1500
|
+
simde__m512i a;
|
1501
|
+
simde__m512i b;
|
1502
|
+
simde__m512i r;
|
1503
|
+
} test_vec[8] = {
|
1504
|
+
{ simde_mm512_set_epi8(INT8_C( 56), INT8_C( -94), INT8_C( -41), INT8_C( -59),
|
1505
|
+
INT8_C( 40), INT8_C( 78), INT8_C( 93), INT8_C( 107),
|
1506
|
+
INT8_C( -47), INT8_C( 66), INT8_C( -8), INT8_C( -52),
|
1507
|
+
INT8_C( 50), INT8_C( 78), INT8_C( 13), INT8_C( 26),
|
1508
|
+
INT8_C( -33), INT8_C( 120), INT8_C( 67), INT8_C( -12),
|
1509
|
+
INT8_C( 80), INT8_C( 88), INT8_C( -65), INT8_C( 49),
|
1510
|
+
INT8_C( 28), INT8_C( 96), INT8_C( -99), INT8_C(-119),
|
1511
|
+
INT8_C( 126), INT8_C( 24), INT8_C( 35), INT8_C( 11),
|
1512
|
+
INT8_C( -43), INT8_C( -24), INT8_C( 1), INT8_C( -61),
|
1513
|
+
INT8_C( 101), INT8_C( 5), INT8_C( 67), INT8_C( -42),
|
1514
|
+
INT8_C( -46), INT8_C(-115), INT8_C(-105), INT8_C( -92),
|
1515
|
+
INT8_C( -3), INT8_C( -44), INT8_C( 13), INT8_C( -36),
|
1516
|
+
INT8_C( 110), INT8_C( -38), INT8_C( -48), INT8_C( 36),
|
1517
|
+
INT8_C( 117), INT8_C( -59), INT8_C( 109), INT8_C( -27),
|
1518
|
+
INT8_C( -62), INT8_C( 98), INT8_C(-121), INT8_C(-108),
|
1519
|
+
INT8_C( -7), INT8_C(-112), INT8_C( -52), INT8_C( -84)),
|
1520
|
+
simde_mm512_set_epi8(INT8_C( 34), INT8_C( 34), INT8_C( -71), INT8_C( -63),
|
1521
|
+
INT8_C( -34), INT8_C(-128), INT8_C( 113), INT8_C( -72),
|
1522
|
+
INT8_C( 86), INT8_C( -73), INT8_C( -43), INT8_C( 95),
|
1523
|
+
INT8_C( 3), INT8_C( 13), INT8_C( 19), INT8_C( -1),
|
1524
|
+
INT8_C( -54), INT8_C( 114), INT8_C( 27), INT8_C( -30),
|
1525
|
+
INT8_C( 52), INT8_C( -54), INT8_C( 78), INT8_C( 23),
|
1526
|
+
INT8_C( 71), INT8_C( 87), INT8_C( 107), INT8_C( -27),
|
1527
|
+
INT8_C( -35), INT8_C(-122), INT8_C( 40), INT8_C( 55),
|
1528
|
+
INT8_C( -2), INT8_C( 40), INT8_C( -63), INT8_C( 85),
|
1529
|
+
INT8_C( -25), INT8_C( -93), INT8_C( 25), INT8_C( 70),
|
1530
|
+
INT8_C( 117), INT8_C( 66), INT8_C( -79), INT8_C( 57),
|
1531
|
+
INT8_C(-115), INT8_C( -27), INT8_C( 59), INT8_C( 25),
|
1532
|
+
INT8_C( -6), INT8_C( 42), INT8_C( -27), INT8_C( -34),
|
1533
|
+
INT8_C( -16), INT8_C( 5), INT8_C( -55), INT8_C( 74),
|
1534
|
+
INT8_C( -29), INT8_C( 77), INT8_C( -17), INT8_C( 16),
|
1535
|
+
INT8_C( -98), INT8_C( -38), INT8_C( 116), INT8_C( -56)),
|
1536
|
+
simde_mm512_set_epi8(INT8_C( 78), INT8_C( 78), INT8_C( 0), INT8_C( 0),
|
1537
|
+
INT8_C( 0), INT8_C( 0), INT8_C( 13), INT8_C( 0),
|
1538
|
+
INT8_C( 66), INT8_C( 0), INT8_C( 0), INT8_C( 56),
|
1539
|
+
INT8_C( 50), INT8_C( -41), INT8_C( 50), INT8_C( 0),
|
1540
|
+
INT8_C( 0), INT8_C( 24), INT8_C( 80), INT8_C( 0),
|
1541
|
+
INT8_C(-119), INT8_C( 0), INT8_C( 120), INT8_C( 28),
|
1542
|
+
INT8_C( 28), INT8_C( 28), INT8_C( 80), INT8_C( 0),
|
1543
|
+
INT8_C( 0), INT8_C( 0), INT8_C( 49), INT8_C( 28),
|
1544
|
+
INT8_C( 0), INT8_C( -42), INT8_C( 0), INT8_C(-105),
|
1545
|
+
INT8_C( 0), INT8_C( 0), INT8_C( 67), INT8_C(-115),
|
1546
|
+
INT8_C(-105), INT8_C( -44), INT8_C( 0), INT8_C( 67),
|
1547
|
+
INT8_C( 0), INT8_C( 0), INT8_C( 101), INT8_C( 67),
|
1548
|
+
INT8_C( 0), INT8_C( -59), INT8_C( 0), INT8_C( 0),
|
1549
|
+
INT8_C( 0), INT8_C(-121), INT8_C( 0), INT8_C( -59),
|
1550
|
+
INT8_C( 0), INT8_C( -48), INT8_C( 0), INT8_C( -84),
|
1551
|
+
INT8_C( 0), INT8_C( 0), INT8_C(-108), INT8_C( 0)) },
|
1552
|
+
{ simde_mm512_set_epi8(INT8_C( -75), INT8_C(-123), INT8_C( -44), INT8_C( -97),
|
1553
|
+
INT8_C( 61), INT8_C(-112), INT8_C( 109), INT8_C( 27),
|
1554
|
+
INT8_C( -9), INT8_C( -31), INT8_C(-111), INT8_C( -59),
|
1555
|
+
INT8_C( 94), INT8_C( 110), INT8_C( 31), INT8_C( 50),
|
1556
|
+
INT8_C( -86), INT8_C( 24), INT8_C( 91), INT8_C(-105),
|
1557
|
+
INT8_C( 39), INT8_C( 25), INT8_C( -65), INT8_C( 69),
|
1558
|
+
INT8_C( -59), INT8_C( -57), INT8_C( -98), INT8_C( 26),
|
1559
|
+
INT8_C( -35), INT8_C( -2), INT8_C( 114), INT8_C( -51),
|
1560
|
+
INT8_C( -16), INT8_C( 101), INT8_C( -92), INT8_C( 65),
|
1561
|
+
INT8_C( -88), INT8_C( 19), INT8_C(-102), INT8_C( -51),
|
1562
|
+
INT8_C( -94), INT8_C( -30), INT8_C( 60), INT8_C( -9),
|
1563
|
+
INT8_C( 4), INT8_C( -93), INT8_C( 110), INT8_C(-102),
|
1564
|
+
INT8_C( 109), INT8_C( 1), INT8_C( 113), INT8_C( 114),
|
1565
|
+
INT8_C( 100), INT8_C( 80), INT8_C( 18), INT8_C( -7),
|
1566
|
+
INT8_C( -87), INT8_C( 0), INT8_C( -55), INT8_C( 37),
|
1567
|
+
INT8_C( 13), INT8_C( 86), INT8_C(-114), INT8_C(-125)),
|
1568
|
+
simde_mm512_set_epi8(INT8_C( 18), INT8_C( 11), INT8_C( 73), INT8_C( 57),
|
1569
|
+
INT8_C( -54), INT8_C( 9), INT8_C( 69), INT8_C( -45),
|
1570
|
+
INT8_C( 71), INT8_C( -6), INT8_C( -68), INT8_C( -8),
|
1571
|
+
INT8_C( 14), INT8_C( -27), INT8_C( 84), INT8_C( -90),
|
1572
|
+
INT8_C( -10), INT8_C( -81), INT8_C( 77), INT8_C(-113),
|
1573
|
+
INT8_C( 32), INT8_C( 17), INT8_C( 62), INT8_C( -18),
|
1574
|
+
INT8_C( 124), INT8_C( -42), INT8_C( -52), INT8_C(-109),
|
1575
|
+
INT8_C( -19), INT8_C( 30), INT8_C( -51), INT8_C(-111),
|
1576
|
+
INT8_C( 100), INT8_C( 63), INT8_C( -80), INT8_C(-126),
|
1577
|
+
INT8_C( 3), INT8_C( 119), INT8_C( 38), INT8_C( -44),
|
1578
|
+
INT8_C( -48), INT8_C( -43), INT8_C( 6), INT8_C(-113),
|
1579
|
+
INT8_C( -5), INT8_C( -18), INT8_C( 58), INT8_C( 77),
|
1580
|
+
INT8_C( -49), INT8_C(-107), INT8_C( -77), INT8_C( 119),
|
1581
|
+
INT8_C( -6), INT8_C( 92), INT8_C(-122), INT8_C( 43),
|
1582
|
+
INT8_C( 85), INT8_C(-111), INT8_C( -15), INT8_C( 90),
|
1583
|
+
INT8_C(-104), INT8_C( 31), INT8_C( -4), INT8_C( 57)),
|
1584
|
+
simde_mm512_set_epi8(INT8_C( 110), INT8_C( 61), INT8_C( 109), INT8_C( 109),
|
1585
|
+
INT8_C( 0), INT8_C( 109), INT8_C(-111), INT8_C( 0),
|
1586
|
+
INT8_C( -9), INT8_C( 0), INT8_C( 0), INT8_C( 0),
|
1587
|
+
INT8_C(-123), INT8_C( 0), INT8_C( -59), INT8_C( 0),
|
1588
|
+
INT8_C( 0), INT8_C( 0), INT8_C( 91), INT8_C( 0),
|
1589
|
+
INT8_C( -51), INT8_C( 114), INT8_C( 24), INT8_C( 0),
|
1590
|
+
INT8_C(-105), INT8_C( 0), INT8_C( 0), INT8_C( 0),
|
1591
|
+
INT8_C( 0), INT8_C( 24), INT8_C( 0), INT8_C( 0),
|
1592
|
+
INT8_C( -9), INT8_C( -16), INT8_C( 0), INT8_C( 0),
|
1593
|
+
INT8_C( 4), INT8_C( -94), INT8_C( -30), INT8_C( 0),
|
1594
|
+
INT8_C( 0), INT8_C( 0), INT8_C( -30), INT8_C( 0),
|
1595
|
+
INT8_C( 0), INT8_C( 0), INT8_C( 19), INT8_C( -92),
|
1596
|
+
INT8_C( 0), INT8_C( 0), INT8_C( 0), INT8_C( -87),
|
1597
|
+
INT8_C( 0), INT8_C( 114), INT8_C( 0), INT8_C( 100),
|
1598
|
+
INT8_C( -55), INT8_C( 0), INT8_C( 0), INT8_C( 80),
|
1599
|
+
INT8_C( 0), INT8_C( 109), INT8_C( 0), INT8_C( 18)) },
|
1600
|
+
{ simde_mm512_set_epi8(INT8_C( -54), INT8_C( 53), INT8_C( 35), INT8_C( 51),
|
1601
|
+
INT8_C( 24), INT8_C( 100), INT8_C( 80), INT8_C( 7),
|
1602
|
+
INT8_C( 54), INT8_C( 114), INT8_C( -42), INT8_C( -2),
|
1603
|
+
INT8_C( 18), INT8_C( 100), INT8_C( 26), INT8_C( -68),
|
1604
|
+
INT8_C( 82), INT8_C( -30), INT8_C( -4), INT8_C( 110),
|
1605
|
+
INT8_C( 24), INT8_C( 88), INT8_C(-100), INT8_C(-120),
|
1606
|
+
INT8_C( -17), INT8_C(-109), INT8_C( 92), INT8_C(-105),
|
1607
|
+
INT8_C( -20), INT8_C( 34), INT8_C( 98), INT8_C( -17),
|
1608
|
+
INT8_C( 2), INT8_C( 6), INT8_C( 37), INT8_C( -85),
|
1609
|
+
INT8_C( 118), INT8_C( 28), INT8_C( 34), INT8_C( 117),
|
1610
|
+
INT8_C( 77), INT8_C( -32), INT8_C( 25), INT8_C( -74),
|
1611
|
+
INT8_C( 93), INT8_C(-108), INT8_C( 3), INT8_C( -90),
|
1612
|
+
INT8_C( 13), INT8_C( -29), INT8_C( -88), INT8_C( 116),
|
1613
|
+
INT8_C( 14), INT8_C( -29), INT8_C( 30), INT8_C( -26),
|
1614
|
+
INT8_C(-115), INT8_C( -36), INT8_C( 94), INT8_C(-125),
|
1615
|
+
INT8_C( 118), INT8_C( 125), INT8_C( -91), INT8_C( 31)),
|
1616
|
+
simde_mm512_set_epi8(INT8_C( -74), INT8_C( -13), INT8_C( -87), INT8_C( -10),
|
1617
|
+
INT8_C( 21), INT8_C( 49), INT8_C( -64), INT8_C( 52),
|
1618
|
+
INT8_C( -97), INT8_C(-103), INT8_C(-127), INT8_C( 53),
|
1619
|
+
INT8_C( 99), INT8_C( 80), INT8_C( 55), INT8_C( 111),
|
1620
|
+
INT8_C( 61), INT8_C( -93), INT8_C( -87), INT8_C( 81),
|
1621
|
+
INT8_C( 108), INT8_C( 89), INT8_C( 63), INT8_C(-109),
|
1622
|
+
INT8_C( -47), INT8_C( -32), INT8_C( 105), INT8_C( 91),
|
1623
|
+
INT8_C( 88), INT8_C( 85), INT8_C( -96), INT8_C( 88),
|
1624
|
+
INT8_C( -85), INT8_C( 3), INT8_C( 124), INT8_C( -33),
|
1625
|
+
INT8_C( -21), INT8_C( -7), INT8_C( -31), INT8_C(-126),
|
1626
|
+
INT8_C( 3), INT8_C( -17), INT8_C( 40), INT8_C( 5),
|
1627
|
+
INT8_C( 126), INT8_C( -60), INT8_C( -91), INT8_C(-112),
|
1628
|
+
INT8_C( 88), INT8_C( 11), INT8_C( 100), INT8_C( 114),
|
1629
|
+
INT8_C( 112), INT8_C( -53), INT8_C( 89), INT8_C( 78),
|
1630
|
+
INT8_C( 115), INT8_C( 117), INT8_C( -33), INT8_C( 14),
|
1631
|
+
INT8_C( -42), INT8_C( -15), INT8_C( 80), INT8_C( -46)),
|
1632
|
+
simde_mm512_set_epi8(INT8_C( 0), INT8_C( 0), INT8_C( 0), INT8_C( 0),
|
1633
|
+
INT8_C( -42), INT8_C( 26), INT8_C( 0), INT8_C( -2),
|
1634
|
+
INT8_C( 0), INT8_C( 0), INT8_C( 0), INT8_C( -42),
|
1635
|
+
INT8_C( 18), INT8_C( -68), INT8_C( 54), INT8_C( -54),
|
1636
|
+
INT8_C( -4), INT8_C( 0), INT8_C( 0), INT8_C( 98),
|
1637
|
+
INT8_C( 110), INT8_C(-100), INT8_C( 82), INT8_C( 0),
|
1638
|
+
INT8_C( 0), INT8_C( 0), INT8_C(-100), INT8_C( 24),
|
1639
|
+
INT8_C(-120), INT8_C( 92), INT8_C( 0), INT8_C(-120),
|
1640
|
+
INT8_C( 0), INT8_C( 93), INT8_C( -85), INT8_C( 0),
|
1641
|
+
INT8_C( 0), INT8_C( 0), INT8_C( 0), INT8_C( 0),
|
1642
|
+
INT8_C( 93), INT8_C( 0), INT8_C( 117), INT8_C( 25),
|
1643
|
+
INT8_C( 6), INT8_C( 0), INT8_C( 0), INT8_C( 0),
|
1644
|
+
INT8_C( -26), INT8_C( 14), INT8_C(-125), INT8_C( 125),
|
1645
|
+
INT8_C( 31), INT8_C( 0), INT8_C( 30), INT8_C( -29),
|
1646
|
+
INT8_C( 118), INT8_C( 94), INT8_C( 0), INT8_C( -29),
|
1647
|
+
INT8_C( 0), INT8_C( 0), INT8_C( 31), INT8_C( 0)) },
|
1648
|
+
{ simde_mm512_set_epi8(INT8_C(-109), INT8_C( 14), INT8_C( -91), INT8_C( -44),
|
1649
|
+
INT8_C( 79), INT8_C( -4), INT8_C( 88), INT8_C( 49),
|
1650
|
+
INT8_C( -95), INT8_C( -92), INT8_C(-116), INT8_C( 8),
|
1651
|
+
INT8_C( 25), INT8_C( 30), INT8_C( -55), INT8_C(-120),
|
1652
|
+
INT8_C( -58), INT8_C( -84), INT8_C( 99), INT8_C( -92),
|
1653
|
+
INT8_C( -29), INT8_C( -47), INT8_C( 42), INT8_C( -56),
|
1654
|
+
INT8_C( 109), INT8_C( -71), INT8_C( -73), INT8_C( -30),
|
1655
|
+
INT8_C( -15), INT8_C(-106), INT8_C( -91), INT8_C( -57),
|
1656
|
+
INT8_C( 51), INT8_C( -8), INT8_C( 55), INT8_C( 36),
|
1657
|
+
INT8_C( -55), INT8_C(-103), INT8_C( 51), INT8_C( -28),
|
1658
|
+
INT8_C( 70), INT8_C( 114), INT8_C( -3), INT8_C( 49),
|
1659
|
+
INT8_C( 23), INT8_C( -28), INT8_C( -87), INT8_C( 57),
|
1660
|
+
INT8_C( 28), INT8_C( -12), INT8_C( -51), INT8_C( 37),
|
1661
|
+
INT8_C( 29), INT8_C( -58), INT8_C( -69), INT8_C( 30),
|
1662
|
+
INT8_C( 43), INT8_C( -65), INT8_C( -2), INT8_C( -83),
|
1663
|
+
INT8_C( -27), INT8_C(-122), INT8_C( 77), INT8_C( 47)),
|
1664
|
+
simde_mm512_set_epi8(INT8_C(-116), INT8_C(-127), INT8_C( -95), INT8_C( -97),
|
1665
|
+
INT8_C( -78), INT8_C( -53), INT8_C( -36), INT8_C( 62),
|
1666
|
+
INT8_C( 63), INT8_C( 28), INT8_C( -37), INT8_C( 40),
|
1667
|
+
INT8_C( -14), INT8_C( 2), INT8_C( -65), INT8_C( -67),
|
1668
|
+
INT8_C( 79), INT8_C( 51), INT8_C( -51), INT8_C( -64),
|
1669
|
+
INT8_C( -40), INT8_C(-102), INT8_C(-107), INT8_C( 82),
|
1670
|
+
INT8_C( 20), INT8_C( 54), INT8_C( 66), INT8_C( 7),
|
1671
|
+
INT8_C( 33), INT8_C( 108), INT8_C( -88), INT8_C( 69),
|
1672
|
+
INT8_C( 98), INT8_C( 43), INT8_C( 25), INT8_C( 58),
|
1673
|
+
INT8_C( 117), INT8_C( -34), INT8_C( -70), INT8_C( 3),
|
1674
|
+
INT8_C( 1), INT8_C( 100), INT8_C( 3), INT8_C( 14),
|
1675
|
+
INT8_C( 117), INT8_C( -91), INT8_C( -89), INT8_C( 66),
|
1676
|
+
INT8_C( 32), INT8_C( -35), INT8_C( 104), INT8_C( 65),
|
1677
|
+
INT8_C(-100), INT8_C( 27), INT8_C( 42), INT8_C( 91),
|
1678
|
+
INT8_C( -47), INT8_C( 39), INT8_C( -65), INT8_C(-124),
|
1679
|
+
INT8_C( -84), INT8_C( -95), INT8_C( -46), INT8_C(-113)),
|
1680
|
+
simde_mm512_set_epi8(INT8_C( 0), INT8_C( 0), INT8_C( 0), INT8_C( 0),
|
1681
|
+
INT8_C( 0), INT8_C( 0), INT8_C( 0), INT8_C( 14),
|
1682
|
+
INT8_C(-109), INT8_C( -44), INT8_C( 0), INT8_C( 49),
|
1683
|
+
INT8_C( 0), INT8_C( 30), INT8_C( 0), INT8_C( 0),
|
1684
|
+
INT8_C( -58), INT8_C( -15), INT8_C( 0), INT8_C( 0),
|
1685
|
+
INT8_C( 0), INT8_C( 0), INT8_C( 0), INT8_C(-106),
|
1686
|
+
INT8_C( -30), INT8_C( -71), INT8_C(-106), INT8_C( 109),
|
1687
|
+
INT8_C( -91), INT8_C( -92), INT8_C( 0), INT8_C( -73),
|
1688
|
+
INT8_C( -28), INT8_C( -55), INT8_C( 51), INT8_C(-103),
|
1689
|
+
INT8_C( -3), INT8_C( 0), INT8_C( 0), INT8_C( 23),
|
1690
|
+
INT8_C( -87), INT8_C( 49), INT8_C( 23), INT8_C( -8),
|
1691
|
+
INT8_C( -3), INT8_C( 0), INT8_C( 0), INT8_C( -28),
|
1692
|
+
INT8_C( 47), INT8_C( 0), INT8_C( 30), INT8_C( 77),
|
1693
|
+
INT8_C( 0), INT8_C( 29), INT8_C( -58), INT8_C( 29),
|
1694
|
+
INT8_C( 0), INT8_C( 43), INT8_C( 0), INT8_C( 0),
|
1695
|
+
INT8_C( 0), INT8_C( 0), INT8_C( 0), INT8_C( 0)) },
|
1696
|
+
{ simde_mm512_set_epi8(INT8_C(-119), INT8_C( 55), INT8_C( -13), INT8_C(-118),
|
1697
|
+
INT8_C( 5), INT8_C( 14), INT8_C(-103), INT8_C( 58),
|
1698
|
+
INT8_C( 109), INT8_C(-113), INT8_C( -44), INT8_C( 126),
|
1699
|
+
INT8_C( 70), INT8_C(-126), INT8_C( 24), INT8_C(-117),
|
1700
|
+
INT8_C( 80), INT8_C( 25), INT8_C( 64), INT8_C( -89),
|
1701
|
+
INT8_C( 60), INT8_C( 5), INT8_C(-119), INT8_C( -29),
|
1702
|
+
INT8_C( -95), INT8_C( -26), INT8_C( 25), INT8_C( -65),
|
1703
|
+
INT8_C( -81), INT8_C( -84), INT8_C( 46), INT8_C( 62),
|
1704
|
+
INT8_C( -25), INT8_C(-116), INT8_C(-126), INT8_C(-103),
|
1705
|
+
INT8_C( 126), INT8_C( -39), INT8_C( 111), INT8_C( -10),
|
1706
|
+
INT8_C( -48), INT8_C( 122), INT8_C( -86), INT8_C( -25),
|
1707
|
+
INT8_C( 35), INT8_C( -4), INT8_C( -7), INT8_C( 76),
|
1708
|
+
INT8_C(-116), INT8_C( 1), INT8_C( 126), INT8_C( -30),
|
1709
|
+
INT8_C( -11), INT8_C( 82), INT8_C( 81), INT8_C( 27),
|
1710
|
+
INT8_C( -15), INT8_C( -14), INT8_C( 56), INT8_C( 60),
|
1711
|
+
INT8_C( -29), INT8_C( -65), INT8_C( -35), INT8_C( 21)),
|
1712
|
+
simde_mm512_set_epi8(INT8_C( 125), INT8_C( -43), INT8_C( -42), INT8_C( -51),
|
1713
|
+
INT8_C( -36), INT8_C( 38), INT8_C( 42), INT8_C( 18),
|
1714
|
+
INT8_C( 24), INT8_C( -25), INT8_C( 19), INT8_C( 15),
|
1715
|
+
INT8_C(-119), INT8_C(-124), INT8_C( 104), INT8_C( -93),
|
1716
|
+
INT8_C( 22), INT8_C( -16), INT8_C( 31), INT8_C( 116),
|
1717
|
+
INT8_C( -99), INT8_C( 45), INT8_C( -54), INT8_C( 50),
|
1718
|
+
INT8_C( -72), INT8_C(-107), INT8_C( 48), INT8_C( 118),
|
1719
|
+
INT8_C( -68), INT8_C( -15), INT8_C(-108), INT8_C( -29),
|
1720
|
+
INT8_C( 118), INT8_C( 96), INT8_C( -51), INT8_C( 107),
|
1721
|
+
INT8_C( -23), INT8_C( -97), INT8_C( -6), INT8_C( 91),
|
1722
|
+
INT8_C( -57), INT8_C( -67), INT8_C(-105), INT8_C( 68),
|
1723
|
+
INT8_C( -50), INT8_C( 16), INT8_C( -86), INT8_C( 6),
|
1724
|
+
INT8_C( 55), INT8_C(-118), INT8_C( 112), INT8_C( 125),
|
1725
|
+
INT8_C( 92), INT8_C( 91), INT8_C( -27), INT8_C( 53),
|
1726
|
+
INT8_C( 28), INT8_C( -66), INT8_C( -69), INT8_C(-117),
|
1727
|
+
INT8_C( -30), INT8_C(-106), INT8_C( 1), INT8_C( 95)),
|
1728
|
+
simde_mm512_set_epi8(INT8_C( -13), INT8_C( 0), INT8_C( 0), INT8_C( 0),
|
1729
|
+
INT8_C( 0), INT8_C(-113), INT8_C( 14), INT8_C(-126),
|
1730
|
+
INT8_C( 58), INT8_C( 0), INT8_C( 70), INT8_C(-119),
|
1731
|
+
INT8_C( 0), INT8_C( 0), INT8_C( 58), INT8_C( 0),
|
1732
|
+
INT8_C( -26), INT8_C( 0), INT8_C( 80), INT8_C( -65),
|
1733
|
+
INT8_C( 0), INT8_C( 64), INT8_C( 0), INT8_C( -84),
|
1734
|
+
INT8_C( 0), INT8_C( 0), INT8_C( 62), INT8_C( -26),
|
1735
|
+
INT8_C( 0), INT8_C( 0), INT8_C( 0), INT8_C( 0),
|
1736
|
+
INT8_C( 122), INT8_C( 76), INT8_C( 0), INT8_C( 126),
|
1737
|
+
INT8_C( 0), INT8_C( 0), INT8_C( 0), INT8_C( 126),
|
1738
|
+
INT8_C( 0), INT8_C( 0), INT8_C( 0), INT8_C( -25),
|
1739
|
+
INT8_C( 0), INT8_C( 76), INT8_C( 0), INT8_C( 122),
|
1740
|
+
INT8_C( -15), INT8_C( 0), INT8_C( 21), INT8_C( 126),
|
1741
|
+
INT8_C( -30), INT8_C( -11), INT8_C( 0), INT8_C( 56),
|
1742
|
+
INT8_C( -30), INT8_C( 0), INT8_C( 0), INT8_C( 0),
|
1743
|
+
INT8_C( 0), INT8_C( 0), INT8_C( -35), INT8_C(-116)) },
|
1744
|
+
{ simde_mm512_set_epi8(INT8_C( 18), INT8_C(-124), INT8_C( -6), INT8_C( -41),
|
1745
|
+
INT8_C(-109), INT8_C( 19), INT8_C( 47), INT8_C( 73),
|
1746
|
+
INT8_C( -58), INT8_C( -50), INT8_C( 73), INT8_C( 110),
|
1747
|
+
INT8_C( 56), INT8_C( -30), INT8_C( -79), INT8_C( 123),
|
1748
|
+
INT8_C( 77), INT8_C( 62), INT8_C( -28), INT8_C( 45),
|
1749
|
+
INT8_C( -95), INT8_C( 12), INT8_C( 53), INT8_C( 75),
|
1750
|
+
INT8_C( 66), INT8_C( -89), INT8_C( 46), INT8_C( -47),
|
1751
|
+
INT8_C( 6), INT8_C( 4), INT8_C( 112), INT8_C( -34),
|
1752
|
+
INT8_C( 121), INT8_C( -3), INT8_C(-102), INT8_C(-115),
|
1753
|
+
INT8_C( -12), INT8_C( 80), INT8_C( 3), INT8_C( 56),
|
1754
|
+
INT8_C( 85), INT8_C( -43), INT8_C( -93), INT8_C( 34),
|
1755
|
+
INT8_C( -58), INT8_C(-101), INT8_C( 51), INT8_C( 1),
|
1756
|
+
INT8_C( -18), INT8_C( -90), INT8_C( -71), INT8_C( 74),
|
1757
|
+
INT8_C( -5), INT8_C(-113), INT8_C( 71), INT8_C( 61),
|
1758
|
+
INT8_C( 92), INT8_C( 73), INT8_C( 116), INT8_C( 110),
|
1759
|
+
INT8_C(-117), INT8_C( 96), INT8_C( -77), INT8_C( 45)),
|
1760
|
+
simde_mm512_set_epi8(INT8_C( 52), INT8_C( -84), INT8_C( 103), INT8_C(-105),
|
1761
|
+
INT8_C( -57), INT8_C( 17), INT8_C(-110), INT8_C(-113),
|
1762
|
+
INT8_C( 56), INT8_C( 125), INT8_C( 56), INT8_C( -88),
|
1763
|
+
INT8_C( -31), INT8_C( 119), INT8_C( -86), INT8_C( 114),
|
1764
|
+
INT8_C( -85), INT8_C( 14), INT8_C( 60), INT8_C( 84),
|
1765
|
+
INT8_C( -61), INT8_C(-111), INT8_C( 74), INT8_C( 113),
|
1766
|
+
INT8_C( 13), INT8_C( -89), INT8_C(-114), INT8_C( -79),
|
1767
|
+
INT8_C( -34), INT8_C( -73), INT8_C( -9), INT8_C(-108),
|
1768
|
+
INT8_C( 93), INT8_C( -78), INT8_C( -1), INT8_C(-102),
|
1769
|
+
INT8_C( 12), INT8_C( 117), INT8_C( 80), INT8_C( 44),
|
1770
|
+
INT8_C( 29), INT8_C( 18), INT8_C( 91), INT8_C( -23),
|
1771
|
+
INT8_C( 110), INT8_C(-126), INT8_C( -71), INT8_C( 65),
|
1772
|
+
INT8_C( -76), INT8_C( 85), INT8_C( 93), INT8_C( -86),
|
1773
|
+
INT8_C(-123), INT8_C(-115), INT8_C(-105), INT8_C( 75),
|
1774
|
+
INT8_C( 45), INT8_C( 22), INT8_C( 73), INT8_C( 74),
|
1775
|
+
INT8_C( 107), INT8_C( -60), INT8_C( -28), INT8_C( -57)),
|
1776
|
+
simde_mm512_set_epi8(INT8_C( 110), INT8_C( 0), INT8_C( -58), INT8_C( 0),
|
1777
|
+
INT8_C( 0), INT8_C( -79), INT8_C( 0), INT8_C( 0),
|
1778
|
+
INT8_C( 73), INT8_C( -6), INT8_C( 73), INT8_C( 0),
|
1779
|
+
INT8_C( 0), INT8_C( -58), INT8_C( 0), INT8_C( -30),
|
1780
|
+
INT8_C( 0), INT8_C( 62), INT8_C( 45), INT8_C( -47),
|
1781
|
+
INT8_C( 0), INT8_C( 0), INT8_C( 12), INT8_C( 112),
|
1782
|
+
INT8_C( -28), INT8_C( 0), INT8_C( 0), INT8_C( 0),
|
1783
|
+
INT8_C( 0), INT8_C( 0), INT8_C( 0), INT8_C( 0),
|
1784
|
+
INT8_C(-102), INT8_C( 0), INT8_C( 0), INT8_C( 0),
|
1785
|
+
INT8_C(-115), INT8_C( -93), INT8_C( 1), INT8_C(-115),
|
1786
|
+
INT8_C(-102), INT8_C(-101), INT8_C( -12), INT8_C( 0),
|
1787
|
+
INT8_C( -3), INT8_C( 0), INT8_C( 0), INT8_C( 51),
|
1788
|
+
INT8_C( 0), INT8_C( 116), INT8_C( -71), INT8_C( 0),
|
1789
|
+
INT8_C( 0), INT8_C( 0), INT8_C( 0), INT8_C( -5),
|
1790
|
+
INT8_C( -71), INT8_C( 73), INT8_C( 71), INT8_C(-113),
|
1791
|
+
INT8_C( -5), INT8_C( 0), INT8_C( 0), INT8_C( 0)) },
|
1792
|
+
{ simde_mm512_set_epi8(INT8_C( 4), INT8_C( -30), INT8_C( -68), INT8_C( 57),
|
1793
|
+
INT8_C( 73), INT8_C( 25), INT8_C( -45), INT8_C( 112),
|
1794
|
+
INT8_C( 41), INT8_C( 41), INT8_C( -56), INT8_C( -93),
|
1795
|
+
INT8_C( 29), INT8_C( 99), INT8_C( 15), INT8_C( 122),
|
1796
|
+
INT8_C( 74), INT8_C( 0), INT8_C( 89), INT8_C( 61),
|
1797
|
+
INT8_C( 124), INT8_C( 36), INT8_C( -87), INT8_C( -25),
|
1798
|
+
INT8_C( 42), INT8_C(-125), INT8_C( -87), INT8_C( 69),
|
1799
|
+
INT8_C( 81), INT8_C( 4), INT8_C( 55), INT8_C( 107),
|
1800
|
+
INT8_C( 0), INT8_C( -7), INT8_C( 37), INT8_C( -15),
|
1801
|
+
INT8_C( 117), INT8_C( 9), INT8_C( -27), INT8_C( 11),
|
1802
|
+
INT8_C( 16), INT8_C( 87), INT8_C( 119), INT8_C(-107),
|
1803
|
+
INT8_C( -22), INT8_C( 27), INT8_C( -86), INT8_C( -63),
|
1804
|
+
INT8_C( 90), INT8_C( -44), INT8_C(-113), INT8_C(-126),
|
1805
|
+
INT8_C( -75), INT8_C( 67), INT8_C( 88), INT8_C( 105),
|
1806
|
+
INT8_C( 80), INT8_C( 7), INT8_C( 66), INT8_C( 126),
|
1807
|
+
INT8_C( 17), INT8_C( -20), INT8_C( -91), INT8_C( -99)),
|
1808
|
+
simde_mm512_set_epi8(INT8_C( 123), INT8_C( 117), INT8_C( 18), INT8_C( 2),
|
1809
|
+
INT8_C(-105), INT8_C( -51), INT8_C( -9), INT8_C( 72),
|
1810
|
+
INT8_C( 69), INT8_C(-116), INT8_C( 95), INT8_C(-110),
|
1811
|
+
INT8_C( -32), INT8_C( 110), INT8_C( -8), INT8_C( 85),
|
1812
|
+
INT8_C( -41), INT8_C( 80), INT8_C( -44), INT8_C( 110),
|
1813
|
+
INT8_C( -28), INT8_C( 116), INT8_C( 41), INT8_C( -31),
|
1814
|
+
INT8_C( 12), INT8_C( 40), INT8_C( 5), INT8_C( 1),
|
1815
|
+
INT8_C( -14), INT8_C( 66), INT8_C( -95), INT8_C( 106),
|
1816
|
+
INT8_C( 66), INT8_C( -91), INT8_C( -20), INT8_C(-109),
|
1817
|
+
INT8_C( -46), INT8_C( 41), INT8_C( 82), INT8_C( -61),
|
1818
|
+
INT8_C( 2), INT8_C( 3), INT8_C( 62), INT8_C( -90),
|
1819
|
+
INT8_C( 99), INT8_C( -54), INT8_C( -28), INT8_C( -21),
|
1820
|
+
INT8_C( 126), INT8_C( 115), INT8_C( -46), INT8_C( 76),
|
1821
|
+
INT8_C( -43), INT8_C( 46), INT8_C( 107), INT8_C( 75),
|
1822
|
+
INT8_C( -93), INT8_C( 67), INT8_C( -37), INT8_C( 4),
|
1823
|
+
INT8_C(-127), INT8_C( -50), INT8_C( -26), INT8_C( 99)),
|
1824
|
+
simde_mm512_set_epi8(INT8_C( 73), INT8_C( -56), INT8_C( 99), INT8_C( 99),
|
1825
|
+
INT8_C( 0), INT8_C( 0), INT8_C( 0), INT8_C( 112),
|
1826
|
+
INT8_C( -56), INT8_C( 0), INT8_C( 4), INT8_C( 0),
|
1827
|
+
INT8_C( 0), INT8_C( -30), INT8_C( 0), INT8_C( -56),
|
1828
|
+
INT8_C( 0), INT8_C( 107), INT8_C( 0), INT8_C( 0),
|
1829
|
+
INT8_C( 0), INT8_C( 69), INT8_C( -87), INT8_C( 0),
|
1830
|
+
INT8_C( 61), INT8_C( -25), INT8_C( -87), INT8_C( 55),
|
1831
|
+
INT8_C( 0), INT8_C( 4), INT8_C( 0), INT8_C( 36),
|
1832
|
+
INT8_C( 27), INT8_C( 0), INT8_C( 0), INT8_C( 0),
|
1833
|
+
INT8_C( 0), INT8_C( -27), INT8_C( 27), INT8_C( 0),
|
1834
|
+
INT8_C( 27), INT8_C( -22), INT8_C( -7), INT8_C( 0),
|
1835
|
+
INT8_C( -22), INT8_C( 0), INT8_C( 0), INT8_C( 0),
|
1836
|
+
INT8_C( -44), INT8_C( 17), INT8_C( 0), INT8_C(-126),
|
1837
|
+
INT8_C( 0), INT8_C( -44), INT8_C( -75), INT8_C( -75),
|
1838
|
+
INT8_C( 0), INT8_C( 17), INT8_C( 0), INT8_C( 126),
|
1839
|
+
INT8_C( 0), INT8_C( 0), INT8_C( 0), INT8_C( 17)) },
|
1840
|
+
{ simde_mm512_set_epi8(INT8_C( 56), INT8_C( 24), INT8_C( -33), INT8_C( 82),
|
1841
|
+
INT8_C( 72), INT8_C( 63), INT8_C(-114), INT8_C( 14),
|
1842
|
+
INT8_C( 2), INT8_C( 71), INT8_C( -31), INT8_C( -46),
|
1843
|
+
INT8_C( 64), INT8_C( -11), INT8_C( 35), INT8_C( -7),
|
1844
|
+
INT8_C( -78), INT8_C( 125), INT8_C( -28), INT8_C( -59),
|
1845
|
+
INT8_C( 6), INT8_C(-127), INT8_C( 34), INT8_C( 64),
|
1846
|
+
INT8_C( 88), INT8_C( -88), INT8_C( 70), INT8_C( -90),
|
1847
|
+
INT8_C( 47), INT8_C( -21), INT8_C(-104), INT8_C( -27),
|
1848
|
+
INT8_C( -16), INT8_C( -29), INT8_C( 51), INT8_C(-116),
|
1849
|
+
INT8_C( -87), INT8_C( 91), INT8_C(-106), INT8_C( -3),
|
1850
|
+
INT8_C( -55), INT8_C( -15), INT8_C(-109), INT8_C(-108),
|
1851
|
+
INT8_C( -41), INT8_C( 79), INT8_C( 54), INT8_C( 68),
|
1852
|
+
INT8_C( -51), INT8_C(-108), INT8_C( -83), INT8_C( 104),
|
1853
|
+
INT8_C( 18), INT8_C(-128), INT8_C( -75), INT8_C( -12),
|
1854
|
+
INT8_C( 56), INT8_C(-104), INT8_C( 56), INT8_C( 47),
|
1855
|
+
INT8_C( -30), INT8_C( -15), INT8_C(-115), INT8_C( 88)),
|
1856
|
+
simde_mm512_set_epi8(INT8_C( 107), INT8_C( 125), INT8_C(-111), INT8_C( -89),
|
1857
|
+
INT8_C( -9), INT8_C( 122), INT8_C( -2), INT8_C( -26),
|
1858
|
+
INT8_C(-100), INT8_C( 80), INT8_C( 89), INT8_C( 38),
|
1859
|
+
INT8_C( 95), INT8_C( -82), INT8_C( -66), INT8_C( 108),
|
1860
|
+
INT8_C( 104), INT8_C( -20), INT8_C( 72), INT8_C( -82),
|
1861
|
+
INT8_C( 23), INT8_C( -45), INT8_C( -20), INT8_C( 8),
|
1862
|
+
INT8_C( -2), INT8_C( -77), INT8_C(-112), INT8_C( 102),
|
1863
|
+
INT8_C( 83), INT8_C( 80), INT8_C( 56), INT8_C( -53),
|
1864
|
+
INT8_C( -83), INT8_C( -86), INT8_C( 15), INT8_C( 30),
|
1865
|
+
INT8_C( -92), INT8_C( -2), INT8_C( 42), INT8_C( -79),
|
1866
|
+
INT8_C( 108), INT8_C( 44), INT8_C( 17), INT8_C( 83),
|
1867
|
+
INT8_C( -49), INT8_C( -44), INT8_C( -42), INT8_C( -54),
|
1868
|
+
INT8_C(-127), INT8_C( 12), INT8_C( 88), INT8_C(-118),
|
1869
|
+
INT8_C( -23), INT8_C( -69), INT8_C( -23), INT8_C( -36),
|
1870
|
+
INT8_C( -23), INT8_C( -80), INT8_C( 33), INT8_C( 82),
|
1871
|
+
INT8_C( -43), INT8_C( -91), INT8_C( -36), INT8_C( -56)),
|
1872
|
+
simde_mm512_set_epi8(INT8_C( 72), INT8_C( -33), INT8_C( 0), INT8_C( 0),
|
1873
|
+
INT8_C( 0), INT8_C( 63), INT8_C( 0), INT8_C( 0),
|
1874
|
+
INT8_C( 0), INT8_C( -7), INT8_C(-114), INT8_C( 71),
|
1875
|
+
INT8_C( 56), INT8_C( 0), INT8_C( 0), INT8_C( 82),
|
1876
|
+
INT8_C( 64), INT8_C( 0), INT8_C( 64), INT8_C( 0),
|
1877
|
+
INT8_C( 88), INT8_C( 0), INT8_C( 0), INT8_C( 64),
|
1878
|
+
INT8_C( 0), INT8_C( 0), INT8_C( 0), INT8_C( -88),
|
1879
|
+
INT8_C( 47), INT8_C( -27), INT8_C( 64), INT8_C( 0),
|
1880
|
+
INT8_C( 0), INT8_C( 0), INT8_C( -16), INT8_C( -29),
|
1881
|
+
INT8_C( 0), INT8_C( 0), INT8_C( 91), INT8_C( 0),
|
1882
|
+
INT8_C(-116), INT8_C(-116), INT8_C( 54), INT8_C( -41),
|
1883
|
+
INT8_C( 0), INT8_C( 0), INT8_C( 0), INT8_C( 0),
|
1884
|
+
INT8_C( 0), INT8_C( 104), INT8_C( -12), INT8_C( 0),
|
1885
|
+
INT8_C( 0), INT8_C( 0), INT8_C( 0), INT8_C( 0),
|
1886
|
+
INT8_C( 0), INT8_C( 0), INT8_C(-115), INT8_C( -15),
|
1887
|
+
INT8_C( 0), INT8_C( 0), INT8_C( 0), INT8_C( 0)) },
|
1888
|
+
};
|
1889
|
+
|
1890
|
+
for (size_t i = 0 ; i < (sizeof(test_vec) / sizeof(test_vec[0])); i++) {
|
1891
|
+
simde__m512i r = simde_mm512_shuffle_epi8(test_vec[i].a, test_vec[i].b);
|
1892
|
+
simde_assert_m512i_i8(r, ==, test_vec[i].r);
|
1893
|
+
}
|
1894
|
+
|
1895
|
+
return MUNIT_OK;
|
1896
|
+
}
|
1897
|
+
|
1898
|
+
static MunitResult
|
1899
|
+
test_simde_mm512_cmpeq_epi8_mask(const MunitParameter params[], void* data) {
|
1900
|
+
(void) params;
|
1901
|
+
(void) data;
|
1902
|
+
|
1903
|
+
const struct {
|
1904
|
+
simde__m512i a;
|
1905
|
+
simde__m512i b;
|
1906
|
+
simde__mmask64 r;
|
1907
|
+
} test_vec[8] = {
|
1908
|
+
{ simde_mm512_set_epi8(INT8_C( 73), INT8_C( 68), INT8_C( -71), INT8_C( -32),
|
1909
|
+
INT8_C( 100), INT8_C( 125), INT8_C( 89), INT8_C( 95),
|
1910
|
+
INT8_C( -23), INT8_C( 76), INT8_C( 84), INT8_C( -43),
|
1911
|
+
INT8_C( 86), INT8_C( 29), INT8_C( 64), INT8_C( 30),
|
1912
|
+
INT8_C( -17), INT8_C( -61), INT8_C( 115), INT8_C( -53),
|
1913
|
+
INT8_C(-100), INT8_C( 104), INT8_C( 111), INT8_C( -59),
|
1914
|
+
INT8_C( -31), INT8_C( 20), INT8_C( 31), INT8_C(-121),
|
1915
|
+
INT8_C( 90), INT8_C( 18), INT8_C( 6), INT8_C( 39),
|
1916
|
+
INT8_C( 15), INT8_C( 62), INT8_C( 39), INT8_C( -25),
|
1917
|
+
INT8_C( 60), INT8_C( 110), INT8_C( 45), INT8_C( 113),
|
1918
|
+
INT8_C( 81), INT8_C( 78), INT8_C( -53), INT8_C( 11),
|
1919
|
+
INT8_C( -27), INT8_C(-113), INT8_C( -3), INT8_C( 14),
|
1920
|
+
INT8_C( 109), INT8_C( 43), INT8_C( -54), INT8_C( 111),
|
1921
|
+
INT8_C( -91), INT8_C( -21), INT8_C( 102), INT8_C( 8),
|
1922
|
+
INT8_C( -41), INT8_C( -47), INT8_C( -90), INT8_C( 3),
|
1923
|
+
INT8_C( 18), INT8_C( 32), INT8_C( 89), INT8_C( -62)),
|
1924
|
+
simde_mm512_set_epi8(INT8_C( 73), INT8_C( 68), INT8_C( -71), INT8_C( -46),
|
1925
|
+
INT8_C( 72), INT8_C( 42), INT8_C( 65), INT8_C( -27),
|
1926
|
+
INT8_C( -37), INT8_C( 76), INT8_C( 84), INT8_C( -95),
|
1927
|
+
INT8_C( -29), INT8_C( 29), INT8_C( 64), INT8_C( 75),
|
1928
|
+
INT8_C( -17), INT8_C( -61), INT8_C( 76), INT8_C( 88),
|
1929
|
+
INT8_C(-100), INT8_C( -91), INT8_C( 111), INT8_C( -59),
|
1930
|
+
INT8_C( -31), INT8_C( -17), INT8_C( 31), INT8_C( 68),
|
1931
|
+
INT8_C( 90), INT8_C( 18), INT8_C(-110), INT8_C( 39),
|
1932
|
+
INT8_C( 15), INT8_C( 62), INT8_C( 24), INT8_C( -25),
|
1933
|
+
INT8_C( 80), INT8_C( 122), INT8_C( 103), INT8_C(-115),
|
1934
|
+
INT8_C( 81), INT8_C( 24), INT8_C( 32), INT8_C( 82),
|
1935
|
+
INT8_C( -27), INT8_C( 105), INT8_C( -3), INT8_C( 14),
|
1936
|
+
INT8_C( 109), INT8_C( 43), INT8_C( -54), INT8_C(-121),
|
1937
|
+
INT8_C( -91), INT8_C(-124), INT8_C( 102), INT8_C( 46),
|
1938
|
+
INT8_C( -41), INT8_C( 101), INT8_C( 51), INT8_C( 3),
|
1939
|
+
INT8_C( 18), INT8_C( 32), INT8_C( -12), INT8_C( -62)),
|
1940
|
+
UINT64_C(0xe066cbadd08bea9d) },
|
1941
|
+
{ simde_mm512_set_epi8(INT8_C( -84), INT8_C(-108), INT8_C( 13), INT8_C( -97),
|
1942
|
+
INT8_C( -34), INT8_C( 27), INT8_C( 124), INT8_C(-120),
|
1943
|
+
INT8_C( 3), INT8_C( 26), INT8_C( 43), INT8_C( -96),
|
1944
|
+
INT8_C( -63), INT8_C( 49), INT8_C( 127), INT8_C( 0),
|
1945
|
+
INT8_C( -20), INT8_C( -31), INT8_C( 125), INT8_C( 14),
|
1946
|
+
INT8_C( -53), INT8_C( -87), INT8_C( 115), INT8_C( -20),
|
1947
|
+
INT8_C( -93), INT8_C( 70), INT8_C( 29), INT8_C( -90),
|
1948
|
+
INT8_C( 105), INT8_C( -54), INT8_C( 96), INT8_C(-106),
|
1949
|
+
INT8_C( 94), INT8_C( -52), INT8_C( -50), INT8_C( -79),
|
1950
|
+
INT8_C( -54), INT8_C( 78), INT8_C( 17), INT8_C( 81),
|
1951
|
+
INT8_C( 35), INT8_C( 120), INT8_C( 47), INT8_C( -25),
|
1952
|
+
INT8_C( 110), INT8_C( 55), INT8_C( 40), INT8_C( -31),
|
1953
|
+
INT8_C( 93), INT8_C( -23), INT8_C( 4), INT8_C( 45),
|
1954
|
+
INT8_C( 59), INT8_C( -33), INT8_C( 124), INT8_C( -52),
|
1955
|
+
INT8_C( 42), INT8_C( -14), INT8_C(-119), INT8_C( 88),
|
1956
|
+
INT8_C( -38), INT8_C( -31), INT8_C(-113), INT8_C( 33)),
|
1957
|
+
simde_mm512_set_epi8(INT8_C( 25), INT8_C(-108), INT8_C( 13), INT8_C( -97),
|
1958
|
+
INT8_C( -34), INT8_C( 119), INT8_C( 122), INT8_C( 82),
|
1959
|
+
INT8_C( 3), INT8_C(-111), INT8_C( 60), INT8_C( -96),
|
1960
|
+
INT8_C( 26), INT8_C( 3), INT8_C( -7), INT8_C( -8),
|
1961
|
+
INT8_C( 94), INT8_C( -31), INT8_C( -71), INT8_C( 14),
|
1962
|
+
INT8_C(-105), INT8_C( -87), INT8_C( 115), INT8_C( -68),
|
1963
|
+
INT8_C( -93), INT8_C( 70), INT8_C( -47), INT8_C(-106),
|
1964
|
+
INT8_C( 105), INT8_C( -54), INT8_C( 96), INT8_C( 105),
|
1965
|
+
INT8_C( 94), INT8_C( 84), INT8_C( -50), INT8_C( -79),
|
1966
|
+
INT8_C( -54), INT8_C( 78), INT8_C( 17), INT8_C( 39),
|
1967
|
+
INT8_C( 35), INT8_C( -87), INT8_C( -83), INT8_C( -25),
|
1968
|
+
INT8_C( 110), INT8_C( 2), INT8_C( -90), INT8_C( -31),
|
1969
|
+
INT8_C( 19), INT8_C( -23), INT8_C( 4), INT8_C( 16),
|
1970
|
+
INT8_C( 59), INT8_C( -33), INT8_C( 124), INT8_C( 127),
|
1971
|
+
INT8_C( -60), INT8_C( -14), INT8_C(-119), INT8_C( 88),
|
1972
|
+
INT8_C( -38), INT8_C( 109), INT8_C(-113), INT8_C( 25)),
|
1973
|
+
UINT64_C(0x789056cebe996e7a) },
|
1974
|
+
{ simde_mm512_set_epi8(INT8_C( 93), INT8_C( 110), INT8_C( 120), INT8_C( 25),
|
1975
|
+
INT8_C( -37), INT8_C( -25), INT8_C( -34), INT8_C(-108),
|
1976
|
+
INT8_C( -77), INT8_C(-114), INT8_C( 79), INT8_C( -50),
|
1977
|
+
INT8_C( -94), INT8_C( 22), INT8_C( -28), INT8_C(-105),
|
1978
|
+
INT8_C( 110), INT8_C( 29), INT8_C( -9), INT8_C( -13),
|
1979
|
+
INT8_C( -71), INT8_C( 107), INT8_C(-115), INT8_C( 86),
|
1980
|
+
INT8_C(-127), INT8_C(-100), INT8_C( 1), INT8_C( 21),
|
1981
|
+
INT8_C( -55), INT8_C( -85), INT8_C( -55), INT8_C( -81),
|
1982
|
+
INT8_C( -41), INT8_C( 39), INT8_C( 18), INT8_C( -92),
|
1983
|
+
INT8_C( 11), INT8_C( -32), INT8_C( -53), INT8_C( 38),
|
1984
|
+
INT8_C( -49), INT8_C(-118), INT8_C( 20), INT8_C( 66),
|
1985
|
+
INT8_C(-106), INT8_C(-109), INT8_C( 45), INT8_C( -24),
|
1986
|
+
INT8_C( -47), INT8_C( 95), INT8_C( 50), INT8_C( 105),
|
1987
|
+
INT8_C( 58), INT8_C( 25), INT8_C( -53), INT8_C( -61),
|
1988
|
+
INT8_C( -90), INT8_C( 92), INT8_C( 83), INT8_C( 120),
|
1989
|
+
INT8_C( 107), INT8_C( -72), INT8_C( 3), INT8_C( -1)),
|
1990
|
+
simde_mm512_set_epi8(INT8_C( 93), INT8_C( 110), INT8_C( 120), INT8_C( -75),
|
1991
|
+
INT8_C( -37), INT8_C( -25), INT8_C( 14), INT8_C(-108),
|
1992
|
+
INT8_C( 5), INT8_C(-114), INT8_C( 79), INT8_C( 57),
|
1993
|
+
INT8_C( -94), INT8_C( 22), INT8_C( 4), INT8_C( 3),
|
1994
|
+
INT8_C( 66), INT8_C( 29), INT8_C( -9), INT8_C( 20),
|
1995
|
+
INT8_C( 93), INT8_C( 107), INT8_C( 6), INT8_C( 86),
|
1996
|
+
INT8_C( 84), INT8_C(-100), INT8_C( 81), INT8_C( 21),
|
1997
|
+
INT8_C( 117), INT8_C( 22), INT8_C( -55), INT8_C( -81),
|
1998
|
+
INT8_C( -41), INT8_C( -17), INT8_C( 19), INT8_C( 106),
|
1999
|
+
INT8_C( 114), INT8_C( -32), INT8_C( 98), INT8_C( -16),
|
2000
|
+
INT8_C( -49), INT8_C(-118), INT8_C( 20), INT8_C( 66),
|
2001
|
+
INT8_C(-106), INT8_C(-109), INT8_C( 97), INT8_C( 29),
|
2002
|
+
INT8_C( -47), INT8_C( -47), INT8_C( 50), INT8_C(-111),
|
2003
|
+
INT8_C( 58), INT8_C( 115), INT8_C( -53), INT8_C( 93),
|
2004
|
+
INT8_C( -90), INT8_C( -27), INT8_C( 41), INT8_C( 120),
|
2005
|
+
INT8_C( 119), INT8_C( 86), INT8_C( -36), INT8_C( -1)),
|
2006
|
+
UINT64_C(0xed6c655384fcaa91) },
|
2007
|
+
{ simde_mm512_set_epi8(INT8_C( 10), INT8_C( 75), INT8_C( 91), INT8_C( -99),
|
2008
|
+
INT8_C( -88), INT8_C( 99), INT8_C( -86), INT8_C( 96),
|
2009
|
+
INT8_C( 14), INT8_C( -1), INT8_C( 14), INT8_C( 100),
|
2010
|
+
INT8_C(-114), INT8_C( 63), INT8_C( 68), INT8_C(-113),
|
2011
|
+
INT8_C( -59), INT8_C( -42), INT8_C( -14), INT8_C(-111),
|
2012
|
+
INT8_C( 6), INT8_C( 68), INT8_C( 11), INT8_C(-108),
|
2013
|
+
INT8_C( -62), INT8_C( 87), INT8_C( -72), INT8_C( -23),
|
2014
|
+
INT8_C( 78), INT8_C( -18), INT8_C( -36), INT8_C( -6),
|
2015
|
+
INT8_C( -68), INT8_C(-115), INT8_C( -24), INT8_C( 127),
|
2016
|
+
INT8_C( -36), INT8_C( 21), INT8_C( 38), INT8_C(-106),
|
2017
|
+
INT8_C( 33), INT8_C( -66), INT8_C(-121), INT8_C( 36),
|
2018
|
+
INT8_C( 24), INT8_C( 61), INT8_C( 66), INT8_C( 20),
|
2019
|
+
INT8_C( 63), INT8_C( -18), INT8_C( 11), INT8_C(-103),
|
2020
|
+
INT8_C( -19), INT8_C( -42), INT8_C( -69), INT8_C( 53),
|
2021
|
+
INT8_C( -40), INT8_C( 112), INT8_C( 8), INT8_C( -69),
|
2022
|
+
INT8_C(-102), INT8_C( 62), INT8_C( 85), INT8_C( 62)),
|
2023
|
+
simde_mm512_set_epi8(INT8_C( 10), INT8_C( 75), INT8_C( -74), INT8_C( -47),
|
2024
|
+
INT8_C( -88), INT8_C( 99), INT8_C( -86), INT8_C(-128),
|
2025
|
+
INT8_C( 94), INT8_C( -1), INT8_C( 99), INT8_C( 100),
|
2026
|
+
INT8_C( -25), INT8_C( 7), INT8_C( 59), INT8_C(-113),
|
2027
|
+
INT8_C( 119), INT8_C( -42), INT8_C( -14), INT8_C( 79),
|
2028
|
+
INT8_C( 4), INT8_C(-111), INT8_C( 11), INT8_C( 80),
|
2029
|
+
INT8_C( -78), INT8_C( 87), INT8_C( -72), INT8_C(-111),
|
2030
|
+
INT8_C( -95), INT8_C( -18), INT8_C( -36), INT8_C( -40),
|
2031
|
+
INT8_C( -68), INT8_C(-115), INT8_C( -24), INT8_C( -50),
|
2032
|
+
INT8_C( -36), INT8_C( 10), INT8_C( 47), INT8_C( 62),
|
2033
|
+
INT8_C( -15), INT8_C( -66), INT8_C(-122), INT8_C( 36),
|
2034
|
+
INT8_C( -22), INT8_C( 61), INT8_C( -11), INT8_C( 20),
|
2035
|
+
INT8_C( 63), INT8_C( 82), INT8_C(-113), INT8_C(-103),
|
2036
|
+
INT8_C( -19), INT8_C( -42), INT8_C( -69), INT8_C( 53),
|
2037
|
+
INT8_C( -40), INT8_C( 112), INT8_C( 8), INT8_C( -69),
|
2038
|
+
INT8_C(-102), INT8_C( 23), INT8_C( 85), INT8_C( 62)),
|
2039
|
+
UINT64_C(0xce516266e8559ffb) },
|
2040
|
+
{ simde_mm512_set_epi8(INT8_C( -7), INT8_C( 2), INT8_C(-111), INT8_C( 64),
|
2041
|
+
INT8_C(-100), INT8_C( 87), INT8_C( 100), INT8_C( -30),
|
2042
|
+
INT8_C( -39), INT8_C( -38), INT8_C( 121), INT8_C( 55),
|
2043
|
+
INT8_C( -64), INT8_C( 81), INT8_C( -3), INT8_C( 79),
|
2044
|
+
INT8_C( -41), INT8_C( 118), INT8_C( -37), INT8_C( -34),
|
2045
|
+
INT8_C( -13), INT8_C( 63), INT8_C( 26), INT8_C( -81),
|
2046
|
+
INT8_C( 90), INT8_C( 43), INT8_C( -31), INT8_C( -17),
|
2047
|
+
INT8_C(-100), INT8_C( -71), INT8_C(-104), INT8_C( -66),
|
2048
|
+
INT8_C( -94), INT8_C( -89), INT8_C( 100), INT8_C( 36),
|
2049
|
+
INT8_C( 17), INT8_C( 116), INT8_C( -30), INT8_C( 16),
|
2050
|
+
INT8_C( 110), INT8_C( 98), INT8_C( 11), INT8_C( -42),
|
2051
|
+
INT8_C( -78), INT8_C( -68), INT8_C( -26), INT8_C( -35),
|
2052
|
+
INT8_C( 12), INT8_C( -40), INT8_C( -27), INT8_C( -40),
|
2053
|
+
INT8_C(-102), INT8_C(-109), INT8_C( 39), INT8_C( 29),
|
2054
|
+
INT8_C( 21), INT8_C( 9), INT8_C( 49), INT8_C( -13),
|
2055
|
+
INT8_C( -49), INT8_C( 7), INT8_C( 91), INT8_C( 15)),
|
2056
|
+
simde_mm512_set_epi8(INT8_C( 78), INT8_C( 2), INT8_C( -91), INT8_C( 64),
|
2057
|
+
INT8_C(-100), INT8_C( 41), INT8_C( -34), INT8_C( -46),
|
2058
|
+
INT8_C( -39), INT8_C( 31), INT8_C( 13), INT8_C( 55),
|
2059
|
+
INT8_C( -42), INT8_C( 33), INT8_C( -3), INT8_C( 79),
|
2060
|
+
INT8_C( -41), INT8_C( 118), INT8_C( -37), INT8_C( 90),
|
2061
|
+
INT8_C( -13), INT8_C( 63), INT8_C( 51), INT8_C( -81),
|
2062
|
+
INT8_C( 90), INT8_C( 43), INT8_C( -31), INT8_C(-112),
|
2063
|
+
INT8_C(-100), INT8_C( 41), INT8_C(-104), INT8_C( -66),
|
2064
|
+
INT8_C( -94), INT8_C( -89), INT8_C( -85), INT8_C(-109),
|
2065
|
+
INT8_C( 113), INT8_C( 116), INT8_C( 100), INT8_C( 16),
|
2066
|
+
INT8_C( 5), INT8_C( -50), INT8_C( -51), INT8_C( -42),
|
2067
|
+
INT8_C( -95), INT8_C( -68), INT8_C( -26), INT8_C( -35),
|
2068
|
+
INT8_C( -73), INT8_C( 71), INT8_C( 65), INT8_C( -40),
|
2069
|
+
INT8_C(-102), INT8_C( 7), INT8_C( 94), INT8_C( 29),
|
2070
|
+
INT8_C( 65), INT8_C( 9), INT8_C( 49), INT8_C( -13),
|
2071
|
+
INT8_C( -33), INT8_C( 7), INT8_C(-101), INT8_C( 15)),
|
2072
|
+
UINT64_C(0x5893edebc5171975) },
|
2073
|
+
{ simde_mm512_set_epi8(INT8_C( -34), INT8_C( -12), INT8_C( 105), INT8_C(-124),
|
2074
|
+
INT8_C( -33), INT8_C( -79), INT8_C( -6), INT8_C( 54),
|
2075
|
+
INT8_C( 81), INT8_C( -11), INT8_C( 67), INT8_C( 63),
|
2076
|
+
INT8_C( 103), INT8_C( 119), INT8_C( -89), INT8_C( 40),
|
2077
|
+
INT8_C( 8), INT8_C( -38), INT8_C( 71), INT8_C( 66),
|
2078
|
+
INT8_C(-106), INT8_C( -45), INT8_C( 18), INT8_C( 100),
|
2079
|
+
INT8_C( 122), INT8_C( 93), INT8_C( -42), INT8_C( 5),
|
2080
|
+
INT8_C( -39), INT8_C( 37), INT8_C( -70), INT8_C( 13),
|
2081
|
+
INT8_C( 99), INT8_C( -57), INT8_C( -88), INT8_C( -36),
|
2082
|
+
INT8_C(-103), INT8_C( 25), INT8_C( 94), INT8_C(-107),
|
2083
|
+
INT8_C( -32), INT8_C( -12), INT8_C( -14), INT8_C( 32),
|
2084
|
+
INT8_C( -38), INT8_C( 10), INT8_C( 89), INT8_C( -69),
|
2085
|
+
INT8_C( -8), INT8_C( 69), INT8_C( -20), INT8_C(-122),
|
2086
|
+
INT8_C( -75), INT8_C( -71), INT8_C( 3), INT8_C( 102),
|
2087
|
+
INT8_C( 119), INT8_C( -58), INT8_C( -49), INT8_C( 80),
|
2088
|
+
INT8_C( -15), INT8_C( -97), INT8_C( 45), INT8_C( 96)),
|
2089
|
+
simde_mm512_set_epi8(INT8_C( -34), INT8_C( -12), INT8_C( 81), INT8_C(-115),
|
2090
|
+
INT8_C( -33), INT8_C( -79), INT8_C(-117), INT8_C( -34),
|
2091
|
+
INT8_C( 81), INT8_C( -11), INT8_C( -63), INT8_C( -61),
|
2092
|
+
INT8_C( 53), INT8_C( 119), INT8_C( 26), INT8_C( 40),
|
2093
|
+
INT8_C( 8), INT8_C( -38), INT8_C( 25), INT8_C( -23),
|
2094
|
+
INT8_C( -16), INT8_C( -45), INT8_C( -64), INT8_C( 100),
|
2095
|
+
INT8_C( 91), INT8_C( 93), INT8_C( -42), INT8_C( 5),
|
2096
|
+
INT8_C( 81), INT8_C( -76), INT8_C( -70), INT8_C( 13),
|
2097
|
+
INT8_C( 26), INT8_C( -57), INT8_C( -88), INT8_C( -64),
|
2098
|
+
INT8_C( -68), INT8_C( -91), INT8_C(-123), INT8_C( 38),
|
2099
|
+
INT8_C( -32), INT8_C( 29), INT8_C( 82), INT8_C( 54),
|
2100
|
+
INT8_C(-107), INT8_C( 10), INT8_C( 89), INT8_C( 28),
|
2101
|
+
INT8_C( -27), INT8_C( 41), INT8_C( -20), INT8_C(-122),
|
2102
|
+
INT8_C( -75), INT8_C( -71), INT8_C( 3), INT8_C( -30),
|
2103
|
+
INT8_C( 97), INT8_C( 18), INT8_C( -90), INT8_C( 107),
|
2104
|
+
INT8_C( 99), INT8_C( 10), INT8_C( 45), INT8_C( 96)),
|
2105
|
+
UINT64_C(0xccc5c57360863e03) },
|
2106
|
+
{ simde_mm512_set_epi8(INT8_C( 48), INT8_C( 94), INT8_C( 112), INT8_C(-107),
|
2107
|
+
INT8_C( -34), INT8_C( -86), INT8_C( 65), INT8_C( 92),
|
2108
|
+
INT8_C( 97), INT8_C( -99), INT8_C( 28), INT8_C( 47),
|
2109
|
+
INT8_C(-117), INT8_C( -22), INT8_C(-111), INT8_C( -67),
|
2110
|
+
INT8_C( 113), INT8_C(-107), INT8_C( -23), INT8_C( 77),
|
2111
|
+
INT8_C( 60), INT8_C( 104), INT8_C(-116), INT8_C( -86),
|
2112
|
+
INT8_C(-113), INT8_C( -79), INT8_C( -64), INT8_C( -15),
|
2113
|
+
INT8_C(-123), INT8_C( 99), INT8_C( 25), INT8_C( 27),
|
2114
|
+
INT8_C( -40), INT8_C( 126), INT8_C( -66), INT8_C( -45),
|
2115
|
+
INT8_C( 57), INT8_C( -30), INT8_C( -12), INT8_C( 16),
|
2116
|
+
INT8_C( 122), INT8_C( 124), INT8_C( -75), INT8_C( 50),
|
2117
|
+
INT8_C( -6), INT8_C( 41), INT8_C( -47), INT8_C( -3),
|
2118
|
+
INT8_C( 29), INT8_C( -20), INT8_C( -45), INT8_C( -46),
|
2119
|
+
INT8_C( -45), INT8_C( -14), INT8_C( 99), INT8_C( 84),
|
2120
|
+
INT8_C( -62), INT8_C( -99), INT8_C(-104), INT8_C( -78),
|
2121
|
+
INT8_C( 106), INT8_C(-117), INT8_C( -94), INT8_C( 3)),
|
2122
|
+
simde_mm512_set_epi8(INT8_C( -88), INT8_C( -74), INT8_C( 2), INT8_C( -83),
|
2123
|
+
INT8_C(-112), INT8_C( -91), INT8_C( 65), INT8_C( 92),
|
2124
|
+
INT8_C( 97), INT8_C( 52), INT8_C( 28), INT8_C( -65),
|
2125
|
+
INT8_C(-117), INT8_C( -90), INT8_C(-111), INT8_C( -67),
|
2126
|
+
INT8_C( 113), INT8_C( 16), INT8_C(-124), INT8_C( 77),
|
2127
|
+
INT8_C( 60), INT8_C( -64), INT8_C(-116), INT8_C( -89),
|
2128
|
+
INT8_C( -7), INT8_C( -79), INT8_C( 46), INT8_C( 114),
|
2129
|
+
INT8_C(-107), INT8_C( 99), INT8_C( -79), INT8_C( 80),
|
2130
|
+
INT8_C( -40), INT8_C( -81), INT8_C( -66), INT8_C( -45),
|
2131
|
+
INT8_C( 57), INT8_C( -30), INT8_C( 66), INT8_C( 71),
|
2132
|
+
INT8_C( 122), INT8_C( 95), INT8_C( -43), INT8_C( 50),
|
2133
|
+
INT8_C( -6), INT8_C( 41), INT8_C( -47), INT8_C( 95),
|
2134
|
+
INT8_C( 5), INT8_C( -20), INT8_C( -45), INT8_C(-118),
|
2135
|
+
INT8_C( 70), INT8_C( 81), INT8_C( 0), INT8_C( 84),
|
2136
|
+
INT8_C( -62), INT8_C(-101), INT8_C( 13), INT8_C( 33),
|
2137
|
+
INT8_C(-104), INT8_C(-117), INT8_C( -11), INT8_C( 20)),
|
2138
|
+
UINT64_C(0x3ab9a44bc9e6184) },
|
2139
|
+
{ simde_mm512_set_epi8(INT8_C( 67), INT8_C( 34), INT8_C( -33), INT8_C( 31),
|
2140
|
+
INT8_C(-128), INT8_C( 55), INT8_C( 93), INT8_C( 58),
|
2141
|
+
INT8_C( 57), INT8_C( 104), INT8_C(-110), INT8_C( 59),
|
2142
|
+
INT8_C( 55), INT8_C( 33), INT8_C(-122), INT8_C( 69),
|
2143
|
+
INT8_C( 57), INT8_C( 30), INT8_C( -13), INT8_C( -65),
|
2144
|
+
INT8_C( -22), INT8_C(-100), INT8_C( 18), INT8_C( -65),
|
2145
|
+
INT8_C( -60), INT8_C(-105), INT8_C( 27), INT8_C( -71),
|
2146
|
+
INT8_C( 52), INT8_C( 12), INT8_C( -4), INT8_C( 64),
|
2147
|
+
INT8_C( 20), INT8_C( 51), INT8_C( 87), INT8_C( 43),
|
2148
|
+
INT8_C( 26), INT8_C( 6), INT8_C( -66), INT8_C( -40),
|
2149
|
+
INT8_C( 87), INT8_C( 1), INT8_C( -26), INT8_C( 92),
|
2150
|
+
INT8_C( -33), INT8_C( 8), INT8_C( 42), INT8_C( -93),
|
2151
|
+
INT8_C( 44), INT8_C( -55), INT8_C(-113), INT8_C( -43),
|
2152
|
+
INT8_C( 32), INT8_C( 105), INT8_C( -27), INT8_C( 96),
|
2153
|
+
INT8_C( 72), INT8_C( 48), INT8_C( -46), INT8_C( 24),
|
2154
|
+
INT8_C( -10), INT8_C( -98), INT8_C( -56), INT8_C( -41)),
|
2155
|
+
simde_mm512_set_epi8(INT8_C( 67), INT8_C( -63), INT8_C( -33), INT8_C( 31),
|
2156
|
+
INT8_C(-128), INT8_C( 55), INT8_C( 93), INT8_C( -8),
|
2157
|
+
INT8_C( 82), INT8_C( 104), INT8_C(-110), INT8_C( 59),
|
2158
|
+
INT8_C( 55), INT8_C( 0), INT8_C( -25), INT8_C( 69),
|
2159
|
+
INT8_C( 27), INT8_C( 30), INT8_C( -13), INT8_C( -65),
|
2160
|
+
INT8_C( -7), INT8_C( -28), INT8_C( 18), INT8_C( -65),
|
2161
|
+
INT8_C( 67), INT8_C( -3), INT8_C( 57), INT8_C( -68),
|
2162
|
+
INT8_C( 52), INT8_C( 12), INT8_C( -4), INT8_C(-128),
|
2163
|
+
INT8_C( 20), INT8_C( 37), INT8_C( 9), INT8_C( 80),
|
2164
|
+
INT8_C( 26), INT8_C( 6), INT8_C( -66), INT8_C( 9),
|
2165
|
+
INT8_C( -98), INT8_C( 1), INT8_C( -26), INT8_C( 92),
|
2166
|
+
INT8_C( -33), INT8_C( 8), INT8_C( -81), INT8_C( -93),
|
2167
|
+
INT8_C( 116), INT8_C( -55), INT8_C(-113), INT8_C( -43),
|
2168
|
+
INT8_C( 32), INT8_C( 105), INT8_C( -27), INT8_C( 37),
|
2169
|
+
INT8_C( 72), INT8_C( -73), INT8_C( -19), INT8_C( 96),
|
2170
|
+
INT8_C( 52), INT8_C( -98), INT8_C( -45), INT8_C( -41)),
|
2171
|
+
UINT64_C(0xbe79730e8e7d7e85) },
|
2172
|
+
};
|
2173
|
+
|
2174
|
+
for (size_t i = 0 ; i < (sizeof(test_vec) / sizeof(test_vec[0])); i++) {
|
2175
|
+
simde__mmask64 r = simde_mm512_cmpeq_epi8_mask(test_vec[i].a, test_vec[i].b);
|
2176
|
+
simde_assert_uint64(r, ==, test_vec[i].r);
|
2177
|
+
}
|
2178
|
+
|
2179
|
+
return MUNIT_OK;
|
2180
|
+
}
|
2181
|
+
|
2182
|
+
static MunitResult
|
2183
|
+
test_simde_mm512_cvtepi16_epi8(const MunitParameter params[], void* data) {
|
2184
|
+
(void) params;
|
2185
|
+
(void) data;
|
2186
|
+
|
2187
|
+
const struct {
|
2188
|
+
simde__m512i a;
|
2189
|
+
simde__m256i r;
|
2190
|
+
} test_vec[8] = {
|
2191
|
+
{ simde_mm512_set_epi16(INT16_C( 14423), INT16_C( 3775), INT16_C( 16156), INT16_C( 17811),
|
2192
|
+
INT16_C(-14881), INT16_C(-30283), INT16_C( 27295), INT16_C(-12290),
|
2193
|
+
INT16_C( 12394), INT16_C( 32764), INT16_C( 8681), INT16_C( 21255),
|
2194
|
+
INT16_C(-21785), INT16_C(-24065), INT16_C(-28005), INT16_C( 15206),
|
2195
|
+
INT16_C( 6131), INT16_C(-29323), INT16_C( -9530), INT16_C( -6655),
|
2196
|
+
INT16_C( 14785), INT16_C( -9158), INT16_C( 7009), INT16_C( 4834),
|
2197
|
+
INT16_C(-15579), INT16_C( 5296), INT16_C( 20054), INT16_C( 12832),
|
2198
|
+
INT16_C( 15724), INT16_C( 5918), INT16_C( 25398), INT16_C( 14084)),
|
2199
|
+
simde_mm256_set_epi8(INT8_C( 87), INT8_C( -65), INT8_C( 28), INT8_C(-109),
|
2200
|
+
INT8_C( -33), INT8_C( -75), INT8_C( -97), INT8_C( -2),
|
2201
|
+
INT8_C( 106), INT8_C( -4), INT8_C( -23), INT8_C( 7),
|
2202
|
+
INT8_C( -25), INT8_C( -1), INT8_C(-101), INT8_C( 102),
|
2203
|
+
INT8_C( -13), INT8_C( 117), INT8_C( -58), INT8_C( 1),
|
2204
|
+
INT8_C( -63), INT8_C( 58), INT8_C( 97), INT8_C( -30),
|
2205
|
+
INT8_C( 37), INT8_C( -80), INT8_C( 86), INT8_C( 32),
|
2206
|
+
INT8_C( 108), INT8_C( 30), INT8_C( 54), INT8_C( 4)) },
|
2207
|
+
{ simde_mm512_set_epi16(INT16_C( 8455), INT16_C( 1140), INT16_C(-23383), INT16_C( 22825),
|
2208
|
+
INT16_C(-21438), INT16_C( 8713), INT16_C(-25940), INT16_C(-31180),
|
2209
|
+
INT16_C(-13214), INT16_C( 10200), INT16_C(-21253), INT16_C( 2612),
|
2210
|
+
INT16_C(-27891), INT16_C( 14031), INT16_C( -9014), INT16_C( 10287),
|
2211
|
+
INT16_C(-11660), INT16_C( 26858), INT16_C(-19518), INT16_C( 2472),
|
2212
|
+
INT16_C( 27637), INT16_C( 14857), INT16_C( 30034), INT16_C(-24153),
|
2213
|
+
INT16_C( 31935), INT16_C( -6397), INT16_C( -2502), INT16_C( 31062),
|
2214
|
+
INT16_C( 30236), INT16_C( 5156), INT16_C( 18439), INT16_C(-13074)),
|
2215
|
+
simde_mm256_set_epi8(INT8_C( 7), INT8_C( 116), INT8_C( -87), INT8_C( 41),
|
2216
|
+
INT8_C( 66), INT8_C( 9), INT8_C( -84), INT8_C( 52),
|
2217
|
+
INT8_C( 98), INT8_C( -40), INT8_C( -5), INT8_C( 52),
|
2218
|
+
INT8_C( 13), INT8_C( -49), INT8_C( -54), INT8_C( 47),
|
2219
|
+
INT8_C( 116), INT8_C( -22), INT8_C( -62), INT8_C( -88),
|
2220
|
+
INT8_C( -11), INT8_C( 9), INT8_C( 82), INT8_C( -89),
|
2221
|
+
INT8_C( -65), INT8_C( 3), INT8_C( 58), INT8_C( 86),
|
2222
|
+
INT8_C( 28), INT8_C( 36), INT8_C( 7), INT8_C( -18)) },
|
2223
|
+
{ simde_mm512_set_epi16(INT16_C( 18175), INT16_C( -3760), INT16_C( 10318), INT16_C(-31849),
|
2224
|
+
INT16_C(-32429), INT16_C(-26500), INT16_C( 24084), INT16_C(-23946),
|
2225
|
+
INT16_C( 2525), INT16_C( 2478), INT16_C(-15141), INT16_C(-27410),
|
2226
|
+
INT16_C( 30961), INT16_C(-31554), INT16_C( -9533), INT16_C(-20012),
|
2227
|
+
INT16_C(-21820), INT16_C( 11767), INT16_C(-17849), INT16_C( 24518),
|
2228
|
+
INT16_C(-22206), INT16_C(-24996), INT16_C(-19566), INT16_C( 17826),
|
2229
|
+
INT16_C( 25765), INT16_C( 29123), INT16_C( 28065), INT16_C( 1432),
|
2230
|
+
INT16_C(-24949), INT16_C( 30580), INT16_C( 20499), INT16_C(-29164)),
|
2231
|
+
simde_mm256_set_epi8(INT8_C( -1), INT8_C( 80), INT8_C( 78), INT8_C(-105),
|
2232
|
+
INT8_C( 83), INT8_C( 124), INT8_C( 20), INT8_C( 118),
|
2233
|
+
INT8_C( -35), INT8_C( -82), INT8_C( -37), INT8_C( -18),
|
2234
|
+
INT8_C( -15), INT8_C( -66), INT8_C( -61), INT8_C( -44),
|
2235
|
+
INT8_C( -60), INT8_C( -9), INT8_C( 71), INT8_C( -58),
|
2236
|
+
INT8_C( 66), INT8_C( 92), INT8_C(-110), INT8_C( -94),
|
2237
|
+
INT8_C( -91), INT8_C( -61), INT8_C( -95), INT8_C(-104),
|
2238
|
+
INT8_C(-117), INT8_C( 116), INT8_C( 19), INT8_C( 20)) },
|
2239
|
+
{ simde_mm512_set_epi16(INT16_C( 10816), INT16_C( 16713), INT16_C( 29707), INT16_C( 15186),
|
2240
|
+
INT16_C( 31860), INT16_C(-28520), INT16_C( 18947), INT16_C(-27460),
|
2241
|
+
INT16_C( 10883), INT16_C( 310), INT16_C( 8277), INT16_C(-28768),
|
2242
|
+
INT16_C( -4553), INT16_C( 23273), INT16_C(-27696), INT16_C(-20678),
|
2243
|
+
INT16_C( 13089), INT16_C( -6620), INT16_C( 31575), INT16_C(-20169),
|
2244
|
+
INT16_C( 14440), INT16_C( -9264), INT16_C(-26919), INT16_C(-25720),
|
2245
|
+
INT16_C(-18371), INT16_C( 25765), INT16_C(-13162), INT16_C(-16808),
|
2246
|
+
INT16_C( 5695), INT16_C(-25080), INT16_C( 19142), INT16_C( 3825)),
|
2247
|
+
simde_mm256_set_epi8(INT8_C( 64), INT8_C( 73), INT8_C( 11), INT8_C( 82),
|
2248
|
+
INT8_C( 116), INT8_C(-104), INT8_C( 3), INT8_C( -68),
|
2249
|
+
INT8_C(-125), INT8_C( 54), INT8_C( 85), INT8_C( -96),
|
2250
|
+
INT8_C( 55), INT8_C( -23), INT8_C( -48), INT8_C( 58),
|
2251
|
+
INT8_C( 33), INT8_C( 36), INT8_C( 87), INT8_C( 55),
|
2252
|
+
INT8_C( 104), INT8_C( -48), INT8_C( -39), INT8_C(-120),
|
2253
|
+
INT8_C( 61), INT8_C( -91), INT8_C(-106), INT8_C( 88),
|
2254
|
+
INT8_C( 63), INT8_C( 8), INT8_C( -58), INT8_C( -15)) },
|
2255
|
+
{ simde_mm512_set_epi16(INT16_C( 5079), INT16_C(-24746), INT16_C( 23487), INT16_C(-22087),
|
2256
|
+
INT16_C( -8346), INT16_C( 29848), INT16_C( 14241), INT16_C( 18254),
|
2257
|
+
INT16_C( -3124), INT16_C(-16186), INT16_C(-13364), INT16_C( 10652),
|
2258
|
+
INT16_C( 31028), INT16_C( 21346), INT16_C( 1443), INT16_C(-20222),
|
2259
|
+
INT16_C(-17028), INT16_C(-21899), INT16_C( 18933), INT16_C( 6935),
|
2260
|
+
INT16_C( 24619), INT16_C( 1737), INT16_C( 12596), INT16_C( 31606),
|
2261
|
+
INT16_C(-32691), INT16_C( 11392), INT16_C( 32126), INT16_C(-32712),
|
2262
|
+
INT16_C( 20927), INT16_C(-27859), INT16_C( 22640), INT16_C( 8969)),
|
2263
|
+
simde_mm256_set_epi8(INT8_C( -41), INT8_C( 86), INT8_C( -65), INT8_C( -71),
|
2264
|
+
INT8_C( 102), INT8_C(-104), INT8_C( -95), INT8_C( 78),
|
2265
|
+
INT8_C( -52), INT8_C( -58), INT8_C( -52), INT8_C(-100),
|
2266
|
+
INT8_C( 52), INT8_C( 98), INT8_C( -93), INT8_C( 2),
|
2267
|
+
INT8_C( 124), INT8_C( 117), INT8_C( -11), INT8_C( 23),
|
2268
|
+
INT8_C( 43), INT8_C( -55), INT8_C( 52), INT8_C( 118),
|
2269
|
+
INT8_C( 77), INT8_C(-128), INT8_C( 126), INT8_C( 56),
|
2270
|
+
INT8_C( -65), INT8_C( 45), INT8_C( 112), INT8_C( 9)) },
|
2271
|
+
{ simde_mm512_set_epi16(INT16_C( 6901), INT16_C(-23435), INT16_C(-26040), INT16_C(-11295),
|
2272
|
+
INT16_C( 623), INT16_C(-23058), INT16_C( 17549), INT16_C(-23291),
|
2273
|
+
INT16_C( 17215), INT16_C( -4892), INT16_C( -849), INT16_C( 21086),
|
2274
|
+
INT16_C(-13056), INT16_C( 19549), INT16_C( 16492), INT16_C(-22767),
|
2275
|
+
INT16_C(-24079), INT16_C( 6429), INT16_C( 15302), INT16_C( -9175),
|
2276
|
+
INT16_C( 17671), INT16_C(-29856), INT16_C(-12718), INT16_C(-22914),
|
2277
|
+
INT16_C(-19613), INT16_C( 14088), INT16_C(-10443), INT16_C( 31757),
|
2278
|
+
INT16_C( 24994), INT16_C( 24174), INT16_C( -9596), INT16_C(-22481)),
|
2279
|
+
simde_mm256_set_epi8(INT8_C( -11), INT8_C( 117), INT8_C( 72), INT8_C( -31),
|
2280
|
+
INT8_C( 111), INT8_C( -18), INT8_C(-115), INT8_C( 5),
|
2281
|
+
INT8_C( 63), INT8_C( -28), INT8_C( -81), INT8_C( 94),
|
2282
|
+
INT8_C( 0), INT8_C( 93), INT8_C( 108), INT8_C( 17),
|
2283
|
+
INT8_C( -15), INT8_C( 29), INT8_C( -58), INT8_C( 41),
|
2284
|
+
INT8_C( 7), INT8_C( 96), INT8_C( 82), INT8_C( 126),
|
2285
|
+
INT8_C( 99), INT8_C( 8), INT8_C( 53), INT8_C( 13),
|
2286
|
+
INT8_C( -94), INT8_C( 110), INT8_C(-124), INT8_C( 47)) },
|
2287
|
+
{ simde_mm512_set_epi16(INT16_C( 15520), INT16_C( 15679), INT16_C( 8541), INT16_C(-20376),
|
2288
|
+
INT16_C( 8861), INT16_C( 12926), INT16_C( 25712), INT16_C( -8433),
|
2289
|
+
INT16_C( -7066), INT16_C(-23691), INT16_C(-20251), INT16_C( 18056),
|
2290
|
+
INT16_C( 5498), INT16_C(-18751), INT16_C(-26321), INT16_C( 7918),
|
2291
|
+
INT16_C( 1647), INT16_C( 21774), INT16_C( 5430), INT16_C(-19512),
|
2292
|
+
INT16_C(-14894), INT16_C( 12466), INT16_C( -9612), INT16_C(-23130),
|
2293
|
+
INT16_C( 18357), INT16_C( 32349), INT16_C(-25760), INT16_C( -6559),
|
2294
|
+
INT16_C(-24198), INT16_C( 13614), INT16_C( 13473), INT16_C(-25578)),
|
2295
|
+
simde_mm256_set_epi8(INT8_C( -96), INT8_C( 63), INT8_C( 93), INT8_C( 104),
|
2296
|
+
INT8_C( -99), INT8_C( 126), INT8_C( 112), INT8_C( 15),
|
2297
|
+
INT8_C( 102), INT8_C( 117), INT8_C( -27), INT8_C(-120),
|
2298
|
+
INT8_C( 122), INT8_C( -63), INT8_C( 47), INT8_C( -18),
|
2299
|
+
INT8_C( 111), INT8_C( 14), INT8_C( 54), INT8_C( -56),
|
2300
|
+
INT8_C( -46), INT8_C( -78), INT8_C( 116), INT8_C( -90),
|
2301
|
+
INT8_C( -75), INT8_C( 93), INT8_C( 96), INT8_C( 97),
|
2302
|
+
INT8_C( 122), INT8_C( 46), INT8_C( -95), INT8_C( 22)) },
|
2303
|
+
{ simde_mm512_set_epi16(INT16_C(-13944), INT16_C( 30422), INT16_C( 10523), INT16_C( 28986),
|
2304
|
+
INT16_C(-23789), INT16_C(-20754), INT16_C( 29282), INT16_C(-10845),
|
2305
|
+
INT16_C( 10721), INT16_C( 2777), INT16_C(-18838), INT16_C( 8324),
|
2306
|
+
INT16_C( 19192), INT16_C( 114), INT16_C( -9073), INT16_C( 2615),
|
2307
|
+
INT16_C( 21008), INT16_C( 12652), INT16_C(-14859), INT16_C( 5734),
|
2308
|
+
INT16_C( -5598), INT16_C(-10707), INT16_C( 2170), INT16_C( 23903),
|
2309
|
+
INT16_C( 29988), INT16_C( 24405), INT16_C( 5383), INT16_C(-29994),
|
2310
|
+
INT16_C( 7143), INT16_C( 22270), INT16_C( -1480), INT16_C( 15491)),
|
2311
|
+
simde_mm256_set_epi8(INT8_C(-120), INT8_C( -42), INT8_C( 27), INT8_C( 58),
|
2312
|
+
INT8_C( 19), INT8_C( -18), INT8_C( 98), INT8_C( -93),
|
2313
|
+
INT8_C( -31), INT8_C( -39), INT8_C( 106), INT8_C(-124),
|
2314
|
+
INT8_C( -8), INT8_C( 114), INT8_C(-113), INT8_C( 55),
|
2315
|
+
INT8_C( 16), INT8_C( 108), INT8_C( -11), INT8_C( 102),
|
2316
|
+
INT8_C( 34), INT8_C( 45), INT8_C( 122), INT8_C( 95),
|
2317
|
+
INT8_C( 36), INT8_C( 85), INT8_C( 7), INT8_C( -42),
|
2318
|
+
INT8_C( -25), INT8_C( -2), INT8_C( 56), INT8_C(-125)) }
|
2319
|
+
};
|
2320
|
+
|
2321
|
+
for (size_t i = 0 ; i < (sizeof(test_vec) / sizeof(test_vec[0])); i++) {
|
2322
|
+
simde__m256i r = simde_mm512_cvtepi16_epi8(test_vec[i].a);
|
2323
|
+
simde_assert_m256i_i8(r, ==, test_vec[i].r);
|
2324
|
+
}
|
2325
|
+
|
2326
|
+
return MUNIT_OK;
|
2327
|
+
}
|
2328
|
+
|
2329
|
+
static MunitResult
|
2330
|
+
test_simde_mm512_cvtepi8_epi16(const MunitParameter params[], void* data) {
|
2331
|
+
(void) params;
|
2332
|
+
(void) data;
|
2333
|
+
|
2334
|
+
const struct {
|
2335
|
+
simde__m256i a;
|
2336
|
+
simde__m512i r;
|
2337
|
+
} test_vec[8] = {
|
2338
|
+
{ simde_mm256_set_epi8(INT8_C( 7), INT8_C( 68), INT8_C( -86), INT8_C( -36),
|
2339
|
+
INT8_C( -19), INT8_C( 73), INT8_C( 92), INT8_C( -27),
|
2340
|
+
INT8_C( 55), INT8_C( -65), INT8_C( -50), INT8_C( 19),
|
2341
|
+
INT8_C(-111), INT8_C( -79), INT8_C( -16), INT8_C( 70),
|
2342
|
+
INT8_C( 27), INT8_C( -28), INT8_C( 116), INT8_C( 42),
|
2343
|
+
INT8_C( -4), INT8_C( 78), INT8_C( 31), INT8_C( 51),
|
2344
|
+
INT8_C( 92), INT8_C( 39), INT8_C(-125), INT8_C( 94),
|
2345
|
+
INT8_C( -78), INT8_C( 67), INT8_C( -43), INT8_C( -71)),
|
2346
|
+
simde_mm512_set_epi16(INT16_C( 7), INT16_C( 68), INT16_C( -86), INT16_C( -36),
|
2347
|
+
INT16_C( -19), INT16_C( 73), INT16_C( 92), INT16_C( -27),
|
2348
|
+
INT16_C( 55), INT16_C( -65), INT16_C( -50), INT16_C( 19),
|
2349
|
+
INT16_C( -111), INT16_C( -79), INT16_C( -16), INT16_C( 70),
|
2350
|
+
INT16_C( 27), INT16_C( -28), INT16_C( 116), INT16_C( 42),
|
2351
|
+
INT16_C( -4), INT16_C( 78), INT16_C( 31), INT16_C( 51),
|
2352
|
+
INT16_C( 92), INT16_C( 39), INT16_C( -125), INT16_C( 94),
|
2353
|
+
INT16_C( -78), INT16_C( 67), INT16_C( -43), INT16_C( -71)) },
|
2354
|
+
{ simde_mm256_set_epi8(INT8_C( 29), INT8_C( -37), INT8_C( 27), INT8_C( 10),
|
2355
|
+
INT8_C( -22), INT8_C( -9), INT8_C(-125), INT8_C( -3),
|
2356
|
+
INT8_C( -53), INT8_C( 92), INT8_C( 103), INT8_C( 92),
|
2357
|
+
INT8_C( 123), INT8_C( 74), INT8_C( 36), INT8_C( 59),
|
2358
|
+
INT8_C( 46), INT8_C( -29), INT8_C(-103), INT8_C( -4),
|
2359
|
+
INT8_C( 109), INT8_C( -54), INT8_C( 41), INT8_C( 79),
|
2360
|
+
INT8_C( 15), INT8_C( -92), INT8_C( 102), INT8_C( 116),
|
2361
|
+
INT8_C( -42), INT8_C( 52), INT8_C( -61), INT8_C( -99)),
|
2362
|
+
simde_mm512_set_epi16(INT16_C( 29), INT16_C( -37), INT16_C( 27), INT16_C( 10),
|
2363
|
+
INT16_C( -22), INT16_C( -9), INT16_C( -125), INT16_C( -3),
|
2364
|
+
INT16_C( -53), INT16_C( 92), INT16_C( 103), INT16_C( 92),
|
2365
|
+
INT16_C( 123), INT16_C( 74), INT16_C( 36), INT16_C( 59),
|
2366
|
+
INT16_C( 46), INT16_C( -29), INT16_C( -103), INT16_C( -4),
|
2367
|
+
INT16_C( 109), INT16_C( -54), INT16_C( 41), INT16_C( 79),
|
2368
|
+
INT16_C( 15), INT16_C( -92), INT16_C( 102), INT16_C( 116),
|
2369
|
+
INT16_C( -42), INT16_C( 52), INT16_C( -61), INT16_C( -99)) },
|
2370
|
+
{ simde_mm256_set_epi8(INT8_C( -9), INT8_C( -47), INT8_C( 107), INT8_C( -74),
|
2371
|
+
INT8_C(-126), INT8_C( 34), INT8_C( 64), INT8_C( 115),
|
2372
|
+
INT8_C( -65), INT8_C(-124), INT8_C( 54), INT8_C( 27),
|
2373
|
+
INT8_C( 41), INT8_C( 112), INT8_C( 61), INT8_C( 6),
|
2374
|
+
INT8_C( 7), INT8_C( 39), INT8_C(-109), INT8_C( -99),
|
2375
|
+
INT8_C( 63), INT8_C( -35), INT8_C(-111), INT8_C( -72),
|
2376
|
+
INT8_C( 109), INT8_C( -39), INT8_C( -99), INT8_C( 26),
|
2377
|
+
INT8_C( 66), INT8_C( -78), INT8_C( 30), INT8_C( 38)),
|
2378
|
+
simde_mm512_set_epi16(INT16_C( -9), INT16_C( -47), INT16_C( 107), INT16_C( -74),
|
2379
|
+
INT16_C( -126), INT16_C( 34), INT16_C( 64), INT16_C( 115),
|
2380
|
+
INT16_C( -65), INT16_C( -124), INT16_C( 54), INT16_C( 27),
|
2381
|
+
INT16_C( 41), INT16_C( 112), INT16_C( 61), INT16_C( 6),
|
2382
|
+
INT16_C( 7), INT16_C( 39), INT16_C( -109), INT16_C( -99),
|
2383
|
+
INT16_C( 63), INT16_C( -35), INT16_C( -111), INT16_C( -72),
|
2384
|
+
INT16_C( 109), INT16_C( -39), INT16_C( -99), INT16_C( 26),
|
2385
|
+
INT16_C( 66), INT16_C( -78), INT16_C( 30), INT16_C( 38)) },
|
2386
|
+
{ simde_mm256_set_epi8(INT8_C( -72), INT8_C( -80), INT8_C( 101), INT8_C( 81),
|
2387
|
+
INT8_C( 23), INT8_C( -68), INT8_C( -57), INT8_C(-111),
|
2388
|
+
INT8_C( -3), INT8_C( 21), INT8_C( 121), INT8_C( -22),
|
2389
|
+
INT8_C(-104), INT8_C( -10), INT8_C( -37), INT8_C( 66),
|
2390
|
+
INT8_C( -93), INT8_C( -80), INT8_C( 34), INT8_C( 104),
|
2391
|
+
INT8_C( -39), INT8_C( -99), INT8_C( 18), INT8_C( 110),
|
2392
|
+
INT8_C(-118), INT8_C( 38), INT8_C( 112), INT8_C( -67),
|
2393
|
+
INT8_C( 60), INT8_C( 47), INT8_C( 32), INT8_C( 33)),
|
2394
|
+
simde_mm512_set_epi16(INT16_C( -72), INT16_C( -80), INT16_C( 101), INT16_C( 81),
|
2395
|
+
INT16_C( 23), INT16_C( -68), INT16_C( -57), INT16_C( -111),
|
2396
|
+
INT16_C( -3), INT16_C( 21), INT16_C( 121), INT16_C( -22),
|
2397
|
+
INT16_C( -104), INT16_C( -10), INT16_C( -37), INT16_C( 66),
|
2398
|
+
INT16_C( -93), INT16_C( -80), INT16_C( 34), INT16_C( 104),
|
2399
|
+
INT16_C( -39), INT16_C( -99), INT16_C( 18), INT16_C( 110),
|
2400
|
+
INT16_C( -118), INT16_C( 38), INT16_C( 112), INT16_C( -67),
|
2401
|
+
INT16_C( 60), INT16_C( 47), INT16_C( 32), INT16_C( 33)) },
|
2402
|
+
{ simde_mm256_set_epi8(INT8_C( 120), INT8_C( -90), INT8_C(-101), INT8_C(-106),
|
2403
|
+
INT8_C( 70), INT8_C( -49), INT8_C( 29), INT8_C( -43),
|
2404
|
+
INT8_C( -42), INT8_C( 38), INT8_C( 16), INT8_C( -43),
|
2405
|
+
INT8_C( -40), INT8_C( -76), INT8_C( -67), INT8_C( 53),
|
2406
|
+
INT8_C( -73), INT8_C( -17), INT8_C( 66), INT8_C( 57),
|
2407
|
+
INT8_C( -65), INT8_C( -63), INT8_C( 17), INT8_C( -9),
|
2408
|
+
INT8_C( 95), INT8_C( -50), INT8_C(-118), INT8_C( 114),
|
2409
|
+
INT8_C( 58), INT8_C( -28), INT8_C( -81), INT8_C( -37)),
|
2410
|
+
simde_mm512_set_epi16(INT16_C( 120), INT16_C( -90), INT16_C( -101), INT16_C( -106),
|
2411
|
+
INT16_C( 70), INT16_C( -49), INT16_C( 29), INT16_C( -43),
|
2412
|
+
INT16_C( -42), INT16_C( 38), INT16_C( 16), INT16_C( -43),
|
2413
|
+
INT16_C( -40), INT16_C( -76), INT16_C( -67), INT16_C( 53),
|
2414
|
+
INT16_C( -73), INT16_C( -17), INT16_C( 66), INT16_C( 57),
|
2415
|
+
INT16_C( -65), INT16_C( -63), INT16_C( 17), INT16_C( -9),
|
2416
|
+
INT16_C( 95), INT16_C( -50), INT16_C( -118), INT16_C( 114),
|
2417
|
+
INT16_C( 58), INT16_C( -28), INT16_C( -81), INT16_C( -37)) },
|
2418
|
+
{ simde_mm256_set_epi8(INT8_C( -97), INT8_C( 10), INT8_C( -75), INT8_C(-120),
|
2419
|
+
INT8_C( -32), INT8_C(-105), INT8_C( -75), INT8_C(-101),
|
2420
|
+
INT8_C( 71), INT8_C(-122), INT8_C(-112), INT8_C( -2),
|
2421
|
+
INT8_C( 60), INT8_C( -71), INT8_C( 101), INT8_C( -1),
|
2422
|
+
INT8_C( 95), INT8_C( -58), INT8_C( -70), INT8_C( 102),
|
2423
|
+
INT8_C( 115), INT8_C( -68), INT8_C(-110), INT8_C( -36),
|
2424
|
+
INT8_C( 6), INT8_C( 58), INT8_C( 73), INT8_C( 97),
|
2425
|
+
INT8_C( -51), INT8_C( -4), INT8_C( 58), INT8_C( 31)),
|
2426
|
+
simde_mm512_set_epi16(INT16_C( -97), INT16_C( 10), INT16_C( -75), INT16_C( -120),
|
2427
|
+
INT16_C( -32), INT16_C( -105), INT16_C( -75), INT16_C( -101),
|
2428
|
+
INT16_C( 71), INT16_C( -122), INT16_C( -112), INT16_C( -2),
|
2429
|
+
INT16_C( 60), INT16_C( -71), INT16_C( 101), INT16_C( -1),
|
2430
|
+
INT16_C( 95), INT16_C( -58), INT16_C( -70), INT16_C( 102),
|
2431
|
+
INT16_C( 115), INT16_C( -68), INT16_C( -110), INT16_C( -36),
|
2432
|
+
INT16_C( 6), INT16_C( 58), INT16_C( 73), INT16_C( 97),
|
2433
|
+
INT16_C( -51), INT16_C( -4), INT16_C( 58), INT16_C( 31)) },
|
2434
|
+
{ simde_mm256_set_epi8(INT8_C( -73), INT8_C(-123), INT8_C( -11), INT8_C( 62),
|
2435
|
+
INT8_C( -96), INT8_C(-103), INT8_C( 85), INT8_C( 88),
|
2436
|
+
INT8_C( -19), INT8_C( 28), INT8_C(-107), INT8_C( -81),
|
2437
|
+
INT8_C(-125), INT8_C( 88), INT8_C( 84), INT8_C( 115),
|
2438
|
+
INT8_C( 105), INT8_C( -47), INT8_C( 68), INT8_C(-124),
|
2439
|
+
INT8_C( 32), INT8_C(-100), INT8_C( 10), INT8_C( -69),
|
2440
|
+
INT8_C( 124), INT8_C( -51), INT8_C( -89), INT8_C( -72),
|
2441
|
+
INT8_C( -92), INT8_C( -5), INT8_C( -46), INT8_C( 115)),
|
2442
|
+
simde_mm512_set_epi16(INT16_C( -73), INT16_C( -123), INT16_C( -11), INT16_C( 62),
|
2443
|
+
INT16_C( -96), INT16_C( -103), INT16_C( 85), INT16_C( 88),
|
2444
|
+
INT16_C( -19), INT16_C( 28), INT16_C( -107), INT16_C( -81),
|
2445
|
+
INT16_C( -125), INT16_C( 88), INT16_C( 84), INT16_C( 115),
|
2446
|
+
INT16_C( 105), INT16_C( -47), INT16_C( 68), INT16_C( -124),
|
2447
|
+
INT16_C( 32), INT16_C( -100), INT16_C( 10), INT16_C( -69),
|
2448
|
+
INT16_C( 124), INT16_C( -51), INT16_C( -89), INT16_C( -72),
|
2449
|
+
INT16_C( -92), INT16_C( -5), INT16_C( -46), INT16_C( 115)) },
|
2450
|
+
{ simde_mm256_set_epi8(INT8_C( 104), INT8_C( 66), INT8_C( 51), INT8_C( 81),
|
2451
|
+
INT8_C( -69), INT8_C( 104), INT8_C( 126), INT8_C( -43),
|
2452
|
+
INT8_C( -40), INT8_C( 23), INT8_C(-124), INT8_C( 98),
|
2453
|
+
INT8_C(-125), INT8_C( 95), INT8_C( -36), INT8_C( 46),
|
2454
|
+
INT8_C(-115), INT8_C( -93), INT8_C( 2), INT8_C( -77),
|
2455
|
+
INT8_C( 80), INT8_C(-116), INT8_C( 61), INT8_C( -89),
|
2456
|
+
INT8_C( -37), INT8_C( 9), INT8_C( 84), INT8_C( -64),
|
2457
|
+
INT8_C( 94), INT8_C( 67), INT8_C( -53), INT8_C( 111)),
|
2458
|
+
simde_mm512_set_epi16(INT16_C( 104), INT16_C( 66), INT16_C( 51), INT16_C( 81),
|
2459
|
+
INT16_C( -69), INT16_C( 104), INT16_C( 126), INT16_C( -43),
|
2460
|
+
INT16_C( -40), INT16_C( 23), INT16_C( -124), INT16_C( 98),
|
2461
|
+
INT16_C( -125), INT16_C( 95), INT16_C( -36), INT16_C( 46),
|
2462
|
+
INT16_C( -115), INT16_C( -93), INT16_C( 2), INT16_C( -77),
|
2463
|
+
INT16_C( 80), INT16_C( -116), INT16_C( 61), INT16_C( -89),
|
2464
|
+
INT16_C( -37), INT16_C( 9), INT16_C( 84), INT16_C( -64),
|
2465
|
+
INT16_C( 94), INT16_C( 67), INT16_C( -53), INT16_C( 111)) }
|
2466
|
+
};
|
2467
|
+
|
2468
|
+
for (size_t i = 0 ; i < (sizeof(test_vec) / sizeof(test_vec[0])); i++) {
|
2469
|
+
simde__m512i r = simde_mm512_cvtepi8_epi16(test_vec[i].a);
|
2470
|
+
simde_assert_m512i_i16(r, ==, test_vec[i].r);
|
2471
|
+
}
|
2472
|
+
|
2473
|
+
return MUNIT_OK;
|
2474
|
+
}
|
2475
|
+
|
2476
|
+
static MunitResult
|
2477
|
+
test_simde_mm512_cvtsepi16_epi8(const MunitParameter params[], void* data) {
|
2478
|
+
(void) params;
|
2479
|
+
(void) data;
|
2480
|
+
|
2481
|
+
const struct {
|
2482
|
+
simde__m512i a;
|
2483
|
+
simde__m256i r;
|
2484
|
+
} test_vec[8] = {
|
2485
|
+
{ simde_mm512_set_epi16(INT16_C( 8002), INT16_C( -42), INT16_C( 317), INT16_C( 3),
|
2486
|
+
INT16_C( 2), INT16_C( 22), INT16_C( 2), INT16_C( 102),
|
2487
|
+
INT16_C( 0), INT16_C( 130), INT16_C( 297), INT16_C( 4068),
|
2488
|
+
INT16_C( -202), INT16_C( 4593), INT16_C( 1545), INT16_C( -2),
|
2489
|
+
INT16_C( -4392), INT16_C( -3947), INT16_C( 301), INT16_C(-11526),
|
2490
|
+
INT16_C( -1), INT16_C( 1), INT16_C( -437), INT16_C( 4),
|
2491
|
+
INT16_C( -139), INT16_C( -4859), INT16_C( -1), INT16_C( 12),
|
2492
|
+
INT16_C( -591), INT16_C( -40), INT16_C( -269), INT16_C( -24)),
|
2493
|
+
simde_mm256_set_epi8(INT8_C( 127), INT8_C( -42), INT8_C( 127), INT8_C( 3),
|
2494
|
+
INT8_C( 2), INT8_C( 22), INT8_C( 2), INT8_C( 102),
|
2495
|
+
INT8_C( 0), INT8_C( 127), INT8_C( 127), INT8_C( 127),
|
2496
|
+
INT8_C(-128), INT8_C( 127), INT8_C( 127), INT8_C( -2),
|
2497
|
+
INT8_C(-128), INT8_C(-128), INT8_C( 127), INT8_C(-128),
|
2498
|
+
INT8_C( -1), INT8_C( 1), INT8_C(-128), INT8_C( 4),
|
2499
|
+
INT8_C(-128), INT8_C(-128), INT8_C( -1), INT8_C( 12),
|
2500
|
+
INT8_C(-128), INT8_C( -40), INT8_C(-128), INT8_C( -24)) },
|
2501
|
+
{ simde_mm512_set_epi16(INT16_C( 2), INT16_C( 49), INT16_C( 2), INT16_C( 131),
|
2502
|
+
INT16_C( 1), INT16_C(-15743), INT16_C( 1984), INT16_C( 9),
|
2503
|
+
INT16_C(-20648), INT16_C( -5458), INT16_C( -1), INT16_C( -1),
|
2504
|
+
INT16_C( -3713), INT16_C( -60), INT16_C( -1328), INT16_C( 4),
|
2505
|
+
INT16_C( 150), INT16_C( -8), INT16_C( 1864), INT16_C( -14),
|
2506
|
+
INT16_C( 20), INT16_C( 194), INT16_C( 0), INT16_C( 5954),
|
2507
|
+
INT16_C( -13), INT16_C( -288), INT16_C( 3162), INT16_C( 1),
|
2508
|
+
INT16_C( 14), INT16_C( 2628), INT16_C( -1), INT16_C( -8)),
|
2509
|
+
simde_mm256_set_epi8(INT8_C( 2), INT8_C( 49), INT8_C( 2), INT8_C( 127),
|
2510
|
+
INT8_C( 1), INT8_C(-128), INT8_C( 127), INT8_C( 9),
|
2511
|
+
INT8_C(-128), INT8_C(-128), INT8_C( -1), INT8_C( -1),
|
2512
|
+
INT8_C(-128), INT8_C( -60), INT8_C(-128), INT8_C( 4),
|
2513
|
+
INT8_C( 127), INT8_C( -8), INT8_C( 127), INT8_C( -14),
|
2514
|
+
INT8_C( 20), INT8_C( 127), INT8_C( 0), INT8_C( 127),
|
2515
|
+
INT8_C( -13), INT8_C(-128), INT8_C( 127), INT8_C( 1),
|
2516
|
+
INT8_C( 14), INT8_C( 127), INT8_C( -1), INT8_C( -8)) },
|
2517
|
+
{ simde_mm512_set_epi16(INT16_C( -562), INT16_C( -4), INT16_C( 14830), INT16_C( 23439),
|
2518
|
+
INT16_C( -872), INT16_C( 2), INT16_C( -152), INT16_C( 42),
|
2519
|
+
INT16_C( 23882), INT16_C( -7), INT16_C(-27326), INT16_C( 5025),
|
2520
|
+
INT16_C( 7663), INT16_C(-14858), INT16_C( 0), INT16_C( -1),
|
2521
|
+
INT16_C( 27), INT16_C( 3), INT16_C( -6), INT16_C( 54),
|
2522
|
+
INT16_C( -16), INT16_C( -120), INT16_C( -1), INT16_C( 0),
|
2523
|
+
INT16_C( 50), INT16_C( -3), INT16_C( 1), INT16_C( -128),
|
2524
|
+
INT16_C( -6425), INT16_C( 1), INT16_C( -1), INT16_C( -167)),
|
2525
|
+
simde_mm256_set_epi8(INT8_C(-128), INT8_C( -4), INT8_C( 127), INT8_C( 127),
|
2526
|
+
INT8_C(-128), INT8_C( 2), INT8_C(-128), INT8_C( 42),
|
2527
|
+
INT8_C( 127), INT8_C( -7), INT8_C(-128), INT8_C( 127),
|
2528
|
+
INT8_C( 127), INT8_C(-128), INT8_C( 0), INT8_C( -1),
|
2529
|
+
INT8_C( 27), INT8_C( 3), INT8_C( -6), INT8_C( 54),
|
2530
|
+
INT8_C( -16), INT8_C(-120), INT8_C( -1), INT8_C( 0),
|
2531
|
+
INT8_C( 50), INT8_C( -3), INT8_C( 1), INT8_C(-128),
|
2532
|
+
INT8_C(-128), INT8_C( 1), INT8_C( -1), INT8_C(-128)) },
|
2533
|
+
{ simde_mm512_set_epi16(INT16_C( 117), INT16_C( 75), INT16_C( -56), INT16_C( -1),
|
2534
|
+
INT16_C( 53), INT16_C( -283), INT16_C( 138), INT16_C( 3),
|
2535
|
+
INT16_C( -1), INT16_C( 6705), INT16_C( 138), INT16_C( -3521),
|
2536
|
+
INT16_C( 22), INT16_C( 1779), INT16_C( 2888), INT16_C( -1),
|
2537
|
+
INT16_C( -189), INT16_C( 17712), INT16_C( -18), INT16_C( 923),
|
2538
|
+
INT16_C( 1), INT16_C( 1), INT16_C( 2605), INT16_C( 353),
|
2539
|
+
INT16_C( 201), INT16_C( -120), INT16_C(-28865), INT16_C( -13),
|
2540
|
+
INT16_C( -701), INT16_C( 945), INT16_C( -2270), INT16_C( 0)),
|
2541
|
+
simde_mm256_set_epi8(INT8_C( 117), INT8_C( 75), INT8_C( -56), INT8_C( -1),
|
2542
|
+
INT8_C( 53), INT8_C(-128), INT8_C( 127), INT8_C( 3),
|
2543
|
+
INT8_C( -1), INT8_C( 127), INT8_C( 127), INT8_C(-128),
|
2544
|
+
INT8_C( 22), INT8_C( 127), INT8_C( 127), INT8_C( -1),
|
2545
|
+
INT8_C(-128), INT8_C( 127), INT8_C( -18), INT8_C( 127),
|
2546
|
+
INT8_C( 1), INT8_C( 1), INT8_C( 127), INT8_C( 127),
|
2547
|
+
INT8_C( 127), INT8_C(-120), INT8_C(-128), INT8_C( -13),
|
2548
|
+
INT8_C(-128), INT8_C( 127), INT8_C(-128), INT8_C( 0)) },
|
2549
|
+
{ simde_mm512_set_epi16(INT16_C( 127), INT16_C( 406), INT16_C( 74), INT16_C( -2),
|
2550
|
+
INT16_C( -12), INT16_C( 196), INT16_C( -4), INT16_C( -4852),
|
2551
|
+
INT16_C( 38), INT16_C( -10), INT16_C( -408), INT16_C( 453),
|
2552
|
+
INT16_C( -6833), INT16_C( 37), INT16_C( -3464), INT16_C( -2),
|
2553
|
+
INT16_C( -488), INT16_C( 0), INT16_C( 643), INT16_C( 6),
|
2554
|
+
INT16_C( 51), INT16_C( 0), INT16_C( -4), INT16_C( -1),
|
2555
|
+
INT16_C(-14928), INT16_C( -46), INT16_C( 58), INT16_C( -3),
|
2556
|
+
INT16_C( 0), INT16_C( -343), INT16_C(-10019), INT16_C( 0)),
|
2557
|
+
simde_mm256_set_epi8(INT8_C( 127), INT8_C( 127), INT8_C( 74), INT8_C( -2),
|
2558
|
+
INT8_C( -12), INT8_C( 127), INT8_C( -4), INT8_C(-128),
|
2559
|
+
INT8_C( 38), INT8_C( -10), INT8_C(-128), INT8_C( 127),
|
2560
|
+
INT8_C(-128), INT8_C( 37), INT8_C(-128), INT8_C( -2),
|
2561
|
+
INT8_C(-128), INT8_C( 0), INT8_C( 127), INT8_C( 6),
|
2562
|
+
INT8_C( 51), INT8_C( 0), INT8_C( -4), INT8_C( -1),
|
2563
|
+
INT8_C(-128), INT8_C( -46), INT8_C( 58), INT8_C( -3),
|
2564
|
+
INT8_C( 0), INT8_C(-128), INT8_C(-128), INT8_C( 0)) },
|
2565
|
+
{ simde_mm512_set_epi16(INT16_C( -1), INT16_C( -378), INT16_C( 3797), INT16_C( 1),
|
2566
|
+
INT16_C( -61), INT16_C( -6468), INT16_C( 0), INT16_C(-18745),
|
2567
|
+
INT16_C( 3), INT16_C( -5), INT16_C( -1), INT16_C( 4066),
|
2568
|
+
INT16_C( -1), INT16_C( -11), INT16_C( -2), INT16_C( 881),
|
2569
|
+
INT16_C( -116), INT16_C( 22), INT16_C( 1), INT16_C( -1127),
|
2570
|
+
INT16_C( 15), INT16_C( 2276), INT16_C( -149), INT16_C( 7345),
|
2571
|
+
INT16_C( 850), INT16_C( -84), INT16_C( -2), INT16_C( 0),
|
2572
|
+
INT16_C( -6), INT16_C( -3696), INT16_C( -2), INT16_C( 2136)),
|
2573
|
+
simde_mm256_set_epi8(INT8_C( -1), INT8_C(-128), INT8_C( 127), INT8_C( 1),
|
2574
|
+
INT8_C( -61), INT8_C(-128), INT8_C( 0), INT8_C(-128),
|
2575
|
+
INT8_C( 3), INT8_C( -5), INT8_C( -1), INT8_C( 127),
|
2576
|
+
INT8_C( -1), INT8_C( -11), INT8_C( -2), INT8_C( 127),
|
2577
|
+
INT8_C(-116), INT8_C( 22), INT8_C( 1), INT8_C(-128),
|
2578
|
+
INT8_C( 15), INT8_C( 127), INT8_C(-128), INT8_C( 127),
|
2579
|
+
INT8_C( 127), INT8_C( -84), INT8_C( -2), INT8_C( 0),
|
2580
|
+
INT8_C( -6), INT8_C(-128), INT8_C( -2), INT8_C( 127)) },
|
2581
|
+
{ simde_mm512_set_epi16(INT16_C( -368), INT16_C( -1403), INT16_C( -10), INT16_C( 2787),
|
2582
|
+
INT16_C( 6145), INT16_C( -228), INT16_C( 2519), INT16_C( -1),
|
2583
|
+
INT16_C( -244), INT16_C( 10), INT16_C( 14), INT16_C( 113),
|
2584
|
+
INT16_C( 23), INT16_C( 1), INT16_C( 21613), INT16_C( -2),
|
2585
|
+
INT16_C( -2), INT16_C( -29), INT16_C( 9866), INT16_C( 356),
|
2586
|
+
INT16_C( -254), INT16_C( -21), INT16_C( 9), INT16_C( 9),
|
2587
|
+
INT16_C( 249), INT16_C( 3052), INT16_C( -8880), INT16_C( 7),
|
2588
|
+
INT16_C( 0), INT16_C( -4602), INT16_C( -8839), INT16_C( 18288)),
|
2589
|
+
simde_mm256_set_epi8(INT8_C(-128), INT8_C(-128), INT8_C( -10), INT8_C( 127),
|
2590
|
+
INT8_C( 127), INT8_C(-128), INT8_C( 127), INT8_C( -1),
|
2591
|
+
INT8_C(-128), INT8_C( 10), INT8_C( 14), INT8_C( 113),
|
2592
|
+
INT8_C( 23), INT8_C( 1), INT8_C( 127), INT8_C( -2),
|
2593
|
+
INT8_C( -2), INT8_C( -29), INT8_C( 127), INT8_C( 127),
|
2594
|
+
INT8_C(-128), INT8_C( -21), INT8_C( 9), INT8_C( 9),
|
2595
|
+
INT8_C( 127), INT8_C( 127), INT8_C(-128), INT8_C( 7),
|
2596
|
+
INT8_C( 0), INT8_C(-128), INT8_C(-128), INT8_C( 127)) },
|
2597
|
+
{ simde_mm512_set_epi16(INT16_C( 502), INT16_C( 22), INT16_C( -4), INT16_C( 1),
|
2598
|
+
INT16_C( 2), INT16_C( -1148), INT16_C( 1), INT16_C( 8),
|
2599
|
+
INT16_C( 25), INT16_C( 8616), INT16_C( -1), INT16_C( 0),
|
2600
|
+
INT16_C( 1091), INT16_C( -370), INT16_C( 0), INT16_C( -1),
|
2601
|
+
INT16_C( -1549), INT16_C( 12), INT16_C( -2), INT16_C( 4),
|
2602
|
+
INT16_C( -3952), INT16_C( 1681), INT16_C( 3), INT16_C( 35),
|
2603
|
+
INT16_C( -6), INT16_C( 0), INT16_C( -2), INT16_C( 51),
|
2604
|
+
INT16_C( 0), INT16_C( 3760), INT16_C( -1), INT16_C( -1)),
|
2605
|
+
simde_mm256_set_epi8(INT8_C( 127), INT8_C( 22), INT8_C( -4), INT8_C( 1),
|
2606
|
+
INT8_C( 2), INT8_C(-128), INT8_C( 1), INT8_C( 8),
|
2607
|
+
INT8_C( 25), INT8_C( 127), INT8_C( -1), INT8_C( 0),
|
2608
|
+
INT8_C( 127), INT8_C(-128), INT8_C( 0), INT8_C( -1),
|
2609
|
+
INT8_C(-128), INT8_C( 12), INT8_C( -2), INT8_C( 4),
|
2610
|
+
INT8_C(-128), INT8_C( 127), INT8_C( 3), INT8_C( 35),
|
2611
|
+
INT8_C( -6), INT8_C( 0), INT8_C( -2), INT8_C( 51),
|
2612
|
+
INT8_C( 0), INT8_C( 127), INT8_C( -1), INT8_C( -1)) }
|
2613
|
+
};
|
2614
|
+
|
2615
|
+
for (size_t i = 0 ; i < (sizeof(test_vec) / sizeof(test_vec[0])); i++) {
|
2616
|
+
simde__m256i r = simde_mm512_cvtsepi16_epi8(test_vec[i].a);
|
2617
|
+
simde_assert_m256i_i8(r, ==, test_vec[i].r);
|
2618
|
+
}
|
2619
|
+
|
2620
|
+
return MUNIT_OK;
|
2621
|
+
}
|
2622
|
+
|
2623
|
+
#endif /* defined(SIMDE_avx512bw_NATIVE) || defined(SIMDE_NO_NATIVE) || defined(SIMDE_ALWAYS_BUILD_NATIVE_TESTS) */
|
2624
|
+
|
2625
|
+
HEDLEY_DIAGNOSTIC_PUSH
|
2626
|
+
HEDLEY_DIAGNOSTIC_DISABLE_CAST_QUAL
|
2627
|
+
|
2628
|
+
static MunitTest test_suite_tests[] = {
|
2629
|
+
#if defined(SIMDE_AVX512BW_NATIVE) || defined(SIMDE_NO_NATIVE) || defined(SIMDE_ALWAYS_BUILD_NATIVE_TESTS)
|
2630
|
+
SIMDE_TESTS_DEFINE_TEST(mm512_add_epi32),
|
2631
|
+
SIMDE_TESTS_DEFINE_TEST(mm512_add_epi64),
|
2632
|
+
|
2633
|
+
SIMDE_TESTS_DEFINE_TEST(mm512_adds_epi8),
|
2634
|
+
SIMDE_TESTS_DEFINE_TEST(mm512_adds_epi16),
|
2635
|
+
SIMDE_TESTS_DEFINE_TEST(mm512_adds_epu8),
|
2636
|
+
SIMDE_TESTS_DEFINE_TEST(mm512_adds_epu16),
|
2637
|
+
|
2638
|
+
SIMDE_TESTS_DEFINE_TEST(mm512_shuffle_epi8),
|
2639
|
+
SIMDE_TESTS_DEFINE_TEST(mm512_cmpeq_epi8_mask),
|
2640
|
+
|
2641
|
+
SIMDE_TESTS_DEFINE_TEST(mm512_cvtepi8_epi16),
|
2642
|
+
SIMDE_TESTS_DEFINE_TEST(mm512_cvtepi16_epi8),
|
2643
|
+
|
2644
|
+
SIMDE_TESTS_DEFINE_TEST(mm512_cvtsepi16_epi8),
|
2645
|
+
|
2646
|
+
#endif /* defined(SIMDE_AVX512bw_NATIVE) || defined(SIMDE_NO_NATIVE) || defined(SIMDE_ALWAYS_BUILD_NATIVE_TESTS) */
|
2647
|
+
{ NULL, NULL, NULL, NULL, MUNIT_TEST_OPTION_NONE, NULL }
|
2648
|
+
};
|
2649
|
+
|
2650
|
+
HEDLEY_C_DECL MunitSuite* SIMDE_TESTS_GENERATE_SYMBOL(suite)(void) {
|
2651
|
+
static MunitSuite suite = { (char*) "/" HEDLEY_STRINGIFY(SIMDE_TESTS_CURRENT_ISAX), test_suite_tests, NULL, 1, MUNIT_SUITE_OPTION_NONE };
|
2652
|
+
|
2653
|
+
return &suite;
|
2654
|
+
}
|
2655
|
+
|
2656
|
+
#if defined(SIMDE_TESTS_SINGLE_ISAX)
|
2657
|
+
int main(int argc, char* argv[HEDLEY_ARRAY_PARAM(argc + 1)]) {
|
2658
|
+
static MunitSuite suite = { "", test_suite_tests, NULL, 1, MUNIT_SUITE_OPTION_NONE };
|
2659
|
+
|
2660
|
+
return munit_suite_main(&suite, NULL, argc, argv);
|
2661
|
+
}
|
2662
|
+
#endif /* defined(SIMDE_TESTS_SINGLE_ISAX) */
|
2663
|
+
|
2664
|
+
HEDLEY_DIAGNOSTIC_POP
|