IDWT 5x3: generalize SSE2 version for AVX2
authorEven Rouault <even.rouault@spatialys.com>
Wed, 21 Jun 2017 10:12:58 +0000 (12:12 +0200)
committerEven Rouault <even.rouault@spatialys.com>
Wed, 21 Jun 2017 10:12:58 +0000 (12:12 +0200)
commitfd0dc535ad9ae0d369d1039aaf56235583ca64ea
tree138e06bb4f02607e0ea51a8ee39ef379d71085b3
parentf6e3475cc9328e5378e96e72b5adf29fb07c5feb
IDWT 5x3: generalize SSE2 version for AVX2

Thanks to our macros that abstract SSE use, the functions can use
AVX2 when available (at compile time)

This brings an extra 23% speed improvement on bench_dwt in 64bit builds
with AVX2 compared to SSE2.
src/lib/openjp2/dwt.c
src/lib/openjp2/opj_malloc.c
src/lib/openjp2/opj_malloc.h