e507a781128de0b7382281e926a937158165280c
[openjpeg.git] / src / lib / openmj2 / mct.c
1 /*
2  * The copyright in this software is being made available under the 2-clauses 
3  * BSD License, included below. This software may be subject to other third 
4  * party and contributor rights, including patent rights, and no such rights
5  * are granted under this license.
6  *
7  * Copyright (c) 2002-2014, Universite catholique de Louvain (UCL), Belgium
8  * Copyright (c) 2002-2014, Professor Benoit Macq
9  * Copyright (c) 2001-2003, David Janssens
10  * Copyright (c) 2002-2003, Yannick Verschueren
11  * Copyright (c) 2003-2007, Francois-Olivier Devaux 
12  * Copyright (c) 2003-2014, Antonin Descampe
13  * Copyright (c) 2005, Herve Drolon, FreeImage Team
14  * All rights reserved.
15  *
16  * Redistribution and use in source and binary forms, with or without
17  * modification, are permitted provided that the following conditions
18  * are met:
19  * 1. Redistributions of source code must retain the above copyright
20  *    notice, this list of conditions and the following disclaimer.
21  * 2. Redistributions in binary form must reproduce the above copyright
22  *    notice, this list of conditions and the following disclaimer in the
23  *    documentation and/or other materials provided with the distribution.
24  *
25  * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS `AS IS'
26  * AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
27  * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
28  * ARE DISCLAIMED.  IN NO EVENT SHALL THE COPYRIGHT OWNER OR CONTRIBUTORS BE
29  * LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR
30  * CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF
31  * SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS
32  * INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN
33  * CONTRACT, STRICT LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE)
34  * ARISING IN ANY WAY OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE
35  * POSSIBILITY OF SUCH DAMAGE.
36  */
37
38 #ifdef __SSE__
39 #include <xmmintrin.h>
40 #endif
41
42 #include "opj_includes.h"
43
44 /* <summary> */
45 /* This table contains the norms of the basis function of the reversible MCT. */
46 /* </summary> */
47 static const double mct_norms[3] = { 1.732, .8292, .8292 };
48
49 /* <summary> */
50 /* This table contains the norms of the basis function of the irreversible MCT. */
51 /* </summary> */
52 static const double mct_norms_real[3] = { 1.732, 1.805, 1.573 };
53
54 /* <summary> */
55 /* Foward reversible MCT. */
56 /* </summary> */
57 void mct_encode(
58                 int* restrict c0,
59                 int* restrict c1,
60                 int* restrict c2,
61                 int n)
62 {
63         int i;
64         for(i = 0; i < n; ++i) {
65                 int r = c0[i];
66                 int g = c1[i];
67                 int b = c2[i];
68                 int y = (r + (g * 2) + b) >> 2;
69                 int u = b - g;
70                 int v = r - g;
71                 c0[i] = y;
72                 c1[i] = u;
73                 c2[i] = v;
74         }
75 }
76
77 /* <summary> */
78 /* Inverse reversible MCT. */
79 /* </summary> */
80 void mct_decode(
81                 int* restrict c0,
82                 int* restrict c1, 
83                 int* restrict c2, 
84                 int n)
85 {
86         int i;
87         for (i = 0; i < n; ++i) {
88                 int y = c0[i];
89                 int u = c1[i];
90                 int v = c2[i];
91                 int g = y - ((u + v) >> 2);
92                 int r = v + g;
93                 int b = u + g;
94                 c0[i] = r;
95                 c1[i] = g;
96                 c2[i] = b;
97         }
98 }
99
100 /* <summary> */
101 /* Get norm of basis function of reversible MCT. */
102 /* </summary> */
103 double mct_getnorm(int compno) {
104         return mct_norms[compno];
105 }
106
107 /* <summary> */
108 /* Foward irreversible MCT. */
109 /* </summary> */
110 void mct_encode_real(
111                 int* restrict c0,
112                 int* restrict c1,
113                 int* restrict c2,
114                 int n)
115 {
116         int i;
117         for(i = 0; i < n; ++i) {
118                 int r = c0[i];
119                 int g = c1[i];
120                 int b = c2[i];
121                 int y =  fix_mul(r, 2449) + fix_mul(g, 4809) + fix_mul(b, 934);
122                 int u = -fix_mul(r, 1382) - fix_mul(g, 2714) + fix_mul(b, 4096);
123                 int v =  fix_mul(r, 4096) - fix_mul(g, 3430) - fix_mul(b, 666);
124                 c0[i] = y;
125                 c1[i] = u;
126                 c2[i] = v;
127         }
128 }
129
130 /* <summary> */
131 /* Inverse irreversible MCT. */
132 /* </summary> */
133 void mct_decode_real(
134                 float* restrict c0,
135                 float* restrict c1,
136                 float* restrict c2,
137                 int n)
138 {
139         int i;
140 #ifdef __SSE__
141         __m128 vrv, vgu, vgv, vbu;
142         vrv = _mm_set1_ps(1.402f);
143         vgu = _mm_set1_ps(0.34413f);
144         vgv = _mm_set1_ps(0.71414f);
145         vbu = _mm_set1_ps(1.772f);
146         for (i = 0; i < (n >> 3); ++i) {
147                 __m128 vy, vu, vv;
148                 __m128 vr, vg, vb;
149
150                 vy = _mm_load_ps(c0);
151                 vu = _mm_load_ps(c1);
152                 vv = _mm_load_ps(c2);
153                 vr = _mm_add_ps(vy, _mm_mul_ps(vv, vrv));
154                 vg = _mm_sub_ps(_mm_sub_ps(vy, _mm_mul_ps(vu, vgu)), _mm_mul_ps(vv, vgv));
155                 vb = _mm_add_ps(vy, _mm_mul_ps(vu, vbu));
156                 _mm_store_ps(c0, vr);
157                 _mm_store_ps(c1, vg);
158                 _mm_store_ps(c2, vb);
159                 c0 += 4;
160                 c1 += 4;
161                 c2 += 4;
162
163                 vy = _mm_load_ps(c0);
164                 vu = _mm_load_ps(c1);
165                 vv = _mm_load_ps(c2);
166                 vr = _mm_add_ps(vy, _mm_mul_ps(vv, vrv));
167                 vg = _mm_sub_ps(_mm_sub_ps(vy, _mm_mul_ps(vu, vgu)), _mm_mul_ps(vv, vgv));
168                 vb = _mm_add_ps(vy, _mm_mul_ps(vu, vbu));
169                 _mm_store_ps(c0, vr);
170                 _mm_store_ps(c1, vg);
171                 _mm_store_ps(c2, vb);
172                 c0 += 4;
173                 c1 += 4;
174                 c2 += 4;
175         }
176         n &= 7;
177 #endif
178         for(i = 0; i < n; ++i) {
179                 float y = c0[i];
180                 float u = c1[i];
181                 float v = c2[i];
182                 float r = y + (v * 1.402f);
183                 float g = y - (u * 0.34413f) - (v * (0.71414f));
184                 float b = y + (u * 1.772f);
185                 c0[i] = r;
186                 c1[i] = g;
187                 c2[i] = b;
188         }
189 }
190
191 /* <summary> */
192 /* Get norm of basis function of irreversible MCT. */
193 /* </summary> */
194 double mct_getnorm_real(int compno) {
195         return mct_norms_real[compno];
196 }