Reformat whole codebase with astyle.options (#128)
[openjpeg.git] / src / lib / openmj2 / mct.c
1 /*
2  * The copyright in this software is being made available under the 2-clauses
3  * BSD License, included below. This software may be subject to other third
4  * party and contributor rights, including patent rights, and no such rights
5  * are granted under this license.
6  *
7  * Copyright (c) 2002-2014, Universite catholique de Louvain (UCL), Belgium
8  * Copyright (c) 2002-2014, Professor Benoit Macq
9  * Copyright (c) 2001-2003, David Janssens
10  * Copyright (c) 2002-2003, Yannick Verschueren
11  * Copyright (c) 2003-2007, Francois-Olivier Devaux
12  * Copyright (c) 2003-2014, Antonin Descampe
13  * Copyright (c) 2005, Herve Drolon, FreeImage Team
14  * All rights reserved.
15  *
16  * Redistribution and use in source and binary forms, with or without
17  * modification, are permitted provided that the following conditions
18  * are met:
19  * 1. Redistributions of source code must retain the above copyright
20  *    notice, this list of conditions and the following disclaimer.
21  * 2. Redistributions in binary form must reproduce the above copyright
22  *    notice, this list of conditions and the following disclaimer in the
23  *    documentation and/or other materials provided with the distribution.
24  *
25  * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS `AS IS'
26  * AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
27  * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
28  * ARE DISCLAIMED.  IN NO EVENT SHALL THE COPYRIGHT OWNER OR CONTRIBUTORS BE
29  * LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR
30  * CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF
31  * SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS
32  * INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN
33  * CONTRACT, STRICT LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE)
34  * ARISING IN ANY WAY OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE
35  * POSSIBILITY OF SUCH DAMAGE.
36  */
37
38 #ifdef __SSE__
39 #include <xmmintrin.h>
40 #endif
41
42 #include "opj_includes.h"
43
44 /* <summary> */
45 /* This table contains the norms of the basis function of the reversible MCT. */
46 /* </summary> */
47 static const double mct_norms[3] = { 1.732, .8292, .8292 };
48
49 /* <summary> */
50 /* This table contains the norms of the basis function of the irreversible MCT. */
51 /* </summary> */
52 static const double mct_norms_real[3] = { 1.732, 1.805, 1.573 };
53
54 /* <summary> */
55 /* Forward reversible MCT. */
56 /* </summary> */
57 void mct_encode(
58     int* restrict c0,
59     int* restrict c1,
60     int* restrict c2,
61     int n)
62 {
63     int i;
64     for (i = 0; i < n; ++i) {
65         int r = c0[i];
66         int g = c1[i];
67         int b = c2[i];
68         int y = (r + (g * 2) + b) >> 2;
69         int u = b - g;
70         int v = r - g;
71         c0[i] = y;
72         c1[i] = u;
73         c2[i] = v;
74     }
75 }
76
77 /* <summary> */
78 /* Inverse reversible MCT. */
79 /* </summary> */
80 void mct_decode(
81     int* restrict c0,
82     int* restrict c1,
83     int* restrict c2,
84     int n)
85 {
86     int i;
87     for (i = 0; i < n; ++i) {
88         int y = c0[i];
89         int u = c1[i];
90         int v = c2[i];
91         int g = y - ((u + v) >> 2);
92         int r = v + g;
93         int b = u + g;
94         c0[i] = r;
95         c1[i] = g;
96         c2[i] = b;
97     }
98 }
99
100 /* <summary> */
101 /* Get norm of basis function of reversible MCT. */
102 /* </summary> */
103 double mct_getnorm(int compno)
104 {
105     return mct_norms[compno];
106 }
107
108 /* <summary> */
109 /* Forward irreversible MCT. */
110 /* </summary> */
111 void mct_encode_real(
112     int* restrict c0,
113     int* restrict c1,
114     int* restrict c2,
115     int n)
116 {
117     int i;
118     for (i = 0; i < n; ++i) {
119         int r = c0[i];
120         int g = c1[i];
121         int b = c2[i];
122         int y =  fix_mul(r, 2449) + fix_mul(g, 4809) + fix_mul(b, 934);
123         int u = -fix_mul(r, 1382) - fix_mul(g, 2714) + fix_mul(b, 4096);
124         int v =  fix_mul(r, 4096) - fix_mul(g, 3430) - fix_mul(b, 666);
125         c0[i] = y;
126         c1[i] = u;
127         c2[i] = v;
128     }
129 }
130
131 /* <summary> */
132 /* Inverse irreversible MCT. */
133 /* </summary> */
134 void mct_decode_real(
135     float* restrict c0,
136     float* restrict c1,
137     float* restrict c2,
138     int n)
139 {
140     int i;
141 #ifdef __SSE__
142     __m128 vrv, vgu, vgv, vbu;
143     vrv = _mm_set1_ps(1.402f);
144     vgu = _mm_set1_ps(0.34413f);
145     vgv = _mm_set1_ps(0.71414f);
146     vbu = _mm_set1_ps(1.772f);
147     for (i = 0; i < (n >> 3); ++i) {
148         __m128 vy, vu, vv;
149         __m128 vr, vg, vb;
150
151         vy = _mm_load_ps(c0);
152         vu = _mm_load_ps(c1);
153         vv = _mm_load_ps(c2);
154         vr = _mm_add_ps(vy, _mm_mul_ps(vv, vrv));
155         vg = _mm_sub_ps(_mm_sub_ps(vy, _mm_mul_ps(vu, vgu)), _mm_mul_ps(vv, vgv));
156         vb = _mm_add_ps(vy, _mm_mul_ps(vu, vbu));
157         _mm_store_ps(c0, vr);
158         _mm_store_ps(c1, vg);
159         _mm_store_ps(c2, vb);
160         c0 += 4;
161         c1 += 4;
162         c2 += 4;
163
164         vy = _mm_load_ps(c0);
165         vu = _mm_load_ps(c1);
166         vv = _mm_load_ps(c2);
167         vr = _mm_add_ps(vy, _mm_mul_ps(vv, vrv));
168         vg = _mm_sub_ps(_mm_sub_ps(vy, _mm_mul_ps(vu, vgu)), _mm_mul_ps(vv, vgv));
169         vb = _mm_add_ps(vy, _mm_mul_ps(vu, vbu));
170         _mm_store_ps(c0, vr);
171         _mm_store_ps(c1, vg);
172         _mm_store_ps(c2, vb);
173         c0 += 4;
174         c1 += 4;
175         c2 += 4;
176     }
177     n &= 7;
178 #endif
179     for (i = 0; i < n; ++i) {
180         float y = c0[i];
181         float u = c1[i];
182         float v = c2[i];
183         float r = y + (v * 1.402f);
184         float g = y - (u * 0.34413f) - (v * (0.71414f));
185         float b = y + (u * 1.772f);
186         c0[i] = r;
187         c1[i] = g;
188         c2[i] = b;
189     }
190 }
191
192 /* <summary> */
193 /* Get norm of basis function of irreversible MCT. */
194 /* </summary> */
195 double mct_getnorm_real(int compno)
196 {
197     return mct_norms_real[compno];
198 }