Small optimisations to audio analysis.
[dcpomatic.git] / src / lib / analyse_audio_job.cc
1 /*
2     Copyright (C) 2012-2015 Carl Hetherington <cth@carlh.net>
3
4     This program is free software; you can redistribute it and/or modify
5     it under the terms of the GNU General Public License as published by
6     the Free Software Foundation; either version 2 of the License, or
7     (at your option) any later version.
8
9     This program is distributed in the hope that it will be useful,
10     but WITHOUT ANY WARRANTY; without even the implied warranty of
11     MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
12     GNU General Public License for more details.
13
14     You should have received a copy of the GNU General Public License
15     along with this program; if not, write to the Free Software
16     Foundation, Inc., 675 Mass Ave, Cambridge, MA 02139, USA.
17
18 */
19
20 #include "audio_analysis.h"
21 #include "audio_buffers.h"
22 #include "analyse_audio_job.h"
23 #include "audio_content.h"
24 #include "compose.hpp"
25 #include "film.h"
26 #include "player.h"
27 #include "playlist.h"
28 #include <boost/foreach.hpp>
29
30 #include "i18n.h"
31
32 using std::string;
33 using std::max;
34 using std::min;
35 using std::cout;
36 using boost::shared_ptr;
37 using boost::dynamic_pointer_cast;
38
39 int const AnalyseAudioJob::_num_points = 1024;
40
41 AnalyseAudioJob::AnalyseAudioJob (shared_ptr<const Film> film, shared_ptr<const Playlist> playlist)
42         : Job (film)
43         , _playlist (playlist)
44         , _done (0)
45         , _samples_per_point (1)
46         , _current (0)
47         , _overall_peak (0)
48         , _overall_peak_frame (0)
49 {
50
51 }
52
53 AnalyseAudioJob::~AnalyseAudioJob ()
54 {
55         delete[] _current;
56 }
57
58 string
59 AnalyseAudioJob::name () const
60 {
61         return _("Analyse audio");
62 }
63
64 string
65 AnalyseAudioJob::json_name () const
66 {
67         return N_("analyse_audio");
68 }
69
70 void
71 AnalyseAudioJob::run ()
72 {
73         shared_ptr<Player> player (new Player (_film, _playlist));
74         player->set_ignore_video ();
75
76         int64_t const len = _playlist->length().frames_round (_film->audio_frame_rate());
77         _samples_per_point = max (int64_t (1), len / _num_points);
78
79         delete[] _current;
80         _current = new AudioPoint[_film->audio_channels ()];
81         _analysis.reset (new AudioAnalysis (_film->audio_channels ()));
82
83         bool has_any_audio = false;
84         BOOST_FOREACH (shared_ptr<Content> c, _playlist->content ()) {
85                 if (dynamic_pointer_cast<AudioContent> (c)) {
86                         has_any_audio = true;
87                 }
88         }
89
90         if (has_any_audio) {
91                 _done = 0;
92                 DCPTime const block = DCPTime::from_seconds (1.0 / 8);
93                 for (DCPTime t; t < _film->length(); t += block) {
94                         analyse (player->get_audio (t, block, false));
95                         set_progress (t.seconds() / _film->length().seconds());
96                 }
97         }
98
99         _analysis->set_peak (_overall_peak, DCPTime::from_frames (_overall_peak_frame, _film->audio_frame_rate ()));
100
101         if (_playlist->content().size() == 1) {
102                 /* If there was only one piece of content in this analysis we may later need to know what its
103                    gain was when we analysed it.
104                 */
105                 shared_ptr<const AudioContent> ac = dynamic_pointer_cast<const AudioContent> (_playlist->content().front ());
106                 DCPOMATIC_ASSERT (ac);
107                 _analysis->set_analysis_gain (ac->audio_gain ());
108         }
109
110         _analysis->write (_film->audio_analysis_path (_playlist));
111
112         set_progress (1);
113         set_state (FINISHED_OK);
114 }
115
116 void
117 AnalyseAudioJob::analyse (shared_ptr<const AudioBuffers> b)
118 {
119         int const frames = b->frames ();
120         int const channels = b->channels ();
121
122         for (int i = 0; i < frames; ++i) {
123                 for (int j = 0; j < channels; ++j) {
124                         float s = b->data(j)[i];
125                         float as = fabsf (s);
126                         if (as < 10e-7) {
127                                 /* SafeStringStream can't serialise and recover inf or -inf, so prevent such
128                                    values by replacing with this (140dB down) */
129                                 s = as = 10e-7;
130                         }
131                         _current[j][AudioPoint::RMS] += pow (s, 2);
132                         _current[j][AudioPoint::PEAK] = max (_current[j][AudioPoint::PEAK], as);
133
134                         if (as > _overall_peak) {
135                                 _overall_peak = as;
136                                 _overall_peak_frame = _done + i;
137                         }
138
139                         if ((_done % _samples_per_point) == 0) {
140                                 _current[j][AudioPoint::RMS] = sqrt (_current[j][AudioPoint::RMS] / _samples_per_point);
141                                 _analysis->add_point (j, _current[j]);
142                                 _current[j] = AudioPoint ();
143                         }
144                 }
145
146                 ++_done;
147         }
148 }