canonical names for video-tools
[ardour.git] / gtk2_ardour / transcode_ffmpeg.cc
1 /*
2     Copyright (C) 2010-2013 Paul Davis
3     Author: Robin Gareus <robin@gareus.org>
4
5     This program is free software; you can redistribute it and/or modify
6     it under the terms of the GNU General Public License as published by
7     the Free Software Foundation; either version 2 of the License, or
8     (at your option) any later version.
9
10     This program is distributed in the hope that it will be useful,
11     but WITHOUT ANY WARRANTY; without even the implied warranty of
12     MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
13     GNU General Public License for more details.
14
15     You should have received a copy of the GNU General Public License
16     along with this program; if not, write to the Free Software
17     Foundation, Inc., 675 Mass Ave, Cambridge, MA 02139, USA.
18
19 */
20 #ifdef WITH_VIDEOTIMELINE
21
22 #include <stdio.h>
23 #include <string.h>
24 #include <sstream>
25 #include <sys/types.h>
26
27 #include "pbd/error.h"
28 #include "pbd/file_utils.h"
29 #include "pbd/file_utils.h"
30 #include "gui_thread.h"
31
32 #include "transcode_ffmpeg.h"
33 #include "utils_videotl.h"
34
35 #include "i18n.h"
36
37 TranscodeFfmpeg::TranscodeFfmpeg (std::string f)
38         : infile(f)
39 {
40         probeok = false;
41         ffexecok = false;
42         ffmpeg_exe = "";
43         ffprobe_exe = "";
44         m_duration = 0;
45 #if 1 /* tentative debug mode */
46         debug_enable = false;
47 #endif
48
49         std::string ff_file_path;
50         if (find_file_in_search_path (PBD::SearchPath(Glib::getenv("PATH")), X_("ffmpeg_harvid"), ff_file_path)) { ffmpeg_exe = ff_file_path; }
51         else if (Glib::file_test(X_("C:\\Program Files\\harvid\\ffmpeg.exe"), Glib::FILE_TEST_EXISTS)) {
52                 ffmpeg_exe = X_("C:\\Program Files\\ffmpeg\\ffmpeg.exe");
53         }
54         else if (Glib::file_test(X_("C:\\Program Files\\ffmpeg\\ffmpeg.exe"), Glib::FILE_TEST_EXISTS)) {
55                 ffmpeg_exe = X_("C:\\Program Files\\ffmpeg\\ffmpeg.exe");
56         }
57
58         if (find_file_in_search_path (PBD::SearchPath(Glib::getenv("PATH")), X_("ffprobe_harvid"), ff_file_path)) { ffprobe_exe = ff_file_path; }
59         else if (Glib::file_test(X_("C:\\Program Files\\harvid\\ffprobe.exe"), Glib::FILE_TEST_EXISTS)) {
60                 ffprobe_exe = X_("C:\\Program Files\\ffmpeg\\ffprobe.exe");
61         }
62         else if (Glib::file_test(X_("C:\\Program Files\\ffmpeg\\ffprobe.exe"), Glib::FILE_TEST_EXISTS)) {
63                 ffprobe_exe = X_("C:\\Program Files\\ffmpeg\\ffprobe.exe");
64         }
65
66         if (ffmpeg_exe.empty() || ffprobe_exe.empty()) {
67                 PBD::warning << _("No ffprobe or ffmpeg executables could be found on this system. Transcoding is not possible until you install those tools.") << endmsg;
68                 return;
69         }
70         ffexecok = true;
71
72         if (infile.empty() || !probe()) {
73                 return;
74         }
75         probeok = true;
76 }
77
78 TranscodeFfmpeg::~TranscodeFfmpeg ()
79 {
80   ;
81 }
82
83 bool
84 TranscodeFfmpeg::probe ()
85 {
86         ffoutput = "";
87         char **argp;
88         argp=(char**) calloc(7,sizeof(char*));
89         argp[0] = strdup(ffprobe_exe.c_str());
90         argp[1] = strdup("-print_format"); // "-of"  ; new version and avprobe compat but avprobe does not yet support csv
91         argp[2] = strdup("csv"); // TODO use "csv=nk=0" and parse key/value pairs -> ffprobe version agnostic or parse XML or JSON key/value
92         argp[3] = strdup("-show_format");
93         argp[4] = strdup("-show_streams");
94         argp[5] = strdup(infile.c_str());
95         argp[6] = 0;
96         ffcmd = new SystemExec(ffprobe_exe, argp);
97         ffcmd->ReadStdout.connect_same_thread (*this, boost::bind (&TranscodeFfmpeg::ffprobeparse, this, _1 ,_2));
98         ffcmd->Terminated.connect_same_thread (*this, boost::bind (&TranscodeFfmpeg::ffexit, this));
99         if (ffcmd->start(1)) {
100                 ffexit();
101                 return false;
102         }
103         ffcmd->wait();
104
105         /* parse */
106
107         std::vector<std::vector<std::string> > lines;
108         ParseCSV(ffoutput, lines);
109         m_width = m_height = 0;
110         m_fps = m_aspect = 0;
111         m_duration = 0;
112         m_codec.clear();
113         m_audio.clear();
114
115         for (std::vector<std::vector<std::string> >::iterator i = lines.begin(); i != lines.end(); ++i) {
116                 if (i->at(0) == X_("format")) {
117                         /* format,filename,#streams,format-name,format-long-name,start-time,duration,size,bitrate */
118                 } else
119                 if (i->at(0) == X_("stream")) {
120                         /*--------- Stream format
121                          * stream,index,codec-name,codec-name-long,PROFILE,
122                          *   codec_time_base,codec_tag_string,codec_tag[hex],
123                          * VIDEO:
124                          *   width,height,has_b_frames,sample_aspect_ratio,display_aspect_ratio
125                          *   pix_fmt,level,
126                          *   timecode
127                          * AUDIO:
128                          *   sample_fmt,sample_rate,channels,bits_per_sample
129                          *
130                          * all cont'd;
131                          *   r_frame_rate,avg_frame_rate,time_base,start_time,duration,
132                          *   bit_rate,nb_frames,nb_read_frames,nb_read_packets
133                          *
134                          *---------- Example
135                          * stream,0,mpeg2video,MPEG-2 video,video,1/50,[0][0][0][0],0x0000,720,576,1,16:15,4:3,yuv420p,8,00:02:30:00,0x1e0,25/1,25/1,1/90000,0.360000,N/A,7000000,N/A,N/A,N/A
136                          * stream,1,ac3,ATSC A/52A (AC-3),audio,1/48000,[0][0][0][0],0x0000,s16,48000,6,0,-1,-1.000000,-1.000000,-1.000000,-1.000000,0x80,0/0,0/0,1/90000,0.280000,312.992000,448000,N/A,N/A,N/A
137                          * stream,2,ac3,ATSC A/52A (AC-3),audio,1/48000,[0][0][0][0],0x0000,s16,48000,2,0,-1,-1.000000,-1.000000,-1.000000,-1.000000,0x82,0/0,0/0,1/90000,0.280000,312.992000,384000,N/A,N/A,N/A
138                          * stream,3,ac3,ATSC A/52A (AC-3),audio,1/48000,[0][0][0][0],0x0000,s16,48000,2,0,-1,-1.000000,-1.000000,-1.000000,-1.000000,0x81,0/0,0/0,1/90000,0.280000,312.992000,192000,N/A,N/A,N/A
139                          */
140                         if (i->at(4) == X_("video") && m_width == 0) {
141                                 std::string::size_type pos;
142
143                                 m_width = atoi(i->at(8).c_str());
144                                 m_height = atoi(i->at(9).c_str());
145                                 m_codec = i->at(3) + " -- " + i->at(2);
146                                 m_fps = atof(i->at(17).c_str());
147
148                                 pos = i->at(17).find_first_of('/');
149                                 if (pos != std::string::npos) {
150                                         m_fps = atof(i->at(17).substr(0, pos).c_str()) / atof(i->at(17).substr(pos+1).c_str());
151                                 }
152
153                                 pos = i->at(12).find_first_of(':');
154                                 m_aspect = 0;
155                                 if (pos != std::string::npos && atof(i->at(12).substr(pos+1).c_str()) != 0) {
156                                         m_aspect = atof(i->at(12).substr(0, pos).c_str()) / atof(i->at(12).substr(pos+1).c_str());
157                                 }
158                                 if (m_aspect == 0) {
159                                         m_aspect = (double)m_width / (double)m_height;
160                                 }
161
162                                 int h,m,s; char f[7];
163                                 if (sscanf(i->at(15).c_str(), "%d:%d:%d:%s",&h,&m,&s,f) == 4) {
164                                         m_duration = (ARDOUR::framecnt_t) floor(m_fps * (
165                                                         h * 3600.0
166                                                 + m * 60.0
167                                                 + s * 1.0
168                                                 + atoi(f) / pow(10, strlen(f))
169                                         ));
170                                 } else {
171                                         m_duration = atof(i->at(21).c_str()) * m_fps;
172                                 }
173
174                         } else if (i->at(4) == X_("audio")) {
175                                 AudioStream as;
176                                 as.name = i->at(3) + " " + i->at(2) + " " + i->at(8) + " " + i->at(9);
177                                 as.stream_id  = i->at(1);
178                                 as.channels   = atoi(i->at(10).c_str());
179                                 m_audio.push_back(as);
180
181                         } else if (i->at(5) == X_("video") && m_width == 0) { /* new ffprobe */
182                                 std::string::size_type pos;
183
184                                 m_width = atoi(i->at(9).c_str());
185                                 m_height = atoi(i->at(10).c_str());
186                                 m_codec = i->at(3) + " -- " + i->at(2);
187                                 m_fps = atof(i->at(18).c_str());
188
189                                 pos = i->at(18).find_first_of('/');
190                                 if (pos != std::string::npos) {
191                                         m_fps = atof(i->at(18).substr(0, pos).c_str()) / atof(i->at(18).substr(pos+1).c_str());
192                                 }
193
194                                 pos = i->at(13).find_first_of(':');
195                                 m_aspect = 0;
196                                 if (pos != std::string::npos && atof(i->at(13).substr(pos+1).c_str()) != 0) {
197                                         m_aspect = atof(i->at(13).substr(0, pos).c_str()) / atof(i->at(13).substr(pos+1).c_str());
198                                 }
199                                 if (m_aspect == 0) {
200                                         m_aspect = (double)m_width / (double)m_height;
201                                 }
202
203                                 int h,m,s; char f[7];
204                                 if (sscanf(i->at(17).c_str(), "%d:%d:%d:%s",&h,&m,&s,f) == 4) {
205                                         m_duration = (ARDOUR::framecnt_t) floor(m_fps * (
206                                                         h * 3600.0
207                                                 + m * 60.0
208                                                 + s * 1.0
209                                                 + atoi(f) / pow(10, strlen(f))
210                                         ));
211                                 } else if (atof(i->at(23).c_str()) != 0) {
212                                         m_duration = atof(i->at(23).c_str());
213                                 } else {
214                                         m_duration = atof(i->at(24).c_str()) * m_fps;
215                                 }
216
217                         } else if (i->at(5) == X_("audio")) { /* new ffprobe */
218                                 AudioStream as;
219                                 as.name = i->at(3) + " " + i->at(2) + " " + i->at(9) + " " + i->at(10);
220                                 as.stream_id  = i->at(1);
221                                 as.channels   = atoi(i->at(11).c_str());
222                                 m_audio.push_back(as);
223                         }
224                 }
225         }
226         /* end parse */
227
228
229         int timeout = 500;
230         while (ffcmd && --timeout) usleep (1000); // wait until 'ffprobe' terminated.
231         if (timeout == 0) return false;
232
233 #if 0 /* DEBUG */
234         printf("FPS: %f\n", m_fps);
235         printf("Duration: %lu frames\n",(unsigned long)m_duration);
236         printf("W/H: %ix%i\n",m_width, m_height);
237         printf("aspect: %f\n",m_aspect);
238         printf("codec: %s\n",m_codec.c_str());
239         if (m_audio.size() > 0) {
240                 for (AudioStreams::iterator it = m_audio.begin(); it < m_audio.end(); ++it) {
241                         printf("audio: %s - %i channels\n",(*it).stream_id.c_str(), (*it).channels);
242                 }
243         } else {
244           printf("audio: no audio streams in file.\n");
245         }
246 #endif
247
248         return true;
249 }
250
251 FFSettings
252 TranscodeFfmpeg::default_encoder_settings ()
253 {
254         FFSettings ffs;
255         ffs.clear();
256         ffs["-vcodec"] = "mpeg4";
257         ffs["-acodec"] = "ac3";
258         ffs["-b"] = "5000k";
259         ffs["-ab"] = "160k";
260         return ffs;
261 }
262
263 FFSettings
264 TranscodeFfmpeg::default_meta_data ()
265 {
266         FFSettings ffm;
267         ffm.clear();
268         ffm["comment"] = "Created with ardour";
269         return ffm;
270 }
271
272 char *
273 TranscodeFfmpeg::format_metadata (std::string key, std::string value)
274 {
275         size_t start_pos = 0;
276         std::string v1 = value;
277         while((start_pos = v1.find_first_not_of(
278                         "abcdefghijklmnopqrstuvwxyz ABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789(),.\"'",
279                         start_pos)) != std::string::npos)
280         {
281                 v1.replace(start_pos, 1, "_");
282                 start_pos += 1;
283         }
284
285         start_pos = 0;
286         while((start_pos = v1.find("\"", start_pos)) != std::string::npos) {
287                 v1.replace(start_pos, 1, "\\\"");
288                 start_pos += 2;
289         }
290
291         size_t len = key.length() + v1.length() + 4;
292         char *mds = (char*) calloc(len, sizeof(char));
293         snprintf(mds, len, "%s=\"%s\"", key.c_str(), v1.c_str());
294         return mds;
295 }
296
297 bool
298 TranscodeFfmpeg::encode (std::string outfile, std::string inf_a, std::string inf_v, FFSettings ffs, FFSettings meta, bool map)
299 {
300 #define MAX_FFMPEG_ENCODER_ARGS (100)
301         char **argp;
302         int a=0;
303
304         argp=(char**) calloc(MAX_FFMPEG_ENCODER_ARGS,sizeof(char*));
305         argp[a++] = strdup(ffmpeg_exe.c_str());
306         if (m_avoffset < 0 || m_avoffset > 0) {
307                 std::ostringstream osstream; osstream << m_avoffset;
308                 argp[a++] = strdup("-itsoffset");
309                 argp[a++] = strdup(osstream.str().c_str());
310         }
311         argp[a++] = strdup("-i");
312         argp[a++] = strdup(inf_v.c_str());
313
314         argp[a++] = strdup("-i");
315         argp[a++] = strdup(inf_a.c_str());
316         for(FFSettings::const_iterator it = ffs.begin(); it != ffs.end(); ++it) {
317                 argp[a++] = strdup(it->first.c_str());
318                 argp[a++] = strdup(it->second.c_str());
319         }
320         for(FFSettings::const_iterator it = meta.begin(); it != meta.end(); ++it) {
321                 argp[a++] = strdup("-metadata");
322                 argp[a++] = format_metadata(it->first.c_str(), it->second.c_str());
323         }
324         if (map) {
325                 argp[a++] = strdup("-map");
326                 argp[a++] = strdup("0:0");
327                 argp[a++] = strdup("-map");
328                 argp[a++] = strdup("1:0");
329         }
330         argp[a++] = strdup("-y");
331         argp[a++] = strdup(outfile.c_str());
332         argp[a] = (char *)0;
333         assert(a<MAX_FFMPEG_ENCODER_ARGS);
334         /* Note: these are free()d in ~SystemExec */
335 #if 1 /* DEBUG */
336         if (debug_enable) { /* tentative debug mode */
337         printf("EXPORT ENCODE:\n");
338         for (int i=0; i< a; ++i) {
339           printf("%s ", argp[i]);
340         }
341         printf("\n");
342         }
343 #endif
344
345         ffcmd = new SystemExec(ffmpeg_exe, argp);
346         ffcmd->ReadStdout.connect_same_thread (*this, boost::bind (&TranscodeFfmpeg::ffmpegparse_v, this, _1 ,_2));
347         ffcmd->Terminated.connect_same_thread (*this, boost::bind (&TranscodeFfmpeg::ffexit, this));
348         if (ffcmd->start(2)) {
349                 ffexit();
350                 return false;
351         }
352         return true;
353 }
354
355 bool
356 TranscodeFfmpeg::extract_audio (std::string outfile, ARDOUR::framecnt_t samplerate, unsigned int stream)
357 {
358         if (!probeok) return false;
359   if (stream >= m_audio.size()) return false;
360
361         char **argp;
362
363         argp=(char**) calloc(15,sizeof(char*));
364         argp[0] = strdup(ffmpeg_exe.c_str());
365         argp[1] = strdup("-i");
366         argp[2] = strdup(infile.c_str());
367         argp[3] = strdup("-ar");
368         argp[4] = (char*) calloc(7,sizeof(char)); snprintf(argp[4], 7, "%"PRId64, samplerate);
369         argp[5] = strdup("-ac");
370         argp[6] = (char*) calloc(3,sizeof(char)); snprintf(argp[6], 3, "%i", m_audio.at(stream).channels);
371         argp[7] = strdup("-map");
372         argp[8] = (char*) calloc(8,sizeof(char)); snprintf(argp[8], 8, "0:%s", m_audio.at(stream).stream_id.c_str());
373         argp[9] = strdup("-vn");
374         argp[10] = strdup("-acodec");
375         argp[11] = strdup("pcm_f32le");
376         argp[12] = strdup("-y");
377         argp[13] = strdup(outfile.c_str());
378         argp[14] = (char *)0;
379         /* Note: argp is free()d in ~SystemExec */
380 #if 1 /* DEBUG */
381         if (debug_enable) { /* tentative debug mode */
382         printf("EXTRACT AUDIO:\n");
383         for (int i=0; i< 14; ++i) {
384           printf("%s ", argp[i]);
385         }
386         printf("\n");
387         }
388 #endif
389
390         ffcmd = new SystemExec(ffmpeg_exe, argp);
391         ffcmd->ReadStdout.connect_same_thread (*this, boost::bind (&TranscodeFfmpeg::ffmpegparse_a, this, _1 ,_2));
392         ffcmd->Terminated.connect_same_thread (*this, boost::bind (&TranscodeFfmpeg::ffexit, this));
393         if (ffcmd->start(2)) {
394                 ffexit();
395                 return false;
396         }
397         return true;
398 }
399
400
401 bool
402 TranscodeFfmpeg::transcode (std::string outfile, const int outw, const int outh, const int kbitps)
403 {
404         if (!probeok) return false;
405
406         char **argp;
407         int bitrate = kbitps;
408         int width = outw;
409         int height = outh;
410
411         if (width < 1 || width > m_width) { width = m_width; } /* don't allow upscaling */
412         if (height < 1 || height > m_height) { height = floor(width / m_aspect); }
413
414         if (bitrate == 0) {
415                 const double bitperpixel = .7; /* avg quality */
416                 bitrate = floor(m_fps * width * height * bitperpixel / 10000.0);
417         } else {
418                 bitrate = bitrate / 10;
419         }
420         if (bitrate < 10)  bitrate = 10;
421         if (bitrate > 1000) bitrate = 1000;
422
423         argp=(char**) calloc(16,sizeof(char*));
424         argp[0] = strdup(ffmpeg_exe.c_str());
425         argp[1] = strdup("-i");
426         argp[2] = strdup(infile.c_str());
427         argp[3] = strdup("-b");
428         argp[4] = (char*) calloc(7,sizeof(char)); snprintf(argp[4], 7, "%i0k", bitrate);
429         argp[5] = strdup("-s");
430         argp[6] = (char*) calloc(10,sizeof(char)); snprintf(argp[6], 10, "%ix%i", width, height);
431         argp[7] = strdup("-y");
432         argp[8] = strdup("-vcodec");
433         argp[9] = strdup("mjpeg");
434         argp[10] = strdup("-an");
435         argp[11] = strdup("-intra");
436         argp[12] = strdup("-g");
437         argp[13] = strdup("1");
438         argp[14] = strdup(outfile.c_str());
439         argp[15] = (char *)0;
440         /* Note: these are free()d in ~SystemExec */
441 #if 1 /* DEBUG */
442         if (debug_enable) { /* tentative debug mode */
443         printf("TRANSCODE VIDEO:\n");
444         for (int i=0; i< 15; ++i) {
445           printf("%s ", argp[i]);
446         }
447         printf("\n");
448         }
449 #endif
450         ffcmd = new SystemExec(ffmpeg_exe, argp);
451         ffcmd->ReadStdout.connect_same_thread (*this, boost::bind (&TranscodeFfmpeg::ffmpegparse_v, this, _1 ,_2));
452         ffcmd->Terminated.connect_same_thread (*this, boost::bind (&TranscodeFfmpeg::ffexit, this));
453         if (ffcmd->start(2)) {
454                 ffexit();
455                 return false;
456         }
457         return true;
458 }
459
460 void
461 TranscodeFfmpeg::cancel ()
462 {
463         if (!ffcmd || !ffcmd->is_running()) { return;}
464         ffcmd->write_to_stdin("q");
465         sleep (1);
466         if (ffcmd) {
467           ffcmd->terminate();
468         }
469 }
470
471 void
472 TranscodeFfmpeg::ffexit ()
473 {
474         delete ffcmd;
475         ffcmd=0;
476         Finished(); /* EMIT SIGNAL */
477 }
478
479 void
480 TranscodeFfmpeg::ffprobeparse (std::string d, size_t /* s */)
481 {
482         ffoutput+=d;
483 }
484
485 void
486 TranscodeFfmpeg::ffmpegparse_a (std::string d, size_t /* s */)
487 {
488         const char *t;
489         if (!(t=strstr(d.c_str(), "time="))) { return; }
490         ARDOUR::framecnt_t f = (ARDOUR::framecnt_t) floorf (atof(t+5) * m_fps);
491         if (f > m_duration ) { f = m_duration; }
492         Progress(f, m_duration); /* EMIT SIGNAL */
493 }
494
495 void
496 TranscodeFfmpeg::ffmpegparse_v (std::string d, size_t /* s */)
497 {
498         if (strstr(d.c_str(), "ERROR") || strstr(d.c_str(), "Error") || strstr(d.c_str(), "error")) {
499                 PBD::warning << "ffmpeg-error: " << d << endmsg;
500         }
501         if (strncmp(d.c_str(), "frame=",6)) {
502 #if 1 /* DEBUG */
503                 if (debug_enable) {
504                         d.erase(d.find_last_not_of(" \t\r\n") + 1);
505                   printf("ffmpeg: '%s'\n", d.c_str());
506                 }
507 #endif
508                 return;
509         }
510         ARDOUR::framecnt_t f = atol(d.substr(6).c_str());
511         Progress(f, m_duration); /* EMIT SIGNAL */
512 }
513
514 #endif /* WITH_VIDEOTIMELINE */