Merge branch 'cairocanvas' of git.ardour.org:ardour/ardour into cairocanvas
[ardour.git] / gtk2_ardour / transcode_ffmpeg.cc
index e886c64f6441c01e8636b1083a584c3603654970..9cbc40564cb4c30070ad9a1700e16d3da1b6042a 100644 (file)
@@ -17,8 +17,6 @@
     Foundation, Inc., 675 Mass Ave, Cambridge, MA 02139, USA.
 
 */
-#ifdef WITH_VIDEOTIMELINE
-
 #include <stdio.h>
 #include <string.h>
 #include <sstream>
@@ -42,6 +40,9 @@ TranscodeFfmpeg::TranscodeFfmpeg (std::string f)
        ffmpeg_exe = "";
        ffprobe_exe = "";
        m_duration = 0;
+       m_avoffset = m_lead_in = m_lead_out = 0;
+       m_width = m_height = 0;
+       m_aspect = m_fps = 0;
 #if 1 /* tentative debug mode */
        debug_enable = false;
 #endif
@@ -117,19 +118,20 @@ TranscodeFfmpeg::probe ()
 
        std::vector<std::vector<std::string> > lines;
        ParseCSV(ffoutput, lines);
+       double timebase = 0;
        m_width = m_height = 0;
        m_fps = m_aspect = 0;
        m_duration = 0;
        m_codec.clear();
        m_audio.clear();
 
-#define PARSE_FRACTIONAL_FPS \
+#define PARSE_FRACTIONAL_FPS(VAR) \
        { \
                std::string::size_type pos; \
-               m_fps = atof(value.c_str()); \
+               VAR = atof(value.c_str()); \
                pos = value.find_first_of('/'); \
                if (pos != std::string::npos) { \
-                       m_fps = atof(value.substr(0, pos).c_str()) / atof(value.substr(pos+1).c_str()); \
+                       VAR = atof(value.substr(0, pos).c_str()) / atof(value.substr(pos+1).c_str()); \
                } \
        }
 
@@ -146,7 +148,9 @@ TranscodeFfmpeg::probe ()
                                        std::string key = kv->substr(0, kvsep);
                                        std::string value = kv->substr(kvsep + 1);
 
-                                       if (key == X_("width")) {
+                                       if (key == X_("index")) {
+                                               m_videoidx = atoi(value.c_str());
+                                       } else if (key == X_("width")) {
                                                m_width = atoi(value.c_str());
                                        } else if (key == X_("height")) {
                                                m_height = atoi(value.c_str());
@@ -160,9 +164,11 @@ TranscodeFfmpeg::probe ()
                                                if (!m_codec.empty()) m_codec += " ";
                                                m_codec += "(" + value + ")";
                                        } else if (key == X_("r_frame_rate")) {
-                                               PARSE_FRACTIONAL_FPS
-                                       } else if (key == X_("time_base") && m_fps == 0) {
-                                               PARSE_FRACTIONAL_FPS
+                                               PARSE_FRACTIONAL_FPS(m_fps)
+                                       } else if (key == X_("avg_frame_rate") && m_fps == 0) {
+                                               PARSE_FRACTIONAL_FPS(m_fps)
+                                       } else if (key == X_("time_base")) {
+                                               PARSE_FRACTIONAL_FPS(timebase)
                                        } else if (key == X_("timecode") && m_duration == 0) {
                                                int h,m,s; char f[7];
                                                if (sscanf(i->at(16).c_str(), "%d:%d:%d:%s",&h,&m,&s,f) == 4) {
@@ -173,9 +179,9 @@ TranscodeFfmpeg::probe ()
                                                                + atoi(f) / pow(10, strlen(f))
                                                        ));
                                                }
-                                       } else if (key == X_("duration_ts")) {
-                                               m_duration = atof(value.c_str());
-                                       } else if (key == X_("duration") && m_duration == 0 && m_fps != 0) {
+                                       } else if (key == X_("duration_ts") && m_fps == 0 && timebase !=0 ) {
+                                               m_duration = atof(value.c_str()) * m_fps * timebase;
+                                       } else if (key == X_("duration") && m_fps != 0 && m_duration == 0) {
                                                m_duration = atof(value.c_str()) * m_fps;
                                        } else if (key == X_("display_aspect_ratio")) {
                                                std::string::size_type pos;
@@ -228,7 +234,7 @@ TranscodeFfmpeg::probe ()
        while (ffcmd && --timeout) usleep (1000); // wait until 'ffprobe' terminated.
        if (timeout == 0) return false;
 
-#if 1 /* DEBUG */
+#if 0 /* DEBUG */
        printf("FPS: %f\n", m_fps);
        printf("Duration: %lu frames\n",(unsigned long)m_duration);
        printf("W/H: %ix%i\n",m_width, m_height);
@@ -253,8 +259,8 @@ TranscodeFfmpeg::default_encoder_settings ()
        ffs.clear();
        ffs["-vcodec"] = "mpeg4";
        ffs["-acodec"] = "ac3";
-       ffs["-b"] = "5000k";
-       ffs["-ab"] = "160k";
+       ffs["-b:v"] = "5000k";
+       ffs["-b:a"] = "160k";
        return ffs;
 }
 
@@ -311,6 +317,7 @@ TranscodeFfmpeg::encode (std::string outfile, std::string inf_a, std::string inf
 
        argp[a++] = strdup("-i");
        argp[a++] = strdup(inf_a.c_str());
+
        for(FFSettings::const_iterator it = ffs.begin(); it != ffs.end(); ++it) {
                argp[a++] = strdup(it->first.c_str());
                argp[a++] = strdup(it->second.c_str());
@@ -319,12 +326,36 @@ TranscodeFfmpeg::encode (std::string outfile, std::string inf_a, std::string inf
                argp[a++] = strdup("-metadata");
                argp[a++] = format_metadata(it->first.c_str(), it->second.c_str());
        }
+       if (m_lead_in != 0 && m_lead_out != 0) {
+               std::ostringstream osstream;
+               argp[a++] = strdup("-vf");
+               osstream << X_("color=c=black:s=") << m_width << X_("x") << m_height << X_(":d=") << m_lead_in << X_(" [pre]; ");
+               osstream << X_("color=c=black:s=") << m_width << X_("x") << m_height << X_(":d=") << m_lead_out << X_(" [post]; ");
+               osstream << X_("[pre] [in] [post] concat=n=3");
+               argp[a++] = strdup(osstream.str().c_str());
+       } else if (m_lead_in != 0) {
+               std::ostringstream osstream;
+               argp[a++] = strdup("-vf");
+               osstream << X_("color=c=black:s=") << m_width << X_("x") << m_height << X_(":d=") << m_lead_in << X_(" [pre]; ");
+               osstream << X_("[pre] [in] concat=n=2");
+               argp[a++] = strdup(osstream.str().c_str());
+       } else if (m_lead_out != 0) {
+               std::ostringstream osstream;
+               argp[a++] = strdup("-vf");
+               osstream << X_("color=c=black:s=") << m_width << X_("x") << m_height << X_(":d=") << m_lead_out << X_(" [post]; ");
+               osstream << X_("[in] [post] concat=n=2");
+               argp[a++] = strdup(osstream.str().c_str());
+       }
+
        if (map) {
+               std::ostringstream osstream;
                argp[a++] = strdup("-map");
-               argp[a++] = strdup("0:0");
+               osstream << X_("0:") << m_videoidx;
+               argp[a++] = strdup(osstream.str().c_str());
                argp[a++] = strdup("-map");
                argp[a++] = strdup("1:0");
        }
+
        argp[a++] = strdup("-y");
        argp[a++] = strdup(outfile.c_str());
        argp[a] = (char *)0;
@@ -357,23 +388,26 @@ TranscodeFfmpeg::extract_audio (std::string outfile, ARDOUR::framecnt_t samplera
   if (stream >= m_audio.size()) return false;
 
        char **argp;
+       int i = 0;
 
        argp=(char**) calloc(15,sizeof(char*));
-       argp[0] = strdup(ffmpeg_exe.c_str());
-       argp[1] = strdup("-i");
-       argp[2] = strdup(infile.c_str());
-       argp[3] = strdup("-ar");
-       argp[4] = (char*) calloc(7,sizeof(char)); snprintf(argp[4], 7, "%"PRId64, samplerate);
-       argp[5] = strdup("-ac");
-       argp[6] = (char*) calloc(3,sizeof(char)); snprintf(argp[6], 3, "%i", m_audio.at(stream).channels);
-       argp[7] = strdup("-map");
-       argp[8] = (char*) calloc(8,sizeof(char)); snprintf(argp[8], 8, "0:%s", m_audio.at(stream).stream_id.c_str());
-       argp[9] = strdup("-vn");
-       argp[10] = strdup("-acodec");
-       argp[11] = strdup("pcm_f32le");
-       argp[12] = strdup("-y");
-       argp[13] = strdup(outfile.c_str());
-       argp[14] = (char *)0;
+       argp[i++] = strdup(ffmpeg_exe.c_str());
+       argp[i++] = strdup("-i");
+       argp[i++] = strdup(infile.c_str());
+#if 0 /* ffmpeg write original samplerate, use a3/SRC to resample */
+       argp[i++] = strdup("-ar");
+       argp[i] = (char*) calloc(7,sizeof(char)); snprintf(argp[i++], 7, "%"PRId64, samplerate);
+#endif
+       argp[i++] = strdup("-ac");
+       argp[i] = (char*) calloc(3,sizeof(char)); snprintf(argp[i++], 3, "%i", m_audio.at(stream).channels);
+       argp[i++] = strdup("-map");
+       argp[i] = (char*) calloc(8,sizeof(char)); snprintf(argp[i++], 8, "0:%s", m_audio.at(stream).stream_id.c_str());
+       argp[i++] = strdup("-vn");
+       argp[i++] = strdup("-acodec");
+       argp[i++] = strdup("pcm_f32le");
+       argp[i++] = strdup("-y");
+       argp[i++] = strdup(outfile.c_str());
+       argp[i++] = (char *)0;
        /* Note: argp is free()d in ~SystemExec */
 #if 1 /* DEBUG */
        if (debug_enable) { /* tentative debug mode */
@@ -422,13 +456,13 @@ TranscodeFfmpeg::transcode (std::string outfile, const int outw, const int outh,
        argp[0] = strdup(ffmpeg_exe.c_str());
        argp[1] = strdup("-i");
        argp[2] = strdup(infile.c_str());
-       argp[3] = strdup("-b");
+       argp[3] = strdup("-b:v");
        argp[4] = (char*) calloc(7,sizeof(char)); snprintf(argp[4], 7, "%i0k", bitrate);
        argp[5] = strdup("-s");
        argp[6] = (char*) calloc(10,sizeof(char)); snprintf(argp[6], 10, "%ix%i", width, height);
        argp[7] = strdup("-y");
        argp[8] = strdup("-vcodec");
-       argp[9] = strdup("mjpeg");
+       argp[9] = strdup("mpeg4");
        argp[10] = strdup("-an");
        argp[11] = strdup("-intra");
        argp[12] = strdup("-g");
@@ -484,10 +518,24 @@ void
 TranscodeFfmpeg::ffmpegparse_a (std::string d, size_t /* s */)
 {
        const char *t;
+       int h,m,s; char f[7];
+       ARDOUR::framecnt_t p = -1;
+
        if (!(t=strstr(d.c_str(), "time="))) { return; }
-       ARDOUR::framecnt_t f = (ARDOUR::framecnt_t) floorf (atof(t+5) * m_fps);
-       if (f > m_duration ) { f = m_duration; }
-       Progress(f, m_duration); /* EMIT SIGNAL */
+
+       if (sscanf(t+5, "%d:%d:%d.%s",&h,&m,&s,f) == 4) {
+               p = (ARDOUR::framecnt_t) floor( 100.0 * (
+                     h * 3600.0
+                   + m * 60.0
+                   + s * 1.0
+                   + atoi(f) / pow(10, strlen(f))
+               ));
+               p = p * m_fps / 100.0;
+               if (p > m_duration ) { p = m_duration; }
+               Progress(p, m_duration); /* EMIT SIGNAL */
+       } else {
+               Progress(0, 0); /* EMIT SIGNAL */
+       }
 }
 
 void
@@ -503,10 +551,13 @@ TranscodeFfmpeg::ffmpegparse_v (std::string d, size_t /* s */)
                  printf("ffmpeg: '%s'\n", d.c_str());
                }
 #endif
+               Progress(0, 0); /* EMIT SIGNAL */
                return;
        }
        ARDOUR::framecnt_t f = atol(d.substr(6).c_str());
-       Progress(f, m_duration); /* EMIT SIGNAL */
+       if (f == 0) {
+               Progress(0, 0); /* EMIT SIGNAL */
+       } else {
+               Progress(f, m_duration); /* EMIT SIGNAL */
+       }
 }
-
-#endif /* WITH_VIDEOTIMELINE */