Set up for the correct handling of UTF-8 with Windows
[dcpomatic.git] / src / lib / util.cc
1 /*
2     Copyright (C) 2012-2015 Carl Hetherington <cth@carlh.net>
3
4     This program is free software; you can redistribute it and/or modify
5     it under the terms of the GNU General Public License as published by
6     the Free Software Foundation; either version 2 of the License, or
7     (at your option) any later version.
8
9     This program is distributed in the hope that it will be useful,
10     but WITHOUT ANY WARRANTY; without even the implied warranty of
11     MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
12     GNU General Public License for more details.
13
14     You should have received a copy of the GNU General Public License
15     along with this program; if not, write to the Free Software
16     Foundation, Inc., 675 Mass Ave, Cambridge, MA 02139, USA.
17
18 */
19
20 /** @file src/lib/util.cc
21  *  @brief Some utility functions and classes.
22  */
23
24 #include "util.h"
25 #include "exceptions.h"
26 #include "dcp_content_type.h"
27 #include "filter.h"
28 #include "cinema_sound_processor.h"
29 #include "config.h"
30 #include "ratio.h"
31 #include "job.h"
32 #include "cross.h"
33 #include "video_content.h"
34 #include "rect.h"
35 #include "md5_digester.h"
36 #include "audio_processor.h"
37 #include "safe_stringstream.h"
38 #include <dcp/util.h>
39 #include <dcp/picture_asset.h>
40 #include <dcp/sound_asset.h>
41 #include <dcp/subtitle_asset.h>
42 #include <curl/curl.h>
43 #include <glib.h>
44 #include <pangomm/init.h>
45 #include <boost/algorithm/string.hpp>
46 #include <boost/bind.hpp>
47 #include <boost/lambda/lambda.hpp>
48 #include <boost/thread.hpp>
49 #include <boost/filesystem.hpp>
50 #ifdef DCPOMATIC_WINDOWS
51 #include <boost/locale.hpp>
52 #include <dbghelp.h>
53 #endif
54 #include <signal.h>
55 #include <iomanip>
56 #include <iostream>
57 #include <fstream>
58 #include <climits>
59 #include <stdexcept>
60 #ifdef DCPOMATIC_POSIX
61 #include <execinfo.h>
62 #include <cxxabi.h>
63 #endif
64
65 #include "i18n.h"
66
67 using std::string;
68 using std::setfill;
69 using std::ostream;
70 using std::endl;
71 using std::vector;
72 using std::min;
73 using std::max;
74 using std::map;
75 using std::list;
76 using std::multimap;
77 using std::istream;
78 using std::pair;
79 using std::cout;
80 using std::bad_alloc;
81 using std::set_terminate;
82 using boost::shared_ptr;
83 using boost::thread;
84 using boost::optional;
85 using dcp::Size;
86
87 /** Path to our executable, required by the stacktrace stuff and filled
88  *  in during App::onInit().
89  */
90 string program_name;
91 static boost::thread::id ui_thread;
92 static boost::filesystem::path backtrace_file;
93
94 /** Convert some number of seconds to a string representation
95  *  in hours, minutes and seconds.
96  *
97  *  @param s Seconds.
98  *  @return String of the form H:M:S (where H is hours, M
99  *  is minutes and S is seconds).
100  */
101 string
102 seconds_to_hms (int s)
103 {
104         int m = s / 60;
105         s -= (m * 60);
106         int h = m / 60;
107         m -= (h * 60);
108
109         SafeStringStream hms;
110         hms << h << N_(":");
111         hms.width (2);
112         hms << setfill ('0') << m << N_(":");
113         hms.width (2);
114         hms << setfill ('0') << s;
115
116         return hms.str ();
117 }
118
119 /** @param s Number of seconds.
120  *  @return String containing an approximate description of s (e.g. "about 2 hours")
121  */
122 string
123 seconds_to_approximate_hms (int s)
124 {
125         int m = s / 60;
126         s -= (m * 60);
127         int h = m / 60;
128         m -= (h * 60);
129
130         SafeStringStream ap;
131
132         bool const hours = h > 0;
133         bool const minutes = h < 10 && m > 0;
134         bool const seconds = m < 10 && s > 0;
135
136         if (hours) {
137                 if (m > 30 && !minutes) {
138                         /// TRANSLATORS: h here is an abbreviation for hours
139                         ap << (h + 1) << _("h");
140                 } else {
141                         /// TRANSLATORS: h here is an abbreviation for hours
142                         ap << h << _("h");
143                 }
144
145                 if (minutes | seconds) {
146                         ap << N_(" ");
147                 }
148         }
149
150         if (minutes) {
151                 /* Minutes */
152                 if (s > 30 && !seconds) {
153                         /// TRANSLATORS: m here is an abbreviation for minutes
154                         ap << (m + 1) << _("m");
155                 } else {
156                         /// TRANSLATORS: m here is an abbreviation for minutes
157                         ap << m << _("m");
158                 }
159
160                 if (seconds) {
161                         ap << N_(" ");
162                 }
163         }
164
165         if (seconds) {
166                 /* Seconds */
167                 /// TRANSLATORS: s here is an abbreviation for seconds
168                 ap << s << _("s");
169         }
170
171         return ap.str ();
172 }
173
174 double
175 seconds (struct timeval t)
176 {
177         return t.tv_sec + (double (t.tv_usec) / 1e6);
178 }
179
180 #ifdef DCPOMATIC_WINDOWS
181
182 /** Resolve symbol name and source location given the path to the executable */
183 int
184 addr2line (void const * const addr)
185 {
186         char addr2line_cmd[512] = { 0 };
187         sprintf (addr2line_cmd, "addr2line -f -p -e %.256s %p > %s", program_name.c_str(), addr, backtrace_file.string().c_str());
188         return system(addr2line_cmd);
189 }
190
191 /** This is called when C signals occur on Windows (e.g. SIGSEGV)
192  *  (NOT C++ exceptions!).  We write a backtrace to backtrace_file by dark means.
193  *  Adapted from code here: http://spin.atomicobject.com/2013/01/13/exceptions-stack-traces-c/
194  */
195 LONG WINAPI
196 exception_handler(struct _EXCEPTION_POINTERS * info)
197 {
198         FILE* f = fopen_boost (backtrace_file, "w");
199         fprintf (f, "C-style exception %d\n", info->ExceptionRecord->ExceptionCode);
200         fclose(f);
201
202         if (info->ExceptionRecord->ExceptionCode != EXCEPTION_STACK_OVERFLOW) {
203                 CONTEXT* context = info->ContextRecord;
204                 SymInitialize (GetCurrentProcess (), 0, true);
205
206                 STACKFRAME frame = { 0 };
207
208                 /* setup initial stack frame */
209 #if _WIN64
210                 frame.AddrPC.Offset    = context->Rip;
211                 frame.AddrStack.Offset = context->Rsp;
212                 frame.AddrFrame.Offset = context->Rbp;
213 #else
214                 frame.AddrPC.Offset    = context->Eip;
215                 frame.AddrStack.Offset = context->Esp;
216                 frame.AddrFrame.Offset = context->Ebp;
217 #endif
218                 frame.AddrPC.Mode      = AddrModeFlat;
219                 frame.AddrStack.Mode   = AddrModeFlat;
220                 frame.AddrFrame.Mode   = AddrModeFlat;
221
222                 while (
223                         StackWalk (
224                                 IMAGE_FILE_MACHINE_I386,
225                                 GetCurrentProcess (),
226                                 GetCurrentThread (),
227                                 &frame,
228                                 context,
229                                 0,
230                                 SymFunctionTableAccess,
231                                 SymGetModuleBase,
232                                 0
233                                 )
234                         ) {
235                         addr2line((void *) frame.AddrPC.Offset);
236                 }
237         } else {
238 #ifdef _WIN64
239                 addr2line ((void *) info->ContextRecord->Rip);
240 #else
241                 addr2line ((void *) info->ContextRecord->Eip);
242 #endif
243         }
244
245         return EXCEPTION_CONTINUE_SEARCH;
246 }
247 #endif
248
249 void
250 set_backtrace_file (boost::filesystem::path p)
251 {
252         backtrace_file = p;
253 }
254
255 /** This is called when there is an unhandled exception.  Any
256  *  backtrace in this function is useless on Windows as the stack has
257  *  already been unwound from the throw; we have the gdb wrap hack to
258  *  cope with that.
259  */
260 void
261 terminate ()
262 {
263         try {
264                 static bool tried_throw = false;
265                 // try once to re-throw currently active exception
266                 if (!tried_throw) {
267                         tried_throw = true;
268                         throw;
269                 }
270         }
271         catch (const std::exception &e) {
272                 std::cerr << __FUNCTION__ << " caught unhandled exception. what(): "
273                           << e.what() << std::endl;
274         }
275         catch (...) {
276                 std::cerr << __FUNCTION__ << " caught unknown/unhandled exception."
277                           << std::endl;
278         }
279
280         abort();
281 }
282
283 void
284 dcpomatic_setup_path_encoding ()
285 {
286 #ifdef DCPOMATIC_WINDOWS
287         /* Dark voodoo which, I think, gets boost::filesystem::path to
288            correctly convert UTF-8 strings to paths, and also paths
289            back to UTF-8 strings (on path::string()).
290
291            After this, constructing boost::filesystem::paths from strings
292            converts from UTF-8 to UTF-16 inside the path.  Then
293            path::string().c_str() gives UTF-8 and
294            path::c_str()          gives UTF-16.
295
296            This is all Windows-only.  AFAICT Linux/OS X use UTF-8 everywhere,
297            so things are much simpler.
298         */
299         std::locale::global (boost::locale::generator().generate (""));
300         boost::filesystem::path::imbue (std::locale ());
301 #endif
302 }
303
304 /** Call the required functions to set up DCP-o-matic's static arrays, etc.
305  *  Must be called from the UI thread, if there is one.
306  */
307 void
308 dcpomatic_setup ()
309 {
310 #ifdef DCPOMATIC_WINDOWS
311         boost::filesystem::path p = g_get_user_config_dir ();
312         p /= "backtrace.txt";
313         set_backtrace_file (p);
314         SetUnhandledExceptionFilter(exception_handler);
315 #endif
316
317         avfilter_register_all ();
318
319 #ifdef DCPOMATIC_OSX
320         /* Add our lib directory to the libltdl search path so that
321            xmlsec can find xmlsec1-openssl.
322         */
323         boost::filesystem::path lib = app_contents ();
324         lib /= "lib";
325         setenv ("LTDL_LIBRARY_PATH", lib.c_str (), 1);
326 #endif
327
328         set_terminate (terminate);
329
330         Pango::init ();
331         dcp::init ();
332
333         Ratio::setup_ratios ();
334         PresetColourConversion::setup_colour_conversion_presets ();
335         VideoContentScale::setup_scales ();
336         DCPContentType::setup_dcp_content_types ();
337         Filter::setup_filters ();
338         CinemaSoundProcessor::setup_cinema_sound_processors ();
339         AudioProcessor::setup_audio_processors ();
340
341         curl_global_init (CURL_GLOBAL_ALL);
342
343         ui_thread = boost::this_thread::get_id ();
344 }
345
346 #ifdef DCPOMATIC_WINDOWS
347 boost::filesystem::path
348 mo_path ()
349 {
350         wchar_t buffer[512];
351         GetModuleFileName (0, buffer, 512 * sizeof(wchar_t));
352         boost::filesystem::path p (buffer);
353         p = p.parent_path ();
354         p = p.parent_path ();
355         p /= "locale";
356         return p;
357 }
358 #endif
359
360 #ifdef DCPOMATIC_OSX
361 boost::filesystem::path
362 mo_path ()
363 {
364         return "DCP-o-matic 2.app/Contents/Resources";
365 }
366 #endif
367
368 void
369 dcpomatic_setup_gettext_i18n (string lang)
370 {
371 #ifdef DCPOMATIC_LINUX
372         lang += ".UTF8";
373 #endif
374
375         if (!lang.empty ()) {
376                 /* Override our environment language.  Note that the caller must not
377                    free the string passed into putenv().
378                 */
379                 string s = String::compose ("LANGUAGE=%1", lang);
380                 putenv (strdup (s.c_str ()));
381                 s = String::compose ("LANG=%1", lang);
382                 putenv (strdup (s.c_str ()));
383                 s = String::compose ("LC_ALL=%1", lang);
384                 putenv (strdup (s.c_str ()));
385         }
386
387         setlocale (LC_ALL, "");
388         textdomain ("libdcpomatic2");
389
390 #if defined(DCPOMATIC_WINDOWS) || defined(DCPOMATIC_OSX)
391         bindtextdomain ("libdcpomatic2", mo_path().string().c_str());
392         bind_textdomain_codeset ("libdcpomatic2", "UTF8");
393 #endif
394
395 #ifdef DCPOMATIC_LINUX
396         bindtextdomain ("libdcpomatic2", LINUX_LOCALE_PREFIX);
397 #endif
398 }
399
400 /** Compute a digest of the first and last `size' bytes of a set of files. */
401 string
402 md5_digest_head_tail (vector<boost::filesystem::path> files, boost::uintmax_t size)
403 {
404         boost::scoped_array<char> buffer (new char[size]);
405         MD5Digester digester;
406
407         /* Head */
408         boost::uintmax_t to_do = size;
409         char* p = buffer.get ();
410         int i = 0;
411         while (i < int64_t (files.size()) && to_do > 0) {
412                 FILE* f = fopen_boost (files[i], "rb");
413                 if (!f) {
414                         throw OpenFileError (files[i].string());
415                 }
416
417                 boost::uintmax_t this_time = min (to_do, boost::filesystem::file_size (files[i]));
418                 fread (p, 1, this_time, f);
419                 p += this_time;
420                 to_do -= this_time;
421                 fclose (f);
422
423                 ++i;
424         }
425         digester.add (buffer.get(), size - to_do);
426
427         /* Tail */
428         to_do = size;
429         p = buffer.get ();
430         i = files.size() - 1;
431         while (i >= 0 && to_do > 0) {
432                 FILE* f = fopen_boost (files[i], "rb");
433                 if (!f) {
434                         throw OpenFileError (files[i].string());
435                 }
436
437                 boost::uintmax_t this_time = min (to_do, boost::filesystem::file_size (files[i]));
438                 dcpomatic_fseek (f, -this_time, SEEK_END);
439                 fread (p, 1, this_time, f);
440                 p += this_time;
441                 to_do -= this_time;
442                 fclose (f);
443
444                 --i;
445         }
446         digester.add (buffer.get(), size - to_do);
447
448         return digester.get ();
449 }
450
451 /** Round a number up to the nearest multiple of another number.
452  *  @param c Index.
453  *  @param s Array of numbers to round, indexed by c.
454  *  @param t Multiple to round to.
455  *  @return Rounded number.
456  */
457 int
458 stride_round_up (int c, int const * stride, int t)
459 {
460         int const a = stride[c] + (t - 1);
461         return a - (a % t);
462 }
463
464 /** Trip an assert if the caller is not in the UI thread */
465 void
466 ensure_ui_thread ()
467 {
468         DCPOMATIC_ASSERT (boost::this_thread::get_id() == ui_thread);
469 }
470
471 string
472 audio_channel_name (int c)
473 {
474         DCPOMATIC_ASSERT (MAX_DCP_AUDIO_CHANNELS == 12);
475
476         /// TRANSLATORS: these are the names of audio channels; Lfe (sub) is the low-frequency
477         /// enhancement channel (sub-woofer).  HI is the hearing-impaired audio track and
478         /// VI is the visually-impaired audio track (audio describe).
479         string const channels[] = {
480                 _("Left"),
481                 _("Right"),
482                 _("Centre"),
483                 _("Lfe (sub)"),
484                 _("Left surround"),
485                 _("Right surround"),
486                 _("Hearing impaired"),
487                 _("Visually impaired"),
488                 _("Left centre"),
489                 _("Right centre"),
490                 _("Left rear surround"),
491                 _("Right rear surround"),
492         };
493
494         return channels[c];
495 }
496
497 bool
498 valid_image_file (boost::filesystem::path f)
499 {
500         if (boost::starts_with (f.leaf().string(), "._")) {
501                 return false;
502         }
503
504         string ext = f.extension().string();
505         transform (ext.begin(), ext.end(), ext.begin(), ::tolower);
506         return (
507                 ext == ".tif" || ext == ".tiff" || ext == ".jpg" || ext == ".jpeg" ||
508                 ext == ".png" || ext == ".bmp" || ext == ".tga" || ext == ".dpx" ||
509                 ext == ".j2c" || ext == ".j2k" || ext == ".jp2"
510                 );
511 }
512
513 bool
514 valid_j2k_file (boost::filesystem::path f)
515 {
516         string ext = f.extension().string();
517         transform (ext.begin(), ext.end(), ext.begin(), ::tolower);
518         return (ext == ".j2k" || ext == ".j2c" || ext == ".jp2");
519 }
520
521 string
522 tidy_for_filename (string f)
523 {
524         string t;
525         for (size_t i = 0; i < f.length(); ++i) {
526                 if (isalnum (f[i]) || f[i] == '_' || f[i] == '-') {
527                         t += f[i];
528                 } else {
529                         t += '_';
530                 }
531         }
532
533         return t;
534 }
535
536 dcp::Size
537 fit_ratio_within (float ratio, dcp::Size full_frame)
538 {
539         if (ratio < full_frame.ratio ()) {
540                 return dcp::Size (rint (full_frame.height * ratio), full_frame.height);
541         }
542
543         return dcp::Size (full_frame.width, rint (full_frame.width / ratio));
544 }
545
546 void *
547 wrapped_av_malloc (size_t s)
548 {
549         void* p = av_malloc (s);
550         if (!p) {
551                 throw bad_alloc ();
552         }
553         return p;
554 }
555
556 FFmpegSubtitlePeriod
557 subtitle_period (AVSubtitle const & sub)
558 {
559         ContentTime const packet_time = ContentTime::from_seconds (static_cast<double> (sub.pts) / AV_TIME_BASE);
560
561         if (sub.end_display_time == static_cast<uint32_t> (-1)) {
562                 /* End time is not known */
563                 return FFmpegSubtitlePeriod (packet_time + ContentTime::from_seconds (sub.start_display_time / 1e3));
564         }
565
566         return FFmpegSubtitlePeriod (
567                 packet_time + ContentTime::from_seconds (sub.start_display_time / 1e3),
568                 packet_time + ContentTime::from_seconds (sub.end_display_time / 1e3)
569                 );
570 }
571
572 map<string, string>
573 split_get_request (string url)
574 {
575         enum {
576                 AWAITING_QUESTION_MARK,
577                 KEY,
578                 VALUE
579         } state = AWAITING_QUESTION_MARK;
580
581         map<string, string> r;
582         string k;
583         string v;
584         for (size_t i = 0; i < url.length(); ++i) {
585                 switch (state) {
586                 case AWAITING_QUESTION_MARK:
587                         if (url[i] == '?') {
588                                 state = KEY;
589                         }
590                         break;
591                 case KEY:
592                         if (url[i] == '=') {
593                                 v.clear ();
594                                 state = VALUE;
595                         } else {
596                                 k += url[i];
597                         }
598                         break;
599                 case VALUE:
600                         if (url[i] == '&') {
601                                 r.insert (make_pair (k, v));
602                                 k.clear ();
603                                 state = KEY;
604                         } else {
605                                 v += url[i];
606                         }
607                         break;
608                 }
609         }
610
611         if (state == VALUE) {
612                 r.insert (make_pair (k, v));
613         }
614
615         return r;
616 }
617
618 string
619 video_asset_filename (shared_ptr<dcp::PictureAsset> asset)
620 {
621         return "j2c_" + asset->id() + ".mxf";
622 }
623
624 string
625 audio_asset_filename (shared_ptr<dcp::SoundAsset> asset)
626 {
627         return "pcm_" + asset->id() + ".mxf";
628 }