Destio небольшой блог

UTF-8

Как сохранить файл в кодировке UTF-16LE с BOM в Ruby

Эти депрекейтед средневековые двухбайтовые кодировки все еще находят некоторое применение в повседневной жизни, поэтому вот что мне пришлось сделать, чтобы сохранить файл в UTF-16LE (Little Endian) с BOM. Это я делал в Ubuntu, где родная кодировка UTF-8, но, наверное, для руби нет разницы. Итак, наши участники – finalXML, это XML объект из Nokogiri, который сам […]

Читать дальше

, , ,

Perl и кириллица (юникод)

Perl настолько стар, что в момент выхода его регулярные выражения поддерживали только клинопись. Ну может еще пару подобных ископаемых способов начертания символов, но юникода тогда точно не было (он появится только через шесть лет, в 1993, а в широкое использование войдет куда позже). Но сейчас уже 2014, поэтому кое-что успело измениться в лучшую сторону. В […]

Читать дальше

, , ,