Форматы файлов локализации

Weblate поддерживает широкий спектр форматов перевода. Каждый формат немного отличается и предоставляет различный набор возможностей.

Подсказка

При выборе формата файла для вашего приложения лучше придерживаться какого-нибудь устоявшегося формата для используемого вами инструментария/платформы. Таким образом, ваши переводчики в дополнение смогут использовать любые инструменты, к которым они привыкли, и вероятность внесения ими своего вклада в ваш проект будет выше.

Автоматическое обнаружение

Weblate пытается определить формат файла во время Добавление проектов и компонентов перевода. Определение может быть неверным для разных вариантов одного и того же формата сериализации (JSON, YAML, properties) или кодировки файла, поэтому, пожалуйста, убедитесь, что Формат файла правильный, перед созданием компонента.

Возможности типов переводов

Пожалуйста, обратитесь к странице документации каждого отдельного формата файла для получения информации о том, какие функции поддерживаются в этом формате.

Двуязычные и одноязычные форматы

Поддерживаются как одноязычные, так и двуязычные форматы. Двуязычные форматы хранят в одном файле два языка — исходный язык и перевод (типовые примеры: GNU gettext PO (переносимый объект), XLIFF 1.1 и 1.2 или Строки Apple iOS). Одноязычные же форматы, напротив, идентифицируют строку по ID, и каждый файл перевода содержит только сопоставление этих ID с одним конкретным языком (например, Строковые ресурсы Android). Некоторые форматы файлов могут использоваться и так, и так; подробности смотрите ниже.

Для правильного использования одноязычных файлов Weblate требует доступа к файлу, содержащему полный список строк для перевода с их источником — этот файл называется Одноязычный базовый файл в Weblate, хотя в вашей парадигме именование может отличаться.

Кроме того, этот рабочий процесс можно расширить, используя Файл промежуточного языка для включения строк, предоставленных разработчиками, но не предназначенных для использования в том виде, в каком они есть, в окончательных строках.

Строковые состояния

Многие форматы файлов различают только строки Untranslated («Без перевода») и Translated («Переведённые»). В некоторых форматах можно хранить более подробную информацию о состоянии, например Needs editing («На правку») или Approved («Одобрено»).

Описание исходной строки

Описания исходной строки можно использовать для передачи дополнительной информации о строке, которую нужно перевести.

Некоторые форматы имеют встроенную поддержку предоставления дополнительной информации переводчикам (например, XLIFF 1.1 и 1.2, GNU gettext PO (переносимый объект), JSON-файлы WebExtension, Файлы CSV, Excel Open XML, Файлы .ts Qt Linguist, JSON-файлы go-i18n, Файл JSON gotext, Файл ARB, ресурсные файлы .NET (RESX, RESW)). Многие другие форматы извлекают ближайший комментарий в качестве описания исходной строки.

Пояснение

Пояснение для строк можно хранить и анализировать из нескольких форматов файлов.

В настоящее время поддерживается только в Формат TermBase eXchange.

Расположение исходной строки

Расположение строки в исходном коде может помочь опытным переводчикам понять предназначение этой строки.

Эта информация обычно доступна в двуязычных форматах, где строки извлекаются из исходного кода с помощью инструментов. Например, GNU gettext PO (переносимый объект) и Файлы .ts Qt Linguist.

Флаги перевода

Флаги перевода позволяют настраивать поведение Weblate. Некоторые форматы поддерживают их определение в файле перевода (вы всегда можете определить их в интерфейсе Weblate, см. Настройка поведения с помощью флагов).

Эта функция смоделирована на флагах в GNU gettext PO (переносимый объект).

Кроме того, для всех форматов на основе XML флаги извлекаются из нестандартного атрибута weblate-flags. Кроме того, max-length:N поддерживается через атрибут maxwidth (см. спецификацию XLIFF), как определено в стандарте XLIFF; см. Указание флагов перевода.

Контекст

Контекст используется для различения одинаковых строк в двуязычном формате, используемом в разных областях (например, «Воскрес» может использоваться как сокращённое название дня «Воскресенье»).

Для одноязычных форматов строковый идентификатор (часто называемый ключом) может служить той же цели, и дополнительный контекст не требуется.

Строки с множественным числом

Множественные числа необходимы для правильной локализации строк с количеством переменных. Правила зависят от целевого языка, и многие форматы соответствуют спецификации CLDR.

Подсказка

Множество строк также требует надлежащей поддержки со стороны платформы приложения. Выберите собственный формат вашей платформы, например GNU gettext PO (переносимый объект), Строковые ресурсы Android или Формат Stringsdict.

Строки только для чтения

Строки из файлов перевода, доступные только для чтения, будут включены, но не могут быть отредактированы в Weblate. Поддержка этой возможности уже встроена в некоторые форматы (XLIFF 1.1 и 1.2 и Строковые ресурсы Android), а в других может быть сэмулирована добавлением к строке флага read-only — смотрите раздел Настройка поведения с помощью флагов.

Поддержка других форматов

Большинство форматов, поддерживаемых translate-toolkit, которые поддерживают сериализацию, могут быть легко поддержаны, но они (пока) не получали никакого тестирования. В большинстве случаев в Weblate требуется дополнительный тонкий слой, чтобы скрыть различия в поведении разных хранилищ.

Чтобы добавить поддержку нового формата, предпочтительный подход состоит в том, чтобы сначала реализовать его поддержку в translate-toolkit.

Параметры формата файла

Параметры формата файла предоставляют способ настройки параметров, связанных с форматом файла. Они настраиваются на уровне компонента и позволяют настраивать обработку синтаксического анализа и сериализации файлов.

Список параметров формата файлов

Имя параметра

Форматы файлов

Метка

Текст справки

csv_encoding

  • csv

  • csv-multi

Кодировка файла

Кодировка, используемая для файлов CSV

Доступные варианты:

auto

Автоопределение

utf-8

UTF-8

csv_simple_encoding

  • csv-simple

Кодировка файла

Кодировка, используемая для простых файлов CSV

Доступные варианты:

auto

Автоопределение

utf-8

UTF-8

iso-8859-1

ISO-8859-1

dos_eol

All file formats

DOS окончания строк

Использовать в строках окончания строк DOS (rn) вместо окончаний строк UNIX (n).

flatxml_key_name

  • flatxml

Имя ключа FlatXML

flatxml_root_name

  • flatxml

Имя корневого элемента FlatXML

flatxml_value_name

  • flatxml

Имя значения элемента FlatXML

gwt_encoding

  • gwt

Кодировка файла

Кодировка, используемая для файлов свойств GWT

Доступные варианты:

utf-8

UTF-8

iso-8859-1

ISO-8859-1

json_indent

  • json

  • json-nested

  • webextension

  • i18next

  • i18nextv4

  • arb

  • go-i18n-json

  • go-i18n-json-v2

  • formatjs

  • gotext

Отступы JSON

json_indent_style

  • json

  • json-nested

  • webextension

  • i18next

  • i18nextv4

  • arb

  • go-i18n-json

  • go-i18n-json-v2

  • formatjs

  • gotext

Стиль отступов JSON

Доступные варианты:

spaces

Пробелы

tabs

Вкладки

json_sort_keys

  • json

  • json-nested

  • webextension

  • i18next

  • i18nextv4

  • arb

  • go-i18n-json

  • go-i18n-json-v2

  • formatjs

  • gotext

Сортировка JSON-ключей

json_use_compact_separators

  • json

  • json-nested

  • webextension

  • i18next

  • i18nextv4

  • arb

  • go-i18n-json

  • go-i18n-json-v2

  • formatjs

  • gotext

Избегайте пробелов после разделителей

line_max_length

  • markdown

  • mdx

Максимальная длина линии

Максимальное количество символов для каждой строки в выходном файле.

md_extract_code_blocks

  • markdown

  • mdx

Извлечение блоков кода

Следует ли извлекать переводимое содержимое из блоков кода в файлах Markdown и MDX.

md_extract_frontmatter

  • markdown

  • mdx

Извлечение фронтматтера

Следует ли извлекать и переводить блоки YAML-фронтматтера в файлах Markdown и MDX.

md_no_placeholders

  • markdown

  • mdx

Отключить заполнители

Отключает обнаружение и обработку заполнителей в файлах Markdown и MDX.

merge_duplicates

  • markdown

  • mdx

  • html

  • txt

  • dokuwiki

  • mediawiki

  • asciidoc

Удаление дубликатов идентичных строк

Объединяет идентичные исходные строки в одну единицу перевода. Предотвращает потерю перевода при реструктуризации файлов или переупорядочивании таблиц путём удаления контекста, зависящего от положения.

po_fuzzy_matching

  • po

Использовать неточное соответствие

po_keep_previous

  • po

Сохранять предыдущие msgid переведённых строк

po_line_wrap

  • po

  • po-mono

Перенос длинных строк

По умолчанию gettext переносит строки на 77 символах и на символах новой строки. С параметром --no-wrap перенос выполняется только на символах новой строки.

Доступные варианты:

77

Переносить строки на 77-м символе и на символе перевода строки (по умолчанию в xgettext)

65535

Переносить строки только на символах новой строки (как xgettext --no-wrap)

-1

Не переносить строки

po_no_location

  • po

Не включайте в файл информацию о местоположении

po_report_msgid_bugs_to

  • po

  • po-mono

Сообщение об ошибках msgid

Позволяет Weblate обновлять заголовок «Report-Msgid-Bugs-To» в файле, если задан адрес сообщения об ошибке в исходной строке.

po_set_language_team

  • po

  • po-mono

Обновление заголовка языковой команды

Позволяет Weblate обновить заголовок «Language-Team» в файле.

po_set_last_translator

  • po

  • po-mono

Обновление заголовка последнего переводчика

Позволяет Weblate обновлять заголовок «Last-Translator» в файле.

po_set_x_generator

  • po

  • po-mono

Обновить заголовок X-Generator

Позволяет Weblate обновлять заголовок «X-Generator» в файле.

properties_encoding

  • properties

Кодировка файла

Кодировка, используемая для файлов свойств Java

Доступные варианты:

iso-8859-1

ISO-8859-1

utf-8

UTF-8

utf-16

UTF-16

strings_encoding

  • strings

Кодировка файла

Кодировка, используемая для файлов строк iOS

Доступные варианты:

utf-8

UTF-8

utf-16

UTF-16

xml_closing_tags

  • ts

  • plainxliff

  • xliff

  • xliff2

  • xliff2-placeables

  • poxliff

  • apple-xliff

  • resx

  • aresource

  • moko-resource

  • cmp-resource

  • tbx

Включать закрывающую метку для пустых XML меток

yaml_indent

  • yaml

  • ruby-yaml

Отступы YAML

yaml_line_break

  • yaml

  • ruby-yaml

Символ перевода строки

Доступные варианты:

dos

DOS (\r\n)

unix

UNIX (\n)

mac

MAC (\r)

yaml_line_wrap

  • yaml

  • ruby-yaml

Перенос длинных строк

Доступные варианты:

80

Переносить строку после 80 символов

100

Переносить строку после 100 символов

120

Переносить строку после 120 символов

180

Переносить строку после 180 символов

65535

Не переносить строки