Lokalisierungsdateiformate¶
Weblate unterstützt eine Vielzahl von Übersetzungsformaten. Jedes Format unterscheidet sich geringfügig und bietet eine Reihe unterschiedlicher Funktionen.
Hinweis
Wenn Sie ein Dateiformat für Ihre Anwendung wählen, ist es besser, ein gut bewährtes Format in dem/der von Ihnen verwendeten Toolkit/Plattform zu verwenden. Auf diese Weise können Ihre Übersetzer zusätzlich die Tools verwenden, an die sie gewöhnt sind und werden eher zu Ihrem Projekt beitragen.
Siehe auch
Automatische Erkennung¶
Weblate versucht, das Dateiformat während Übersetzungsprojekte und Komponenten hinzufügen zu erkennen. Die Erkennung kann für verschiedene Varianten desselben Serialisierungsformats (JSON, YAML, properties) oder derselben Dateicodierung falsch sein. Bitte überprüfen Sie daher, ob das Dateiformat korrekt ist, bevor Sie die Komponente erstellen.
Fähigkeiten der Übersetzungstypen¶
Please refer to the documentation page of each individual file format for information about which features are supported in that format.
Zweisprachige und einsprachige Formate¶
Es werden sowohl einsprachige als auch zweisprachige Formate unterstützt. Zweisprachige Formate speichern zwei Sprachen in einer einzigen Datei – Quelle und Übersetzung (typische Beispiele sind GNU gettext PO (Portable Object), XLIFF 1.1 und 1.2 oder Apple-iOS-Zeichenketten). Auf der anderen Seite identifizieren einsprachige Formate die Zeichenkette durch eine ID und jede Sprachdatei enthält nur die Zuordnung dieser zu einer bestimmten Sprache (typischerweise Android-Zeichenketten-Ressourcen). Einige Dateiformate werden in beiden Varianten verwendet, siehe die detaillierte Beschreibung unten.
Für die korrekte Verwendung einsprachiger Dateien benötigt Weblate Zugriff auf eine Datei, die eine vollständige Liste der zu übersetzenden Zeichenketten mit ihrem Quelltext enthält – diese Datei heißt in Weblate Einsprachige Basissprachdatei, obwohl die Benennung in Ihrem Paradigma abweichen kann.
Zusätzlich kann dieser Arbeitsablauf durch die Verwendung von einer Zwischensprachedatei erweitert werden, um von Entwicklern bereitgestellte Zeichenketten einzuschließen, die jedoch nicht in den endgültigen Zeichenketten verwendet werden sollen.
Zeichenkettenstatus¶
Viele Dateiformate unterscheiden nur zwischen den Zeichenketten „nicht übersetzt“ und „übersetzt“. Bei einigen Formaten ist es möglich, detailliertere Statusinformationen zu speichern, wie z. B. „bearbeitungsbedürftig“ oder „genehmigt“.
Beschreibung der Ausgangszeichenkette¶
Ausgangszeichenkettenbeschreibungen können verwendet werden, um zusätzliche Informationen über den zu übersetzenden Text zu übergeben.
Mehrere Formate bieten native Unterstützung für das Bereitstellen zusätzlicher Informationen für Übersetzer (zum Beispiel XLIFF 1.1 und 1.2, GNU gettext PO (Portable Object), JSON-Datei WebExtension, CSV-Dateien, Excel Open XML, Qt Linguist .ts, JSON-Dateien go-i18n, JSON-Dateien gotext, ARB-Datei, .NET-Ressourcendateien (RESX, RESW)). Viele andere Formate extrahieren den nächsten Kommentar als Ausgangszeichenkettenbeschreibung.
Erklärung¶
Die Erklärung für Zeichenketten kann aus einigen Dateiformaten gespeichert und analysiert werden.
Wird derzeit nur in TermBase-eXchange-Format unterstützt.
Ort der Ausgangszeichenkette¶
Der Ort einer Zeichenkette im Quellcode kann geübten Übersetzern helfen, herauszufinden, wie die Zeichenkette verwendet wird.
Diese Information ist in der Regel in zweisprachigen Formaten verfügbar, bei denen Zeichenketten mit Hilfe von Tools aus dem Quellcode extrahiert werden. Zum Beispiel GNU gettext PO (Portable Object) und Qt Linguist .ts.
Übersetzungsmarkierungen¶
Übersetzungsmarkierungen ermöglichen das Verhalten von Weblate anzupassen. Einige Formate unterstützen die Definition dieser in der Übersetzungsdatei (Sie können jederzeit in der Weblate-Oberfläche definiert werden, siehe Verhalten mit Markierungen anpassen).
Diese Funktion ist den Markierungen in GNU gettext PO (Portable Object) nachempfunden.
Zusätzlich werden die Markierungen für alle XML-basierten Formate aus dem nicht standardisierten Attribut weblate-flags extrahiert. Zusätzlich wird max-length:N durch das maxwidth-Attribut unterstützt, wie im XLIFF-Standard definiert, siehe Angabe von Übersetzungsmarkierungen.
Kontext¶
Der Kontext wird verwendet, um identische Zeichenketten in einem zweisprachigen Format zu unterscheiden, die in verschiedenen Bereichen verwendet werden (z. B. kann Sun als abgekürzter Name des Tages „Sonntag“ oder als Name unseres nächstgelegenen Sterns verwendet werden).
Bei einsprachigen Formaten kann die Zeichenkettenkennung (oft als Schlüssel bezeichnet) denselben Zweck erfüllen und ein zusätzlicher Kontext ist nicht erforderlich.
Zeichenketten mit Pluralformen¶
Pluralformen sind notwendig, um Zeichenketten mit variabler Anzahl richtig zu lokalisieren. Die Regeln hängen von der Zielsprache ab und viele Formate folgen der CLDR-Spezifikation für diese Sprache.
Hinweis
Die Pluralbildung von Zeichenketten muss auch vom Anwendungsframework ordnungsgemäß unterstützt werden. Wählen Sie das native Format Ihrer Plattform wie GNU gettext PO (Portable Object), Android-Zeichenketten-Ressourcen oder Stringsdict-Format.
Schreibgeschützte Zeichenketten¶
Schreibgeschützte Zeichenketten aus Übersetzungsdateien werden einbezogen, können aber in Weblate nicht bearbeitet werden. Diese Funktion wird nur von wenigen Formaten (XLIFF 1.1 und 1.2 und Android-Zeichenketten-Ressourcen) nativ unterstützt, kann aber in anderen Formaten durch Hinzufügen einer read-only-Markierung emuliert werden, siehe Verhalten mit Markierungen anpassen.
Unterstützung anderer Formate¶
Die meisten von translate-toolkit unterstützten Formate, die Serialisierung unterstützen, können problemlos unterstützt werden, wurden aber (noch) nicht getestet. In den meisten Fällen ist eine zusätzliche dünne Schicht in Weblate erforderlich, um die Unterschiede im Verhalten der verschiedenen Speicher zu verbergen.
Um die Unterstützung für ein neues Format hinzuzufügen, ist der bevorzugte Ansatz, zuerst die Unterstützung für dieses Format in das translate-toolkit zu implementieren.
Siehe auch
Dateiformat-Parameter¶
Mit den Dateiformat-Parametern lassen sich die zum Dateiformat gehörenden Einstellungen konfigurieren. Sie werden auf Komponentenebene konfiguriert und ermöglichen das Anpassen der Dateianalyse und Serialisierung.
Liste der Dateiformat-Parameter¶
Parametername |
Dateiformate |
Label |
Hilfetext |
|---|---|---|---|
csv_encoding |
|
Dateicodierung |
Für CSV-Dateien verwendete Codierung Verfügbare Auswahlmöglichkeiten:
|
csv_simple_encoding |
|
Dateicodierung |
Für einfache CSV-Dateien verwendete Codierung Verfügbare Auswahlmöglichkeiten:
|
dos_eol |
Alle Dateiformate |
DOS-Zeilenumbrüche |
DOS-Zeilenumbrüche (rn) anstelle von UNIX-Zeilenumbrüche (n) in Zeichenketten verwenden. |
flatxml_key_name |
|
FlatXML-Schlüsselname |
|
flatxml_root_name |
|
FlatXML-Wurzelname |
|
flatxml_value_name |
|
FlatXML-Wertname |
|
gwt_encoding |
|
Dateicodierung |
Für GWT-Properties-Dateien verwendete Codierung Verfügbare Auswahlmöglichkeiten:
|
json_indent |
|
JSON-Einrückung |
|
json_indent_style |
|
JSON-Einrückungsstil |
Verfügbare Auswahlmöglichkeiten:
|
json_sort_keys |
|
Nach JSON-Schlüssel sortieren |
|
json_use_compact_separators |
|
Leerzeichen nach Trennzeichen vermeiden |
|
line_max_length |
|
Maximale Zeilenlänge |
Die maximale Anzahl von Zeichen für jede Zeile in der Ausgabedatei. |
md_extract_code_blocks |
|
Codeblöcke extrahieren |
Ob übersetzbare Inhalte aus Codeblöcken in Markdown- und MDX-Dateien extrahiert werden sollen. |
md_extract_frontmatter |
|
Front Matter extrahieren |
Ob YAML-Front-Matter-Blöcke in Markdown- und MDX-Dateien extrahiert und übersetzt werden sollen. |
md_no_placeholders |
|
Platzhalter deaktivieren |
Deaktiviert die Erkennung und Verarbeitung von Platzhaltern in Markdown- und MDX-Dateien. |
merge_duplicates |
|
Identische Zeichenketten deduplizieren |
Konsolidiert identische Ausgangszeichenketten zu einer einzigen Übersetzungseinheit. Verhindert Übersetzungsverluste beim Umstrukturieren von Dateien oder Neuanordnen von Tabellen, indem positionsabhängiger Kontext entfernt wird. |
po_fuzzy_matching |
|
Fuzzy-Matching verwenden |
|
po_keep_previous |
|
Frühere msgids der übersetzten Zeichenketten beibehalten |
|
po_line_wrap |
|
Umbruch langer Zeilen |
Standardmäßig bricht gettext Zeilen bei 77 Zeichen und bei Zeilenvorschüben um. Mit dem Parameter Verfügbare Auswahlmöglichkeiten:
|
po_no_location |
|
Keine Ortsangaben in die Datei aufnehmen |
|
po_report_msgid_bugs_to |
|
msgid-Fehler melden an |
Lässt Weblate den „Report-Msgid-Bugs-To“-Dateiheader aktualisieren, wenn die Adresse für Fehlerberichte bei Ausgangszeichenketten gesetzt ist. |
po_set_language_team |
|
Language-Team-Header aktualisieren |
Lässt Weblate den „Language-Team“-Dateiheader aktualisieren. |
po_set_last_translator |
|
Last-Translator-Header aktualisieren |
Lässt Weblate den „Last-Translator“-Dateiheader aktualisieren. |
po_set_x_generator |
|
X-Generator-Header aktualisieren |
Lässt Weblate den „X-Generator“-Dateiheader aktualisieren. |
properties_encoding |
|
Dateicodierung |
Für Java-Properties-Dateien verwendete Codierung Verfügbare Auswahlmöglichkeiten:
|
strings_encoding |
|
Dateicodierung |
Für iOS-Zeichenketten-Dateien verwendete Codierung Verfügbare Auswahlmöglichkeiten:
|
xml_closing_tags |
|
Schließendes Tag für leere XML-Tags einschließen |
|
yaml_indent |
|
YAML-Einrückung |
|
yaml_line_break |
|
Zeilenumbrüche |
Verfügbare Auswahlmöglichkeiten:
|
yaml_line_wrap |
|
Umbruch langer Zeilen |
Verfügbare Auswahlmöglichkeiten:
|