Hilfethemen
Kontakt
Haben Sie Anregungen? Lassen unsere Hilfeseiten noch Fragen offen?
Wörterbücher erstellen
Inhalt
- Einführung in Wörterbücher
- Metadatenrichtlinien
- Textrichtlinien
- Einfaches Wörterbuch-HTML
- Beugungen für Wörterbücher
- Wörterbuch mit KindleGen erstellen
- Kindle-Wörterbücher testen
Einführung in Wörterbücher
Ein Wörterbuch ist ein Kindle-eBook (MOBI-Datei) mit zusätzlichen Tags zur Unterstützung der Such- und Nachschlagefunktionen. Elektronische Wörterbücher:
- Haben einen Hauptindex – eine Liste von Wörtern oder Sätzen in alphabetischer Reihenfolge. Leser können diese Liste schnell durchsuchen, indem sie den Anfang des Wortes eingeben, und dann in den Ergebnissen den gewünschten Eintrag auswählen.
- Sind als Wörterbuch markiert. Die Eingabe- und Ausgabesprachen des Wörterbuchs müssen korrekt spezifiziert sein, damit Kindle-Geräte das Wörterbuch für die Suche im Buch verwenden können.
Ein (einsprachiges) Englischwörterbuch definiert Englisch als Eingabe- und Ausgabesprache. Ein Französisch-Englisch-Wörterbuch spezifiziert Französisch als Eingabesprache und Englisch als Ausgabesprache. Wenn Sie ein bidirektionales Wörterbuch veröffentlichen wollen (Beispiel: Spanisch-Französisch und Französisch-Spanisch), müssen Sie für jede Sprachrichtung ein separates eBook erstellen.
Ein Kindle-Wörterbuch sollte alle Komponenten eines normalen Kindle-eBooks beinhalten. Es sollten eine OPF-Datei und HTML-Dateien mit CSS vorliegen. Jedes Wörterbuch sollte Folgendes enthalten:
- Ein Coverbild
- Eine Copyright-Seite
- Alle relevanten Dateien oder Schlussteile (Erklärungen von Symbolen, Anhänge usw.)
- Definitionen der Wörter (diese bilden den Hauptteil)
Dieses Format unterstützt den verbesserten Schriftsatz derzeit nicht.
Metadatenrichtlinien
Die OPF-Datei eines Wörterbuchs ähnelt grundsätzlich der anderer Kindle-Bücher, weist aber im Abschnitt <x-metadata> spezielle Metadaten-Tags auf. Diese Tags in der OPF-Datei definieren die Ausgangs- und Zielsprache des Wörterbuchs. Falls das Wörterbuch mehrere Indexe hat, wird in der OPF-Datei außerdem der Name des primären Nachschlageindex spezifiziert.
- Das <DictionaryInLanguage>-Element enthält den Sprachencode nach ISO 639-1 für die Eingabesprache des Wörterbuchs. Bei einem Spanisch-Französisch-Wörterbuch ist die Eingabesprache Spanisch.
- Das <DictionaryOutLanguage>-Element enthält den Sprachencode nach ISO 639-1 für die Sprache der Definitionen, die vom Wörterbuch angezeigt werden. Bei einem Spanisch-Französisch-Wörterbuch ist die Ausgabesprache Französisch.
- Das <DefaultLookupIndex>-Element spezifiziert den Index, der zuerst angezeigt wird, wenn das Wörterbuch von einem anderen eBook aus geöffnet wird. Der Standardindex muss immer dann definiert werden, falls das Wörterbuch mehr als einen Index aufweist. Der Indexname in <DefaultLookupIndex>-Tags in der OPF-Datei sollte auch dem Wert des name-Attributs in den <idx:entry>-Elementen im Inhalt des Wörterbuch entsprechen (siehe Details zu HTML).
Beispielsweise wäre der Code der Eingabesprache bei einem Spanisch-Französisch-Wörterbuch es, der Code der Ausgabesprache fr und dem Hauptindex könnte der Name Spanisch zugewiesen werden. Siehe Liste mit Ländercodes.
Beispiel: (Metadaten eines zweisprachigen Wörterbuchs)
<x-metadata> <DictionaryInLanguage>es</DictionaryInLanguage> <DictionaryOutLanguage>fr</DictionaryOutLanguage> <DefaultLookupIndex>Spanisch</DefaultLookupIndex> ... </x-metadata> |
Bei einem einsprachigen Wörterbuch muss derselbe Sprachencode zweimal angegeben werden: einmal für die Eingabesprache und ein weiteres Mal für die Ausgabesprache. Zur Identifizierung einer regionalen Variante der Ausgangs- und/oder Zielsprache kann ein regionales Suffix an den ISO-639-1-Code angehängt werden. Beispiel: en-gb steht für britisches Englisch, en-us für US-amerikanisches Englisch.
Beispiel: (Metadaten eines einsprachigen Wörterbuchs, regionale Variante)
<x-metadata> <DictionaryInLanguage>en-us</DictionaryInLanguage> <DictionaryOutLanguage>en-us</DictionaryOutLanguage> <DefaultLookupIndex>Stichwort</DefaultLookupIndex> ... </x-metadata> |
Textrichtlinien
Ein einfaches, sauberes Format eignet sich am besten für die Suche im Buch. Amazon empfiehlt folgende Inhalte und Gestaltungspraktiken für eine hochwertige Leseerfahrung:
- Das Stichwort (das definierte Wort) sollte am Anfang des Eintrags stehen und sich vom restlichen Inhalt abheben (Darstellung in eigener Zeile, linksbündig, in Fettschrift).
- Jeder Wörterbucheintrag sollte eine Definition (bzw. bei zweisprachigen Wörterbüchern eine Übersetzung) enthalten.
- Zwei Einträge sollten durch eine horizontale Linie getrennt sein.
- Der Abschnitt jedes Buchstabens im Alphabet sollte auf einer neuen Seite beginnen.
- Bilder sollten vermieden werden (siehe Einschränkungen für Bilder).
- Es sollten keine Tabellen verwendet werden (siehe Einschränkungen für Tabellen).
- Schriftfarbe, -größe und -art sollten nicht erzwungen werden (siehe Textrichtlinien).
Einfaches Wörterbuch-HTML
Format
Wörterbücher für Kindle werden im Format MOBI 7 und nicht in KF8 erstellt. Aus diesem Grund muss für das Layout ein einspaltiges Format verwendet werden. Mehrere Spalten und Seitenleisten werden in MOBI 7 nicht unterstützt.Frameset-Element
Alle Wörterbücher müssen ein <mbp:frameset>-Element als erstes Unterelement des <body>-Elements besitzen. Dieses Frameset-Element enthält alle <idx:entry>-Elemente des Wörterbuchs.
Der Namespace für dieses <mbp:frameset>-Element ist
xmlns:mbp="https://kindlegen.s3.amazonaws.com/AmazonKindlePublishingGuidelines_DE.pdf" und muss im <html>-Stammelement des XHTML-Dokuments deklariert werden.
Beispiel:
<html xmlns:math="http://exslt.org/math" xmlns:svg="http://www.w3.org/2000/svg" xmlns:tl="https://kindlegen.s3.amazonaws.com/AmazonKindlePublishingGuidelines_DE.pdf" xmlns:saxon="http://saxon.sf.net/" xmlns:xs="http://www.w3.org/2001/XMLSchema" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:cx="https://kindlegen.s3.amazonaws.com/AmazonKindlePublishingGuidelines_DE.pdf" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:mbp="https://kindlegen.s3.amazonaws.com/AmazonKindlePublishingGuidelines_DE.pdf" xmlns:mmc="https://kindlegen.s3.amazonaws.comAmazonKindlePublishingGuidelines_DE.pdf" xmlns:idx="https://kindlegen.s3.amazonaws.com/AmazonKindlePublishingGuidelines_DE.pdf"> <head><meta http-equiv="Content-Type" content="text/html; charset=utf-8"></head> <body> <mbp:frameset> <idx:entry name="english" scriptable="yes" spell="yes"> <idx:short><a id="1"></a> <idx:orth value="aardvark"><b>aard•vark</b> <idx:infl> <idx:iform value="aardvarks"></idx:iform> <idx:iform value="aardvark's"></idx:iform> <idx:iform value="aardvarks'"></idx:iform> </idx:infl> </idx:orth> <p> Ein nachtaktives wühlendes Säugetier, das in Afrika südlich der Sahara beheimatet ist und sich ausschließlich von Ameisen und Termiten ernährt. </idx:short> </idx:entry> [... andere Einträge ...] </mbp:frameset> </body> </html> |
Stichwortindex
Um einen alphabetischen Stichwortindex zu erstellen, müssen Sie spezielle Tags verwenden, die in der Standard-HTML nicht vorgesehen sind. Der Quellcode ist auch mit diesen zusätzlichen <idx>-Tags gültiges XHTML.
<idx:entry>..</idx:entry>
Das <idx:entry>-Tag wird verwendet, um den Umfang jedes Eintrags im Index zu definieren. In einem Wörterbuch sollte jedes Stichwort mit seinen Definitionen zwischen <idx:entry> und </idx:entry> platziert werden. Sie können beliebige HTML-Anweisungen innerhalb dieses Tags verwenden.
Das <idx:entry>-Tag kann die Attribute name, scriptable und spell enthalten. Das Attribut name verweist auf den Index, zu dem das Stichwort gehört. Der Wert von name sollte dem in der OPF-Datei definierten Namen des Standardnachschlageindex entsprechen. Das Attribut scriptable erlaubt den Zugriff auf den Eintrag vom Index aus. Das Attribut scriptable kann nur den Wert "yes" haben. Das Attribut spell ermöglicht die Suche mit Platzhaltern und eine Rechtschreibprüfung beim Nachschlagen. Das Attribut spell kann nur den Wert "yes" haben.
Beispiel:
<idx:entry name="english" scriptable="yes" spell="yes"> |
Das <idx:entry>-Tag kann darüber hinaus ein id-Attribut mit der sequenziellen ID-Nummer des Eintrags enthalten. Diese Nummer sollte mit dem Wert des id-Attributs innerhalb eines Anker-Tags übereinstimmen, das zur Erstellung von Querverweisen eingefügt wird.
Beispiel:
<idx:entry name="japanese" scriptable="yes" spell="yes" id="12345"> <a id="12345"></a> |
Die ID-Nummer des Eintrags wird nicht für die Suche im Buch verwendet. Stattdessen muss die Wortform-Entität, die für die Nachschlagefunktion indexiert wird, wie im folgenden Abschnitt beschrieben im <idx:orth>-Element enthalten sein.
<idx:orth>..</idx:orth>
Das <idx:orth>-Tag wird zur Definition des Etiketts verwendet, das in der Indexliste erscheint und bei der Suche als Stichwort abgerufen werden kann. Diese Zeichenkette entspricht dem Text, den der Benutzer in das Suchfeld eingibt, um einen Eintrag zu finden.
Beispiel:
<idx:orth>Etikett des Eintrags im Index</idx:orth> |
Das Beispiel unten zeigt einen sehr einfachen Eintrag, der Teil eines Deutschwörterbuchs sein könnte. In diesem Beispielcode erscheint das Wort „Stuhl“ in der Indexliste und kann von Benutzern gesucht werden.
Beispiel:
<idx:entry> <idx:orth>Stuhl</idx:orth> Ein Sitzmöbel für eine Person mit Rückenlehne, normalerweise vier Beinen und manchmal zwei Armlehnen. <idx:entry> |
Das Attribut value kann im <idx:orth>-Tag verwendet werden, um ein verborgenes Etikett in den Eintrag einzufügen. Dieses Attribut gewährleistet die einwandfreie Suchfunktion trotz spezieller Formatierungen, die bei Wörterbüchern häufig auf Stichwörter angewendet werden.
Beispiel:
<idx:orth value="Verborgenes Etikett des Eintrags im Index">Anzeigeformat</orth> |
Falls das Stichwort im Wörterbuch zur Anzeige von Homografen mit einer hochgestellten Zahl, dem Symbol eines eingetragenen Handelszeichens, mit mittleren Punkten zur Silbentrennung oder mit irgendwelchen anderen zusätzlichen Symbolen angezeigt werden soll, können diese Sonderzeichen im Text zwischen den <idx:orth>-Tags verwendet werden, aber nicht in der Zeichenkette des Attributs value. Der Text im Attribut value sollte exakt mit der Zeichenkette übereinstimmen, die für die Suche eingegeben wird. Fehlt das Attribut value, wird die Entität zwischen den <idx:orth>-Tags für die Suchfunktion indexiert. Wenn mittlere Punkte, hochgestellte Zahlen oder andere Symbole im Text zwischen den <idx:orth>-Tags enthalten sind, schlägt die Suche im Buch fehl, sofern dem Attribut value kein verborgenes Etikett zugewiesen wurde.
Beispiel:
<idx:orth value="Amazon">A•ma•zon®<sup>3</sup></orth> |
Falls das Wörterbuch mehr als ein orthografisches Script verwendet, kann das Attribut format des <orth>-Tags zur Identifizierung jedes Scripts verwendet werden, um den Index zu erstellen.
Beispiel:
<idx:orth format="script name"> |
Neben dem Haupt-Stichwortindex, der sämtliche Einträge des Wörterbuches enthält, ist für die Suche im Buch ein zusätzlicher Index der Flexionsformen aller Stichwörter notwendig. Zur Erstellung dieses verborgenen Beugungsindex sollten zusätzliche Daten wie unten gezeigt in das <idx:orth>-Tag eingefügt werden.
Beugungen für Wörterbücher
Wörterbücher sollten so aufgebaut sein, dass alle gebeugten Formen eines Grundworts auf denselben Eintrag verweisen. Eine vollständige Liste der Flexionsformen sollte für jedes Stichwort vorhanden sein. Falls für einen Eintrag mehrere Schreibweisen möglich sind, müssen getrennte Flexionsformen für jede Schreibweise vorliegen.
Beugungsindex
Zur Erstellung dieses verborgenen Beugungsindex fügen Sie die Flexionsformen für die Stichwörter in verschachtelte <idx:infl>- und <idx:iform />-Tags innerhalb des <idx:orth>-Elements ein. Dieser Index kann nicht direkt vom Benutzer durchsucht werden, sondern wird ausschließlich für die Suche im Buch verwendet.
<idx:infl>..</idx:infl>
Das <idx:infl>-Element kann mehrere <idx:iform />-Elemente enthalten. Bei den <idx:iform />-Elementen handelt es sich immer um leere Elemente, die ausschließlich zur Aufnahme von Attributen und verborgenen Inhalten dienen. Das value-Attribut verweist auf die Flexionsformen, die den Beugungsindex bilden.
Beispiel:
<idx:orth>record <idx:infl> <idx:iform value="records" /> <idx:iform value="recording" /> <idx:iform value="recorded" /> </idx:infl> </idx:orth> |
Das <idx:infl>-Tag, das <idx:iform />-Tag und das value-Attribut sind obligatorisch. Das <idx:infl>-Element kann außerdem ein optionales inflgrp-Attribut zum Anzeigen der Wortart enthalten. Das <idx:iform />-Element kann ein optionales name-Attribut zum Anzeigen der Kategorie der Flexionsparadigmen enthalten. Bei Sprachen, die stark auf Flexionen zurückgreifen, wird durch die Verwendung dieser optionalen Kategorien der Umfang des Beugungsindex erweitert. Dies kann die Performance der Suchfunktion beeinträchtigen.
Beispiel:
<idx:orth>record <idx:infl inflgrp="noun"> <idx:iform name="plural" value="records" /> </idx:infl> <idx:infl inflgrp="verb"> <idx:iform name="present participle" value="recording" /> <idx:iform name="past participle" value="recorded" /> <idx:iform name="present 3ps" value="records" /> </idx:infl> </idx:orth> |
Die als Attribute des <idx:iform />-Tags definierten Werte sind für den Benutzer nicht sichtbar. Sie stellen jedoch die erforderlichen Informationen bereit, um bei der Suche im Buch von den Flexionsformen auf die jeweiligen Stichwörter zu verweisen. Um den Benutzer über die Wortart oder Flexionsparadigmen zu informieren, sollten ergänzende Angaben in den Hauptteil des Eintrags eingefügt werden (d. h. zusätzlich zu Definitionen und Beispielen).
<idx:key>..</idx:key> (VERALTET)
Analog zum <idx:infl>-Tag dient das <idx:key>-Tag zur Unterstützung der Suche nach Indexeinträgen durch die Eingabe alternativer Wortformen. <idx:key>-Tags in einem Kindle-Wörterbuch können jedoch eine Instabilität der Nachschlagefunktion bewirken und die Anwendung des Parameters für Suchen mit exakter Übereinstimmung beeinträchtigen. Aus diesem Grund dürfen <idx:key>-Tags in Kindle-Wörterbüchern nicht mehr verwendet werden. Verwenden Sie stattdessen die Tags <idx:infl> und <idx:iform /> für alternative Wortformen.
Parameter für Suchen mit exakter Übereinstimmung
Das Kindle-Gerät verwendet standardmäßig einen Fuzzy-Algorithmus, um die diakritischen Zeichen bei der Suche nach einem Wort zu vergleichen. Sprachen, die kontrastive diakritische Zeichen verwenden, um zwischen unterschiedlichen Wortformen zu unterscheiden, sollten im <idx:iform />-Tag das Attribut exact="yes" verwenden, um bei der Suche eine exakte Übereinstimmung der diakritischen Zeichen zu erzwingen.
Beispiel:
<idx:entry name="spanish" scriptable="yes" spell="yes"> <a id="12345"></a> <idx:orth value="uña"><b>uña</b> <idx:infl> <idx:iform value="uñas" exact="yes" /> </idx:infl> </idx:orth> Wenn dem Parameter exact der Wert „yes“ zugewiesen ist, führt die Suche nach „uñas“ zur Ausgabe des Stichworts „uña“ („Fingernagel“) und unterdrückt dabei das Stichwort „una“ („eine“). |
Wörterbuch mit KindleGen erstellen
Beim Erstellen eines Wörterbuchs mithilfe des Befehlszeilentools KindleGen sollten Sie folgende Syntax verwenden:
kindlegen.exe [filename.opf] -c2 –verbose -dont_append_source |
Falls die Wörterbucheinträge in einer einzigen, sehr großen XHTML-Datei enthalten sind, kann KindleGen das Wörterbuch möglicherweise nicht generieren. Sollte die Erstellung fehlschlagen, kann dieses Problem behoben werden, indem der Wörterbuchinhalt in zwei oder mehrere XHTML-Dateien aufgeteilt wird.
Siehe Anleitung zur Verwendung von KindleGen.
Kindle-Wörterbücher testen
Formatierung testen
Amazon empfiehlt, die Formatierung des konvertierten Wörterbuchs zu begutachten, um eine gute visuelle Leseerfahrung für den Benutzer zu gewährleisten:
- Prüfen Sie die Formatierung der Definitionen, indem Sie das Wörterbuch durchblättern und mehrere Definitionen nachschlagen. (Das Wörterbuchformat kann mit Kindle Previewer oder jedem Kindle-Gerät geprüft werden. Die Prüfung der Suchfunktion erfordert jedoch ein eReader-Gerät.)
- Prüfen Sie die Wörter auf nicht unterstützte Zeichen, unterbrochene oder zusammengefügte Wörter, die Anzeige akzentuierter Zeichen, Symbole, Aussprachehilfe usw.
- Prüfen Sie, ob keine Tippfehler vorhanden sind.
- Prüfen Sie, ob vorhandene Links wie beabsichtigt funktionieren. (Links werden im Fenster der Suche im Buch deaktiviert, sollten jedoch innerhalb des Wörterbuchs korrekt funktionieren.)
- Vergewissern Sie sich, dass Bilder (falls vorhanden) deutlich und lesbar sind.
- Stellen Sie sicher, dass Schriftfarbe und Schriftart nicht erzwungen sind.
Nachschlagefunktion testen
Amazon empfiehlt die Überprüfung der Richtigkeit der Suchergebnisse, wenn das Wörterbuch als Nachschlagewerk für Suchbegriffe aus anderen Büchern verwendet wird. Dieser Teil der Prüfung kann nur mit eReader-Geräten vorgenommen werden (nicht mit Previewer), da nur eReader-Geräte dem Benutzer ermöglichen, das standardmäßige Wörterbuch für die Suchfunktion auszuwählen.
- Laden Sie das Wörterbuch per Sideload auf das eReader-Gerät. Schließen Sie dazu den Kindle mit einem USB- oder Mini-USB-Kabel an Ihren Computer an. Ihr Computer sollte das Gerät erkennen. Im angezeigten Pop-up-Fenster sollten Sie ein Verzeichnis namens „Dokumente“ sehen. Legen Sie die Wörterbuchdatei in diesem Verzeichnis ab und melden Sie den Kindle vom Computer ab.
- Wählen Sie das Testwörterbuch als standardmäßiges Nachschlagewörterbuch aus:
- Kindle Paperwhite: Wählen Sie Start > Menü > Einstellungen > Geräteoptionen > Sprache und Wörterbücher > Wörterbücher > [Eingabesprache].
- Schlagen Sie mehrere Wörter nach, und prüfen Sie die angezeigten Definitionen. Öffnen Sie einen anderen Titel, wählen Sie ein Wort aus, und prüfen Sie die angezeigte Definition. Falls keine Definition erscheint, besteht wahrscheinlich ein Problem mit den HTML-Tags. Hier einige Empfehlungen für Wörter, die Sie zu Testzwecken nachschlagen sollten:
- Konjugationen regelmäßiger und unregelmäßiger Verben
- Beispiele: wandern, wandert, wanderte, wandernd; gehen, geht, ging, gehend
- Substantive, Adjektive, Adverbien und deren Konjugationen/Deklinationen
- Beispiele: Tisch, Tische; Wolf, Wölfe; heiß, heißer, am heißesten
- Grammatik- und Zeichensetzungsregeln, die in der jeweiligen Sprache oft verwendet werden
- Beispiele: Zusammenziehungen, Auslassungen, Verben mit klitischen Pronomen
- Konjugationen regelmäßiger und unregelmäßiger Verben
- Prüfen Sie die Indexdarstellung des Wörterbuchs. Öffnen Sie dazu das Wörterbuch und geben Sie den Anfang eines Worts in das Suchfeld ein. Es sollte eine Liste der Stichwörter in alphabetischer Reihenfolge erscheinen, die entsprechend den eingegebenen Buchstaben dynamisch aktualisiert wird. Die Auswahl eines Stichworts aus der Indexliste sollte den Benutzer zum korrekten Wörterbucheintrag führen.