Argomenti della guida
Contattaci
Vuoi lasciare un feedback? Non riesci a trovare la risposta che cerchi nelle pagine di assistenza?
Creazione dei dizionari
Sommario
- Introduzione ai dizionari
- Linee guida sui metadati
- Linee guida per il testo
- HTML di base per i dizionari
- Flessioni per dizionari
- Creazione di un dizionario con KindleGen
- Test dei dizionari Kindle
Introduzione ai dizionari
Un dizionario è un eBook Kindle (file MOBI) con tag supplementari aggiunti per supportare la funzionalità di ricerca e consultazione. L'eBook dizionario:
- Contiene un indice primario: un elenco di parole o frasi elencate in ordine alfabetico. I lettori possono ricercare rapidamente all'interno di questo elenco digitando l'inizio della parola e selezionando la voce desiderata.
- È contrassegnato come dizionario. Le lingue di input e output del dizionario devono essere opportunamente definite, in modo che i dispositivi Kindle possano usare il dizionario per la ricerca nel libro.
Ad esempio, un dizionario di inglese (monolingue) elenca l'inglese come lingua di input e di output. Un dizionario francese-inglese elenca il francese come lingua di input e l'inglese come lingua di output. Per realizzare un dizionario bilingue bidirezionale (esempio: spagnolo-francese e francese-spagnolo), è necessario creare due eBook separati: uno per spagnolo-francese e l'altro per francese-spagnolo.
Un dizionario Kindle dovrebbe avere le stesse componenti di un normale eBook Kindle. Dovrebbe includere un file OPF e dei file HTML con CSS. Ogni dizionario dovrebbe includere:
- Un'immagine di copertina
- Una pagina del copyright
- Elementi della parte introduttiva e della parte conclusiva (spiegazioni dei simboli, appendici ecc.)
- Definizioni delle parole (questa è la parte più rilevante del file)
Al momento questo formato non supporta la composizione migliorata.
Linee guida sui metadati
Il file OPF di un dizionario è simile a quello di altri libri Kindle, ma contiene anche tag di metadati speciali nella sezione <x-metadata>. Questi tag aggiuntivi impostano la lingua di partenza e la lingua di arrivo per il dizionario. Se il dizionario presenta più indici, il file OPF specifica anche il nome dell'indice di ricerca primario.
- L'elemento <DictionaryInLanguage> contiene il codice linguistico ISO 639-1 per la lingua dei libri per cui il dizionario è stato realizzato. Per un dizionario spagnolo-francese, la lingua di input è lo spagnolo.
- L'elemento <DictionaryOutLanguage> contiene il codice linguistico ISO 639-1 per la lingua delle definizioni restituite dal dizionario. Per un dizionario spagnolo-francese, la lingua di output è il francese.
- L'elemento <DefaultLookupIndex> indica l'indice che si aprirà per primo quando il dizionario viene utilizzato per la ricerca da un altro eBook. Se il dizionario contiene più indici, deve essere specificato l'indice di default. Il nome dell'indice racchiuso nei tag <DefaultLookupIndex> nel file OPF deve inoltre apparire come il valore dell'attributo name negli elementi <idx:entry> nel contenuto del dizionario (consulta i dettagli relativi al linguaggio HTML).
A titolo di esempio, per un dizionario spagnolo-francese il codice linguistico di input sarà es, il codice linguistico di output sarà fr e l'indice primario sarà denominato Spagnolo. Consulta un elenco di codici paese.
Esempio: (metadati per dizionario bilingue)
<x-metadata> <DictionaryInLanguage>es</DictionaryInLanguage> <DictionaryOutLanguage>fr</DictionaryOutLanguage> <DefaultLookupIndex>Spagnolo</DefaultLookupIndex> ... </x-metadata> |
Per un dizionario monolingue, lo stesso codice linguistico deve essere visualizzato due volte: una volta per identificare la lingua di input e una seconda volta per identificare la stessa lingua come lingua di output. Per identificare una variante regionale per la lingua di partenza e/o di arrivo, è possibile inserire un suffisso regionale al codice ISO 639-1. Ad esempio, en-gb indica l'inglese britannico, mentre en-us indica l'inglese americano.
Esempio: (metadati per dizionario monolingue, variante regionale)
<x-metadata> <DictionaryInLanguage>en-us</DictionaryInLanguage> <DictionaryOutLanguage>en-us</DictionaryOutLanguage> <DefaultLookupIndex>lemma</DefaultLookupIndex> ... </x-metadata> |
Linee guida per il testo
Per eseguire ricerche nel libro è preferibile un formato semplice e chiaro. Amazon consiglia quanto segue per la formattazione e i contenuti del dizionario, per garantire all'utente un'esperienza di alta qualità:
- Il lemma (la parola da definire) deve occupare la prima posizione della voce e deve essere distinto dal contenuto circostante (su una riga a sé stante, allineato a sinistra, in grassetto).
- Ogni voce del dizionario deve contenere una definizione (o traduzione, per i dizionari bilingue).
- Tra le voci deve essere inserita una linea orizzontale.
- Le sezioni relative a ciascuna lettera alfabetica devono iniziare in una nuova pagina.
- Le immagini vanno evitate (consulta la sezione sulle limitazioni relative alle immagini).
- Le tabelle non devono essere utilizzate (consulta la sezione sulle limitazioni relative alle tabelle).
- Il colore, le dimensioni e il tipo di carattere non devono essere forzati (consulta la sezione relativa alle linee guida sul testo).
HTML di base per i dizionari
Formato
I dizionari per Kindle devono essere in formato MOBI 7, non in formato KF8. Per questa ragione, il layout del dizionario dovrebbe essere in un formato su colonna singola. Il formato MOBI 7 non supporta la presenza di più colonne e barre laterali.Elemento frameset
Tutti i dizionari devono avere un elemento <mbp:frameset> come elemento secondario iniziale di <body>. Questo elemento frameset contiene tutti gli elementi <idx:entry> del dizionario.
Lo spazio per il nome di questo elemento <mbp:frameset> è
xmlns:mbp="https://kindlegen.s3.amazonaws.com/AmazonKindlePublishingGuidelines_IT.pdf" e deve essere indicato nell'elemento <html> radice del documento XHTML.
Esempio:
<html xmlns:math="http://exslt.org/math" xmlns:svg="http://www.w3.org/2000/svg" xmlns:tl="https://kindlegen.s3.amazonaws.com/AmazonKindlePublishingGuidelines.pdf" xmlns:saxon="http://saxon.sf.net/" xmlns:xs="http://www.w3.org/2001/XMLSchema" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:cx="https://kindlegen.s3.amazonaws.com/AmazonKindlePublishingGuidelines.pdf" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:mbp="https://kindlegen.s3.amazonaws.com/AmazonKindlePublishingGuidelines.pdf" xmlns:mmc="https://kindlegen.s3.amazonaws.com/AmazonKindlePublishingGuidelines.pdf" xmlns:idx="https://kindlegen.s3.amazonaws.com/AmazonKindlePublishingGuidelines.pdf"> <head><meta http-equiv="Content-Type" content="text/html; charset=utf-8"></head> <body> <mbp:frameset> <idx:entry name="english" scriptable="yes" spell="yes"> <idx:short><a id="1"></a> <idx:orth value="aardvark"><b>aard•vark</b> <idx:infl> <idx:iform value="aardvarks"></idx:iform> <idx:iform value="aardvark's"></idx:iform> <idx:iform value="aardvarks'"></idx:iform> </idx:infl> </idx:orth> <p> Mammifero notturno nativo dell'Africa sub-sahariana che vive in tana e si nutre soltanto di formiche e termiti. </p> </idx:short> </idx:entry> [...altre voci…] </mbp:frameset> </body> </html> |
Indice dei lemmi
Per creare un indice alfabetico dei lemmi, è necessario usare tag speciali che non fanno parte del linguaggio HTML standard. La fonte costituisce comunque un XHTML valido con l'aggiunta dei seguenti markup <idx>.
<idx:entry>..</idx:entry>
Il tag <idx:entry> contrassegna l'ambito di ciascuna voce da indicizzare. In un dizionario, tutti i lemmi con le relative definizioni devono essere interposti tra <idx:entry> e </idx:entry>. All'interno di questo tag è possibile collocare qualsiasi tipo di HTML.
Il tag <idx:entry> può includere gli attributi name, scriptable e spell. L'attributo name indica l'indice a cui appartiene il lemma. Il valore dell'attributo name dovrebbe corrispondere al nome dell'indice di ricerca di default elencato nell'OPF. L'attributo scriptable rende accessibile la voce dall'indice. L'unico valore possibile per l'attributo scriptable è "yes". L'attributo spell attiva la ricerca con caratteri jolly e la correzione ortografica durante la ricerca di una parola. L'unico valore possibile per l'attributo spell è "yes".
Esempio:
<idx:entry name="english" scriptable="yes" spell="yes"> |
Il tag <idx:entry> può includere inoltre un attributo id con il numero identificativo sequenziale della voce. Questo numero deve corrispondere al valore dell'attributo id in un tag di ancoraggio utilizzato per effettuare collegamenti con riferimenti incrociati:
Esempio:
<idx:entry name="japanese" scriptable="yes" spell="yes" id="12345"> <a id="12345"></a> |
Il numero identificativo della voce non viene utilizzato per la ricerca nel libro; invece, l'entità da indicizzare per la ricerca deve essere contenuta nell'elemento <idx:orth>, come indicato nelle sezioni seguenti.
<idx: orth>.. </idx: orth>
Il tag <idx:orth> viene utilizzato per delimitare l'etichetta che sarà visualizzata nell'elenco dell'indice e che potrà essere cercata come lemma della ricerca. Di seguito è riportato il testo che gli utenti possono inserire nella casella di ricerca per trovare una voce.
Esempio:
<idx:orth>Etichetta di una voce di indice</idx:orth> |
Questo è un esempio di una voce molto semplice che potrebbe far parte di un qualsiasi dizionario di italiano. Da questo codice di esempio, la parola "sedia" appare nell'elenco dell'indice e può essere cercata dagli utenti.
Esempio:
<idx:entry> <idx:orth>sedia</idx:orth> Posto a sedere per una persona dotato di schienale, quattro gambe e due braccioli. <idx:entry> |
L'attributo value può essere utilizzato sul tag <idx:orth> per includere un'etichetta nascosta nella voce. Questo attributo conserva la funzionalità di ricerca in presenza di una formattazione speciale come quella che generalmente viene utilizzata per i lemmi nei dizionari.
Esempio:
<idx:orth value="Etichetta nascosta della voce di indice">Visualizza formato</orth> |
Se il lemma deve essere visualizzato nel dizionario con un esponente per indicare voci omografe, con il simbolo del marchio registrato, punti al centro per separare le sillabe o con qualsiasi altro simbolo aggiuntivo, questa speciale formattazione deve apparire nel testo tra i tag <idx:orth> ma non nel testo dell'attributo value. Il testo dell'attributo value dovrebbe corrispondere esattamente alla forma da usare per la ricerca. Se non è presente un attributo value, l'entità compresa tra i tag <idx:orth> sarà indicizzata per la ricerca. Se nel testo compreso tra i tag <idx:orth> sono presenti punti al centro, esponenti o altri simboli, la ricerca nel libro avrà esito negativo, a meno che nell'attributo value non sia presente un'etichetta nascosta con il modulo di ricerca.
Esempio:
<idx:orth value="Amazon">A•ma•zon®<sup>3</sup></orth> |
Se il dizionario usa più di uno script ortografico, l'attributo format sul tag <orth> può essere utilizzato per identificare gli script per la costruzione dell'indice.
Esempio:
<idx:orth format="script name"> |
Insieme a questo indice primario dei lemmi per tutte le voci del dizionario, la ricerca nel libro richiede anche un indice aggiuntivo delle forme flesse per ciascun lemma. Per costruire l'indice nascosto delle flessioni, i dati aggiuntivi devono essere nidificati all'interno del tag <idx:orth> come segue.
Flessioni per dizionari
I dizionari devono essere costruiti in modo tale che più forme flesse di un'unica parola radice accedano alla stessa voce. Deve essere specificato un elenco completo delle forme flesse per ciascun lemma. Se una voce usa più ortografie, è necessario indicare le varie flessioni per ciascuna ortografia.
Indice delle flessioni
Per creare l'indice nascosto delle flessioni, i dati delle forme flesse devono essere racchiusi nei tag <idx:infl> e <idx:iform /> nidificati all'interno dell'elemento <idx:orth>. L'utente non potrà effettuare una ricerca direttamente in questo indice, il quale sarà invece utilizzato per la ricerca nel libro.
<idx: infl>.. </idx: infl>
L'elemento <idx:infl> può contenere più elementi <idx:iform />. Gli elementi <idx:iform /> sono sempre vuoti e utilizzati solo per gli attributi e non per il contenuto visibile. L'attributo value indica le forme flesse che costituiscono l'indice delle flessioni.
Esempio:
<idx:orth>record <idx:infl> <idx:iform value="records" /> <idx:iform value="recording" /> <idx:iform value="recorded" /> </idx:infl> </idx:orth> |
I tag <idx:infl> e <idx:iform /> e l'attributo value sono obbligatori. L'elemento <idx:infl> può includere anche un attributo inflgrp opzionale per denotare una parte del discorso e l'elemento <idx:iform /> può includere un attributo name opzionale per indicare la categoria del paradigma flessivo. Per le lingue che utilizzano la flessione in modo esteso, l'inclusione di queste categorie opzionali amplierà le dimensioni dell'indice delle flessioni, con conseguente rallentamento delle prestazioni durante la ricerca.
Esempio:
<idx:orth>record <idx:infl inflgrp="noun"> <idx:iform name="plural" value="records" /> </idx:infl> <idx:infl inflgrp="verb"> <idx:iform name="present participle" value="recording" /> <idx:iform name="past participle" value="recorded" /> <idx:iform name="present 3ps" value="records" /> </idx:infl> </idx:orth> |
I valori elencati come attributi del tag <idx:iform /> non saranno visibili all'utente, ma forniranno le informazioni richieste per il reindirizzamento dalle forme flesse ai lemmi associati durante la ricerca nel libro. Per informare l'utente circa le parti del discorso o i paradigmi flessivi, è necessario includere del testo aggiuntivo nel corpo della voce (ossia, accanto alla definizione e agli esempi).
<idx:key>..</idx:key> (SCONSIGLIATO)
Come il tag <idx:infl>, anche il tag <idx:key> è concepito per consentire la ricerca di una voce nell'indice tramite una forma di ricerca alternativa. Tuttavia, la presenza di tag <idx:key> in un dizionario Kindle può creare instabilità nella funzionalità di ricerca e interferire con il funzionamento del parametro per la corrispondenza esatta. Per questi motivi, l'uso dei tag <idx:key> nei dizionari Kindle è sconsigliato. Al contrario, i tag <idx:infl> e <idx:iform /> devono essere usati per racchiudere le forme di ricerca alternative.
Parametro per la corrispondenza esatta
Per default, il dispositivo Kindle usa un algoritmo fuzzy per associare i segni diacritici durante la ricerca di una parola. Le lingue che utilizzano segni diacritici contrastivi per distinguere le differenti forme delle parole devono usare l'attributo exact="yes" nel tag <idx:iform /> per forzare la corrispondenza esatta dei segni diacritici durante la ricerca.
Esempio:
<idx:entry name="spanish" scriptable="yes" spell="yes"> <a id="12345"></a> <idx:orth value="uña"><b>uña</b> <idx:infl> <idx:iform value="uñas" exact="yes" /> </idx:infl> </idx:orth> Impostando il parametro exact su "yes", il dispositivo verrà forzato a far corrispondere uñas con il lemma uña ("unghia"), impedendo l'associazione con una ("una"). |
Creazione di un dizionario con KindleGen
Quando si crea un dizionario con KindleGen mediante la linea di comando, è necessario usare la seguente sintassi:
kindlegen.exe [filename.opf] -c2 –verbose -dont_append_source |
Se le voci del dizionario sono contenute in un singolo file XHTML molto grande, KindleGen potrebbe non essere in grado di creare il dizionario. In questo caso il problema può essere risolto dividendo il contenuto del dizionario in due o più file XHTML.
Consulta le istruzioni sull'uso di KindleGen.
Test dei dizionari Kindle
Test del formato
Amazon consiglia di verificare che il dizionario convertito sia opportunamente formattato in modo da offrire all'utente una buona esperienza visiva:
- Controlla la formattazione delle definizioni scorrendo il dizionario e leggendo più definizioni. Il formato del dizionario può essere controllato utilizzando Kindle Previewer o un qualsiasi dispositivo Kindle; tuttavia, il test della ricerca richiede l'uso di un lettore di eBook.
- Controlla le parole per individuare caratteri non supportati, parole spezzate o unite, corretta visualizzazione dei caratteri accentati, dei simboli, della guida alla pronuncia ecc.
- Verifica che non siano presenti errori ortografici.
- Verifica che i collegamenti (se presenti) funzionino correttamente. I collegamenti saranno disabilitati nella finestra di ricerca nel libro, ma devono essere attivi all'interno del dizionario stesso.
- Se sono presenti delle immagini, controlla che siano chiare e leggibili.
- Controlla che il colore e il tipo di carattere non siano forzati.
Test di ricerca
Amazon consiglia di verificare che le definizioni vengano restituite correttamente in caso di utilizzo del dizionario per cercare parole in altri libri. Questa parte del test può essere effettuata solo con un lettore di eBook (Previewer escluso), poiché solo questi dispositivi consentono all'utente di impostare il dizionario di default per la ricerca.
- Trasferisci il dizionario in un lettore di eBook. A tal fine, collega Kindle al computer utilizzando un cavo USB a mini USB. Il computer dovrebbe rilevare il dispositivo. Nella finestra visualizzata è presente una cartella denominata Documenti. Inserisci il file del dizionario in questa cartella, quindi espelli Kindle dal computer.
- Imposta il dizionario del test come dizionario di default per la ricerca:
- Kindle Paperwhite: seleziona Home > Menu > Impostazioni > Opzioni del dispositivo > Lingua e dizionario > Dizionari > [Lingua di partenza]
- Cerca più parole per verificare le definizioni restituite. Apri un titolo diverso dal dizionario, seleziona una parola e annota la definizione restituita nella finestra di ricerca. Se la ricerca dà esito negativo, controlla gli errori nei tag HTML. Suggeriamo di cercare le seguenti tipologie di parole:
- Coniugazioni di verbi regolari e irregolari
- Esempio: camminare, cammina, camminando; andare, va, andò, andato, andando
- Sostantivi, aggettivi, avverbi e relative coniugazioni/declinazioni
- Esempio: scrivania, scrivanie; lupo, lupi; caldo, più caldo, caldissimo
- Convenzioni grammaticali e di punteggiatura comunemente utilizzate nella lingua
- Esempio: contrazioni, elisioni, verbi con pronomi clitici
- Coniugazioni di verbi regolari e irregolari
- Controlla la visualizzazione dell'indice del dizionario. A tal fine, apri il dizionario e inizia a digitare una parola nella casella di ricerca. Sarà visualizzato un elenco alfabetico di lemmi che dovrebbe aggiornarsi dinamicamente in base alle lettere digitate. Selezionando un lemma dall'elenco dell'indice, l'utente sarà reindirizzato alla voce del dizionario corrispondente a tale lemma.