NOME¶
charmap - simboli di carattere per definire codifiche di carattere
DESCRIZIONE¶
Una descrizione di insiemi di caratteri (charmap) definisce un insieme di
caratteri disponibili e la loro codifica. Tutti gli insiemi di caratteri
supportati dovrebbero contenere l'
insieme portatile di caratteri come
sottoinsieme appropriato.
SINTASSI¶
Il file di una charmap inizia con un'intestazione che può contenere le
seguenti parole chiave:
- <codeset>
- è seguito dal nome del codeset (insieme di
codici)
- <mb_cur_max>
- è seguito dal numero massimo di byte in un carattere a
più byte; i caratteri a più byte non sono al momento supportati.
Il valore di default è 1
- <mb_cur_min>
- è seguito dal numero minimo di byte in un carattere:
il valore deve essere minore o uguale di mb_cur_max. se non
specificato, di default vale mb_cur_max.
- <escape_char>
- è seguito da un carattere che viene usato come escape
nel resto del file per indicare quei caratteri da interpretare
specialmente. Di default è il backslash ( \ ).
- <comment_char>
- è seguito da un carattere che viene usato per indicare
i commenti nel resto del file. Di default è il cancelletto ( #
).
La definizione vera e propria della charmap inizia con la parola chiave
CHARMAP nella colonna 1.
Le righe seguenti possono definire la codifica di un carattere in uno di questi
due modi:
- <nome simbolico> <codifica>
<commenti>
- Questa forma definisce esattamente un carattere e la sua
codifica.
- <nome simbolico>...<nome simbolico>
<codifica> <commenti>
- Questa forma definisce una coppia di caratteri, ed è
utile solo per i caratteri a più byte che non sono al momento
implementati.
L'ultima riga in un file di charmap deve contenere
END CHARMAP.
Nomi simbolici¶
Un
nome simbolico per un carattere contiene solo caratteri dell'
insieme portatile di caratteri. Il nome stesso è racchiuso fra
parentesi angolari. I caratteri che seguono il
<carattere di
escape> vengono interpretati letteralmente; per esempio, la sequenza
'<\\\>>' rappresenta il nome simbolico
'\>'
racchiuso fra parentesi angolari.
Codifiche di carattere¶
La codifica può avere una di queste tre forme:
- <escape>d<numero>
- con un numero decimale
- <escape>x<numero>
- con un numero esadecimale
- <escape><numero>
- con un numero ottale.
FILE¶
/usr/share/i18n/charmaps/*
POSIX.2
VEDERE ANCHE¶
locale(1),
localedef(1),
localeconv(3),
setlocale(3),
locale(5)