.\" -*- coding: UTF-8 -*-
.ie  t .ds dg \(dg
.el .ds dg (!)
.\" From Henry Spencer's regex package (as found in the apache
.\" distribution). The package carries the following copyright:
.\"
.\"  Copyright 1992, 1993, 1994 Henry Spencer.  All rights reserved.
.\" %%%LICENSE_START(MISC)
.\"  This software is not subject to any license of the American Telephone
.\"  and Telegraph Company or of the Regents of the University of California.
.\"
.\"  Permission is granted to anyone to use this software for any purpose
.\"  on any computer system, and to alter it and redistribute it, subject
.\"  to the following restrictions:
.\"
.\"  1. The author is not responsible for the consequences of use of this
.\"     software, no matter how awful, even if they arise from flaws in it.
.\"
.\"  2. The origin of this software must not be misrepresented, either by
.\"     explicit claim or by omission.  Since few users ever read sources,
.\"     credits must appear in the documentation.
.\"
.\"  3. Altered versions must be plainly marked as such, and must not be
.\"     misrepresented as being the original software.  Since few users
.\"     ever read sources, credits must appear in the documentation.
.\"
.\"  4. This notice may not be removed or altered.
.\" %%%LICENSE_END
.\"
.\" In order to comply with `credits must appear in the documentation'
.\" I added an AUTHOR paragraph below - aeb.
.\"
.\" In the default nroff environment there is no dagger \(dg.
.\"
.\" 2005-05-11 Removed discussion of `[[:<:]]' and `[[:>:]]', which
.\" 	appear not to be in the glibc implementation of regcomp
.\"
.\"*******************************************************************
.\"
.\" This file was generated with po4a. Translate the source file.
.\"
.\"*******************************************************************
.TH REGEX 7 "13 agosto 2020" "" "Manuale del programmatore di Linux"
.SH NOME
regex \- espressioni regolari POSIX.2
.SH DESCRIZIONE
Le espressioni regolari (dette "ER"), così come definite da POSIX.2,
appaiono in due forme: ER moderne (approssimativamente, quelle di \fIegrep\fP;
POSIX.2 le definisce ER "estese") e ER obsolete (approssimativamente quelle
di \fBed\fP(1); ER di "base" in POSIX.2). Le ER obsolete esistono per
compatibilità con alcuni vecchi programmi, e verranno discusse alla
fine. POSIX.2 lascia aperti alcuni aspetti della sintassi e della semantica
delle ER: "\*(dg" denota scelte che potrebbero non essere completamente
portabili ad altre implementazioni di POSIX.2.
.PP
Una ER (moderna) è una\*(dg diramazione o più diramazioni non vuote*\(dg,
\fIdiramazioni\fP, separati da \(aq|\(aq. L'ER corrisponde a qualsiasi cosa che
corrisponda ad una delle diramazioni.
.PP
Una diramazione è formata da uno\*(dg o più \fIpezzi\fP
concatenati. Corrisponde ad una corrispondenza per il primo pezzo, seguita
da una corrispondenza per il secondo, e così via.
.PP
Un pezzo è formato da un \fIatomo\fP, eventualmente seguito da un singolo\*(dg
\(aq*\(aq, \(aq+\(aq, \(aq?\(aq o \fIlimite\fP. Un atomo seguito da \(aq*\(aq
corrisponde ad una successione di 0 o più corrispondenze dell'atomo. Un
atomo seguito da \(aq+\(aq corrisponde ad una successione di 1 o più
corrispondenze dell'atomo. Un atomo seguito da \(aq+\(aq corrisponde ad una
successione di 0 o 1 corrispondenza dell'atomo.
.PP
Un \fIlimite\fP (o quantificatore) è formato da \(aq{\(aq seguito da un intero
decimale senza segno, eventualmente seguito da \(aq,\(aq eventualmente
seguito da un altro intero decimale senza segno, obbligatoriamente seguito
da \(aq}\(aq. Gli interi devono essere compresi fra 0 e \fBRE_DUP_MAX\fP
(255\*(dg) inclusi, e se ce ne sono due, il primo non deve essere maggiore
del secondo. Un atomo seguito da un limite contenente un intero \fIi\fP e
nessuna virgola corrisponde ad una successione di esattamente \fIi\fP
corrispondenze dell'atomo. Un atomo seguito da un limite contenente un
intero \fIi\fP e una virgola corrisponde ad una successione di \fIi\fP o più
corrispondenze dell'atomo. Un atomo seguito da un limite contenente due
interi \fIi\fP e \fIj\fP corrisponde ad una successione di \fIi\fP fino a \fIj\fP
(inclusi) corrispondenze dell'atomo.
.PP
Un atomo è formato da un'espressione regolare racchiusa fra "\fI()\fP"
(corrispondente ad una corrispondenza per l'espressione regolare), un
insieme vuoto di "\fI()\fP" (corrispondente alla stringa nulla)\*(dg,
un'\fIespressione parentetica\fP (vedi sotto), \(aq.\(aq (corrispondente ad un
qualsiasi carattere singolo),  \(aq\(ha\(aq (corrispondente alla stringa
nulla a inizio riga), \(aq$\(aq (corrispondente alla stringa nulla a fine
riga), una \(aq\e\(aq seguita da uno dei caratteri  "\fI\(ha.[$()|*+?{\e\fP""
(corrispondente a quel carattere interpretato come un carattere normale),
una \(aq\e\(aq seguita da un qualsiasi altro carattere\*(dg (corrispondente
a quel carattere interpretato come un carattere normale, come se la
\(aq\e\(aq non fosse presente\*(dg), oppure un singolo carattere privo di
ulteriori significati (interpretato come se stesso). Una \(aq{\(aq seguita
da un carattere che non sia una cifra è un carattere normale, non l'inizio
di un limite\*(dg. È vietato terminare un'ER con \(aq\e\(aq.
.PP
Un'\fIespressione parentetica\fP è un elenco di caratteri racchiusi da
"\fI[]\fP". Corrisponde di norma ad un qualsiasi singolo carattere fra quelli
della lista (ma vedi oltre). Se l'elenco inizia con \(aq\(ha\(aq,
l'espressione corrisponde ad un qualsiasi singolo carattere \fInon\fP fra
quelli della lista (ma vedi oltre). Due caratteri nell'elenco separati da un
\(aq\-\(aq formano un'abbreviazione per l'intera \fIserie\fP di caratteri
compresi nella sequenza di collazione fra i due caratteri (inclusi). Per
esempio, "\fI[0\-9]\fP" corrisponde, in ASCII, ad una qualsiasi cifra
decimale. Due serie non possono\*(dg condividere un estremo, per esempio
"\fIa\-c\-e\fP". Le serie dipendono particolarmente dalla sequenza di collazione,
e un programma, per essere portabile, non dovrebbe dipenderne.
.PP
Se si vuole includere una \(aq]\(aq nell'elenco, bisogna metterla al primo
posto (dopo un eventuale  \(aq\(ha\(aq). Se si vuole includere un \(aq\-\(aq
nell'elenco, bisogna metterlo al primo o all'ultimo posto, o come estremo
destro di una serie. Se si vuole usare un \(aq\-\(aq come estremo sinistro di
una serie, bisogna trasformarlo in un elemento di collazione racchiudendolo
fra "\fI[.\fP" e "\fI.]\fP" (vedi sotto). Eccetto queste combinazioni, e alcune
altre con \(aq[\(aq (vedi il prossimo paragrafo), tutti gli altri caratteri
speciali, inclusa la \(aq\e\(aq perdono il loro significato speciale quando
all'interno di un'espressione parentetica.
.PP
All'interno di un'espressione parentetica, un elemento di collazione (un
carattere o una sequenza di più caratteri che viene ordinata come se fosse
un carattere singolo o una sequenza di collazione che sta per uno dei due)
racchiuso fra "\fI[.\fP" e "\fI.]\fP" rappresenta la sequenza di caratteri
dell'elemento di collazione. La sequenza è un unico argomento dell'elenco
nell'espressione parentetica. Pertanto, un'espressione che contiene un
elemento di collazione a più caratteri può corrispondere a più di un
carattere. Per esempio, se la sequenza di collazione include l'elemento di
collazione "ch", allora l'ER "\fI[[.ch.]]*c\fP" corrisponde ai primi cinque
caratteri di "chchcc".
.PP
All'interno di un'espressione parentetica, un elemento di collazione
racchiuso fra "\fI[=\fP" e "\fI=]\fP" è una classe di equivalenza, cioè la
sequenza di caratteri di tutti gli elementi di collazione equivalenti, lui
incluso (se non ci sono altri elementi di collazione equivalenti, il
risultato è lo stesso che ci sarebbe se i segni di delimitazione fossero
"\fI[.\fP" e "\fI.]\fP"). Per esempio, se o e \o'o\(ha'  appartengono ad una
classe di equivalenza, allora `[[=o=]]', "\fI[[=\o'o\(ha'=]]\fP" e
"\fI[o\o'o\(ha']\fP" sono tutti sinonimi. Una classe di equivalenza non\*(dg
può essere un estremo di una serie.
.PP
All'interno di un'espressione parentetica, il nome di una \fIclasse di
caratteri\fP racchiusa fra "\fI[:\fP" e "\fI:]\fP" rappresenta l'elenco di tutti i
caratteri di quella classe. I nomi delle classi standard di caratteri sono:
.PP
.RS
.TS
l l l.
alnum	digit	punct
alpha	graph	space
blank	lower	upper
cntrl	print	xdigit
.TE
.RE
.PP
.\" As per http://bugs.debian.org/cgi-bin/bugreport.cgi?bug=295666
.\" The following does not seem to apply in the glibc implementation
.\" .PP
.\" There are two special cases\*(dg of bracket expressions:
.\" the bracket expressions "\fI[[:<:]]\fP" and "\fI[[:>:]]\fP" match
.\" the null string at the beginning and end of a word respectively.
.\" A word is defined as a sequence of
.\" word characters
.\" which is neither preceded nor followed by
.\" word characters.
.\" A word character is an
.\" .I alnum
.\" character (as defined by
.\" .BR wctype (3))
.\" or an underscore.
.\" This is an extension,
.\" compatible with but not specified by POSIX.2,
.\" and should be used with
.\" caution in software intended to be portable to other systems.
Questi rappresentano le classi di carattere definite in \fBwctype\fP(3). Una
localizzazione potrebbe fornirne altre. Una classe di caratteri non può
essere usata come estremo di una serie.
.PP
Nel caso che un'ER possa corrispondere a più di una sotto\-stringa di una
data stringa, l'ER corrisponde a quella che inizia per prima nella
stringa. Se l'ER può corrispondere a più sotto\-stringhe che iniziano nello
stesso punto, l'ER corrisponde a quella più lunga. Le sottoespressioni
corrispondono anche alle sottostringhe più lunghe possibile, a patto che
l'intera corrispondenza sia la più lunga possibile, con le sottoespressioni
che iniziano prima nell'ER hanno priorità su quelle che iniziano dopo. Si
noti che in particolare, le sottoespressioni ad alto livello hanno la
precedenza sulle loro espressioni componenti, che sono di livello più basso.
.PP
La lunghezza di una corrispondenza è misurata in caratteri, non in elementi
di collazione. Una stringa nulla è considerata più lunga di una
corrispondenza mancata. Per esempio, "\fIbb*\fP" corrisponde ai tre caratteri
di mezzo di "abbbc", "\fI(wee|week)(knights|nights)\fP" corrisponde a tutti e
dieci i caratteri di "weeknights", se "\fI(.*).*\fP" è corrisposto a "abc" la
sottoespressione fra parentesi corrisponde ai tre caratteri, e se "\fI(a*)*\fP"
è corrisposto a "bc" sia l'intera ER che l'espressione tra parentesi
corrispondono alla stringa nulla.
.PP
Se viene richiesta una corrispondenza indipendente da maiuscole e minuscole,
l'effetto è essenzialmente lo stesso che si avrebbe togliendo ogni
differenza fra maiuscole e minuscole nell'alfabeto. Quando un carattere
alfabetico che esiste sia come maiuscola che come minuscola appare come
carattere ordinario al di fuori di un'espressione parentetica, viene, in
pratica, trasformato nell'espressione parentetica comprendente entrambi i
casi: per esempio, \(aqx\(aq diventa "\fI[xX]\fP". Quando un simile carattere
appare all'interno di un'espressione parentetica, la controparte viene
aggiunta all'espressione: ad esempio, "\fI[x]\fP" diventa "\fI[xX]\fP" e
"\fI[\(hax]\fP" diventa "\fI[\(haxX]\fP".
.PP
Non viene imposto nessun limite particolare alla lunghezza delle ER\*(dg. I
programmi, per essere portabili, non dovrebbero impiegare ER più lunghe di
256 byte, in quanto un'implementazione potrebbe rifiutare una simile ER e
rimanere conforme a POSIX.
.PP
Le espressioni regolari obsolete si differenziano in diversi modi. \(aq|
\(aq, \(aq+\(aq, e \(aq?\(aq sono caratteri ordinari e non hanno nessun
equivalente per le loro funzionalità. I delimitatori dei limiti sono
"\fI\e{\fP" e "\fI\e}\fP", mentre \(aq{\(aq e \(aq}\(aq sono caratteri
ordinari. Le parentesi delle sottoespressioni annidate sono "\fI\e(\fP" e
"\fI\e)\fP", mentre aq(\(aq e \(aq)\(aq sono caratteri ordinari. \(aq\(ha\(aq è
un carattere normale tranne che all'inizio dell'ER o\*(dg all'inizio di
un'espressione parentetica, \(aq$\(aq è un carattere normale tranne che alla
fine dell'ER o\*(dg alla fine di un'espressione parentetica, e and \(aq*\(aq
è un carattere normale se appare all'inizio dell'ER o all'inizio di
un'espressione parentetica (eventualmente preceduto da un \(aq\(ha\(aq)
iniziale).
.PP
Infine, c'è un nuovo tipo di atomo, una \fIreferenza all'indietro\fP:
\(aq\e\(aq seguita da una cifra decimale \fId\fP diversa da zero corrisponde
alla stessa sequenza di caratteri a cui corrisponde la \fId\fP\-esima
espressione parentetica (contando, da sinistra verso destra, le
sottoespressioni in base alla posizione della loro parentesi di destra), in
modo che, ad esempio, "\fI\e([bc]\e)\e1\fP" corrisponda a "bb" o "cc" ma non a
"bc".
.SH BUG
Avere due tipi di ER è un pasticcio.
.PP
Le specifiche attuali in POSIX.2 dicono che \(aq)\(aq è un carattere normale
in mancanza di un corrispondente \(aq(\(aq: questo è un risultato non voluto
di una scelta sbagliata di vocaboli, e sarebbe meglio cambiarlo. Non fare
affidamento su questo.
.PP
Le referenze all'indietro sono un casino incredibile, e rendono molto
difficile un'implementazione efficiente. La loro definizione è pure ambigua:
"\fIa\e(\e(b\e)*\e2\e)*d\fP" corrisponde a "abbbd" o no? È meglio non usarle.
.PP
.\" As per http://bugs.debian.org/cgi-bin/bugreport.cgi?bug=295666
.\" The following does not seem to apply in the glibc implementation
.\" .PP
.\" The syntax for word boundaries is incredibly ugly.
Le specifiche in POSIX.2 sulle corrispondenze indipendenti da
maiuscole/minuscole sono approssimative. La definizione data sopra di «un
caso implica tutti i casi» è quella al momento considerata corretta dagli
implementatori.
.SH AUTORE
.\" Sigh... The page license means we must have the author's name
.\" in the formatted output.
Questa pagina è tratta dal pacchetto sulle espressioni regolari di Henry
Spencer.
.SH "VEDERE ANCHE"
\fBgrep\fP(1), \fBregex\fP(3)
.PP
POSIX.2, sezione 2.8 (Notazione per le espressioni regolari).
.SH COLOPHON
Questa pagina fa parte del rilascio 5.10 del progetto Linux
\fIman\-pages\fP. Una descrizione del progetto, le istruzioni per la
segnalazione degli errori, e l'ultima versione di questa pagina si trovano
su \%https://www.kernel.org/doc/man\-pages/.

.SH TRADUZIONE
La traduzione italiana di questa pagina di manuale è stata creata da
Ottavio G. Rizzo <rizzo@pluto.linux.it>,
Giulio Daprelà <giulio@pluto.it>,
Elisabetta Galli <lab@kkk.it>
e
Marco Curreli <marcocurreli@tiscali.it>
.

Questa traduzione è documentazione libera; leggere la
.UR https://www.gnu.org/licenses/gpl-3.0.html
GNU General Public License Versione 3
.UE
o successiva per le condizioni di
copyright.
Non ci assumiamo alcuna responsabilità.

Per segnalare errori nella traduzione di questa pagina di
manuale inviare un messaggio a
.MT
pluto-ildp@lists.pluto.it
.ME .