Chapitre 8. Expressions régulières

Une expression régulière est composée de zéro branche ou plus, séparés par le caractère ' | '. Elle correspond à tout ce qui peut correspondre avec l'une des branches.

Une branche est composé de zéro partie ou plus, concaténées. Elle correspond à une concordance avec la première partie, suivi d'une concordance avec la deuxième,...

Une partie est un atome suivi éventuellement par ' * ', ' + ' ou ' ? '. Un atome suivi de ' * ' correspond à une séquence de 0 concordance avec l'atome ou plus. Un atome suivi de ' + ' correspond à une séquence de 1 concordance avec l'atome ou plus. Un atome suivi de ' ? ' correspond à une concordance avec l'atome ou avec une chaîne vide.

Un atome peut être :

Un intervalle est une séquence de caractères inclus entre les caractères ' [ ' et ' ] '. Il correspond normalement à tout caractère appartenant à la séquence. Si la séquence commence par ' ^ ', il correspond à tout caractère unique n'appartenant pas au reste de la séquence. Si deux caractères de la séquence sont séparés par un ' - ', il correspond à n'importe quel caractère ASCII compris entre les deux caractères reliés, ceux-ci inclus (par exemple ' [0-9] ' correspond à n'importe quel chiffre décimal). Pour inclure le caractère ' ] ' dans la séquence, il faut le placer en première position ( ou éventuellement en deuxième s’il suit ' ^ ' ). Pour inclure le caractère ' - ', il faut le placer en première ou en dernière position dans la séquence.