Morphologie mathématique — Wikipédia

Une forme (en bleu), sa dilatation morphologique (en vert), et son érosion morphologique (en jaune) par un élément structurant en forme de diamant.

La morphologie mathématique est une théorie et technique mathématique et informatique d'analyse de structures qui est liée avec l'algèbre, la théorie des treillis, la topologie et les probabilités.

Le développement de la morphologie mathématique est inspiré des problèmes de traitement d'images, domaine qui constitue son principal champ d'application. Elle fournit en particulier des outils de filtrage, segmentation, quantification et modélisation d'images. Elle est également utilisable en traitement du signal, par exemple pour filtrer les variations d'une mesure (physique, biologique) au cours du temps.

Aperçu général

[modifier | modifier le code]

Une des idées de base de la morphologie mathématique est d'étudier ou de traiter un ensemble à l'aide d'un autre ensemble, appelé élément structurant, qui sert de sonde. À chaque position de l'élément structurant, on regarde s'il touche ou s'il est inclus dans l'ensemble initial. En fonction de la réponse, on construit un ensemble de sortie. On obtient ainsi des opérateurs de base qui sont relativement intuitifs.

Des propriétés que l'on retrouve souvent dans les opérateurs morphologiques sont :

Ceci implique en particulier une perte d'information ; bien utilisés, ces opérateurs permettent d'éliminer des structures ne respectant pas certains critères, comme de largeur ou de volume.

La morphologie mathématique s'intéresse aussi aux ensembles et aux fonctions aléatoires.

Le principal domaine d'application de la morphologie mathématique est le traitement d'images. Elle fournit, en particulier, des outils de filtrage, de segmentation et de quantification. Depuis son apparition, en 1964, elle connaît un succès grandissant et désormais contribue à garnir la boite à outils de tout traiteur d'images.

Bref historique

[modifier | modifier le code]

La morphologie mathématique a été inventée en 1964 par Georges Matheron et Jean Serra dans les laboratoires de l'école des Mines de Paris. Son développement a toujours été fortement motivé par des applications industrielles. Dans un premier temps, il s'est agi de répondre à des problèmes dans le domaine de l'exploitation minière, mais très vite ses champs d'applications se sont diversifiés : biologie, imagerie médicale, sciences des matériaux, vision industrielle, multimédia, télédétection et géophysique constituent quelques exemples de domaines dans lesquels la morphologie mathématique a apporté une contribution importante.

La morphologie mathématique reste un domaine actif de recherche. En témoignent les nombreuses publications scientifiques sur le sujet, ainsi que les symposiums internationaux sur la morphologie mathématique qui ont lieu tous les deux ou trois ans.

Quelques exemples de thèmes de recherche actuels :

  • ligne de partage des eaux : parallélisation, approche topologique, hiérarchisation ;
  • extension à des espaces non-euclidiens, à des fonctions vectorielles (images en couleurs, images multi-spectrales, etc.) et à des images non conventionnelles;
  • liens avec l'apprentissage profond (réseaux morphologiques; pré-traitement et post-traitement);
  • approches stochastiques pour la segmentation et le filtrage;
  • architectures électroniques efficaces pour l'implantation d'opérateurs morphologiques;
  • développement d'algorithmes rapides;
  • traitement de nuages de points;
  • modélisation de structures physiques, en particulier dans le domaine des sciences des matériaux.

Opérateurs de base

[modifier | modifier le code]

La morphologie mathématique peut être développée dans le cadre abstrait de la théorie des treillis. Cependant, une présentation plus pratique, visant un utilisateur potentiel d'outils de traitement d'images, plutôt qu'un mathématicien, est ici adoptée.

Cas ensembliste

[modifier | modifier le code]

Plaçons-nous dans , souvent utilisé comme modélisation du support des images binaires à deux dimensions, même si tout ce qui est présenté dans cette section reste valable dans , où est un entier strictement positif. Soit un sous-ensemble de , appelé élément structurant. Si est un élément de , alors nous noterons l'ensemble translaté de  :

L'élément structurant joue en quelque sorte le rôle de modèle local, ou de sonde. Il est promené partout sur l'image à traiter, et à chaque position on étudie sa relation avec l'image binaire, considérée comme un ensemble. Ces relations peuvent être du type « est inclus dans l'ensemble », ou « touche l'ensemble », par exemple.

En pavage carré, les éléments structurants les plus classiquement utilisés sont la croix, constituée de l'origine et des quatre points les plus proches, et le carré, constitué de l'origine et des huit points les plus proches. Ces deux éléments structurants correspondent respectivement à deux définitions possibles du voisinage d'un pixel ou du type de connexité de l'image. En pavage hexagonal, l'élément de base est l'hexagone centré.

On introduit aussi le symétrique d'un ensemble, noté  :

Si est symétrique, on a .

Dilatation et érosion

[modifier | modifier le code]

Soit un sous-ensemble de . La dilatation morphologique avec l'élément structurant est définie comme la somme de Minkowski[1]:

Une autre formulation plus intuitive est :

La dilatation morphologique n'est, en général, pas inversible. L'opération qui en quelque sorte tente de produire l'inverse de la dilatation est l'érosion morphologique:

La dilatation et l'érosion sont les opérateurs de base de la morphologie mathématique. Pratiquement tous les autres peuvent être définis à l'aide de ceux-ci, en utilisant des compositions de fonctions et des opérations ensemblistes.

Propriétés algébriques de la dilatation et de l’érosion
[modifier | modifier le code]

La dilatation est une transformation extensive si B contient l’origine : L’érosion est anti-extensive si B contient l'origine : La dilatation et l’érosion sont des transformations croissantes (comme l’union et l’intersection) : La dilatation et l’érosion ne sont pas des transformations idempotentes : Par contre la dilatation et l’érosion vérifient la propriété d’itérativité qui permet de construire des dilatations ou des érosions avec des éléments structurants homothétiques : La dilatation est une transformation continue et l’érosion est une transformation semi-continue supérieure. Cette propriété découle directement de la propriété de l’intersection dans la soustraction de Minkowski.

La dilatation est distributive par rapport à l’union et l’érosion par rapport à l’intersection : Soit une famille d’éléments structurants homothétiques et une homothétie de rapport . La compatibilité de la dilatation et de l’érosion avec les homothéties s’écrivent :

Propriétés topologiques de la dilatation et de l'érosion
[modifier | modifier le code]

La dilatation, comme l’union, préserve la connexité. La dilatation n’est pas une transformation qui préserve l’homotopie. En effet, elle connecte des éléments disjoints et bouche des trous. L’érosion n’est pas une transformation qui préserve l’homotopie. En effet, elle sépare les parties connexes et supprime des éléments lorsqu’ils sont petits. L’érosion, comme l’intersection, ne préserve pas la connexité.

Ouverture et fermeture

[modifier | modifier le code]

La composition d'une dilatation morphologique avec l'érosion par le même élément structurant ne produit pas, en général, l'identité, mais deux autres opérateurs morphologiques, l'ouverture morphologique : et la fermeture morphologique : L'ouverture peut être caractérisée géométriquement: elle donne l'union de tous les inclus dans . Ainsi, la forme de l'élément structurant permet de choisir les structures qui peuvent le contenir.

La fermeture est le dual de l'ouverture : la fermeture du complémentaire d'un ensemble est égale au complémentaire de l'ouverture de cet ensemble.

On notera que si l'élément structurant n'est pas symétrique, on devra utiliser l'élément symétrique pour le second opérateur (dilatation dans le cas de l'ouverture et érosion dans le cas de la fermeture).

Propriétés de l’ouverture et de la fermeture
[modifier | modifier le code]
  • La fermeture et l'ouverture sont des opérations croissantes et idempotentes, deux propriétés qui définissent les filtres morphologiques.
  • La fermeture est extensive (), et l'ouverture est anti-extensive ().
  • L’ouverture et la fermeture sont des opérateurs semi-continu supérieur. C’est l’érosion qui impose cette propriété, la dilatation étant continue.
  • Du point de vue topologique, l’ouverture ne préserve pas la connexité alors que la fermeture la préserve. L’ouverture et la fermeture ne sont pas des transformations homotopiques.

Transformation en tout ou rien

[modifier | modifier le code]

On peut aussi prendre deux éléments structurants et pour définir des transformations. Si on demande en chaque point à d'être à l'extérieur de l'ensemble et à à l'intérieur on obtient la transformation en tout ou rien (hit or miss transform en anglais) : désigne le complémentaire de l'ensemble . Cette transformation permet de détecter certaines configurations précises de pixels. Parmi  les configurations les plus utilisées on aura :

  • Les points extrêmes et les points triples du squelette obtenu par amincissement.
  • Les configurations correspondant aux différents nombres de connexités.

Épaississement et amincissement

[modifier | modifier le code]

En ajoutant le résultat de la transformation à l'ensemble initial on obtient un épaississement : en enlevant le résultat de l'ensemble initial on obtient un amincissement :

Applications : squelette, skiz, enveloppe convexe
[modifier | modifier le code]
  • En prenant des suites d'amincissements, on peut réduire progressivement l'ensemble initial (comme si on l'épluchait). De cette façon on peut calculer différents types de squelettes, dont des squelettes homotopiques.
  • Des épaississements homotopiques permettent aussi de construire des Skiz (squelettes par zone d’influence).
  • Avec une autre configuration on pourra obtenir par épaississement les enveloppes convexes.

Extension aux fonctions

[modifier | modifier le code]

Une image à niveaux de gris peut être modélisée comme une fonction de dans . Soit une fonction appartenant à cet ensemble. On a alors :

L'ouverture et la fermeture de fonctions s'obtiennent comme dans le cas ensembliste :

L'ouverture et la fermeture morphologiques constituent déjà des outils intéressants de filtrage d'images. Cependant, ils peuvent modifier le contour des objets, propriété qui peut être malvenue. Les opérateurs par reconstruction et plus généralement les nivellements, introduits plus loin, permettent de pallier cet inconvénient.

Épaississements et amincissements ne sont pas, en général, des opérateurs croissants. Par conséquent, leur application aux fonctions (en pratique, aux images à niveaux de gris) n'est pas triviale. Plusieurs extensions ont été proposées dans la littérature.

Exemple d'utilisation : détection de contours

[modifier | modifier le code]

La détection de contours représente une tâche importante en traitement d'images. La morphologie mathématique propose des outils non-linéaires de détection de contours, comme le gradient et le laplacien morphologiques.

Le gradient morphologique, aussi appelé gradient de Beucher du nom de son inventeur, est défini par :

Il correspond, en quelque sorte, à la version morphologique du module du gradient euclidien.

Le laplacien morphologique est construit de façon analogue :

correspond à l'opérateur identité.

Opérateurs connexes, nivellements

[modifier | modifier le code]

Tous les opérateurs définis dans les sections précédentes l’ont été dans un cadre euclidien à savoir que l’espace de définition de l’image sert de référence pour les opérateurs. Dans cette section, on va reprendre les deux opérateurs de base que sont l’érosion et la dilatation mais en restant dans un sous espace de , nommé espace de référence. Les transformations euclidiennes deviendront ainsi des transformations géodésiques (appelées aussi transformations conditionnelles).

La géodésie est la science de la mesure de la forme et des dimensions de la terre. Ainsi une distance géodésique correspond au chemin le plus court pour aller d’un point à un autre en restant à la surface du globe. La longueur de ce chemin, à la différence de la distance euclidienne, ne correspond pas à un segment droit mais à celle d’un arc géodésique. La définition d’arc géodésique implique la notion de connexité par arc. Un espace topologique est dit connexe par arcs si tout couple de points de est relié par un chemin dont le support est inclus dans .

De l’euclidien au géodésique pour les ensembles

[modifier | modifier le code]

Distance euclidienne et distance géodésique

[modifier | modifier le code]

La distance géodésique utilise les mêmes axiomes que la distance euclidienne, seul, le chemin est différent.

Soit quatre points .

Sur la partie gauche de l’image, on a représenté les segments de droite associés aux différentes distances euclidiennes. Sur la partie droite, on a représenté les trois arcs géodésiques reliant et . On remarque que le point ne possède aucun chemin géodésique car il appartient à une composante disjointe de celle contenant les trois autres points.

Comparaison entre distance euclidienne et géodésique

La distance géodésique vérifie bien les axiomes d’une distance. On a, en effet :

À ces axiomes, il faut ajouter un quatrième. Lorsqu'il n’y a aucun chemin géodésique, on a :Pour les mêmes points, il est possible de comparer les distances géodésiques par rapport à et les distances euclidiennes. On aura toujours une distance géodésique plus grande ou égale à la distance euclidienne avec la possibilité d’avoir une distance euclidienne finie et une distance géodésique infinie :On notera au passage que, pour relier deux points, il peut y avoir plusieurs arcs géodésiques équivalents, alors que le chemin euclidien est unique.

Élément structurant géodésique

[modifier | modifier le code]

Dans l’élément structurant isotrope centré en et de taille est le disque fermé , défini par :Le disque géodésique, se définit par rapport à l’ensemble de référence en remplaçant la distance euclidienne par la distance géodésique par rapport à . On a alors :

Boule géodésique (cyan) et euclidienne (disque entier)

La figure ci-contre illustre la différence qui existe entre un élément structurant euclidien et un élément structurant géodésique. Sur cette figure, on a placé le disque sur différentes positions . Le disque euclidien reste le même indépendamment de la position x. Par contre, le disque géodésique change de forme ou peut disparaître en fonction de sa position. Du disque initial, il ne reste que ce qui vérifie la distance géodésique. Ainsi les points du disque qui ne sont pas commun avec sont ignorés (positions ). Si le centre du disque n’appartient pas à , alors le disque géodésique n’existe pas ().

Les transformations géodésiques de base pour les ensembles

[modifier | modifier le code]

En plus de l’ensemble à transformer que l’on appellera (pour marqueur), il faut introduire l’ensemble de référence géodésique .

La dilatation géodésique

[modifier | modifier le code]

On part de la définition euclidienne de la dilatation en remplaçant la boule euclidienne par la boule géodésique. On peut alors écrire : Ensuite, on répète cette opération élémentaire fois : Les figures suivantes illustrent l’effet d’une dilatation géodésique par un hexagone. Une composante connexe de l’ensemble ne peut être dilaté que si elle intersecte , sinon elle disparaît. La dilatation s’arrête lorsque les frontières de sont atteintes.

L’ensemble se comporte comme un masque dans lequel on peut modifier et se comporte comme un marqueur permettant d’envahir une composante connexe de .

L’érosion géodésique

[modifier | modifier le code]

De la même manière, on introduit l’érosion géodésique en remplaçant la boule euclidienne par la boule géodésique dans l’expression définissant l’érosion. On peut donc écrire :Comme l’élément structurant utilisé est symétrique, on a dualité entre l’érosion et la dilatation géodésique. Cette dualité s’exprime de manière légèrement différente de celle du cas euclidien car c’est le complémentaire par rapport à qu’il faut prendre en compte. Cette relation de dualité s’écrit alors avec l’opérateur de différence symétrique :Les figures illustrent l’effet de l’érosion géodésique sur un ensemble par rapport à en utilisant un élément structurant hexagonal.

On remarque que les parties de , totalement incluses dans et n’ayant pas de frontières communes, s’érodent comme dans le cas euclidien. Lorsqu’il y a des frontières communes, celles-ci ne sont pas affectées par l’érosion.

La reconstruction pour les ensembles

[modifier | modifier le code]

Définition de la reconstruction

[modifier | modifier le code]

La reconstruction d’un ensemble à partir d’un autre est une des principales applications de la dilatation géodésique. On part donc de deux ensembles ; le premier est appelé l’ensemble des marqueurs noté , le second est l’ensemble de référence ou masque . Par définition, la reconstruction est une dilatation géodésique infinie, par rapport à , des marqueurs . Cela s’écrit :Lorsque toutes les composantes connexes contenant des marqueurs seront envahies, on ne pourra plus modifier l’image. Ceci constitue le test d’arrêt de la procédure. Les figures suivantes illustrent la reconstruction de à partir des marqueurs .

Propriétés de la reconstruction

[modifier | modifier le code]
Propriétés par rapport à l’ensemble de référence
[modifier | modifier le code]
  • La reconstruction est idempotente : la reconstruction s’arrêtant lorsque l’on ne modifie plus rien, elle vérifie cette propriété.
  • La reconstruction est anti-extensive par rapport à  : ne sont reconstruites que les composantes connexes contenant un marqueur.
  • La reconstruction est croissante :La reconstruction correspond donc à une ouverture algébrique de l’ensemble de référence.
Propriétés par rapport aux marqueurs
[modifier | modifier le code]
  • La reconstruction est idempotente
  • La reconstruction est extensive par rapport à  :
  • La reconstruction est croissante :

La reconstruction correspond donc à une fermeture algébrique des marqueurs.

Applications de la reconstruction pour les ensembles

[modifier | modifier le code]

On ne citera ici que les plus importantes.

L’érosion reconstruction
[modifier | modifier le code]

Dans l’érosion-reconstruction, les marqueurs seront les érodés euclidiens de et la dilatation euclidienne sera remplacée par la dilatation géodésique des marqueurs par rapport à l’ensemble . Cela s’écrit :Cette érosion-reconstruction est illustrée par les figures suivantes et comparée avec l’ouverture géodésique utilisant le même élément structurant.

Élimination des composantes connexes coupant le bord du champ d’image
[modifier | modifier le code]

Pour certaines applications analytiques, il est nécessaire d’éliminer les composantes connexes de qui coupent le bord du champ d’observation . Pour cela, il faut les isoler en les reconstruisant à partir d’un marqueur constitué de tous les pixels du bord du champ , noté et les soustraire de . La procédure va donc être la suivante :L’ensemble ne contient que des composantes connexes totalement incluses dans . Ceci est illustré par les figures suivantes.

Bouchage de trous
[modifier | modifier le code]

La reconstruction est utilisée dans une opération qui sert souvent en traitement d’image : le bouchage de trous. Comme dans l’application précédente, le marqueur est . L’algorithme est le suivant :Les figures suivantes illustrent la séquence d’opérations.

Les érodés ultimes
[modifier | modifier le code]
  • Définition

Soit un ensemble présenté sur la figure suivante. Les érodés ultimes apparaissent au cours d’une succession d’érosions de par un élément structurant convexe. Ils sont constitués par l’union des composantes connexes qui disparaissent lors de l’érosion de taille immédiatement supérieure.

Érodés ultimes (rouge) de l'ensemble X4

Soit une érosion digitale élémentaire, et son itérée d'ordre i. L'érosion ultime dérivée de et notée se définit alors comme le ‘’résidu’’ entre et les ouvertures par reconstruction de chaque érosion dans la précédente :Les érodés ultimes correspondent à l’union de toutes ces reconstructions en faisant varier de 1 à imax lorsqu’il n’y a plus rien par érosion.

  • Propriétés des érodés ultimes
    • L’érosion ultime est anti extensive.
    • Les éléments constituants l’ensemble des érodés ultimes sont disjoints.
    • Une érosion unitaire sur les érodés ultime donne un ensemble vide.
    • L’érosion ultime est idempotente.

Ces érodés ultimes peuvent également être obtenus à partir des maxima de la fonction distance en utilisant une méthode géodésique pour les fonctions que l’on voit ci après. En restant dans le domaine ensembliste, les érodés ultimes servent à marquer les parties convexes des objets et peuvent être utilisés pour segmenter des agrégats de particules convexes.

Transformations géodésiques pour les fonctions

[modifier | modifier le code]

Comme pour le cas ensembliste, on aura une fonction de référence et une fonction qui sera transformée . Les deux opérateurs de base sont toujours la dilatation géodésique et l’érosion géodésique.

Dilatation géodésique pour les fonctions

[modifier | modifier le code]

La dilatation géodésique élémentaire de sous s’exprime de manière analogue à celle utilisée pour les ensembles.

Dans le cas des fonctions, ces éléments seront des éléments plats et convexes isotropes. On a, en effet :Pour une dilatation géodésique de taille quelconque, on aura également :

Interprétation sur une fonction f(x) définie dans R1-R
[modifier | modifier le code]

Les images en niveaux de gris sont des fonctions définies dans . Pour faciliter la vision du comportement des opérateurs, on va utiliser une fonction définie dans . Soit également une fonction définie dans le même espace. Pour notre exemple, la seule possibilité est un ‘’élément structurant plat’’ constitué d’un ‘’segment droit’’ de longueur centré.

Les figures suivantes illustrent le cas d’une dilatation géodésique de taille .


On remarque que les marqueurs dilatés restent toujours sous la fonction . Avec un élément structurant plat, il reste des parties de qui sont inaccessibles à la dilatation. Ce sont des parties convexes incluant les maxima.

On remarque que les marqueurs sont généralement choisis de telle sorte que l’on ait :

Érosion géodésique pour les fonctions

[modifier | modifier le code]

Par définition, l’érosion géodésique élémentaire est donnée par :Comme pour la dilatation géodésique, on aura par itération :L’érosion géodésique pour les fonctions se déduit également de la dilatation géodésique pour les fonctions par dualité. Appelons ‘’le niveau de gris maximum supporté par l’image’’. On aura alors :

Cette expression est d’ailleurs celle utilisée pour construire n’importe quelle érosion géodésique.

Interprétation sur une fonction définie dans R1-R
[modifier | modifier le code]

Les figures illustrent le comportement de l’érosion géodésique pour une fonction .

On remarque que la fonction érodée conserve des résidus dans les parties concaves de la fonction . Ce résultat est symétrique de celui obtenu par dilatation géodésique.

La reconstruction pour les fonctions

[modifier | modifier le code]

Comme nous l’avons fait pour les ensembles, il est possible de reconstruire des fonctions géodésiquement par rapport à une autre fonction. Deux cas sont à envisager.

  • La reconstruction de par dilatation géodésique infinie (ouverture)

  • La reconstruction de par érosion géodésique infinie (fermeture)

La première figure illustre le résultat obtenu dans le cas de la reconstruction de sous la fonction et la seconde figure, la reconstruction de sur la fonction .

Application de la reconstruction pour les fonctions

[modifier | modifier le code]
Maxima d’une fonction
[modifier | modifier le code]

Les maxima régionaux d’une image sont les points de l’image à partir desquels il n’existe que des chemins descendants. Soit une image. À partir de cette image, on va construire une image des marqueurs en soustrayant un niveau de gris à . on aura donc :Ensuite, on effectue une reconstruction de sous et par différence avec , on obtient les maxima régionaux. On a donc :

Maxima (rouge) d'une image en niveaux de gris
Minima d’une fonction
[modifier | modifier le code]

Pour la recherche des minima régionaux d’une fonction, on applique le même principe. Tout d’abord, on forme l’image des marqueurs :Ensuite, on effectue une reconstruction de sur et par différence avec , on obtient les minima régionaux. On a donc :

Minima (rouge) d'une image en niveaux de gris
Maxima et minima étendus
[modifier | modifier le code]

La recherche des maxima et minima d’une fonction donnent de très bons résultats si l’image n’est pas bruitée. En présence de bruit, la notion de maxima et de minima étendus, appelés aussi Hmax et Hmin, permet de n’extraire d’une image que les extrema significatifs. L’algorithme est semblable à celui des maxima et des minima. Seule, la construction des marqueurs est légèrement différente. En effet, au lieu de translater l’image d’un niveau de gris (en moins ou en plus), on effectue une translation de h niveaux de gris en plus ou en moins. Les Hmax et Hmin s’écrivent alors de la manière suivante.

Les figures suivantes illustrent la construction des Hmax dans le cas d’une fonction .

A titre d’exemple, on montre le résultat dans le cas de l’image d’un pavage en niveaux de gris bruité. Les maxima régionaux de ce pavage sont inutilisables à cause du bruit. Par contre, les Hmax permettent de visualiser les plateaux de chaque pavé.

La recherche des maxima significatifs peut être améliorée par un filtrage de l’image binaire résultante, comme le montre la figure suivante. Les ‘’Hmin’’ sont obtenus et traités de manière analogue.

Segmentation

[modifier | modifier le code]

Segmenter une image à niveaux de gris consiste à produire une partition du support de l'image, de façon que les régions de la partition correspondent aux objets présents dans l'image.

Les filtres morphologiques constituent une aide précieuse dans un processus de segmentation. En particulier, les nivellements permettent de filtrer les images tout en préservant les contours importants, ce qui simplifie l'opération de segmentation proprement dite. Dans certains cas, un filtrage important peut de lui-même produire une partition pertinente. Mais l'outil morphologique le plus connu en segmentation d'images est la ligne de partage des eaux.

Il existe plusieurs algorithmes de segmentation par ligne de partage des eaux. L'idée de base consiste à simuler une inondation de l'image, vue comme un relief topographique où le niveau de gris correspond à l'altitude. Les frontières entre régions de la partition ont alors tendance à se placer sur les lignes de crête. Typiquement, on applique cet opérateur au gradient de l'image (norme du gradient euclidien, ou gradient morphologique) que l'on cherche à segmenter, et par conséquent les frontières se placent de façon privilégiée sur les lignes de gradient élevé.

Plusieurs algorithmes de calcul de ligne de partage des eaux ont une complexité linéaire en fonction du nombre de pixels de l'image, ce qui les place parmi les méthodes de segmentation les plus rapides.

Quantification : Paramètres de base

[modifier | modifier le code]

À l’origine la morphologie mathématique a été conçue pour traiter et analyser des images de matériaux ou images biologiques afin d’en extraire des informations quantifiées sous forme de paramètres ou de fonctions:. Ici, on se limitera aux images 2D définies dans l’espace et aux sous-espaces. Dans ce cas l’espace est représenté par une grille de points. Deux cas sont envisagés: la grille carrée (pavage carré) et la grille triangulaire (pavage hexagonal). En ce qui concerne les paramètres, on sait qu’ils peuvent être obtenus à partir de la caractéristique d’Euler-Poincaré ou nombre de connexité des différents espaces, notés pour l’espace .

Les nombres de connexité dans l’espace discret

[modifier | modifier le code]

Espace R0 : N0 (X)

[modifier | modifier le code]

Cet espace correspond au réseau de points associés aux pixels.Sur l’image binaire, est égal au nombre de pixel à 1.

Espace R1 : N1 (X)

[modifier | modifier le code]

Les droites utilisables dans correspondent à des pixels alignés. Les extrémités de segments de ces droites coupant correspondent (en sortie) à des transitions de pixel de type 1 0. L’image binaire associée est obtenue par une transformation en tout ou rien. D'un point de vue pratique cela revient à vérifier, pour chaque pixel , la configuration de voisinage . Les éléments 1 de la configuration sont relatifs à l’ensemble et ceux à 0 au complémentaire. On aura donc :Pour l'ensemble : Pour la mesure :

Les éléments structurants dans les différents pavages sont :

  • En pavage hexagonal dans la direction 0 : .

(Les autres orientations à 60° et 120° sont obtenues par rotation de la configuration.)

  • En pavage carré dans la direction 0 : .

(Les autres orientations à 45°, 90°, 135° sont obtenues par rotation de la configuration.)

Espace R2 : N2 (X)

[modifier | modifier le code]

Rappelons que correspond au nombre de composantes connexes diminué du nombre de trous qu’elles contiennent.

  • Pavage hexagonal

Pour déterminer ce nombre avec le pavage triangulaire, on utilise la relation d’Euler : En pavage hexagonal s représentant le nombre de sommets (pixels à 1), c le nombre de côtés de type 1-1 (à une rotation près) et f le nombre de triangles ayant les 3 sommets à 1. Un calcul élémentaire sur toutes les combinaisons donne le résultat suivant :Pour les ensembles : et Pour la mesure :

Les éléments structurants dans les différents pavages sont :

et .

  • En pavage carré (8 connexité) on fait le même raisonnement ce qui donne les éléments structurants :

et .

Les paramètres métriques de base associés

[modifier | modifier le code]

Comme pour les nombres de connexité, les paramètres métriques de base doivent vérifier les conditions de Hugo Hadwiger. L’ensemble doit être un ensemble aléatoire stationnaire et constitué d’une union finie de convexes. La mesure doit avoir les propriétés suivantes :

  • Invariante par translation de  :
  • Compatible avec homothéties (agrandissement ) :
  • C-additive :
  • Continue ou semi continue

Le paramètre métrique est la longueur totale de l’ensemble notée .Elle se calcule à partir de et la taille du pixel . On a en effet :

Ces paramètres métriques sont:

  • L’aire de l’ensemble notée

Elle se calcule à partir de et l’aire du pixel . On a en effet :

  • Le périmètre de l’ensemble noté

Pour obtenir ce périmètre, on va utiliser la relation de Cauchy (géométrie intégrale) qui relie la variation diamétrale d'un ensemble à son périmètre : avec taille du pixel. On notera que l'estimation de ce périmètre à un aspect statistique. Le nombre de connexité doit être estimé dans plusieurs directions.

Vers l'espace R3

[modifier | modifier le code]

La géométrie intégrale permet également d’accéder à des paramètres de en utilisant les nombres de connexité des espaces inférieures.

  • Ainsi, la surface de la frontière notée est obtenue à partir du nombre de connexité par la relation de Crofton : est la projection de sur le plan perpendiculaire à la direction et l'aire associée à la ligne .
  • L'intégrale de courbure moyenne est estimée à partir de la variation diamétrale dans notée en utilisant la relation de Meusnier:Cette variation diamétrale est reliée au nombre de connexité dans par la relation :Ce qui donne finalement : représente la distance entre 2 plans.

De l’analyse globale à l’analyse locale (stéréologie [2])

[modifier | modifier le code]

Les images destinées aux études scientifiques sont souvent obtenues à partir d’un microscope dont le champ est plus petit que l’ensemble à analyser. Dans ce cas, on dit que l’analyse est locale par opposition à l’analyse globale où l’ensemble est totalement visible.

Les paramètres globaux précédemment définis doivent être transformés en paramètres locaux ramenés à l’unité d’espace.

Paramètres locaux de l'espace R0

[modifier | modifier le code]
  • L’unique paramètre est la fraction de points :

Paramètres locaux de l'espace R1

[modifier | modifier le code]
  • Fraction linéique :Dans ce contexte statistique, on démontre aisément que l'estimation de la fraction linéique est égale à la fraction de points :
  • Nombre de connexité par unité de longueur:

Paramètres locaux de l'espace R2

[modifier | modifier le code]
  • Fraction surfacique :On a également :
  • Périmètre spécifique :En utilisant la relation de Cauchy, on obtient :
  • Nombre de connexité par unité de surface :

Paramètres locaux de l'espace R3

[modifier | modifier le code]
  • Fraction volumique :Ici encore, on a :
  • Surface spécifique :En utilisant la relation de Crofton, on a :
  • Intégrale de courbure moyenne par unité de volume :L'intégrale de courbure moyenne peut être estimée à partir du nombre de connexité dans selon la relation de Meusnier :
  • Nombre de connexité par unité de volume :Ce paramètre de nature topologique n'est pas accessible à partir des espaces de dimension inférieure.


Quantification 2 : Granulométrie et dispersion

[modifier | modifier le code]

Les paramètres stéréologiques sont des paramètres moyens. De plus, ils ne sont pas nombreux. On conçoit aisément qu’ils soient insuffisants pour donner une description assez complète de la structure. Si l’on accepte de perdre l’aspect stéréologique, la morphologie mathématique permet d’obtenir de nombreuses informations quantitatives supplémentaires. Cette quantification dépend souvent d’un paramètre de taille associé aux transformations d’images. La quantification conduira à une opération de tri dont le dénombrement ou la mesure conduira à une fonction granulométrique. La dispersion d’un ensemble dans un autre est également quelque chose d’important à connaître. La stéréologie ne fournit qu’un paramètre dérivé qui est loin de répondre à la question.

L’analyse granulométrique

[modifier | modifier le code]

Axiomes de l’analyse granulométrique (Georges Matheron)

[modifier | modifier le code]

La méthode de tri doit vérifier les règles suivantes :

  • La méthode de tri doit vérifier la propriété de croissance
  • La méthode de tri est anti-extensive
  • Dans le cas de deux tris successifs, c’est le paramètre le plus grand qui l’emporte. Le résultat est indépendant de l’ordre des opérateurs. Cela s’écrit : Cette dernière condition va réduire considérablement le nombre des opérateurs candidats.

Les fonctions granulométriques

[modifier | modifier le code]

On distingue les granulométries en nombre et les granulométries en mesure.

  • Si le tri granulométrique consiste à ne conserver que tout ce qui est plus petit que , alors la fonction de distribution granulométrique en nombre sera définie par :
  • Au lieu de compter les objets, on peut reporter une mesure qui leur est associée (la masse dans un tamis).On obtient alors une fonction de distribution granulométrique en mesure définie par : En analyse d’image la mesure est le volume dans , l’aire pour et la longueur pour .

Analyse granulométrique individuelle

[modifier | modifier le code]
Ensemble de particules individuelles (jaune)

Ce type d’analyse n’est possible que si l’ensemble à analyser est constitué d’une collection d’objets totalement disjoints. Chaque objet est isolé puis mesuré selon un critère de taille (aire, périmètre diamètre de Féret…). Le résultat de la mesure permet de mettre cet objet dans une classe de taille.

  • Les problèmes du masque de mesure

Pour faire les mesures qu’on vient de citer, il est nécessaire que l’objet soit totalement inclus dans le champ de mesures. On doit donc éliminer ceux qui coupent le bord du champ. On a vu que cela est facilement réalisé par morphologie mathématique . Cependant, on a d’autant plus de chance d’éliminer un objet que sa taille est grande. Cela va introduire un biais dans l’analyse granulométrique. Pour résoudre ce problème, il faut pouvoir connaître la probabilité qu’un objet a d’être inclus dans le champ . Or, on a vu que donne l’ensemble des points de est totalement inclus dans .

Particule individuelle et rectangle circonscrit associé

Ce raisonnement peut être transcrit pour résoudre notre problème en cherchant à éroder le masque rectangulaire par . Il est facile de voir qu’on obtiendra rigoureusement le même résultat si on remplace par le rectangle circonscrit minimum de même orientation que . La probabilité d’inclusion se calcule alors facilement : Dans cette expression, représente le côté horizontal et le côté vertical du champ (indice Z) ou du rectangle (indice R). Le biais sera alors corrigé en incrémentant la classe de taille non pas de 1 mais de . Cette méthode corrective a été proposée par Lantuéjoul.

Analyse granulométrique par ouverture avec un élément structurant à 2 dimensions

[modifier | modifier le code]

Le milieu complémentaire des objets de la figure 1 ne peut pas être traité par cette méthode car la notion d’objet individuel n’a plus de sens. Cependant les axiomes de Matheron se vérifient lorsque l’ouverture est faite avec un élément structurant convexe. En effet, un élément structurant convexe permet de construire une famille de même nature dont tous les membres se déduisent de l’élément de taille 1 par un rapport d’homothétie de taille . Ce type de granulométrie est une granulométrie en mesure car l’ouverture ne possède pas de bonnes propriétés topologiques (un objet peut être scindé en deux par ouverture). Pour une image définie dans , la seule mesure utilisée est l’aire de l’ensemble ouvert.

En analyse locale, il faut tenir compte du masque de mesure et donc travailler dans un masque érodé, on a donc : Il existe un cas particulier où la granulométrie peut être établie en nombre. C’est lorsque l’ensemble est constitué d’objets convexes disjoints. Dans ce cas, on aura :

Analyse granulométrique par ouverture avec un élément structurant linéaire

[modifier | modifier le code]

L’élément structurant linéaire est traditionnellement noté . Les règles s’appliquent de la même manière que pour l’ouverture bidimensionnelle mais ici les granulométries en mesure et en nombre peuvent toujours se calculer puisque l’intersection d’un ensemble par une droite