En mathématiques, une suite de polynômes orthogonaux est une suite infinie de polynômesp0(x), p1(x), p2(x) ... à coefficients réels, dans laquelle chaque pn(x) est de degré n, et telle que les polynômes de la suite sont orthogonaux deux à deux pour un produit scalaire de fonctions donné.
Le produit scalaire de fonctions le plus simple est l'intégrale du produit de ces fonctions, sur un intervalle borné :
Plus généralement, on peut introduire une « fonction poids » W(x) dans l'intégrale (sur l'intervalle d'intégration ]a , b[, W doit être à valeurs finies et strictement positives, et l'intégrale du produit de la fonction poids par un polynôme doit être finie ; les bornes a , b peuvent être infinies) :
Avec cette définition du produit scalaire, deux fonctions sont orthogonales entre elles si leur produit scalaire est égal à zéro (de la même manière que deux vecteurs sont orthogonaux (perpendiculaires) si leur produit scalaire égale zéro). On introduit alors la norme associée : ; le produit scalaire fait de l'ensemble de toutes les fonctions de norme finie un espace de Hilbert.
L'intervalle d'intégration est appelé intervalle d'orthogonalité.
Les polynômes orthogonaux les plus simples sont les polynômes de Legendre pour lesquels l'intervalle d'orthogonalité est ]-1, 1[ et la fonction poids est la fonction constante de valeur 1 :
Toute suite de polynômes p0, p1,..., où chaque pk est de degré k, est une base de l'espace vectoriel (de dimension infinie) de tous les polynômes, « adaptée au drapeau ». Une suite de polynômes orthogonaux est une telle base qui est, de plus, orthogonale pour un certain produit scalaire. Ce produit scalaire étant fixé, une telle suite est presque unique (unique à produit près de ses vecteurs par des scalaires non nuls), et peut s'obtenir à partir de la base canonique (1, x, x2, ...) (non orthogonale en général), par le procédé de Gram-Schmidt.
Quand on construit une base orthogonale, on peut être tenté de la rendre orthonormale, c'est-à-dire telle que pour tout n, en divisant chaque pn par sa norme. Dans le cas des polynômes, on préfère ne pas imposer cette condition supplémentaire car il en résulterait souvent des coefficients contenant des racines carrées. On préfère souvent choisir un multiplicateur tel que les coefficients restent rationnels, et donnent des formules aussi simples que possible. C'est la standardisation. Les polynômes « classiques » énumérés ci-dessous ont été ainsi standardisés ; typiquement, le coefficient de leur terme de plus haut degré ou leur valeur en un point ont été mis à une quantité donnée (pour les polynômes de Legendre, P'n(1)=1). Cette standardisation est une convention qui pourrait aussi parfois être obtenue par une mise à l'échelle de la fonction poids correspondante. Notons
(la norme de pn est la racine carrée de hn). Les valeurs de hn pour les polynômes standardisés sont énumérées dans le tableau ci-dessous. Nous avons
Pour toute suite de polynômes orthogonaux, il existe une relation de récurrence relativement à trois polynômes consécutifs.
Les coefficients an , bn , cn sont donnés par
où kj et kj' désignent les deux premiers coefficients de pj :
et hj le produit scalaire de pj par lui-même :
.
(Par convention, c0, p–1, k'0 sont nuls.)
Démonstration
Avec les valeurs données pour an et bn, le polynôme (an x + bn)pn – pn+1 est de degré inférieur à n (les termes de degrés n+1 et n s'éliminent). On peut donc l'exprimer sous forme d'une combinaison linéaire des éléments de la base (pj)n–1 j=0 de :
avec
(car pour j<n, pj est orthogonal à pn et pn+1).
De plus, de par la forme intégrale du produit scalaire,
Pour j<n-1, ce produit scalaire est nul car x pj est de degré <n.
Pour j=n-1, il est égal à car (par le même raisonnement qu'au début) an –1x pn–1–pn est de degré inférieur à n.
On peut conclure :
avec
Ce résultat admet une réciproque, le théorème de Favard, affirmant que sous certaines conditions supplémentaires, une suite de polynômes satisfaisant cette récurrence est une suite de polynômes orthogonaux (pour une certaine fonction de pondération W).
La relation de récurrence précédente permet alors de montrer :
Démonstration
Démontrons la première de ces deux formules (la seconde s'en déduit en faisant tendre y vers x), par récurrence sur n. Pour n=-1 elle est vraie (par convention, K-1=0). Supposons-la vraie au rang n-1 et prouvons-la au rang n. En remplaçant pn+1 on obtient
Tout polynôme d'une suite de polynômes orthogonaux dont le degré n est supérieur ou égal à 1 admet n racines distinctes, toutes réelles, et situées strictement à l'intérieur de l'intervalle d'intégration[1] (c'est une propriété remarquable : il est rare, pour un polynôme de degré élevé dont les coefficients ont été choisis au hasard, d'avoir toutes ses racines réelles).
Les racines des polynômes se trouvent strictement entre les racines du polynôme de degré supérieur dans la suite.
Démonstration
On met d'abord tous les polynômes sous une forme standardisée telle que le coefficient dominant soit positif (ce qui ne change pas les racines), puis on effectue une récurrence sur n. Pour n=0 il n'y a rien à démontrer. Supposons la propriété acquise jusqu'au rang n. Notons x1 < ... < xn les racines de pn et y0 < ... < yn celles de pn+1. La relation de récurrence donne pn+1(xj) = –cnpn–1(xj) avec (d'après le choix de standardisation) cn > 0. Or par hypothèse de récurrence, (–1)n–jpn–1(xj)>0. On en déduit (–1)n+1–jpn+1(xj)>0 . En outre, ∀ x > yn, pn+1(x) > 0 et ∀ x<y0, (–1)n+1pn+1(x) > 0. Ceci permet de conclure : y0 < x1 < y1 < ... < xn < yn.
Une autre méthode de démonstration est de prouver (par récurrence, ou plus simplement en utilisant le noyau de Christoffel-Darboux) que pour tout n et tout x, pn+1'(x) pn(x) > pn+1(x) pn'(x), pour en déduire que pn+1'(yj) et pn(yj) ont même signe, si bien que (–1)n–jpn(yj) > 0, ce qui permet de conclure que pn s'annule entre les yj.
Équations différentielles conduisant à des polynômes orthogonaux
où Q est un polynôme quadratique donné et L un polynôme linéaire donné. La fonction f est inconnue, et la constante λ est un paramètre. On peut remarquer qu'une solution polynomiale est a priori envisageable pour une telle équation, les degrés des termes étant compatibles. Cependant, les solutions de cette équation différentielle ont des singularités, à moins que λ ne prenne des valeurs spécifiques. La suite de ces valeurs λ0, λ1, λ2, etc. conduit à une suite de polynômes solutions P0, P1, P2... si l'une des assertions suivantes est vérifiée :
Q est vraiment quadratique et a deux racines réelles distinctes, L est linéaire et sa racine est située entre les deux racines de Q, et les termes de plus haut degré de Q et L ont le même signe.
Q n'est pas quadratique, mais linéaire, L est linéaire, les racines de Q et L sont différentes, et les termes de plus haut degré de Q et L ont le même signe si la racine de L est plus petite que celle de Q, ou inversement.
Q est un polynôme constant non nul, L est linéaire, et le terme de plus haut degré de L est de signe opposé à celui de Q.
Ces trois cas conduisent respectivement aux polynômes de Jacobi, de Laguerre et d'Hermite. Pour chacun de ces cas :
La solution est une suite de polynômes P0, P1, P2…, chaque Pn ayant un degré n, et correspondant au nombre λn ;
L'intervalle d'orthogonalité est limité par les racines de Q ;
La racine de L est à l'intérieur de l'intervalle d'orthogonalité.
En notant , les polynômes sont orthogonaux sous la fonction poids
W(x) ne peut pas s'annuler ou prendre une valeur infinie dans l'intervalle, bien qu'il puisse le faire aux extrémités.
W(x) peut être choisi positif sur l'intervalle (multiplier l'équation différentielle par –1 si nécessaire)
En raison de la constante d'intégration, la quantité R(x) est définie à une constante multiplicative près. Le tableau ci-dessous donne les valeurs "officielles" de R(x) et W(x).
où les nombres en dépendent de la normalisation. Les valeurs de en sont données dans le tableau plus bas.
Pour démontrer cette formule on vérifie, dans chacun des trois cas ci-dessus, que le Pn qu'elle fournit est bien un polynôme de degré n, puis, par intégrations par parties répétées, que pour tout polynôme P, est égal à donc est nul si P est de degré inférieur à n. Cette méthode montre en outre que .
Il est possible de définir des polynômes orthogonaux à plusieurs variables à l'aide d'intégrales multiples. C'est par exemple le cas des polynômes de Zernike, utiles en optique géométrique et en ophtalmologie, ou, plus généralement encore, celui des harmoniques sphériques.
Jean Dieudonné, « Fractions continuées et polynômes orthogonaux », dans E.N. Laguerre, Polynômes orthogonaux et applications, Springer, (lire en ligne), p. 1-15
Jean-Louis Ovaert, Polynômes orthogonaux, dans Dictionnaire des mathématiques, algèbre, analyse, géométrie, Albin Michel et Encyclopædia Universalis, Paris, 1997