R7423

Commande prédictive
par
Jacques RICHALET
Directeur société ADERSA
1.
1.1
1.2
1.3
1.4
Les quatre principes de la commande prédictive............................
Modèle interne..............................................................................................
Trajectoire de référence ...............................................................................
Structuration de la variable manipulée ......................................................
1.3.1 Rappel...................................................................................................
1.3.2 Équation de commande......................................................................
1.3.3 Régime permanent..............................................................................
Autocompensateur.......................................................................................
R 7 423
—
—
—
—
—
—
—
2
2
3
5
5
5
6
6
2.
2.1
2.2
Réglage ........................................................................................................
Spécifications................................................................................................
Compromis de réglage ................................................................................
—
—
—
7
7
8
3.
3.1
3.2
3.3
Contraintes .................................................................................................
Cas général ...................................................................................................
Contraintes sur la variable manipulée........................................................
Contraintes sur une sortie dynamique .......................................................
—
—
—
—
9
9
10
10
4.
4.1
4.2
Mise en œuvre ...........................................................................................
Système du premier ordre...........................................................................
Système intégrateur pur ..............................................................................
—
—
—
10
10
13
5.
5.1
5.2
Commande partagée................................................................................
Deux actions exclusives...............................................................................
Deux actions coopératives...........................................................................
—
—
—
13
13
14
6.
6.1
6.2
Évaluation ...................................................................................................
Avantages .....................................................................................................
Inconvénients................................................................................................
—
—
—
15
15
15
7.
Pratique industrielle ................................................................................
—
16
8.
Conclusion ..................................................................................................
—
17
Références bibliographiques ..........................................................................
—
17
L
‘essentiel des régulations industrielles sera toujours réalisé par des régulateurs PID. Ils ont, quand ils s’appliquent, une efficacité remarquable, et un
rapport prix/performance avec lequel il est difficile de rivaliser. Ils sont, pour ces
raisons, commercialisés sur une échelle industrielle mondiale et sont un outil de
base classique de l’industrie de production.
Mais ce régulateur ne couvre pas tous les besoins et ses performances
s’essoufflent dans plusieurs cas, citons :
— les processus « difficiles », non linéaires, instables, non stationnaires,
à grand retard pur, et aussi multivariables ;
— lorsque les performances exigées par l’utilisateur sont très tendues : forte
atténuation des perturbations, erreur de traînage nulle en poursuite, réponse en
temps minimal, ce qui amène à fonctionner sur des contraintes qui affectent soit
les variables d’action, soit des variables internes du processus.
Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Mesures et Contrôle
R 7 423 − 1
COMMANDE PRÉDICTIVE ________________________________________________________________________________________________________________
Pour la compréhension ultérieure des conditions de mise en œuvre de la commande prédictive, il est important de savoir que l’acceptation industrielle du PID
vient du fait qu’une fois le matériel installé (capteur, actionneur), il suffit, sans
étude préalable, de fixer quelques valeurs de paramètres, sans grande réflexion
ou difficulté particulière, et qu’un essai expérimental suffit. L’automatique est
alors l’affaire des régleurs. La situation est tout autre avec la commande prédictive.
Si les boucles élémentaires, du type régulation du débit par une vanne, sont
très efficacement traitées par le PID, il en est tout autre des boucles difficiles qui,
en juste contrepartie, ont généralement un impact économique fort, ce qui justifie la démarche.
L’autre composante, en plus de ce besoin de performance, qui a favorisé l’éclosion de la commande avancée, se situe sur le plan méthodologique avec l’apparition des méthodes de modélisation et de simulation. Sur le plan technique,
l’accessibilité plus aisée aux calculateurs numériques susceptibles de réaliser
des traitements algorithmiques, mélangeant calcul et logique, inaccessibles à
des organes purement analogiques, a également considérablement facilité
l’introduction de ces méthodes de commande à base de modèle.
La rupture entre l’automatique classique et la commande prédictive est dans le
fait que le régulateur prédictif va être construit sur la base d’un modèle, qu’il va
utiliser sur le site, en temps réel.
Le modèle s’est fait régulateur.
Le PID Smith à compensation de retard utilise également un modèle, mais il ne
fait pas de prédiction du futur.
Remerciements : nous tenons à exprimer nos vifs remerciements à madame Nathalie Fulget, enseignante à l’ESISAR, Valence, qui a participé à la rédaction de cet article.
1. Les quatre principes
de la commande prédictive
mance recherchée, tout en ne nécessitant pas une connaissance
parfaite du processus, mais qui utiliserait quand même une information de structure du processus pour obtenir des performances
meilleures.
Plusieurs méthodes de commande prédictive existent. Il est normal qu’il en soit ainsi car les 3 000 unités industrielles significativement pilotées par un régulateur prédictif (1996) sont de nature
variée. Des problèmes différents, traités par des auteurs d’origine
diverse, créent une multiplicité de solutions.
Le modèle est le plus souvent embarqué explicitement dans le
calculateur de commande et pour cela dénommé modèle interne. Le
choix de la structure du modèle dépend du processus et des spécifications de la commande. Il doit être capable de réaliser une prédiction véritable du comportement futur du processus, sous l’effet
d’une action supposée connue dans l’avenir.
Cependant, par la force logique de la démarche, si les solutions
sont très ouvertes, la méthode s’appuie sur quatre principes universels, auxquels on doit se soumettre, si l’on veut tirer tous les avantages de cette commande. Décrivons ces quatre composantes.
Ce modèle peut être de connaissance ou de représentation, sa
forme est ouverte. Il peut être mathématique, ou simplement logique, à base de règles, ou même être constitué d’une base de données expérimentales plus ou moins brute.
1.1 Modèle interne
La modélisation et l’identification sont des sujets déjà abordés et
sur lesquels nous allons nous appuyer (cf. J. Richalet, Pratique de
l’identification, 1991, éditions Hermès) [9] [13].
Si l’on était capable de modéliser parfaitement les processus et
les signaux, la commande serait quasiment réduite à un calcul en
boucle ouverte. À l’opposé, la boucle fermée a précisément été
inventée pour piloter essentiellement avec comme seule information, des mesures, sans intervention explicite de la connaissance du
processus. Entre ces deux approches extrêmes, la commande par
modèle tente de trouver un moyen terme qui apporterait la perfor-
R 7 423 − 2
Deux types fondamentaux de modèles internes existent :
— modèles indépendants où la sortie du modèle interne n’est calculée qu’avec les entrées connues, mesurées, du processus
(figure 1a) ;
— modèles réalignés (ou recalés) où la sortie du modèle est calculée avec des sorties passées ou des variables internes du processus, mesurées ou estimées (figure 1b).
Notons u l’entrée, yP et yM les sorties du processus P et du
modèle, δNmes les perturbations non mesurées, δMes les perturbations mesurées.
Prenons l’exemple pédagogique simple d’un système du premier
ordre décrit par l’équation (1) dont la sortie discrète yP(n) ne dépend
que de la sortie précédente yP(n – 1) et de l’entrée u (n – 1) :
y P ( n ) = α y P( n – 1 ) + ( 1 – α ) ⋅ K ⋅ u ( n – 1 )
Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Mesures et Contrôle
(1)
________________________________________________________________________________________________________________ COMMANDE PRÉDICTIVE
δNMes + δMes
u
yM
M0
+
u
yP
P
+
+
M1
δMes
+
a
u
yM
+
M1
+
yM1
M2
M2
a modèle indépendant
b
δNMes + δMes
u
+
u
P
yP
+
δMes
+
yM2
yP
+
M1
+
M1
+
M2
yM
c
M2
Figure 2 – Principe de décomposition
b modèle recalé
schéma 2b la sortie du modèle y M 1 par la sortie du processus yP
prise comme étant une variable de tendance (figure 2c) (cf. § 3).
Figure 1 – Modèle indépendant et modèle recalé
Si l’on satisfait la condition :
Pour calculer la sortie du modèle yM(n) que l’on veut simuler,
deux possibilités sont offertes :
— la sortie du modèle est exprimée avec la sortie passée du processus (modèle recalé) :
y M ( n ) = α M y P( n – 1 ) + ( 1 – α M ) K M ⋅ u ( n – 1 )
(2)
— ou bien l’équation récurrente où yM(n – 1) intervient donne
(modèle indépendant) :
yM ( n ) = αM yM ( n – 1 ) + ( 1 – αM ) KM ⋅ u ( n – 1 )
(3)
On retrouve là d’ailleurs la différence entre la méthode d’identification des moindres carrés et la méthode du modèle.
La première ne nécessite pas de simulateur, mais donne un résultat biaisé en général. La deuxième nécessite d’intégrer une équation
grâce à un solveur ou un simulateur, mais donne des résultats non
biaisés.
Les deux démarches ont leur intérêt a priori. En effet, si le processus est instable en boucle ouverte, il est clair que la deuxième solution n’est pas applicable, car la sortie du modèle divergerait. Par
contre, elle laisse la liberté complète du choix de la structure du
modèle qui, sur un plan algorithmique, va jouer le rôle d’une sousroutine, qui n’a d’autre argument que l’entrée, alors que la première
solution exige de mesurer soit l’état interne (technique d’observation peu accessible dans l’industrie), soit les sorties passées si l’on
utilise une représentation polynomiale, dont la robustesse numérique est faible dès que l’ordre du processus augmente et que sa stabilité se dégrade.
Principe de décomposition
Considérons un système représenté par un transfert M0 avec un
mode instable ou mal amorti (figure 2a). On peut toujours le représenter sous la forme de deux systèmes stables M1, M2 (figure 2b).
Le principe de décomposition consiste alors à remplacer dans le
M0 = M1 ⁄ ( 1 – M2 )
(4)
Les comportements des sorties yM et yP seront identiques, dans le
cas nominal ( objet ≡ modèle ).
On a donc en fait une représentation mixte qui n’utilise que la sortie mesurée et qui permet de n’avoir que des modèles stables, susceptibles d’être implantés.
Une telle procédure permet de piloter des processus instables
avec cependant la technique du modèle indépendant qui accepte
n’importe quelle représentation, entre autres celle d’état, qui est la
plus générale et la plus robuste numériquement. Cette décomposition est d’utilisation très fréquente et tend à éliminer les méthodes
avec modèles réalignés.
Nous verrons au paragraphe 2.1 que les méthodes avec modèles
réalignés ont, de plus, l’inconvénient majeur de présenter une
erreur de position si l’on n’y apporte pas une correction spécifique
supplémentaire.
1.2 Trajectoire de référence
Le futur de la sortie du processus est spécifié par l’intermédiaire
d’une trajectoire (figure 3), initialisée sur la valeur mesurée ou estimée yP de la sortie du processus, qui tend vers la consigne, quelle
qu’elle soit, suivant une certaine dynamique ; cette dynamique va
ainsi définir, de façon évidente, le comportement en boucle fermée.
En pratique, on se limite souvent à la trajectoire exponentielle qui
a le mérite d’être simple, de ne nécessiter qu’un seul point de
mesure pour être initialisée, et de donner un comportement désiré
sans surtension.
Ce choix se justifie d’autant plus que le futur proche est désensibilisé, par l’introduction d’un horizon de coïncidence (H1 H2). Il ne
Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Mesures et Contrôle
R 7 423 − 3
COMMANDE PRÉDICTIVE ________________________________________________________________________________________________________________
n
Passé
Futur
C (n + H )
ε (n + H )
Consigne C
Trajectoire
de référence yref
ε (n)
Sortie
prédite
yP
∆P
Sortie processus
yP
∆M
Sortie modèle
H
yM
H1
H2
Horizon de coïncidence
Figure 3 – Trajectoire
de référence et horizon
de coïncidence
Horizon de prédiction
s’agit pas en effet de rechercher une coïncidence à tous les instants
futurs, mais seulement sur un certain nombre de points entre H1
et H2.
Le premier intérêt de la procédure est de pouvoir piloter des systèmes à retard pur, en choisissant H1 au-delà du temps de retard pur.
Pour un système sans retard, on peut, dans une première approche, interpréter le choix de cet horizon sur la base physique suivante. Supposons que l’on choisisse un horizon court H1 = H2 = 1, la
sortie du processus va suivre la trajectoire de référence à chaque
pas d’échantillonnage. On transforme alors le processus en un système du 1er ordre, ce qui a pour conséquence que la commande va
être très « active » pour compenser tous les modes du processus.
Par contre, si l’horizon est très lointain, cela revient à ne commander
que le régime statique et la commande sera alors voisine d’un échelon pour un changement de consigne en échelon, mais les modes
du processus en boucle ouverte apparaîtront complètement libres.
une commande qui réalise, sur ce modèle, le même incrément de
sortie modèle ∆M = ∆P. Ce transfert de spécification est un élément
clé de la méthode.
Il suppose que le système soit localement linéarisable, puisque la
commande ne sera calculée qu’avec cette valeur, indépendamment
de la valeur absolue de la sortie du processus, ou de son état.
La trajectoire de référence est prise exponentielle de décrément λ,
elle relie le point courant de la sortie à la consigne C (n).
A un point futur, dit de coïncidence, pris à n + H, on souhaite qu’il
y ait égalité entre la trajectoire de référence et la sortie prédite du
processus. Cette prescription est incrémentale, à savoir : on cherche
un projet de variable manipulée tel que la variation de la variable
régulée soit égale à l’incrément ∆P de la trajectoire de référence, on
a alors :
C ( n + H ) – y Ref ( n + H ) = λ H ( C ( n ) – y P ( n ) )
Nous verrons que ce choix d’horizon a un impact sur la stabilité
du processus. Piloter à court terme engendre donc des actions de
grande amplitude pour des systèmes passe-bas, avec le cas extrême
du système ayant un retard pur, où une commande infinie rendrait
le système bouclé instable.
La dynamique de la trajectoire de référence peut éventuellement
être variable dans le temps ou suivant l’état du processus. Elle est le
facteur qui va régler la dynamique en boucle fermée avec une
grande simplicité, directement interprétable par n’importe quel
régleur.
La méthode de commande consiste alors à transférer l’incrément
de sortie désiré du processus, ∆P spécifié par la trajectoire de référence, vers un modèle mathématique qui va permettre de calculer
R 7 423 − 4
H1 < H < H2
(5)
y Ref ( n + H ) = y P ( n + H )
C ( n + H ) – yˆ P ( n + H ) = λ H ( C ( n ) – y P ( n ) )
Dans le cas où la consigne est constante C (n) = C0 :
∆P =
( C0 – yP ( n ) ) ⋅ ( 1 – λ H )
= ∆M = yM ( n + H ) – yM ( n )
Cet écart ∆P prescrit, issu de la valeur de la consigne et de la
mesure de la sortie du processus, est alors transposé dans le monde
du modèle mathématique ∆M auquel on va demander de réaliser le
même incrément sous l’effet d’une action de commande à rechercher.
Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Mesures et Contrôle
________________________________________________________________________________________________________________ COMMANDE PRÉDICTIVE
1.3 Structuration de la variable manipulée
La sortie forcée sera alors, par superposition linéaire :
Nb
yF ( n + i ) =
1.3.1 Rappel
∑
u K SB K ( i )
K=1
La solution d’une équation différentielle comporte deux termes,
l’un yF dit solution forcée, l’autre yL solution libre.
Prenons l’exemple simple d’un système du premier ordre :
y M ( n ) = α y M ( n – 1 ) + ( 1 – α ) Ku ( n – 1 )
i>0
yL ( n + i ) = yM ( 0 ) α i
La solution forcée yF suppose que les conditions initiales soient
nulles, et que le processus soit soumis à une entrée connue dans le
futur :
yM ( 0 ) = 0
u(n + i) ≠ 0
yF ( n + i ) = K ( 1 – α i )
si u ( n + i ) = 1 par exemple
Par hypothèse de linéarité, on peut additionner les deux réponses
pour obtenir la réponse totale :
yM ( n + i ) = yL ( n + i ) + yF ( n + i )
La réponse totale dépend donc du passé subi et du futur qui
dépend du régulateur. Certaines méthodes s’attachent à rechercher
les commandes futures de l’instant présent à l’instant H2, avec H2
degrés de liberté, au plus.
Pour les deux raisons suivantes, il est plus efficace de structurer la
commande, en la projetant sur une base de fonctions :
— on limite le nombre d’inconnus NB en projetant le futur sur une
base de fonctions UBK de dimension plus petite que H2 ;
— on limite a priori les discontinuités, et le spectre de la commande, en limitant la dimension de la base, soit par exemple son
ordre dans le cas d’une base polynomiale (développement de
Taylor).
La commande future sera donc exprimée sous la forme suivante :
Nb
u(n + i) =
∑
u K ( n ) UB K ( i )
Cette projection sur une base a justifié le nom de PFC (Predictive
Functional Control) [10].
1.3.2 Équation de commande
La solution libre, dite aussi sans second membre, suppose une
entrée future nulle :
yM ( 0 ) = y0
u(n + i) = 0
Le choix des fonctions de base sera précisé ultérieurement.
(6)
L’incrément désiré ∆P à un instant H ∈ ( H 1 H 2 ) , spécifié par la trajectoire de référence, est alors transporté dans l’espace du modèle
auquel on demande d’incrémenter sa sortie de la même valeur.
L’incrément de sortie modèle est, par contre, complètement connu
en fonction des sorties actuelles yM(n), libre yL(n + H ) et forcée
yF(n + H ) du modèle, qui est soumis à une entrée u (n + i ) dont on
cherche la valeur, solution de l’équation :
∆P = ( C0 – yP ( n ) ) ( 1 – λ H ) = yL ( n + H ) + yF ( n + H ) – yM ( n )
■ Dans le cas élémentaire où la commande serait structurée par
une seule fonction de base, supposée constante à l’avenir (un échelon d’amplitude à rechercher), et où un seul point de coïncidence à
H serait considéré, on obtient alors la relation la plus simple qu’il
soit :
(8)
( C – y P ( n ) ) ( 1 – λ H ) = y L ( n + H ) + u ( n ) SB 0 ( H ) – y M ( n )
dont on extrait la valeur u (n), solution.
Le principe de l’horizon glissant amène à recommencer cette opération identiquement à chaque période d’échantillonnage, ce qui
peut surprendre. Il est classique d’entendre :
— pourquoi ne pas viser le point suivant H = 1, puisque l’on calcule à chaque instant une trajectoire qui ne sera pas suivie à cause
des perturbations d’état et de structure qui affectent le processus ?
— pourquoi ne pas appliquer, au contraire, toutes les commandes futures, calculées, et ne calculer qu’un nouveau jeu de H2 commandes toutes les H2 périodes ?
La réponse à ces questions viendra au paragraphe traitant du
« réglage ».
■ Dans le cas général, l’horizon ne se réduit pas à un point de coïncidence, et il convient alors d’utiliser un solveur qui va, suivant les
différentes variantes :
— minimiser un critère de distance entre la sortie prédite
yˆ P ( n + i ) et la trajectoire de référence yRef(n+i ), critère le plus souvent quadratique car différentiable :
K=1
H2
où les UBK sont dénommées fonctions de base.
Chaque entrée de base UBK induit une sortie de base SBK connue
a priori pour un modèle donné. Si l’on prend la base polynomiale,
on a, par exemple, le schéma de la figure 4.
UB0 = u (t)
SB0
UB1 = u (t).t
SB1
UB2 = u (t).t 2
SB2
Figure 4 – Entrées et sorties de base
(7)
C =
∑ [ yRef ( n + i ) – yˆ P ( n + i ) ] 2
(9)
i = H1
— amener la sortie prédite dans un canal donné δ (i ) spécifié
autour de la trajectoire de référence, tout en respectant des
contraintes sur la ou les variables d’action et/ou sur les variables
d’état interne du processus.
De nombreuses propositions de solveur existent, l’introduction de
contraintes complique grandement le problème et un compromis
est à trouver entre la puissance des organes de calcul disponibles, la
sophistication de la solution, et la cadence d’échantillonnage.
La commande d’une grosse unité de distillation pétrolière, multivariable, contrainte, mais avec une cadence d’échantillonnage de
5 minutes ne sera pas traitée de la même façon que la commande
d’un laminoir avec une cadence de commande de 5 ms.
Un compromis où une dégradation de performance limitée, due à
un solveur approché, mais où la commande serait cependant
implantable dans une carte de commande économique, est à
trouver.
Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Mesures et Contrôle
R 7 423 − 5
COMMANDE PRÉDICTIVE ________________________________________________________________________________________________________________
1.3.3 Régime permanent
δ
Il n’y a pas d’erreur permanente, malgré la présence de perturbations de structure ou de perturbations d’état constantes :
+
R
C 0 = y P ( ∞ ) implique que :
yL ( n + H ) – yM ( n ) = –yF ( n + H )
Si nous sommes dans le cas d’un modèle réaligné, cette équation
est satisfaite pour tout système asymptotiquement stable : la
réponse lâchée d’un régime permanent vers 0 est l’opposée de la
réponse forcée de 0 à ce régime permanent. L’équation est cohérente car elle fait intervenir les variables issues du modèle et les
paramètres du même modèle. En mélangeant mesures issues du
processus et paramètres issus du modèle, l’équation de commande
ne boucle pas à 0, ce qui fait que les commandes à modèle réaligné
présentent un biais, ce qui contribue encore à diminuer leur intérêt
plus académique qu’industriel.
yP
P
+
∆P
+
u
e (n)
F.E.P.
--
yM
M
F.E.P.
R
P
M
~ (n + H )
e
filtrage, estimation, prédiction
régulateur
processus
modèle
Figure 5 – Autocompensateur
1.4 Autocompensateur
Le modèle interne étant embarqué dans le calculateur de commande, il est a priori intéressant d’observer la qualité de la modélisation en temps réel par l’écart objet-modèle e ( n ) = y P ( n ) – y M ( n )
et éventuellement d’exploiter ce signal pour améliorer la commande
(figure 5).
Ce signal est en général non nul, pour deux raisons essentielles :
— perturbations d’état : le processus physique est perturbé par
des entrées inconnues (δ ), qui induisent, de façon linéaire additive
sur les variables d’état du système, et entre autres sur la sortie, des
écarts aléatoires (couple perturbateur sur un servomécanisme,
perte thermique inconnue non prise en compte sur un réacteur chimique, etc.) ;
— perturbations de structure : le modèle étant toujours « faux »,
dans sa structure qualitative, et/ou dans la valeur numérique de ses
paramètres structuraux, les sorties du processus vont différer,
même sans perturbations d’état (inertie d’un système mécanique,
coefficient d’échange thermique d’un réacteur, etc.).
Suivant ces deux hypothèses, les traitements vont être plutôt de
nature :
— estimation de l’état du processus, reconstruction des perturbations, par des techniques qui relèvent de la théorie des observateurs, à supposer que le modèle soit correct dans sa structure ;
— identification en temps réel de la structure, ou plutôt réadaptation numérique des paramètres, ce qui relève des techniques
d’auto-adaptation en temps réel.
On voit là que toutes les méthodes susmentionnées, abondamment étudiées théoriquement dans le passé, peuvent à loisir s’intégrer dans le schéma de la commande prédictive. En fait, une
approche simplifiée, intégrant implicitement les deux aspects, peut
être proposée : les deux types de perturbations étant toujours présents, il ne s’agit pas dans le cadre restreint de l’horizon de prédiction, qui nous intéresse ici, de faire une détermination en temps réel
des caractéristiques supposées stationnaires du bruit additif, ou de
réidentifier le modèle dans un schéma d’auto-adaptation, mais de
faire une simple prédiction, à l’instant n + H, de l’erreur non stationnaire de modélisation, dite DOM, Différence Objet-Modèle sur un
horizon glissant (figure 6).
Il convient alors de faire une estimation de l’incrément de l’erreur
de modélisation, terme que l’on va ajouter dans le membre de droite
de l’équation de commande (7), qui va ainsi continuer de se compléter. Elle devient alors :
∆ P = ( C – y P ( n ) )(1 – λ H )
˜
= y L ( n + H ) + y F ( n + H ) – y M ( n ) + ( e˜ ( n + H ) – e ( n ) )
R 7 423 − 6
(10)
e (n) = DOM
s
e
n -- H *
∆1 e~ (n + H )
n
n+H
e entrée prédite
s sortie prédite
Figure 6 – Correction de DOM d’ordre 1
Le problème revient alors à faire un filtrage, une estimation et une
prédiction (F.E.P.) sur un horizon relativement court, à chaque instant réactualisées en état, d’un signal monodimensionnel dans le
cas d’un processus monovariable.
De nombreuses techniques sont disponibles, elles passent toutes
par les étapes suivantes :
— hypothèse sur la structure du signal, c’est-à-dire polynôme de
degré N, ou signal harmonique à M composantes, etc. ;
— calage de cette structure sur un horizon passé (H*), par
exemple par une technique de minimisation quadratique... ;
— hypothèse que, sur l’horizon de prédiction, la structure retenue
et les paramètres glissants identifiés sont constants ;
— initialisation de la structure retenue et extrapolation à l’instant
n + H.
On introduit alors en fait une deuxième boucle de retour comme
le montre le schéma de la figure 5, à laquelle on va demander de rattraper des écarts basse fréquence, par exemple de type polynomial
ou fréquentiel. L’estimateur-prédicteur risque donc de provoquer
des instabilités par bouclage, s’il est trop actif, commençant alors
à jouer un rôle équivalent à celui de la boucle principale de
rétroaction. On va donc, pour ces raisons, demander à l’autocompensateur de ne rattraper que des biais dynamiquement lents ou
des dérives.
Un autocompensateur harmonique à la fréquence ωδ crée une
absorption sélective à cette fréquence qui peut être de 20 dB
(figure 7).
Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Mesures et Contrôle
________________________________________________________________________________________________________________ COMMANDE PRÉDICTIVE
et d’une sortie future pour laquelle on est amené à faire une hypothèse de structure (prédiction plate, figure 9) ou polynomiale
d’ordre plus élevé.
yP
δ
ωδ
ωC
0 dB
ωR
L’incrément de sortie (∆Tei) est à ajouter dans le membre de droite
de l’équation de commande.
ω
Cette procédure est très efficace, car étant en boucle ouverte, elle
ne risque pas de déclencher des instabilités ; elle repose sur la qualité du modèle. Elle est à utiliser pour des perturbations de fréquence moyenne, étant inutile pour des perturbations qui seraient
déjà dans la zone de réjection naturelle de la boucle ordinaire.
Figure 7 – Réjection de perturbation
Text
Tcons
R
2. Réglage
Tei
P2
+
q
P1
2.1 Spécifications
Tint
+
Tous les systèmes de commande doivent satisfaire trois principaux types de spécification : précision, dynamique, robustesse.
■ Précision
R
Tcons
q
Tei
régulateur
consigne
action
perturbation
Le système est asservi, c’est-à-dire que sa sortie doit être égale à
une consigne constante ou variable dans le temps, malgré des perturbations d’état et de structure : le régulateur idéal serait celui qui
se comporterait comme un filtre « passe-tout » pour le signal de
consigne, et « passe-rien » pour toutes les perturbations.
Figure 8 – Variable de tendance
■ Dynamique
~
Text
Text
Tei
n -- H
Lors d’un changement de consigne, le processus en boucle
ouverte, que l’on suppose ici asymptotiquement stable, répond avec
une certaine dynamique, évaluée classiquement par son temps de
réponse à 5 %, (temps au-delà duquel le processus reste à ± 5 % de
sa réponse asymptotique) : temps de réponse en boucle
ouverte : TRBO. Le système bouclé répondra en un temps
dénommé temps de réponse en boucle fermée : TRBF.
∆Tei
n
n+H
~
Text température prédite
Figure 9 – Prédiction plate de l’effet de tendance
Le rapport TRBO/TRBF va jouer un rôle important dans le réglage
du régulateur, amenant à des commandes surtensives ou non.
Une autre façon de spécifier les performances dynamiques porte
sur sa capacité de réjection des perturbations, exprimées dans le
domaine fréquentiel, et principalement, en pratique industrielle, par
le diagramme de Bode qui donne le rapport des modules entre une
perturbation additive sur la sortie (δ) et cette sortie (y), en fonction
de la fréquence (diagramme souvent appelé « colline », par sa
forme caractéristique, figure 10).
ω→0
ω→∞
Il convient de noter qu’un écart permanent est déjà naturellement
compensé par la technique du modèle indépendant, qui contient
implicitement un intégrateur non exprimé explicitement, ce qui
élimine d’ailleurs élégamment les problèmes de saturation d’intégrateur (wind-up). C’est donc pour des écarts, au moins structurables par une rampe, que se justifie la méthode. Dans le cas d’un
autocompensateur fréquentiel, il convient de filtrer le signal d’erreur
dans la zone spectrale d’intérêt et de faire la prédiction d’un signal
harmonique à la fréquence choisie ωδ.
y ⁄ δ → –∞
y⁄δ →0
La fréquence de coupure ωc montre qu’au-delà d’une certaine fréquence ωc, le régulateur augmente l’effet des perturbations. On voit
l’importance de la position relative de cette fréquence par rapport au
spectre des perturbations additives du processus.
yP
δ
■ Variable de tendance
Un cas particulier de la démarche, très utile en pratique, est celui
de la prise en compte des variables de tendance, définie comme une
perturbation mesurable, mais sur laquelle on ne peut agir, par
exemple : dans la régulation de la température (Tint) d’une habitation, prise en compte de la température extérieure (Text).
Supposons pour simplifier que ce soit l’entrée mesurée d’un processus connu modélisé, (figure 8) ; son effet incrémental sur la sortie est composé d’une sortie lâchée, qui est parfaitement calculable,
0 dB
ωC
ωR
ω
Figure 10 – Réjection de perturbation
Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Mesures et Contrôle
R 7 423 − 7
COMMANDE PRÉDICTIVE ________________________________________________________________________________________________________________
■ Robustesse
3) Trajectoire de référence : dynamique
Il s’agit là d’être capable de fonctionner, avec une stabilité assurée, malgré des désadaptations de la structure du processus estimée lors du réglage initial du régulateur.
■ La difficulté fondamentale de l’automatique est que ces spécifications sont contradictoires, elles s’opposent, propriété vraie pour
toutes méthodes. Le rôle de l’automaticien est de trouver un compromis. Dans le cas du PID, augmenter le gain du régulateur diminue, certes, l’erreur de traînage vis-à-vis d’une consigne en rampe,
diminue également le temps de réponse, mais diminue aussi la
marge de stabilité, évaluée par exemple par la marge de gain.
L’acceptation industrielle d’une méthode de commande dépend
de son apport en performance, mais aussi de sa facilité de réglage,
et de son aptitude à négocier ces compromis.
La méthode de réglage optimale serait une méthode « orthonormale », où chaque spécification serait réglée par un seul paramètre, sans interaction sur les autres spécifications.
■ Dans le cas de la commande prédictive, de quoi dispose-t-on ?
1) Modèle : principe fondamental
C’est l’essentiel du réglage, c’est sur ce poste qu’est passé le plus
de temps, et où sont les risques de l’opération.
2) Fonctions de base : précision
On montre la propriété fondamentale suivante :
Supposons que le processus soit asymptotiquement stable et
possède k intégrateurs, et que la consigne C soit de la forme :
dc
C =
∑ ci ⋅ t i
i=0
Si l’on choisit comme fonctions de base des polynômes de la
forme :
UB K ( t ) = t K – 1 , K = 1, … m
avec m > d c – k
il n’y a pas d’erreur de traînage dans le cas nominal.
Par exemple, un système de poursuite avec un intégrateur, soumis à une consigne parabolique (robotique, systèmes d’armes...)
suivra sans erreur de traînage une consigne « participative » parabolique, c’est-à-dire connue sur l’horizon de coïncidence, si l’on
prend comme fonctions de base, un échelon UB0 = t 0 et une rampe
UB1 = t1 (performance très difficile à obtenir facilement avec toute
autre technique de commande) figure 11.
La précision apparaît alors aisée à spécifier, car les autres paramètres de réglage n’ont pas d’incidence sur elle, étant complètement
découplée.
yp
Comme nous l’avons vu, si le point de coïncidence était unique et
si à la période d’échantillonnage suivante, le processus était sans
perturbation, sa sortie suivrait parfaitement la première trajectoire
de référence exponentielle, transformant alors le processus en un
système du 1er ordre de réponse spécifiée.
Inversement, si le point de coïncidence est très lointain, en fait sur
le régime permanent, on pilote alors avec le gain statique du processus et, pour un écart donné, le régulateur répondra par un échelon,
avec une commande qui sera donc très « douce », proche de la sortie libre d’un processus. Le choix de l’horizon de coïncidence va
donc avoir une certaine influence sur l’allure de la variable manipulée et sur le respect de la spécification de la dynamique.
4) Horizon de coïncidence : robustesse
Comme le raisonnement précédent le laisse entendre, l’horizon
de coïncidence a une influence majeure sur la stabilité et la robustesse du processus bouclé. Une analyse mathématique plus précise
est ici nécessaire [10], toutefois une interprétation physique simple
est possible. Prenons le cas des systèmes à retard pur et à
déphasage non minimal (réponse inverse), figure 12.
Avec une fonction de base en échelon, il est clair que l’on ne peut
spécifier une réponse en boucle fermée avec un point de coïncidence qui tomberait avant le temps de retard pur HD (figure 12a). De
plus, si le système est à déphasage non minimal, la réponse forcée,
étant ici négative, amènerait à une commande négative qui rendrait
le système immédiatement instable (H > HD). Le choix de l’horizon
de coïncidence est en fait déterminé par une procédure d’aide au
choix qui vient compléter ces informations qualitatives, en analysant divers réglages.
Pour les processus asymptotiquement stables non surtensifs,
avec une fonction de base en échelon et un point unique de coïncidence, on démontre la stabilité a priori, en choisissant H > HF
(HF point d’inflexion de la réponse indicielle du processus)
(figure 12b).
On montre également que, dans ce cas, la performance dynamique (λ : décrément de la trajectoire de référence) et la robustesse, ici
mesurée par la marge de gain MG, sont liées par la relation :
( 1 – λ H ) ⋅ MG = Cte
2.2 Compromis de réglage
Sortie processus
t
Figure 11 – Cible participative - poursuite à erreur de traînage nulle
R 7 423 − 8
Il n’en est pas exactement ainsi, car le principe d’horizon glissant
fait qu’à chaque période d’échantillonnage une nouvelle trajectoire
de référence est initialisée sur la sortie du processus perturbé. Mais
le temps de réponse effectif constaté et le temps de réponse de la
référence sont voisins et varient dans le même sens.
Consigne
Erreur de traînage = 0
0
La trajectoire de référence a une signification immédiate à tout
instant : si l’on suppose le processus dans un état zéro et si l’on
applique un changement de consigne en échelon, la première trajectoire de référence, si elle était suivie parfaitement, fixerait la réponse
dynamique du processus en boucle fermée.
Nous avons vu que l’on peut exclure des compromis de synthèse,
la spécification de précision en régime permanent, obtenue sans
interaction avec les autres caractéristiques.
D’une façon générale, il convient, dans la relation liant la robustesse à la performance dynamique (figure 13), de déterminer le
besoin en marge de stabilité, évaluée par la marge de gain (MG)
(facteur multiplicatif du gain du processus qui rend instable le système), ou par la marge de retard (MR) (temps de retard pur négligé
qui rend le système instable), ou par la marge de stabilité absolue
(MRS), [distance la plus courte entre le point critique (0, –1), du plan
de Nyquist et le lieu de transfert de la boucle fermée].
Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Mesures et Contrôle
________________________________________________________________________________________________________________ COMMANDE PRÉDICTIVE
Si l’on affecte 2 à l’influence la plus forte et 0 à pas d’influence, on
obtient le guide du tableau 1.
y
Tableau 1 – Réglage - Effet des actions
0
HD
H
Précision
Dynamique
Robustesse
Fonction de base
2
0
0
Trajectoire de référence
0
2
1
Horizon de coïncidence
0
1
2
a réponse inverse
Des réglages complémentaires sont possibles, concernant la présence d’un terme d’adoucissement de variation de la commande (γ)
qui intervient dans le critère (C ), mais il a une interaction avec le
temps de réponse :
y
H2
C =
∑ ( yˆ P ( n + h ) – yR ( n + h ) ) 2 + γ
H1
0
HF
i
b réponse non surtensive
où
H2 – 1
∑
[ u(k) ( n + 1 ) ]2
(11)
i=0
u(k)
est la dérivée d’ordre k de la commande,
yR
la référence,
γ
un coefficient de pondération.
Dans les cas élémentaires, tels que décrits au paragraphe suivant,
le lien entre les caractéristiques du processus et les paramètres du
régulateur sont explicites ; dans les cas industriels ordinaires, un
logiciel de conception assistée par ordinateur (CAO) est nécessaire
(cf. P.F.C.).
Figure 12 – Choix du point de coïncidence
PCF
MG
3. Contraintes
PID
MG1
3.1 Cas général
1
0
MG0
1
TRBF/TRBO
Figure 13 – Compromis : marge de gain - dynamique
Les nécessités de la commande industrielle peuvent être interprétées, dans une formulation simplifiée comme suit : dans un temps
donné, agir sur le processus de telle sorte que, malgré des perturbations d’état et de structure, son vecteur d’état soit à un instant n + H
dans un domaine spécifié, tout en respectant un champ de contraintes qui affecte ses actionneurs (limitations énergétiques), et ses
composantes d’état (sorties dynamiques).
Le problème se pose clairement en terme de maîtrise permanente, à horizon fini, glissant avec le temps.
Les spécifications sont très dépendantes du processus, par
exemple :
— un asservissement d’antenne, sous un dôme protecteur, qui
n’est pas soumis à des perturbations aérodynamiques et reste de
structure constante, devra satisfaire des performances dynamiques
très fortes : on choisira une robustesse définie par une marge de
gain de 6 dB, mais avec un rapport TRBO/TRBF entre 5 et 10 ;
— un four de traitement thermique qui peut fonctionner avec des
charges très variables, présentant une inertie thermique qui peut
varier dans un rapport 10, va exiger une très grande robustesse.
Deux cas se présentent alors : ou bien, pour respecter un fonctionnement stable en toutes circonstances, on choisit une dynamique en
boucle fermée assez lente (TRBO/TRBF=1), ou bien, si les exigences
de réjection de perturbations sont fortes, on adapte en temps réel le
modèle interne du régulateur en fournissant l’information de charge
du four qui est probablement disponible dans le système de gestion
de production, laissant à la robustesse passive le soin de prendre en
compte tout ce qui serait trop difficile de recueillir pour des raisons
techniques ou économiques.
Deux types de considérations sont à prendre en compte :
— à partir du moment où l’on demande des performances élevées au système de commande, la probabilité de buter sur une contrainte augmente. Il importe alors de connaître le domaine des
contraintes, d’avoir une bonne robustesse et une dynamique satisfaisante : problème essentiellement temporel, qu’il s’agit de traiter
impérativement à chaque instant de façon non stationnaire ;
— l’évaluation a posteriori des caractéristiques statistiques de la
réjection des perturbations, comme moyen de qualification des performances, observées sur un horizon infini, présente également de
l’intérêt, en particulier pour l’industrie de production continue qui va
pouvoir en tirer directement une information à signification économique et optimiser les conditions de marche des unités.
La malchance est que les commandes à horizon infini sont étudiables dans un environnement théorique plus confortable que les
commandes à horizon fini, qui sont, par contre, bien adaptées aux
problèmes véritablement posés par l’utilisateur industriel.
La commande prédictive à horizon fini est donc en présence d’un
problème complexe de minimisation d’un critère de qualité, tout en
Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Mesures et Contrôle
R 7 423 − 9
COMMANDE PRÉDICTIVE ________________________________________________________________________________________________________________
respectant un champ de contraintes qui peut rapidement être de
grande dimension. La minimisation quadratique sous contrainte
d’une fonctionnelle, chapitre de mathématique appliquée abondamment étudié, peut être utilisée, de même que les techniques de programmation linéaire du type Simplex. Les solutions sont, là encore,
très ouvertes. Elles sont lourdes de mise en œuvre et nécessitent
beaucoup de calculs et sont, avec la technologie actuelle, encore
inaccessibles pour le pilotage de systèmes rapides, mais d’utilisation courante pour les processus lents du type pétrolier.
Nous traiterons ici, à titre d’exemple, une procédure approchée
mais suffisamment simple pour être implantée sur des cartes de
commande élémentaire pour des processus rapides.
C2
(b)
(a)
P2
y2
C1
u
P1
y1
Figure 15 – Commande avec contrainte d’état
3.2 Contraintes sur la variable manipulée
Dès que l’on tend à augmenter les performances d’un processus,
on touche donc les limites des actionneurs (par exemple, courant
maximum d’un moteur, débit maximum d’une vanne d’alimentation, valeurs extrêmes, vitesse et accélération limitées, etc.).
Une solution simple, mais théoriquement non optimale, consiste
à utiliser une procédure de bouclage intermédiaire qui alimente le
modèle interne, non pas avec la valeur calculée par l’algorithme,
mais avec la mesure de l’action effectivement appliquée, quelle que
soit son origine : commande manuelle, autre régulateur, valeur limitée a priori après le calcul de la commande, etc.
Notons au passage que cette procédure assure des transitions
sans à-coups, appréciées des opérateurs.
Le modèle yM est calculé avec l’action appliquée uA :
yM = yM ( uA ( n ) )
La procédure consiste à faire implicitement le scénario suivant
(figure 15).
1) calculer la commande du régulateur R1 qui tend à satisfaire la
prescription de la trajectoire de référence, puis prédire par le modèle
interne de P2 le comportement de la sortie de P2.
2) cela est fait en considérant que l’incrément de la sortie du processus est égal à l’incrément connu de la sortie du modèle calculé
de façon habituelle.
Deux cas se présentent :
a) la sortie prédite ne viole pas la contrainte sur l’horizon de coïncidence. Le projet est alors acceptable (figure 15a) ;
b) la sortie prédite viole la contrainte et, dans ce cas, le mieux qui
puisse être fait est de faire tendre la sortie de P2 vers la contrainte
C2, sans dépassement, à l’aide d’un régulateur R2 avec (figure 15b) :
valeur de consigne de P2 = valeur de contrainte C2 et y2
Dans l’équation de commande (7), on trouve alors les termes
« sortie modèle » et « sortie lâchée », calculés correctement avec
une entrée du modèle effectivement contrainte, qui donne une commande qui va être passée à travers un limiteur (figure 14), mais calculée à l’instant courant.
Procédant ainsi, le processus, vu du régulateur, reste linéaire et la
prédiction est correcte ; cependant, la commande n’est que sousoptimale, car les limitations qui peuvent intervenir sur la commande
dans le futur, et non pas uniquement instantanément, ne sont pas
prises en compte. L’expérience montre que la perte d’optimalité est
en général faible, alors que la procédure est simple, ce qui justifie sa
large utilisation.
La mise en œuvre consiste alors à avoir en permanence deux
régulateurs qui fonctionnent en permanence avec les deux consignes (P1, consigne), (P2, contrainte), avec des modèles internes alimentés par la variable manipulée effectivement appliquée, ce qui
garantit une commutation sans à-coups. Un superviseur fait alors,
dans un ordre hiérarchique défini, le test de la prédiction du projet
de l’autre régulateur.
La méthode peut s’étendre facilement à plusieurs contraintes
dynamiques par un système voteur (figure 16), qui va sélectionner
la commande qui satisfait (ou viole moins) les diverses contraintes.
Elle double ici le nombre de régulateurs, mais la procédure a une
complexité qui n’est que répétitive et linéaire avec le nombre de
contraintes, ce qui justifie son succès industriel.
3.3 Contraintes sur une sortie dynamique
Il n’est pas possible dans ce cas d’éviter la prise en compte du
futur. La stratégie sous-optimale proposée ici est utilisée pour sa
facilité de réglage.
Soit donc un processus P1 à piloter tout en respectant une
contrainte Max sur le processus dynamique P2, par exemple : réguler
la température profonde d’une pièce dans un four de traitement tout
en respectant un gradient spatial ou temporel de sa température de
surface.
R
u
uA
P
4. Mise en œuvre
Nous traitons ici complètement deux exemples : un système du
premier ordre et un système intégrateur pur, d’une part parce que
l’on rencontre en fait souvent des processus que l’on peut approximer par ce type de modèle, d’autre part parce qu’ils ont une valeur
pédagogique certaine. Tous les calculs peuvent être faits à la main,
démontrant ainsi clairement toute la mise en œuvre de la procédure,
qui, dans le cas de processus plus complexes, nécessitera de passer
par une CAO pour obtenir les équations du régulateur.
yP
4.1 Système du premier ordre
M
Figure 14 – Limitateur sur la variable manipulée
R 7 423 − 10
yM
On considère un processus de fonction de transfert :
K
H ( p ) = ----------------1 + Tp
Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Mesures et Contrôle
________________________________________________________________________________________________________________ COMMANDE PRÉDICTIVE
C1
u
M1
u1
Superviseur
C2
u
M2
u
P1
y1
P2
y2
u2
Processus
Figure 16 – Commande
contrainte avec superviseur
Caractéristiques choisies pour la commande prédictive PFC :
— consigne future constante : C (n) ;
— fonction de base : échelon ;
— trajectoire de référence (exponentielle) de décrément logarithT ech 
- où TR = TRBF/3 est la constante de temps
mique λ = exp – ---------- TR 
de la trajectoire de référence et Tech est la période de commande ;
— un point de coïncidence à H.
1°) Expression de la sortie lâchée du modèle yL(n + H ) et de la
sortie forcée yF (n + H )
Le modèle est représenté par l’équation suivante :
yM ( n + 1 ) = αM yM ( n ) + KM ( 1 – αM ) u ( n )
d’où :
[ C ( n ) – yP ( n ) ] ( 1 – λ H )
1
- + -------- y M ( n )
u ( n ) = ----------------------------------------------------------H)
KM
KM ( 1 – αM
ce qui peut être représenté par la figure 17.
La trajectoire de référence caractérisée par λ dans l’équation établie intervient comme un facteur (1 – λH) de l’écart consigne C (n ) –
sortie processus yP(n ). On constate qu’il n’y a pas d’intégrateur
explicite et par conséquent qu’il y a suppression du problème de
saturation (PID).
5°) Transfert liant la commande u à l’écart (C – yP) et yP à la
consigne
Nous avons :
Si la fonction de base est un échelon, on a donc :
H y (n)
yL ( n + H ) = αM
M
H )u(n)
yF ( n + H ) = KM ( 1 – αM
(13)
yM = HM u
(12)
et
( C – yP ) ( 1 – λ H )
1
u = ----------------------------------------- + -------- y M
H)
KM
KM ( 1 – αM
La réponse d’un système du premier ordre à une fonction échelon
à l’instant n + H est la somme de la réponse lâchée (yL) et de la
réponse forcée (yF) de ce système :
( 1 – λH )
K M u = ( C – y P ) ---------------------+ HM ⋅ u
H)
( 1 – αM
yM ( n + H ) = yL ( n + H ) + yF ( n + H )
2°) Expression de la trajectoire de référence yR(n + H)
( 1 – λH )
u ( K M – H M ) = ( C – y P ) ---------------------H)
( 1 – αM
Ralliement de la trajectoire de référence à la consigne avec une
dynamique du premier ordre : pour le point de coïncidence H :
C ( n + H ) – yR ( n + H ) = λ H [ C ( n ) – yP ( n ) ]
d’où :
1
( 1 – λH )
u
---------------- = ---------------------⋅ ----------------------H) K –H
C – yP
( 1 – αM
M
M
Pour une consigne constante :
C(n + H) = C(n)
KM ( 1 – αM ) z –1
H M ( z ) = --------------------------------------1 – αM z –1
d’où :
yR ( n + H ) = C ( n ) – λ H [ C ( n ) – yP ( n ) ]
3°) Expression de la sortie processus prédite yˆ P ( n + H )
yˆ P ( n + H ) = y M ( n + H ) + ( y P ( n ) – y M ( n ) )
4°) Expression de la variable manipulée u (n )
L’équation de commande est obtenue à partir de l’équation :
y R ( n + H ) = yˆ P ( n + H )
soit en utilisant les équations précédentes :
C ( n ) – λ H [ C ( n ) – yP ( n ) ] – yP ( n ) = yM ( n + H ) – yM ( n )
H ) = K (1 – αH )u(n)
C ( n ) ( 1 – λ H ) – yP ( n ) ( 1 – λ H ) + yM ( n ) ( 1 – αM
M
M
(δ = 0 )
soit :
1 – αM z –1
( 1 – λH )
u
---------------- = ---------------------⋅ ---------------------------------------------------------------------------------------H
C – yP
( 1 – α M ) K M ( 1 – α M z –1) – K M ( 1 – α M ) z –1
1 – αM z –1
( 1 – λH )
u
- ⋅ -------------------------------------------- = -----------------------------H )K
C – yP
( 1 – αM
1 – z –1
M
(14)
1 
- entre l’écart
On retrouve donc un intégrateur implicite  --------------- 1 – z –1
( C – y P ) et la commande u.
Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Mesures et Contrôle
R 7 423 − 11
COMMANDE PRÉDICTIVE ________________________________________________________________________________________________________________
δ
C
+
1 -- λH
+
--
H K
11 -- αM
2 M
+
u
K
+
1 + Tp
+
KM . (1 -- αM) z--1
1 -- αM z--1
yP
yM
1
KM
Figure 17 – Commande
équivalente
u (n)
Amplitude maximum
Amplitude minimum
Temps (ou n)
Figure 18 – Prise en compte de contraintes d’amplitude
6°) Prise en compte de contraintes
■ Contrainte d’amplitude
Une contrainte d’amplitude se traduit, au point de vue des équations de commande, par l’introduction d’une inégalité supplémentaire. Celle-ci fixe une limite (maximale ou minimale) que la variable
d’action ne peut pas dépasser : exemple : 0, 2 < u ( n ) < 1, 5 , ce qui
implique la prise en compte de deux inégalités (figure 18).
— algorithme avec une contrainte de vitesse et une contrainte
d’amplitude :
initialisation
début boucle sur n
acquisition de yP(n ) et de C (n )
calcul de yM(n ) = f (yM(n – 1), u (n – 1))
calcul de u (n ) = f (yP, C, yM, ...)
(1)
si u ( n ) > u ( n – 1 ) + V max ⋅ T ech alors
u ( n ) = u ( n – 1 ) + V max ⋅ T ech
(2)
si u ( n ) > U max alors u (n ) = Umax
fin boucle sur n
Les deux nouvelles lignes (1) et (2) de ce dernier algorithme mettent en évidence la possible modification de la valeur de la variable
d’action u (n ). Il faut remarquer que le calcul de yM(n ) prend en
compte, lors de chaque itération, l’éventuelle limite imposée à u (n ),
calculée lors de la précédente itération.
On obtient pour un changement de consigne le comportement de
la figure 19.
■ Contrainte de vitesse
Une contrainte de vitesse limite l’amplitude de la variation de la
variable d’action entre deux instants consécutifs, séparés par une
période d’échantillonnage Tech. Cette contrainte correspond à une
contrainte d’amplitude sur la dérivée de u (n ).
u(n) – u(n – 1)
Sous forme de représentation discrète : ---------------------------------------- < V max
T ech
dans le cas d’une contrainte sur l’accroissement, ou encore
u(n) – u(n – 1)
---------------------------------------- < V min , dans le cas d’une contrainte minimale. De
T ech
u (n)
1
0,5
0
0
même que la contrainte d’amplitude, la contrainte de vitesse se traduit par la prise en compte d’une inégalité supplémentaire
(exemple : u ( n ) < V max ⋅ T ech + u ( n – 1 ) ).
Il est à noter que la valeur de la variable manipulée u (n – 1) utilisée pour calculer la sortie modèle est celle résultant de la prise en
compte des contraintes.
■ Prise en compte des contraintes dans
commande
— algorithme sans contrainte :
initialisation
début boucle sur n
acquisition de yP(n ) et de C (n )
calcul de yM(n ) = f (yM(n – 1), u (n – 1))
calcul de u (n ) = f (yP, C, yM, ...)
fin boucle sur n
R 7 423 − 12
l’algorithme
de
5
10
15
20
25
30
Temps (unités arbitraires)
Variable manipulée
c (n)
1
0,8
0,6
yP (n) = yM (n)
0,4
0,2
0
0
5
10
15
20
25
30
Temps (unités arbitraires)
Consigne c, sorties modèle et processus
Figure 19 – Technique PFC, premier ordre, avec contraintes
de vitesse et d’amplitude (unités arbitraires)
Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Mesures et Contrôle
________________________________________________________________________________________________________________ COMMANDE PRÉDICTIVE
u
+
G
M1
yM = yP
M2
y1
+
avec
yM
y2
avec
Figure 20 – Décomposition
y M1L ( n + H ) = α H y M1 ( n )
1 – αH
y M1F ( n + H ) = G ⋅ ---------------- u ( n )
1–α
y M2 ( n + H ) = y M2L ( n + H ) + y M2F ( n + H )
y M2L ( n + H ) = α H y M2 ( n )
y M2F ( n + H ) = ( 1 – α H ) y P ( n ) .
Soit :
4.2 Système intégrateur pur
1 – αH
yˆ P ( n + H ) = α H y M1 ( n ) + G ---------------- u ( n )
1–α
+ α H yM2 ( n ) + ( 1 – α H ) yP ( n ) – yM ( n )
Considérons le système de fonction de transfert :
G z –1
H ( z –1) = ---------------1 – z –1
Décomposons-le en 2 systèmes (figure 20) où (α < 1 arbitraire) :
z –1
M 1 ( z –1) = ---------------------1 – α z –1
M 2 ( z –1) = ( 1 – α ) M 1 ( z –1)
M2
( z –1)
( 1 – α ) z –1
= ------------------------1 – α z –1
On vérifie bien que :
yM = u ⋅ G ⋅ M1 + yM M2
y M ( z –1) ( 1 – M 2 ) = u ⋅ G ⋅ M 1
y M ( z –1)
GM 1
GM 1
--------------------- = ---------------- = ----------------------------------u
1 – M2
1 – ( 1 – α ) M1
y M ( z –1)
Gz –1
Gz –1
--------------------- = ----------------------------------------------------= ----------------u
1 – αz –1 – ( 1 – α ) z –1 1 – z –1
Dans le cas nominal, on remplacera yM de la figure 20 par yP.
Équations de commande :
Les caractéristiques de la commande PFC sont :
— consigne constante : C (n ) ;
— fonction de base échelon ;
— trajectoire de référence ;
— point de coïncidence H ;
— prédiction plate écart objet-modèle.
L’équation de prédiction devient :
1 – αH
[ C ( n ) – y P ( n ) ] ( 1 – λ H ) – α H y M ( n ) – G ---------------- u ( n )
1–α
– ( 1 – α H ) yP ( n ) + yM ( n ) = 0
1 – αH
G ---------------- u ( n ) = [ C ( n ) – y P ( n ) ] ( 1 – λ H )
1–α
– ( α H – 1 ) yM ( n ) – ( 1 – α H ) yP ( n )
( 1 – α ) ( 1 – λH )
1–α
- [ C ( n ) – y P ( n ) ] + ------------- [ y M ( n ) – y P ( n ) ]
u ( n ) = ------------------ ⋅ -------------------G
G
1 – αH
avec :
yM ( n ) = yM1 ( n ) + yM2 ( n )
y M1 ( n ) = α y M1 ( n – 1 ) + Gu ( n – 1 )
yM2 ( n ) = α yM2 ( n – 1 ) + ( 1 – α ) yP ( n – 1 )
S’il n’y a pas d’erreur de modélisation HM = HP, cela implique
yM = yP.
L’expression de la variable d’action devient :
( 1 – α ) ( 1 – λH )
- [ C ( n ) – yP ( n ) ]
u ( n ) = ------------------ ⋅ -------------------G
( 1 – αH )
En poursuivant les calculs, on trouve que dans le cas nominal
(HM = HP), le système en boucle fermée se comporte bien comme un
système du premier ordre, de gain unitaire et ayant pour décrément
celui de la trajectoire de référence λ rejetant complètement les perturbations additives constantes sur la sortie (figure 21).
Dans le cas d’un système intégrateur avec retard pur, on obtient,
pour un changement de consigne, le comportement de la figure 22.
Équation de prédiction :
y R ( n + H ) – yˆ P ( n + H ) = 0
5. Commande partagée
avec :
yR ( n + H ) = C ( n + H ) – λ H [ C ( n ) – yP ( n ) ]
yˆ P ( n + H ) = y M ( n + H ) + y P ( n ) – y M ( n )
Donnons ici un exemple d’ouverture de la commande prédictive,
montrant sa capacité de s’adapter à un environnement particulier.
où :
yM ( n ) = yM1 ( n ) + yM2 ( n )
y M1 ( n ) = αy M1 ( n – 1 ) + Gu ( n – 1 )
y M2 ( n ) = αy M2 ( n – 1 ) + ( 1 – α ) y M ( n – 1 )
et :
yM ( n + H ) = yM1 ( n + H ) + yM2 ( n + H )
y M1 ( n + H ) = y M1L ( n + H ) + y M1F ( n + H )
5.1 Deux actions exclusives
Il arrive souvent que l’on dispose de plusieurs variables d’action
pour piloter la sortie d’un processus soumis à plusieurs actionneurs
de nature différente (gain statique, dynamique). C’est typiquement
le cas de la commande des réacteurs chimiques où, pour chauffer le
fluide caloporteur, l’on dispose par exemple d’un crayon électrique
alors que, pour le refroidir, il faut passer par un échangeur thermique. La solution classique avec un régulateur PID est de considérer
que l’on a un seul actionneur et de régler un PID sur un processus
Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Mesures et Contrôle
R 7 423 − 13
COMMANDE PRÉDICTIVE ________________________________________________________________________________________________________________
1
0,5
0
u (n)
--0,5
--1
0
2
4
6
8
10
12
14
16
18
20 Temps
commande, on déclenche des oscillations de pompage du fluide
caloporteur, alors que la température du réacteur reste encore relativement correcte, tandis que la diminution escomptée du temps de
réponse n’est pas obtenue. La difficulté vient de ce que, lors de la
commutation d’un organe à l’autre, les sorties lâchées des deux systèmes ne sont pas prises en compte, alors qu’avec PFC, il n’y a pas
de difficultés particulières. L’équation de commande comporte alors
2 sorties lâchées et forcées (à droite), alors que les sorties lâchées et
sorties modèles sont toujours actives. A chaque échantillonnage, on
calculera d’abord une action, l’autre étant mise à 0 ; si le résultat est
positif, elle est appliquée, sinon c’est l’autre action qui le sera.
On note yLF, yMF, yFF les sorties lâchées, modèle et forcées froides
et yLCH, yMCH, yFCH les sorties lâchées, modèle et forcées chaudes.
Variable manipulée
Calcul de uCH :
( C 0 – y P ) ( 1 – λ H ) = y LCH ( n + H ) – y MCH ( n ) + y LF ( n + H )
1,5
– y MF ( n ) + u CH ( n ) S FCH ( n + H )
c (n)
1
y
yP (n) = yM (n)
0,5
Calcul de uF :
( C 0 – y P ) ( 1 – λ H ) = y LCH ( n + H ) – y MCH ( n ) + y LF ( n + H )
– y MF ( n ) + u F ( n ) S FF ( n + H )
0
0
2
4
6
8
10
12
14
16
18
20 Temps
Consigne c, sorties modèle et processus
Figure 21 – Technique PFC : intégrateur pur, avec perturbation
sur l’entrée
Chaque action peut également être passée dans un limiteur et
fournir ainsi une commande agissant sur contrainte. L’on gagne
alors en performance et, ce qui est peut-être encore plus apprécié,
en commodité de réglage.
5.2 Deux actions coopératives
0,8
0,6
0,4
u (n)
0,2
0
0
5
10
15
20
25
30 Temps
Variable manipulée
c (n)
1
Un autre cas est celui où l’on dispose de deux actionneurs qui
vont agir ensemble en permanence, mais qui ont encore des caractéristiques différentes. Par exemple, l’un a une grande autorité de
commande mais une dynamique lente, à laquelle on va demander
de contrer les perturbations à basse fréquence et de tenir le régime
permanent, alors que l’autre a une dynamique rapide mais une
excursion faible. Le but est alors de faire tendre la variable d’action
rapide vers u10 , au milieu de sa plage d’action, pour contrer les perturbations à hautes fréquences, alors que l’action lente tient le
régime permanent. Le risque avec une solution PID est d’avoir une
commande non coopérative, à savoir l’action lente contrerait
l’action rapide qui lui serait opposée. La solution PFC consiste à
modifier le critère de commande (10) en introduisant un terme
supplémentaire de satisfaction de l’objectif, et de faire tendre u1
vers u10 , alors qu’en régime permanent, u2 est stabilisé :
0,8
0,6
ymay (n)
0,4
C =
yP (n) = yM (n)
H2
H2
H1
H1
∑ [ yRef ( n ) – yP ( n ) ] 2 + λ1 ∑ [ u1 ( n ) – u10 ( n ) ] 2
0,2
H2
+ λ2 ∑ [ u2 ( n ) – u2 ( n – 1 ) ] 2
0
0
5
10
15
20
25
30 Temps
ymay sortie modèle non retardée
Consigne c, sorties modèle et processus
Figure 22 – Technique PFC : intégrateur pur, avec retard pur
(unités arbitraires)
« moyen », intermédiaire entre les deux processus réels, de couper
en deux le champ d’action : de 0 % à 50 % de l’autorité de commande, l’action sera aiguillée vers le « froid », et au-delà vers le
« chaud » (figure 23).
S’il s’agit d’une régulation peu exigeante, un réglage moyen
robuste, donc mou, donnera satisfaction ; mais, dès que l’on veut
diminuer le temps de réponse, tirer le maximum du système de
R 7 423 − 14
H1
Le critère est nul si, et seulement si :
— satisfaction de la trajectoire de référence : y Ref ( n ) = y P ( n )
— u1 tend vers sa valeur de repos idéale : u1(n ) = u10
— u2 se stabilise à une valeur qui va contrer les perturbations
u2(n) = Cte
En dérivant l’expression du critère par rapport à u1 et u2, on montre que la solution obtenue est équivalente, d’une part, à ne considérer qu’une variable d’action passée à travers deux filtres
complémentaires :
F 2 = 1 ⁄ ( 1 + τp )
et
F 1 = τp ⁄ ( 1 + τp )
et, d’autre part, à attribuer la sortie du filtre passe-bas F2 à l’action
lente et la sortie du filtre dérivateur F1 à la variable d’action rapide
qui doit tendre vers u10 (figure 24).
Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Mesures et Contrôle
________________________________________________________________________________________________________________ COMMANDE PRÉDICTIVE
uCH
Chaud
+
+
PID
P
--
--
uF
Froid
Figure 23 – Commande partagée
exclusive
c) Contraintes (entrée-sortie)
u1 → u10 = 0
F1
u
P1
PH
+
R
+
F2
P2
PB
Figure 24 – Commande partagée coopérative
6. Évaluation
Question souvent posée à juste titre par un automaticien industriel, familier de commande classique PID : quels sont les avantages
et inconvénients comparés de la commande prédictive par rapport
aux techniques classiques ? Une expérience de longue date, dans de
nombreux secteurs, permet de présenter objectivement les performances et limites de la commande prédictive.
6.1 Avantages
a) Puissance
Tout système théoriquement commandable, monovariable, multivariable, linéaire ou non, stationnaire ou non, avec contraintes
diverses, peut être piloté par cette technique. Si l’on doit toujours
exploiter au maximum toutes les particularités de chaque processus, la procédure de mise en œuvre reste la même pour tout processus.
La méthode est générique et permet toutes sortes d’extensions,
nous en avons vu quelques-unes (commandes partagées, par
exemple).
C’est la caractéristique fondamentale et unique, qui en fait tout
l’intérêt industriel. La prise en compte des contraintes peut se faire
de façon complète ou approchée suivant l’optimalité recherchée et
les moyens de calculs disponibles.
d) Tendance
La prise en tendance d’une perturbation mesurée ne peut se faire
que si l’on se donne un rendez-vous dans le futur, ce qui impose en
fait le schéma prédictif. Facile à mettre en œuvre, stable car en boucle ouverte, cette possibilité est à utiliser dès qu’elle est possible.
Elle permet de diminuer les écarts de régulation tout en ne compromettant pas la robustesse.
e) Précision
La projection de la commande sur une base future permet de ne
pas avoir d’erreur de traînage sur une consigne quelconque connue
ou estimée sur l’horizon de coïncidence : propriété très appréciée
des équipements réalisant des asservissements de poursuite.
f) Compromis dynamique - stabilité
Aucune commande n’est robuste par nature.
Cette propriété s’oppose aux performances dynamiques et le but
est de « casser » le caractère fatal de cette opposition. La démarche
professionnelle honnête est de laisser le concepteur choisir entre
ces deux exigences en lui présentant les termes du compromis.
g) Professionnalisme
Étant systématique et rationnelle, la commande prédictive est
susceptible de rentrer dans le cadre d’une démarche de CAO, capable d’attaquer des problèmes industriels de grande dimension.
Documentée à toutes les étapes, car partant d’un modèle, elle est
donc transférable et facile à maintenir par la justification explicite de
ces choix.
Cependant, elle laisse la porte ouverte à toutes « astuces » spécifiques qui vont valoriser l’auteur.
h) Diagnostic
Le modèle est disponible en ligne. La comparaison entre les sorties ou états du modèle et du processus permet d’aller plus loin que
le simple autocompensateur ici exposé. Une analyse poussée peut
conduire aux techniques de diagnostic, de maintenance prédictive
selon état, etc., qui contribue fort à la diminution du démérite.
6.2 Inconvénients
b) Insensibilité
Fondamentalement, toute commande revient à inverser le processus à réguler, ce qui amène à introduire des « zéros » dans le régulateur, source d’une grande sensibilité aux bruits divers qui affectent
les mesures. La spécification d’erreur nulle en régime permanent
impose également d’avoir un intégrateur dans ce régulateur, source
de problèmes de commutation et de désaturation. Si implicitement
ces fonctions sont satisfaites, elles ne le sont pas explicitement, ce
qui élimine ainsi une grande sensibilité aux bruits et les problèmes
de gestion de l’intégrateur.
Ils sont la contrepartie normale des avantages, deux aspects
opposés de la même caractéristique fondamentale issue de la
modélisation.
a) Nécessité d’un modèle : difficulté scientifique
Il faut faire explicitement une réflexion de modélisation. Celle-ci
peut être complète et déboucher sur un modèle de connaissance, ou
rapide et se contenter d’un modèle de représentation (boîte noire).
Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Mesures et Contrôle
R 7 423 − 15
COMMANDE PRÉDICTIVE ________________________________________________________________________________________________________________
Elle est le plus souvent intermédiaire et nécessite de mettre en
œuvre des outils de simulation et d’identification.
Modéliser présente toujours un risque puisque le produit final
(équations mathématiques) est par nature hétérogène avec les données de base.
b) Puissance de calcul : difficulté technique
Par rapport à un PID classique, il est clair que, s’il peut s’appliquer,
son rapport « puissance de calcul/performance » est bien supérieur.
Même dans le cas de régulateur mis sous forme compacte, le
nombre d’opérations augmente avec l’ordre du processus et la prise
en compte des contraintes.
L’optimalité a un coût, interdisant l’emploi de la méthode dans
des organes frustres de calcul, pour certains processus très rapides.
L’espoir que les progrès de la technologie électronique permettent de disposer de calculateurs de plus en plus performants est à
modérer par les exigences de plus en plus grandes demandées aux
systèmes de commande qui satureront éternellement les possibilités offertes. L’utilisation en temps réel de modèle de connaissance
(déjà possible dans certains cas), qui apportera une robustesse
active remarquable tant en état qu’en structure par une adaptation
naturelle à l’environnement, est très exigeante en puissance de traitement (mémoire, temps de cycle).
c) Nouvelle démarche : difficulté industrielle
Après les inconvénients scientifiques et technologiques, voyons
maintenant les modalités industrielles de mise en œuvre, liées aux
structures de l’entreprise.
Les répartitions de responsabilité étaient auparavant bien clairement distribuées dans l’entreprise. L’automatique était l’affaire des
régleurs : instrumentation, actionneurs, capteurs, maintenance et
calculateurs, fonction essentiellement perçue par le reste de l’entreprise par sa partie matérielle visible.
Le producteur, spécialiste du processus, connaît son système
dans ses aspects matériels, fonctionnels, logiques, etc., et utilise, en
tant que de besoin, les services du « régleur ». Il est plus soucieux
d’optimalité de marche que de régulation dynamique, alors que
l’automaticien, fonction horizontale de l’entreprise, n’a pas à connaître tous les processus.
L’automatique à base de modèle nécessite, par contre, une coopération certaine entre ces deux acteurs, qui peut, pour toutes sortes
de raisons dépassant le cadre technique qui est ici le nôtre, se mettre en place ou non.
L’automatique avancée est un projet de l’entreprise et qui ne peut
être entrepris sans prise de conscience et désir de travailler dans ce
nouvel environnement culturel.
Le personnel doit alors avoir une formation complémentaire portant sur la modélisation, l’identification, la simulation et la commande avancée, dont certains décideurs auront peut-être encore,
pendant un certain temps, des difficultés à en apprécier l’utilité.
7. Pratique industrielle
Quelles sont les étapes qu’il convient de suivre pour attaquer un
problème de commande industriel avec ce type de stratégie de
commande ?
Décrivons ici toutes les étapes possibles. Elles peuvent, suivant
les cas, être banales ou critiques.
a) Première approche
Il s’agit de récupérer, à un niveau plus qualitatif que quantitatif,
toutes informations sur le système à piloter. Il faut consulter la littérature sur le sujet, les « experts », l’expérience des utilisateurs, à
tout niveau, etc., et recueillir des données objectives, avec des tests
simples pour se familiariser avec la nature des signaux : variables
d’action, de tendance, à réguler. La nature des processus (stables,
R 7 423 − 16
intégrateurs, mono ou multivariables, retard pur, etc.), variation de
la structure suivant les conditions de marche, contraintes diverses,
etc.
Première tentative de mise en correspondance entre des faits
expérimentaux et des hypothèses. Premières spécifications : que
demande-t-on au système de commande ? régulation, poursuite,
optimisation, etc. ?
Toutes ces réflexions débouchent sur un premier simulateur, frustre, qui n’a que la simple ambition de mettre en place une première
cohérence entre toutes ces informations, sans prétendre simuler
quantitativement de façon précise le réel.
C’est une phase délicate, où le métier intervient et où les contacts
humains ont leur importance.
Sur ce premier simulateur, on va pouvoir dialoguer et entreprendre l’étape fondamentale suivante.
b) Synthèse des protocoles d’essais
Ou bien le processus n’existe pas et, dans ce cas, on travaillera
sur un modèle théorique, qui a le plus souvent servi au calcul de la
structure matérielle du processus, ou bien il existe et il va falloir par
itérations successives caler les modèles qui vont se perfectionner à
l’occasion d’application de signaux de tests. Cela va permettre de
faire tendre le comportement du modèle vers celui du processus.
Il convient tout d’abord de s’assurer de la qualité du système de
mesure : étalonnage cohérent des capteurs, fidélité de l’instrumentation, qualité du système d’acquisition de données, fréquence
d’échantillonnage, capacité de stockage, possibilité de tracer et
d’observer les signaux, etc.
L’ensemble des signaux de test, dit protocole d’essai, va jouer un
rôle fondamental. C’est pratiquement le seul contact avec le processus et son propriétaire, sauf au moment de l’implantation définitive,
et c’est de lui que va découler la qualité du modèle et donc du régulateur.
Le protocole idéal pour le propriétaire qui ne veut pas être perturbé serait un test de durée nulle et d’amplitude nulle !
Ce protocole fera donc en général l’objet d’une optimisation, fatalement spécifique, ce qui exclut des techniques conçues sur des
considérations théoriques qui ne prenaient pas en compte à l’époque ces contraintes de diminution de la nuisance (amplitude-durée)
que représente un test expérimental. Les techniques du type signal
binaire pseudo-aléatoire, sont donc à proscrire d’une façon
générale ; elles donnent une précision insuffisante dans les basses
fréquences au prix d’une durée (ou amplitude) qui peut être dans un
rapport 20 avec un protocole optimisé.
L’expérience montre que c’est sur ce poste, avec la réflexion sur la
structure du modèle, que l’on passe le plus de temps.
c) Application des essais
Étant volontairement rares, ces essais doivent donc être préparés
avec grande précaution. Les signaux de test sont appliqués soit en
boucle ouverte, soit en boucle fermée comme des consignes additives à la consigne d’un régulateur dont il s’agit alors d’améliorer les
performances, suivant une procédure qui va se perfectionner progressivement au fur et à mesure de la connaissance du processus.
Tout doit être noté avec soin lors des essais, et un test de ce type
ne peut être fait en « cachette », car il va mobiliser des intervenants
divers.
d) Prétraitement
La probabilité que des artefacts perturbent l’essai est très grande :
entrées secondaires autoritaires, défaut du système d’acquisition,
interventions intempestives d’un opérateur, etc. Il convient alors de
vérifier, à vue, la qualité des enregistrements. A l’opposé, une
démarche académique qui consisterait à alimenter sans intervention humaine un algorithme d’identification avec des données
inexploitables est à proscrire.
e) Identification
Elle doit donner de préférence tous les modèles qui sont à une
distance donnée du processus, dans le double but de pouvoir opti-
Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Mesures et Contrôle
________________________________________________________________________________________________________________ COMMANDE PRÉDICTIVE
miser les protocoles d’essais et d’avoir une mesure de la spécification de robustesse qui va être demandée au régulateur.
f) Simulateur
Tous les modèles partiels ainsi identifiés, concaténés, créent un
simulateur, sur lequel des tests complémentaires de son pouvoir
prédictif sont appliqués, à partir d’une base de données qui n’a pas
servi à l’identification. Des analyses de sensibilité sont alors possibles pour déterminer les risques encourus par les variations de
structure éventuelles du processus.
g) Retour sur les spécifications
Le processus est alors mieux appréhendé, mieux perçu par les
intervenants, et l’expérience montre que les spécifications évoluent
toujours. La fixation des contraintes est mieux argumentée, les compromis entre robustesse et dynamique plus clairs dans la tête de
l’exploitant.
h) Régulateur
C’est la récompense de tous les efforts. La CAO de commande
prédictive fournit alors tous les éléments de choix dans le domaine
temporel et fréquentiel en ce qui concerne la dynamique, et toutes
les marges de stabilité nécessaires. Le respect des contraintes
apporte alors tous les avantages et une comparaison avec la situation antérieure et la situation proposée est alors faisable dans les
environnements (perturbation d’état et de structure) qui doivent être
plus durs que ce que le processus ne rencontrera jamais.
Une évaluation de l’intérêt économique est à faire. Si cet intérêt
est confirmé, il faut alors passer à l’implantation dans un organe de
calcul qui va recevoir, soit directement le code C généré par la CAO,
soit une formule générique dont les paramètres vont être chargés
par un organe supérieur.
La mise en route devra être faite avec prudence, en particulier en
demandant une trajectoire de référence assez molle au début, à durcir avec le temps. C’est là que l’on apprécie la validation du modèle,
puisque seules les erreurs d’implantation du régulateur sont à craindre. La génération de code, sans intervention de transfert par un
intermédiaire humain, donc faillible, facilite ici la tâche.
i) Évaluation
Il importe alors d’évaluer le plus objectivement possible les performances comparées, entre « avant » et « après », soit par une
réponse dynamique, soit par un histogramme de l’écart par rapport
à la consigne. Mais la commodité de réglage et la souplesse de
modification des objectifs sont deux éléments importants. Opérateur, producteur, directeur, n’attendent pas d’un régulateur nouveau
les mêmes améliorations et ils doivent être tous satisfaits.
j) Maintenance
Tous les dangers commencent alors. Il est maintenant relativement aisé, en procédant strictement suivant le plan ci-dessus
exposé, de faire des progrès techniques et économiques très signi-
ficatifs. Rester toujours adapté malgré des changements d’objectifs,
de matière première, d’instrumentation, etc., est autrement plus difficile. Amateurisme et professionnalisme se distinguent à ce niveau.
La documentation, la justification des choix de modèle, du
réglage du régulateur, etc., doivent être facilement accessibles et de
façon claire. Une formation est nécessaire ; sinon, au moindre changement d’environnement, il y aura régression et retour à l’état primitif antérieur. Ordre et rigueur s’imposent.
Il faut faire remarquer que la disponibilité de la sortie du modèle
en temps réel et de la sortie du processus, ouvre la porte vers les
techniques de diagnostic et de maintenance suivant état, qui peuvent apporter une contribution significative à l’augmentation de la
disponibilité, et donc de la production, du processus.
8. Conclusion
Ce qui a été présenté ici n’a d’autre prétention que d’être une simple introduction aux concepts de la commande prédictive, car beaucoup reste à dire tant au niveau des développements et justifications
théoriques que de l’implantation informatique des régulateurs. Il ne
s’agissait que de présenter les principes, qui nécessitent un effort
certain de compréhension.
Cette commande n’est pas à ajouter à la liste des commandes proposées par ailleurs, car elle est plus une démarche qu’une proposition spécifique, comme ont pu l’être, dans le passé, le PID, la
commande quadratique ou le placement des pôles, etc.
C’est une démarche ouverte, qui, si l’on respecte ses principes
fondamentaux, est capable d’intégrer précisément tous les résultats
de ces méthodes. Mises à part les commandes de niveau 0 : manuel,
tout ou rien, logique, PID, etc., commandes sans modèle qui en
nombre couvriront toujours l’essentiel des besoins alimentaires,
l’avenir appartient, lorsqu’il s’agit de piloter des unités économiquement significatives, aux commandes avec modèle interne. Qu’elles
soient prédictives ne complique pas le travail de l’automaticien mais
lui donne la possibilité technique, et la rentabilité économique attachée, de prendre en compte les contraintes, porte ouverte vers
l’optimalité à horizon fini, qui est le véritable problème industriel à
résoudre.
La difficulté, éternelle, reste donc la modélisation, investissement
premier fondamental, qui fait sortir du domaine strict de la commande. L’automaticien industriel qui était un « régleur », car il adaptait les paramètres de réglage d’un régulateur préexistant, devient
en partie un modéliste, et cette fonction rencontre celle du
« spécialiste processus », avec tout l’intérêt que cela entraîne et toutes les difficultés organisationnelles attachées.
Références bibliographiques
[1]
BITMEAD (R.R.), GEVERS (M.) et WERTZ (V.).
– Adaptive optimal control : the thinking
man’s GPC. Prentice-Hall, 1990.
[2]
BORNE
(P.),
DAUPHIN-TANGUY
(G.),
RICHARD (J.P.), ROTELLA (F.) et ZAMBETTAKIS (I.). – Commande et optimisation des processus. Éditions Technip, 1992.
[3]
BOUCHER (P.) et DUMUR (D.). – La commande prédictive. IFP Technique, 1996.
[4]
CLARKE (D.W.), MOHTADI (C.) et TUFFS
(P.S.). – Generalized predictive control.
Part 1 : The basic algorithm, Automatica,
vol. 23, n° 2, p 137-148, and Generalized predictive control. Part 2 : Extensions and inter-
[5]
[6]
[7]
[8]
pretations. Automatica, vol. 23, n° 2, p 149160 [GPC], 1987.
CORRIOU (J.P.). – Commande des procédés.
Tec. et Doc. 1996, Paris.
CUTLER (C.R.) et RAMAKER (B.L.). – Dynamic
matrix control, A computer control algorithm, Proceedings JACC, San Francisco,
USA, 1980.
MORARI (M.) et ZAFIRIOU (E.). – Robust process control. Prentice-Hall, Englewood Cliffs,
New Jersey, 1989.
RICHALET (J.), RAULT (A.), TESTUD (J.L.) et
PAPON (J.). – Model predictive heuristic control : applications to industrial processes.
Automatica, vol. 14, n° 5, p 413-428, 1978.
[9]
RICHALET (J.). – Pratique de l’identification.
Hermès, 1991.
[10]
RICHALET (J.). – Pratique de la commande
prédictive. Hermès, 1993.
[11]
SCATTOLINI (R.) et BITTANTI (S.). – On the
choice of the horizon in long-range predictive
control - some simple criteria. Automatica,
vol. 26, n° 5, p 915-917, 1990.
[12]
SOETERBOEK (A.R.M.). – Predictive Control.
Prentice-Hall [UPC], 1992.
[13]
RICHALET (J.). – Modélisation et identification des processus. R 7 140 (4. 1983), Techniques de l’Ingénieur, traité Mesures et
Contrôle, volume R7.
Toute reproduction sans autorisation du Centre français d’exploitation du droit de copie est strictement interdite.
© Techniques de l’Ingénieur, traité Mesures et Contrôle
R 7 423 − 17