Respect des délais et du budget : Comment les réseaux neuronaux peuvent résoudre les problèmes d'inventaire

Imaginez que vous dirigiez une fabrique de gâteaux. L'une de vos principales matières premières est la farine, que vous utilisez en grandes quantités, et vous devez donc commander de la farine assez régulièrement. Il est cependant difficile de prévoir exactement combien vous devez en commander, car vos commandes de gâteaux peuvent varier considérablement. Au cours d'un mois calme, une livraison hebdomadaire régulière de farine peut faire l'affaire, mais en période de forte activité, par exemple avant Noël, vous devrez peut-être passer quelques commandes urgentes pour faire tourner les lignes de production et vous assurer que les clients ne sont pas déçus.

Thomas Asikis (Université de Zurich) et PRN Automation.

Bien entendu, les commandes urgentes sont coûteuses. Il n'est donc pas souhaitable d'en prévoir un trop grand nombre. D'un autre côté, stocker de la farine pour éviter les frais de livraison urgente implique des coûts d'entreposage supplémentaires, voire du gaspillage (la farine a une durée de conservation limitée !). Et bien sûr, manquer de matière première comporte le risque d'arrêts de production et de perte de clients. C'est un équilibre très délicat à trouver.

Ce problème - connu sous le nom de "problème de double approvisionnement", où "double approvisionnement" fait référence aux deux options de livraison (lente mais abordable, ou rapide et coûteuse) - est bien sûr ancien et plutôt prosaïque. Mais ces dernières années, les mathématiciens ont travaillé sur de nouvelles solutions, qui ont permis des améliorations impressionnantes de l'efficacité en seulement 15 ans ; et aujourd'hui, l'apprentissage automatique permet de se rapprocher encore plus d'un résultat optimal.

Réduire l'écart

Les problèmes d'approvisionnement en stock sont un sous-ensemble spécifique de problèmes de contrôle optimal, un domaine mathématique dont Lew Pontrjagin et Richard Bellman ont été les pionniers au milieu du 20ème siècle (et qui a été utilisé pour planifier les missions lunaires Apollo). En 2007, l'état de l'art en matière de double approvisionnement était l'heuristique de l'"indice unique", qui permettait une gestion des stocks avec un "écart d'optimalité" (c'est-à-dire la différence entre les coûts réels et les coûts optimaux) d'environ 10 à 20 %. L'année suivante, l'approche du "double indice" a permis de réduire cet écart à environ 1 à 2 %.

Bien entendu, cet écart est un calcul théorique qui ne peut généralement pas être déterminé avec précision dans le monde réel. Il s'agit néanmoins d'une indication utile de l'ampleur de l'inefficacité du système. En 2019, après une décennie de recherches supplémentaires sur la percée du double indice, cet écart a été réduit à 0,5-1 % grâce à la méthode du "double indice plafonné".

Il s'agit d'une amélioration considérable, mais il reste encore de l'argent sur la table : comment pouvons-nous éliminer la dernière partie du gaspillage dans le système ? Comment parvenir au meilleur système possible pour une gestion efficace des stocks?

Lucas Bottcher — Lucas Böttcher (Frankfurt School of Finance & Management et Université de Floride)

Dans ce domaine de recherche étonnamment actif, une nouvelle approche a vu le jour, qui exploite la capacité des réseaux neuronaux récurrents à apprendre et à s'améliorer. Cette solution, conçue par une équipe de recherche paneuropéenne composée de Thomas Asikis (Game Theory, Université de Zurich), de Lucas Böttcher (Frankfurt School of Finance & Management et Université de Floride) et de Ioannis Fragkos (Rotterdam School of Management Université Erasmus de Rotterdam), utilise un réseau neuronal dynamique pour calculer les calendriers de commande possibles et les coûts associés, en tenant compte d'un large éventail d'éléments d'entrée.

Les résultats sont impressionnants. Après seulement quelques minutes d'entraînement sur un ordinateur personnel ordinaire, le réseau neuronal peut obtenir des écarts d'optimalité nettement plus faibles que ceux obtenus à l'aide des calculs standard de "l'indice dual plafonné". Dans un grand nombre d'instances étudiées par les auteurs, le réseau neuronal a soit surpassé la politique de double indice plafonné, soit obtenu des performances égales. En outre, ils ont démontré que leur méthode peut être intégrée de manière transparente au système avec des données de la demande réelle, ce qui permet de relever efficacement le défi de l'apprentissage des politiques de commande optimales dans les scénarios d'approvisionnement du monde réel.

Training time — Le réseau neuronal dynamique effectue des calculs répétés, les compare aux résultats précédents et ajuste son travail en conséquence, générant ainsi une efficacité toujours plus grande. Dans ce graphique, le haut de la bande bleue montre les résultats typiques et inefficaces des approches standard, mais en bas, l'apprentissage continu entraîne une réduction constante de l'écart d'optimalité - se rapprochant de plus en plus de l'efficacité parfaite.

La clé de cette avancée réside dans l'élément "informé par la dynamique". Cela signifie que le réseau neuronal est conçu pour tenir compte de la manière dont le système optimisé se comporte au fil du temps. La conception de cette approche s'appuie également sur les connaissances existantes de la structure des solutions optimales - les neurones du réseau ressemblent aux "bonnes manières" définies de passer des commandes, de sorte que le réseau s'appuie sur des pratiques déjà validées. Le résultat ? Des coûts moins élevés, mais aussi moins de déchets et une meilleure satisfaction de la clientèle - au bénéfice des consommateurs et de l'environnement, ainsi que de l'usine.

nnc cdi order comparison — Par rapport au meilleur résultat obtenu précédemment dans le cadre du système à double indice plafonné (en orange), le contrôleur à réseau neuronal (CNR) obtient une efficacité nettement supérieure en passant davantage de commandes régulières (à gauche) et moins de commandes urgentes, ce qui permet d'économiser des coûts sans pénurie.

Bien que le problème de l'inventaire soit un exemple très concret qui montre des gains pratiques importants, l'utilité de cette approche va au-delà de la logistique. La conception de ces réseaux neuronaux permet d'obtenir de meilleurs résultats que les méthodes traditionnelles développées en recherche opérationnelle et en contrôle optimal, avec seulement quelques minutes de temps de calcul. Le processus de conception de ces réseaux peut être appliqué efficacement à tout système complexe pour lequel nous disposons de modèles qui capturent son évolution dans le temps, ce qui permet de résoudre des problèmes dans le domaine des transports et des soins de santé, par exemple. En particulier, l'émergence de jumeaux numériques médicaux (modèles informatiques simulant des systèmes biomédicaux) est très prometteuse pour faire progresser le traitement et le développement de médicaments. Cela est possible grâce à l'intégration de modèles informatiques de patients avec des contrôleurs de réseaux neuronaux efficaces.

La résolution du problème de contrôle des stocks à double source est une belle illustration de la puissance de l'apprentissage automatique - malgré des efforts de recherche intensifs au cours des dernières années, les méthodes computationnelles avaient du mal à apporter de nouvelles améliorations. Mais des améliorations sont encore possibles, comme le montre ce réseau neuronal informé par la dynamique. Il est passionnant d'imaginer combien d'autres problèmes délicats pourront faire l'objet d'approches similaires dans les années à venir.

Plus d'informations :

L. Böttcher, T. Asikis, and I. Fragkos, “Control of Dual-Sourcing Inventory Systems Using Recurrent Neural Networks,” INFORMS Journal on Computing, vol. 35, no. 6, pp. 1308–1328, Nov. 2023, doi: 10.1287/ijoc.2022.0136.

Pour toute demande de renseignements, veuillez contacter Linda Seward

Actualités & informations