Même si les personnes chargées de construire les modèles sont souvent les « personnes chargées de la collecte des données », je connais très peu d’associés qui pensent qu’il s’agit d’une partie particulièrement agréable de leur travail. Pourtant, la collecte de données est un élément indispensable de la plupart des projets de simulation. Dès le début de chaque projet de simulation, il convient d’identifier les données qui seront nécessaires et la manière dont elles seront obtenues.
Identifier les données
Il existe de nombreux types de données dont vous pourriez avoir besoin. Comme pour d’autres aspects de la simulation, il est préférable d’identifier les données requises de manière itérative. Commencez par examiner les principales zones de votre modèle : sections d’arrivée, sections de traitement, zones de stockage, zones de départ, mouvements internes et autres aspects similaires. Pour chaque zone, examinez les paramètres clés nécessaires à sa description. Par exemple, dans une zone d’arrivée : Qu’est-ce qui arrive ? Existe-t-il plusieurs types d’entités ? Ont-elles toutes des attributs descriptifs importants ? Vous attendez-vous à ce que les arrivées suivent un certain type de schéma temporel ? L’examen de ces questions vous aidera également à définir le modèle et l’approche de modélisation et, de manière itérative, à obtenir plus de détails sur les données exactes requises.
Localiser les données
Avec le niveau actuel d’automatisation et de suivi électronique, la disponibilité des données est devenue plus fréquente. S’il s’agit d’un système existant, il se peut que des données soient déjà collectées régulièrement. S’il s’agit d’un nouveau système, le fournisseur peut avoir accès à des données collectées sur des systèmes similaires. Dans les deux cas, l’existence de données ne vous facilite pas nécessairement la tâche. Par exemple, vous êtes peut-être intéressé par le temps de traitement d’une opération, et ce temps de traitement est automatiquement saisi. Mais ce qui n’est pas toujours évident, c’est ce que ce chiffre représente exactement. Inclut-il (parfois) le temps pendant lequel le processus a échoué (peut-être que les échecs courts sont intégrés, mais pas les échecs longs) ? Inclut-il (parfois) le temps pendant lequel un opérateur est parti en pause et a oublié de se déconnecter correctement ? La détection et le nettoyage de ces situations peuvent être une partie fastidieuse et frustrante de l’utilisation des données existantes.
Créer des données
Si les données dont vous avez besoin n’existent pas ou ne peuvent pas être nettoyées de manière appropriée, vous devez souvent les créer. Sur un système existant, la méthode la plus précise consiste à saisir électroniquement les données ou à faire réaliser des études manuelles pour les déterminer. L’une ou l’autre de ces méthodes peut s’avérer très coûteuse. Une autre approche consiste à obtenir des estimations de la part des personnes qui connaissent l’entreprise, c’est-à-dire les personnes qui la dirigent ou la gèrent. Bien que rapide et peu coûteuse, cette méthode peut être entachée de biais et d’inexactitudes. De même, pour un système qui n’existe pas encore, vous devrez peut-être vous appuyer sur les spécifications fournies par un vendeur, ce qui risque également d’introduire des biais et des inexactitudes. Nous reviendrons plus tard sur la manière de gérer cette situation.
Il s’agit d’un aperçu rapide de quelques étapes initiales à prendre en compte dans la collecte de données. La semaine prochaine, j’aborderai d’autres étapes concernant l’utilisation de ces données. D’ici là, bonne modélisation !
Dave Sturrock
VP Produits – Simio LLC