Les services managés regroupent l’ensemble des prestations visant à assurer la performance, l’intégrité et le fonctionnement optimal de votre système d’information (SI).
Cette gestion de l’activité opérationnelle du SI peut être confiée en tout ou partie à votre prestataire qui devient un véritable partenaire de l’entreprise, compte tenu des enjeux de cette fonction.
Les engagements et responsabilités sont clairement établis par un contrat de prestation et un contrat de support (SLA) dédiés. Ceux-ci définissent notamment le périmètre d’intervention, la nature des prestations, mais aussi les niveaux de criticité des incidents, les garanties de temps d’intervention, de rétablissement par la mise en place d’un contournement si nécessaire (GTI/GTR), de correction définitive et tout autre paramètre permettant de combiner maîtrise et sérénité pour l’entreprise.
Les services managés intègrent ainsi le monitoring, la maintenance, la gestion des incidents et leur résolution, l’application des mises à jour et la gestion de la sécurité appliqués à l’ensemble du système d’information (comprenant les équipements réseaux, les serveurs, les solutions de stockage, la sauvegarde et les équipements associés). Ils regroupent donc un ensemble de prestations en accord avec la DSI (Direction du Système d’Information) afin de gagner en agilité, sérénité, pérennité et accompagner la stratégie de l’entreprise dans sa transformation numérique.
Pour l’ensemble de ces opérations, LMSYS a fait le choix de former l’ensemble de son équipe aux pratiques ITIL visant à fournir un service de qualité. Ceci implique notamment l’usage de CMDB (base de données de gestion de configuration) qui permet d’identifier chaque composant du SI appelé « élément de configuration. Dans ce cadre la création d’un comité de pilotage récurrent est mise en place. Ce comité réalise le suivi des indicateurs défini dans le cadre du contrat de support (par exemple, le nombre de tickets traités, temps de résolution moyen, etc.), et de la gestion opérationnelle de l’infrastructure (indicateurs tels que le taux d’usage des serveurs, le taux d’occupation de la capacité de stockage, etc.) permettant ainsi de mesurer la qualité du service rendu et de prendre des décisions futures pour l’infrastructure.
Monitoring : Supervision et métrologie
La supervision correspond au traitement de l’information instantanée, c’est-à-dire à tout ce qui relève des occurrences qui peuvent affecter le SI. LMSYS a fait le choix du système open source iCinga 2 pour assurer les services de supervision.
Ses agents, déployés dans le SI permettent de gérer le contrôle des services, l’identification enregistrement des évènements, l’envoi de notification d’alarmes… tout ce qui permet de nourrir l’historique des évènements.
Les journaux de logs systèmes ou applicatifs sont également utilisés pour assurer cette surveillance ; centralisés au sein d’un « puits de log » et traités par un outil tel que Graylog.
La métrologie complète le monitoring, en visant quant à elle, à obtenir des données sur plusieurs )indicateurs de suivi du SI consommations CPU et RAM, nombre de requêtes traitées, entrées/sorties (I0), ..). Nous utilisons l’agent Telegraf associé à la solution Victoria Metrics / Grafana.
L’ensemble des informations générées par le monitoring participe au suivi du Si afin d’identifier des problèmes potentiels et induire la stratégie de maintenance adéquate et à l’élaboration d’un diagnostic.
Le capacity planning
Le capacity planning (on parle aussi de capacity management) vise à allouer les ressources informatiques nécessaires à la bonne exécution des différentes activités de l’entreprise tout en maintenant le même niveau de performance technique.
Il s’agit donc d’adapter les ressources (CPU, RAM, stockage…) au fil de la montée en charge des services déployés afin d’assurer la scalabilité de l’infrastructure. Une mauvaise anticipation du besoin en capacité peut entraîner une dégradation des performances, voire l’interruption de certains services, mais à l’inverse, surdimensionner par principe, un environnement informatique génèrera un gaspillage de ressources (une stratégie incompatible avec l’approche Numérique responsable) et une perte financière.
L’enjeu du capacity planning est donc de prévoir l’évolution des besoins et d’optimiser l’allocation de ressources pour garantir la performance et la disponibilité de l’IT. Ces actions liées au capacity management peuvent être automatisées dans certains cas.
Maintenance (MCO)
La maintenance se traduit par l’ensemble des opérations visant à assurer le maintien en conditions opérationnelles du SI. Elle intègre donc les données de la CMBD, de monitoring, d’incidentologie et du capacity planning pour définir une stratégie à 2 niveaux : la maintenance préventive et la maintenance corrective.
La maintenance préventive se défini par les actions qui sont mises en place pour éviter un incident et qui implique la gestion des changements (mises à jour de sécurité des OS et des applications notamment) ou encore la détection de failles de sécurité connues et déclarées par le biais de la CMDB.
La maintenance corrective fait référence à la notion d’intervention en cas d’incident.
LMSYS s’appuie sur des outils de ticketing (tels que GLPI) afin de tracer et déclencher le traitement approprié.
Gestion opérationnelle d’un contrat de services
BT Services fournit des services de conseils, d’intégration, de support et de maintien en conditions opérationnelles d’infrastructures réseaux et IT. Dans le cadre d’un contrat de services avec un grand groupe industriel français dont le siège est situé en Nouvelle Aquitaine, BT Services doit mettre en place un service d’exploitation du LAN, du WAN, des équipements de sécurité et de la VoIP sur les 360 sites du groupe à l’international.
LMSYS assumant déjà le rôle de Service Delivery Manager avec une équipe dédiée hébergée chez le client, nous avons eu à assurer la transition vers la nouvelle équipe d’exploitation réparties sur deux sites en France.
Le SDM a pour cela, géré la montée en compétence des nouvelles équipes afin que celles-ci s’approprient les environnements techniques et leurs spécificités:
Nos connaissances des processus client, des interlocuteurs et des contraintes métier ont permis :
Après avoir mené à bien ce projet de transition, le niveau de satisfaction client a perduré pendant 3 ans après la signature du contrat, grâce à une gestion opérationnelle quotidienne structurée et proche du client.