Qu'est ce que l'iDRAC?

iDRAC signifie Integrated Dell Remote Access Controller", soit en français dans le texte "contrôleur d'accès à distance Dell intégré".

C'est une option de carte mère incluse dans les serveurs et systèmes de milieu de gamme vendus par Dell.

Son objectif est de contrôler les différents composants physiques du châssis afin de pouvoir fournir des alertes sur des événements liés au matériel.

Etant donné qu'il s'appuie sur son propre matériel et des canaux de communication dédié, il est relativement peu lié au système hôte et continue généralement de fonctionner en cas de problèmes logiciels ou matériels de ce dernier.


Options disponibles

L'iDRAC assure donc le suivi de toutes sortes d'événements et d'état du matériel: températures, ventilateurs, alimentation, chassis, RAID, disques...

Le système iDRAC est en capacité d'envoyer des alertes par différents canaux (email, SMS,...), mais peut également être configuré pour répondre aux requêtes SNMP.

C'est précisément cette méthode qui nous intéresse afin de maîtriser notre supervision depuis notre outil centralisateur. Il faut du coup configurer correctement l'agent SNMP avec la communauté qui sera utilisée pour venir lire les données.


Intégration à sa solution de supervision

Dans notre cas, intégré à PRTG, nous remontons des informations sur les interfaces réseau, sur les disques, sur le system health, ...

Cela permet de conserver de manière centralisée des métriques qui nous permettrons de faire du troubleshooting a posteriori, mais aussi de mettre en place des seuils d'alertes pro actives, et de pouvoir avoir une gestion globale unifiée de son alerting, en prenant en compte les différents workflows à suivre: les différents niveaux d'équipes concernées, les escalades, les plages horaires...


Problèmes potentiels et solutions

Parfois, il arrive que les capteurs n'accèdent plus aux données.

L'agent SNMP répond toujours, mais quand on fait un walk sur l'OID du tableau des disques par exemple, on se rend compte qu'il n'y a pas de réponse:


Là où habituellement on a un réponse verbeuse du style:


Dans ces cas-là, bien souvent le redémarrage de votre iDRAC (pas du serveur) corrigera le problème et rétablira l'accès aux données. N'hésitez pas également à bien vérifier si le firmware de l'iDRAC est à jour.