Power – Thermal Emergency Balancer.

Besoin : Rendre un les images d’un film dans les temps, à l’aide d’un moteur de rendu compatible CPU/GPU, via ajout des stations de travail

“Arrivée de Courant limitée.”

Contraintes :

  • Arrivée de courant limitée
  • Climatisation limitée
  • Besoin de disponibilité des rendus des stations de travail hors rendu
  • Intégration au render manager ‘Muster’
  • Certaines machines en domaine AD, d’autres en standalone, une dernière partie en système ‘Read Only’
  • Disparité des OS et installations
    • Windows 7, différentes itérations de Windows 10
    • Systèmes en-US, systèmes fr-FR
    • Management instable via Ansible
  • Pas de possibilité d’envisager d’évolution long terme dans le délai imparti

Réalisation :

Ont été mis en place une série de scripts permettant de :

  • Une session de rendu sécurisée et automatique sur les machines, via plusieurs stratégies, permettant à une machine de démarrer automatiquement en tant qu’user : render, puis de lancer un script local de surveillance de la session, le Worker Muster pour effectuer les rendus.
    • La session de rendu devant avoir accès a tous les projets, il est nécessaire de s’assurer qu’aucune interaction n’est possible, afin d’éviter toute fuite de données via ce biais. Ainsi il est impossible de naviguer dans les fichiers, les seuls interactions possibles permettant de redémarrer la machine, ou de ‘Logout’ afin de pouvoir se connecter soit même à la machine
    • Les stratégies utilisées ont été diverses étant donné la nature du réseau, emploi de GPO pour les machines en domaine, interception d’un script de démarrage pour les machines standalone, interception étendue de ce script pour les machines en Read Only
    • Assigner/Désassigner des machines en fonction de la température et de la consommation. Dès qu’un pic de sécurité de l’un de ces paramètres est atteint, des paquets de 5 machines coupent immédiatement leur rendu pour ne pas dépasser de seuil critique et provoquer de pannes, passé un délai de sécurité, si les seuils sont de nouveaux bas, des machines sont alors progressivement réassignées jusqu’à atteindre un niveau de fonctionnement optimal
    • La température est interprétée via les sondes individuelles, mais également par des points critiques évalués via les caméras thermiques, ainsi la température ambiante, mais aussi la température globale, des murs, des fuites d’air, sont prises en compte

Des modules de mesure temps réel des différents départs de courant du bâtiment ont été mis en place pour surveiller les consommations à chaque disjoncteur ou étaient reliées les machines, ainsi que la consommation générale de l’ensemble du bâtiment et des 3 phases électriques. La consommation électrique est évaluée par la ligne individuelle (capacité d’un disjoncteur) que par la consommation d’ensemble des 3 phases qui ne devait pas dépasser les 36kVA

“L’ensemble de ces procédures de contrôle ou d’urgence peuvent évidemment etre répliqués sur tous systemes ou gestionnaires de rendus comme Deadline.”

contact@hardbricks.com