AI Infrastructure Ingénieur — Swissquote

CHF 63 000 - 107 500
Swissquote · Gland (VD)
Categoria: IT Contratto: full-time Salario: CHF 63 000 - 107 500
Postuler
Lieu
Gland
Contrat
full-time
Publié
il y a 27 jours
SalaireCHF 63 000 - 107 500

Vue d’ensemble du poste

Vous rejoindrez l'équipe IT Platform Operations du Département IT, dont le rôle est d'exploiter la couche entre l'infrastructure brute et les services d'entreprise de la banque : le tissu d'intergiciel de type application, l'avion de contrôle Kubernetes, et la surface orientée utilisateur de la plate-forme d'IA souveraine de la banque.

Le candidat idéal disposera d'une expertise approfondie dans l'exploitation des systèmes d'ingénierie de plate-forme Kubernetes-native à l'échelle, et dirigera l'intégration d'outils d'IA open-source dans un environnement d'entreprise réglementé tout en assurant des échelles d'inférence grand langage (LLM).

Votre expertise aidera votre équipe à fournir la plate-forme sur laquelle la banque fournit un accès réglementé aux capacités internes et externes de l'IA — inférence distribuée, flux de travail d'agents, carnets de notes et chatbots — construite sur le GPU et le substrat de service fourni par les équipes Systèmes et Stockage.

Avec votre équipe, vous travaillerez en étroite collaboration avec les architectes informatiques, les analystes d'observation et de performance, la fonction Cybersecurity et les équipes de systèmes pour planifier et exécuter l'objectif à long terme du département d'une capacité d'IA souveraine qui fonctionne sous la banque.

  • Conception, déploiement et exploitation de l'inférence LLM distribuée (LLM-d) sur Kubernetes – dimensionnement pour le débit, la latence de queue et l'utilisation GPU contre le substrat de service fourni par IT Systems Services (ITSS).
  • Exploiter et durcir la surface d'IA orientée vers l'utilisateur : le chatbot interservices Open WebUI, les carnets JupyterHub pour les data savants et le catalogue des agents (registre des agents).
  • Construisez et exploitez Agentgateway en tant que couche de routage régie vers des fournisseurs externes (Anthropic Claude API, OpenAI GPT API), en appliquant la politique de trafic, en limitant les tarifs, en contrôlant les coûts et en vérifiant l'enregistrement.
  • Mettre en œuvre des contrôles de sécurité du contenu, de défense contre les injections rapides et d'audit des flux de travail des agents, ainsi que le modèle d'identité des agents requis pour la conformité à la loi de l'UE sur l'IA et à la DORA.
  • Exploiter le plan de contrôle de Kubernetes — etcd, serveur API, planificateur et contrôleur-gestionneur — avec le calibrage HA et la discipline de surtension-upgrade; contribuer à la gestion multi-grappes pour le modèle de groupe croisé mésiné.
  • Définir les ALS et instrumenter la plate-forme pour la performance et la disponibilité; diriger la réponse incidente à travers la plate-forme AI et le chemin critique de contrôle-plan.

Exigences principales

  • privilégiées
  • Expérience pratique avec les frameworks LLM-d ou les frameworks distribués comparables (p. ex. vLLM, TGI, NVIDIA Triton, Ray Serve, KServe).
  • Expérimentez l'exploitation de JupyterHub, Open WebUI ou de plates-formes similaires de portable et de chatbot.
  • Familiarisation avec les cadres d'agents de Kubernetes-native (par exemple kagent), les couches d'acheminement/portes d'accès (par exemple Agentgateway) et les modèles d'enregistrement/de catalogue des agents.
  • Expérience d'intégration et de gouvernance de fournisseurs externes de LLM (Anthropic Claude, OpenAI GPT) — routage, limitation des tarifs, contrôle des coûts et audit.
  • Compétence dans une ou plusieurs des langues suivantes : Python, Go, Rust, Java, C++.
  • Confortable avec l'infrastructure comme code et l'outillage d'automatisation gouvernée (Ansible / AAP, Terraform, etc.); connaissance de streaming d'événements (Apache Kafka) et piles d'observation. QS2

Processus de candidature

  • Vous rejoindrez l'équipe IT Platform Operations du Département IT, dont le rôle est d'exploiter la couche entre l'infrastructure brute et les services d'entreprise de la banque : le tissu d'intergiciel de type application, l'avion de contrôle Kubernetes, et la surface orientée utilisateur de la plate-forme d'IA souveraine de la banque.
  • Le candidat idéal disposera d'une expertise approfondie dans l'exploitation des systèmes d'ingénierie de plate-forme Kubernetes-native à l'échelle, et dirigera l'intégration d'outils d'IA open-source dans un environnement d'entreprise réglementé tout en assurant des échelles d'inférence grand langage (LLM).
  • Votre expertise aidera votre équipe à fournir la plate-forme sur laquelle la banque fournit un accès réglementé aux capacités internes et externes de l'IA — inférence distribuée, flux de travail d'agents, carnets de notes et chatbots — construite sur le GPU et le substrat de service fourni par les équipes Systèmes et Stockage.
  • Avec votre équipe, vous travaillerez en étroite collaboration avec les architectes informatiques, les analystes d'observation et de performance, la fonction Cybersecurity et les équipes de systèmes pour planifier et exécuter l'objectif à long terme du département d'une capacité d'IA souveraine qui fonctionne sous la banque.
  • Conception, déploiement et exploitation de l'inférence LLM distribuée (LLM-d) sur Kubernetes – dimensionnement pour le débit, la latence de queue et l'utilisation GPU contre le substrat de service fourni par IT Systems Services (ITSS).
  • Exploiter et durcir la surface d'IA orientée vers l'utilisateur : le chatbot interservices Open WebUI, les carnets JupyterHub pour les data savants et le catalogue des agents (registre des agents).
  • Construisez et exploitez Agentgateway en tant que couche de routage régie vers des fournisseurs externes (Anthropic Claude API, OpenAI GPT API), en appliquant la politique de trafic, en limitant les tarifs, en contrôlant les coûts et en vérifiant l'enregistrement.
  • Mettre en œuvre des contrôles de sécurité du contenu, de défense contre les injections rapides et d'audit des flux de travail des agents, ainsi que le modèle d'identité des agents requis pour la conformité à la loi de l'UE sur l'IA et à la DORA.

Détails supplémentaires

  • Élaborer et tenir à jour la documentation sur l'architecture et les manuels opérationnels, et participer à la rotation 24×7 sur appel. Qualités minimales Qualifications privilégiées
  • Confortable avec l'infrastructure comme code et l'outillage d'automatisation gouvernée (Ansible / AAP, Terraform, etc.); connaissance de streaming d'événements (Apache Kafka) et piles d'observation.

Notes et contenu original

  • Élaborer et tenir à jour la documentation sur l'architecture et les manuels opérationnels, et participer à la rotation 24×7 sur appel.
  • Qualités minimales
  • Qualifications privilégiées
Postuler
Logo Swissquote
Entreprise
Swissquote · Gland
Frontaliere Ticino a repéré cette opportunité dans le suivi des entreprises.

Toutes les offres Swissquote à Gland →

Explorer des offres similaires