Senior Deep Learning Ingénieur — NVIDIA (ufficio Zurich)
CHF 101 500 - 154 000
NVIDIA (ufficio Zurich) · Zürich (ZH)
- Lieu
- Zürich
- Contrat
- full-time
- Publié
- il y a 31 jours
SalaireCHF 101 500 - 154 000
Vue d’ensemble du poste
Nous sommes à la recherche d'un ingénieur principal d'apprentissage profond pour aider à amener les modèles de la Fondation mondiale Cosmos de la recherche à des systèmes de production efficaces.
Vous vous concentrerez sur l'optimisation et le déploiement de modèles pour une inférence haute performance sur diverses plateformes GPU.
Ce rôle se situe à l'intersection de l'apprentissage profond, des systèmes et de l'optimisation GPU - en étroite collaboration avec des chercheurs, des ingénieurs en logiciels et des experts en matériel.
- Nous sommes à la recherche d'un ingénieur principal d'apprentissage profond pour aider à amener les modèles de la Fondation mondiale Cosmos de la recherche à des systèmes de production efficaces.
- Vous vous concentrerez sur l'optimisation et le déploiement de modèles pour une inférence haute performance sur diverses plateformes GPU.
Détails supplémentaires
- Les développeurs utilisent Cosmos pour accélérer le développement physique de l'IA pour les véhicules autonomes (AV), les robots et les agents d'IA d'analyse vidéo en simulant et en raisonnant sur le monde physique. Ce que tu vas faire :
- Profiler et analyser les charges de travail liées à l'apprentissage approfondi afin d'identifier et d'éliminer les goulets d'étranglement. Ce que nous devons voir :
- Expérience des techniques d'optimisation des inférences (comme la quantification) et des cadres d'optimisation des inférences, l'un des suivants : TensorRT, TensorRT-LLM, vLLM, SGLang. Des façons de se démarquer de la foule :
- Expérience éprouvée dans l'analyse, la modélisation et l'ajustement de la performance des charges de travail du GPU, à la fois l'inférence et la formation.
Notes et contenu original
- Les développeurs utilisent Cosmos pour accélérer le développement physique de l'IA pour les véhicules autonomes (AV), les robots et les agents d'IA d'analyse vidéo en simulant et en raisonnant sur le monde physique.
- Ce que tu vas faire :
- Profiler et analyser les charges de travail liées à l'apprentissage approfondi afin d'identifier et d'éliminer les goulets d'étranglement.
- Ce que nous devons voir :
- Expérience des techniques d'optimisation des inférences (comme la quantification) et des cadres d'optimisation des inférences, l'un des suivants : TensorRT, TensorRT-LLM, vLLM, SGLang.
- Des façons de se démarquer de la foule :