Ingegnere Ricerca IA (Ottimizzazione Kernel & Inference) — Tether Operations
CHF 49'500 - 75'000
Tether Operations · Zürich, Zürich (ZH)
- Località
- Zürich
- Contratto
- remote
- Pubblicato
- 9 giorni fa
SalarioCHF 49'500 - 75'000
Panoramica
Unisciti a Tether e Forma il futuro della finanza digitale A Tether, non stiamo solo costruendo prodotti, siamo pionieri di una rivoluzione finanziaria globale.
Le nostre soluzioni all'avanguardia consentono alle aziende, dagli scambi e dai portafogli ai processori di pagamento e agli sportelli bancomat, di integrare senza soluzione di continuità i gettoni di riserva in blockchains.
Imbragando la potenza della tecnologia blockchain, Tether consente di memorizzare, inviare e ricevere gettoni digitali istantaneamente, in modo sicuro e globale, il tutto ad una frazione del costo.
- Unisciti a Tether e Forma il futuro della finanza digitale A Tether, non stiamo solo costruendo prodotti, siamo pionieri di una rivoluzione finanziaria globale.
- Le nostre soluzioni all'avanguardia consentono alle aziende, dagli scambi e dai portafogli ai processori di pagamento e agli sportelli bancomat, di integrare senza soluzione di continuità i gettoni di riserva in blockchains.
- Le tue responsabilità includono l'ingegneria robuste condotte di inferenza, la definizione di metriche di prestazioni complete e l'identificazione e la risoluzione di strozzature in ambienti di produzione.
- L'obiettivo finale è quello di attivare prestazioni AI ad alto rendimento, bassa latenza, bassa memoria e scalabile che offrono valore tangibile in scenari dinamici e reali. responsabilità
- Ci aspettiamo di avere una profonda esperienza nella progettazione e nell'ottimizzazione dei modelli che servono tubazioni e framework di inferenza, nonché un forte background in architetture di modelli avanzati.
- Adottiamo un approccio pratico e ricercato per sviluppare, testare e implementare nuove strategie di servizio e algoritmi di inferenza.
Responsabilità principali
- Le tue responsabilità includono l'ingegneria robuste condotte di inferenza, la definizione di metriche di prestazioni complete e l'identificazione e la risoluzione di strozzature in ambienti di produzione.
- L'obiettivo finale è quello di attivare prestazioni AI ad alto rendimento, bassa latenza, bassa memoria e scalabile che offrono valore tangibile in scenari dinamici e reali. responsabilità
- Progettazione e distribuzione di architetture all'avanguardia che offrono un'elevata produttività e bassa latenza ottimizzando l'utilizzo della memoria.
- Assicurarsi che questi gasdotti siano in grado di funzionare in modo efficiente in ambienti diversi, tra cui dispositivi e piattaforme di bordo con protezione dalle risorse.
- Stabilire obiettivi di prestazioni chiare come latenza ridotta, una risposta token migliorata e un'impronta di memoria minimizzata.
- Costruire, eseguire e monitorare i test di inferenza controllati in ambienti di produzione simulati e live.
- Traccia gli indicatori chiave delle prestazioni come latenza della risposta, il throughput, il consumo di memoria e i tassi di errore, con particolare attenzione alle metriche specifiche per i dispositivi basati sulle risorse.
- Documento risultati iterativi e confrontare i risultati contro i benchmark consolidati per convalidare le prestazioni su piattaforme.
- Identificare e preparare set di dati di test di alta qualità e scenari di simulazione su misura per le sfide di distribuzione del mondo reale, in particolare quelle incontrate su dispositivi a bassa risorsa.
- Impostare criteri misurabili per garantire che queste risorse valutano efficacemente le prestazioni del modello, latenza e l'utilizzo della memoria in varie condizioni operative.
Requisiti principali
- Ci aspettiamo di avere una profonda esperienza nella progettazione e nell'ottimizzazione dei modelli che servono tubazioni e framework di inferenza, nonché un forte background in architetture di modelli avanzati.
- Adottiamo un approccio pratico e ricercato per sviluppare, testare e implementare nuove strategie di servizio e algoritmi di inferenza.
- Deve avere conoscenza di Metal Shading Language (MSL).
- Si dovrebbe essere comodo scrivere personalizzato compute shaders da zero.
- L'esperienza comprovata nelle ottimizzazioni del kernel di basso livello e nell'ottimizzazione dell'inferenza sui dispositivi mobili è essenziale.
- I tuoi contributi avrebbero dovuto portare a miglioramenti misurabili nella latenza di inferenza, nel throughput e nell'impronta di memoria per applicazioni specifiche per il dominio, in particolare su dispositivi e piattaforme di bordo con restrizioni alle risorse.
- È necessaria una profonda comprensione del modello moderno che serve architetture e tecniche di ottimizzazione delle inferenze.
- Questo include metodi all'avanguardia per ottenere prestazioni a bassa latenza, ad alto rendimento e una gestione efficiente della memoria in scenari di distribuzione diversi e limitati dalle risorse.
- Deve avere una forte esperienza nella scrittura dei kernel GPU per i dispositivi mobili (cioè smartphone) e una profonda comprensione dei modelli che servono quadri e motori.
- È necessaria un'esperienza pratica nello sviluppo e nella distribuzione di oleodotti di inferenza end-to-end, dall'ottimizzazione dei modelli per un servizio efficiente all'integrazione di queste soluzioni su dispositivi basati sulle risorse.
- Capacità dimostrata di applicare la ricerca empirica per superare le sfide nel servizio del modello, come ottimizzazione della latenza, strozzature computazionali e vincoli di memoria.
- Si dovrebbe essere esperti nella progettazione di framework di valutazione robusti e iterating sulle strategie di ottimizzazione per spingere continuamente i confini delle prestazioni di inferenza e l'efficienza del sistema.
Cosa offre l’azienda
- Tether Education: Democratizzazione dell'accesso all'apprendimento digitale di alto livello, forniamo agli individui di prosperare nelle economie digitali e di gig, guidando la crescita globale e l'opportunità.
- Tether Evolution: All'incrocio tra tecnologia e potenziale umano, stiamo spingendo i confini di ciò che è possibile, realizzando un futuro in cui innovazione e capacità umane si fondono in modi potenti e senza precedenti.
- Perché unirsi a noi?
- Il nostro team è una centrale di talento globale, che lavora a distanza da ogni angolo del mondo.
- Se siete appassionati di fare un segno nello spazio fintech, questa è la vostra opportunità di collaborare con alcune delle menti più brillanti, spingendo i confini e stabilendo nuovi standard.
- Siamo cresciuti veloci, siamo stati magra, e assicurato il nostro posto come leader nel settore.
- Se avete eccellenti capacità di comunicazione inglese e siete pronti a contribuire alla piattaforma più innovativa del pianeta, Tether è il posto per voi.
- Sei pronto a far parte del futuro?
- Riguardo al lavoro Come membro del nostro team di modelli AI, guiderai l'innovazione nelle architetture di servizio e di inferenza per sistemi AI avanzati.
- Il vostro lavoro si concentrerà sull'ottimizzazione delle strategie di implementazione e inferenza del modello per fornire prestazioni altamente reattive, efficienti e scalabili in applicazioni reali.
Contatti
- importanti per i candidati Le truffe di reclutamento sono diventate sempre più comuni.
- Per proteggersi, si prega di tenere a mente il seguente quando si applica per i ruoli:
- Applicare solo attraverso i nostri canali ufficiali.
- Non utilizziamo piattaforme o agenzie di terze parti per il reclutamento, a meno che non sia chiaro.
- Tutti i ruoli aperti sono elencati nella nostra pagina di carriera ufficiale: https://tether.recruitee.com/
- Verificare l’identità del reclutatore.
- Tutti i nostri reclutatori hanno verificato i profili LinkedIn.
- Siate cauti di metodi di comunicazione insoliti.
- Non conduciamo interviste su WhatsApp, Telegram o SMS.
- Tutte le comunicazioni vengono effettuate tramite e-mail e piattaforme aziendali ufficiali.
Azienda e contesto
- Ma questo è solo l’inizio: Tether Power: Guidare la crescita sostenibile, le nostre soluzioni energetiche ottimizzano il potere in eccesso per l'estrazione mineraria di Bitcoin utilizzando pratiche eco-friendly nelle strutture all'avanguardia e geo-diverse.
Dettagli ulteriori
- Informazioni importanti per i candidati Le truffe di reclutamento sono diventate sempre più comuni.