Ingegnere Ricerca IA (Ottimizzazione Kernel & Inference) — Tether Operations

CHF 49'500 - 75'000

Tether Operations · Zürich, Zürich (ZH)

Categoria: Ingegneria Contratto: remote Salario: CHF 49'500 - 75'000

Vai alla candidatura

Località: Zürich
Contratto: remote
Pubblicato: 9 giorni fa

SalarioCHF 49'500 - 75'000

Panoramica

Unisciti a Tether e Forma il futuro della finanza digitale A Tether, non stiamo solo costruendo prodotti, siamo pionieri di una rivoluzione finanziaria globale.

Le nostre soluzioni all'avanguardia consentono alle aziende, dagli scambi e dai portafogli ai processori di pagamento e agli sportelli bancomat, di integrare senza soluzione di continuità i gettoni di riserva in blockchains.

Imbragando la potenza della tecnologia blockchain, Tether consente di memorizzare, inviare e ricevere gettoni digitali istantaneamente, in modo sicuro e globale, il tutto ad una frazione del costo.

Unisciti a Tether e Forma il futuro della finanza digitale A Tether, non stiamo solo costruendo prodotti, siamo pionieri di una rivoluzione finanziaria globale.
Le nostre soluzioni all'avanguardia consentono alle aziende, dagli scambi e dai portafogli ai processori di pagamento e agli sportelli bancomat, di integrare senza soluzione di continuità i gettoni di riserva in blockchains.
Le tue responsabilità includono l'ingegneria robuste condotte di inferenza, la definizione di metriche di prestazioni complete e l'identificazione e la risoluzione di strozzature in ambienti di produzione.
L'obiettivo finale è quello di attivare prestazioni AI ad alto rendimento, bassa latenza, bassa memoria e scalabile che offrono valore tangibile in scenari dinamici e reali. responsabilità
Ci aspettiamo di avere una profonda esperienza nella progettazione e nell'ottimizzazione dei modelli che servono tubazioni e framework di inferenza, nonché un forte background in architetture di modelli avanzati.
Adottiamo un approccio pratico e ricercato per sviluppare, testare e implementare nuove strategie di servizio e algoritmi di inferenza.

Responsabilità principali

Le tue responsabilità includono l'ingegneria robuste condotte di inferenza, la definizione di metriche di prestazioni complete e l'identificazione e la risoluzione di strozzature in ambienti di produzione.
L'obiettivo finale è quello di attivare prestazioni AI ad alto rendimento, bassa latenza, bassa memoria e scalabile che offrono valore tangibile in scenari dinamici e reali. responsabilità
Progettazione e distribuzione di architetture all'avanguardia che offrono un'elevata produttività e bassa latenza ottimizzando l'utilizzo della memoria.
Assicurarsi che questi gasdotti siano in grado di funzionare in modo efficiente in ambienti diversi, tra cui dispositivi e piattaforme di bordo con protezione dalle risorse.
Stabilire obiettivi di prestazioni chiare come latenza ridotta, una risposta token migliorata e un'impronta di memoria minimizzata.
Costruire, eseguire e monitorare i test di inferenza controllati in ambienti di produzione simulati e live.
Traccia gli indicatori chiave delle prestazioni come latenza della risposta, il throughput, il consumo di memoria e i tassi di errore, con particolare attenzione alle metriche specifiche per i dispositivi basati sulle risorse.
Documento risultati iterativi e confrontare i risultati contro i benchmark consolidati per convalidare le prestazioni su piattaforme.
Identificare e preparare set di dati di test di alta qualità e scenari di simulazione su misura per le sfide di distribuzione del mondo reale, in particolare quelle incontrate su dispositivi a bassa risorsa.
Impostare criteri misurabili per garantire che queste risorse valutano efficacemente le prestazioni del modello, latenza e l'utilizzo della memoria in varie condizioni operative.

Requisiti principali

Ci aspettiamo di avere una profonda esperienza nella progettazione e nell'ottimizzazione dei modelli che servono tubazioni e framework di inferenza, nonché un forte background in architetture di modelli avanzati.
Adottiamo un approccio pratico e ricercato per sviluppare, testare e implementare nuove strategie di servizio e algoritmi di inferenza.
Deve avere conoscenza di Metal Shading Language (MSL).
Si dovrebbe essere comodo scrivere personalizzato compute shaders da zero.
L'esperienza comprovata nelle ottimizzazioni del kernel di basso livello e nell'ottimizzazione dell'inferenza sui dispositivi mobili è essenziale.
I tuoi contributi avrebbero dovuto portare a miglioramenti misurabili nella latenza di inferenza, nel throughput e nell'impronta di memoria per applicazioni specifiche per il dominio, in particolare su dispositivi e piattaforme di bordo con restrizioni alle risorse.
È necessaria una profonda comprensione del modello moderno che serve architetture e tecniche di ottimizzazione delle inferenze.
Questo include metodi all'avanguardia per ottenere prestazioni a bassa latenza, ad alto rendimento e una gestione efficiente della memoria in scenari di distribuzione diversi e limitati dalle risorse.
Deve avere una forte esperienza nella scrittura dei kernel GPU per i dispositivi mobili (cioè smartphone) e una profonda comprensione dei modelli che servono quadri e motori.
È necessaria un'esperienza pratica nello sviluppo e nella distribuzione di oleodotti di inferenza end-to-end, dall'ottimizzazione dei modelli per un servizio efficiente all'integrazione di queste soluzioni su dispositivi basati sulle risorse.
Capacità dimostrata di applicare la ricerca empirica per superare le sfide nel servizio del modello, come ottimizzazione della latenza, strozzature computazionali e vincoli di memoria.
Si dovrebbe essere esperti nella progettazione di framework di valutazione robusti e iterating sulle strategie di ottimizzazione per spingere continuamente i confini delle prestazioni di inferenza e l'efficienza del sistema.

Cosa offre l’azienda

Tether Education: Democratizzazione dell'accesso all'apprendimento digitale di alto livello, forniamo agli individui di prosperare nelle economie digitali e di gig, guidando la crescita globale e l'opportunità.
Tether Evolution: All'incrocio tra tecnologia e potenziale umano, stiamo spingendo i confini di ciò che è possibile, realizzando un futuro in cui innovazione e capacità umane si fondono in modi potenti e senza precedenti.
Perché unirsi a noi?
Il nostro team è una centrale di talento globale, che lavora a distanza da ogni angolo del mondo.
Se siete appassionati di fare un segno nello spazio fintech, questa è la vostra opportunità di collaborare con alcune delle menti più brillanti, spingendo i confini e stabilendo nuovi standard.
Siamo cresciuti veloci, siamo stati magra, e assicurato il nostro posto come leader nel settore.
Se avete eccellenti capacità di comunicazione inglese e siete pronti a contribuire alla piattaforma più innovativa del pianeta, Tether è il posto per voi.
Sei pronto a far parte del futuro?
Riguardo al lavoro Come membro del nostro team di modelli AI, guiderai l'innovazione nelle architetture di servizio e di inferenza per sistemi AI avanzati.
Il vostro lavoro si concentrerà sull'ottimizzazione delle strategie di implementazione e inferenza del modello per fornire prestazioni altamente reattive, efficienti e scalabili in applicazioni reali.

Contatti

importanti per i candidati Le truffe di reclutamento sono diventate sempre più comuni.
Per proteggersi, si prega di tenere a mente il seguente quando si applica per i ruoli:
Applicare solo attraverso i nostri canali ufficiali.
Non utilizziamo piattaforme o agenzie di terze parti per il reclutamento, a meno che non sia chiaro.
Tutti i ruoli aperti sono elencati nella nostra pagina di carriera ufficiale: https://tether.recruitee.com/
Verificare l’identità del reclutatore.
Tutti i nostri reclutatori hanno verificato i profili LinkedIn.
Siate cauti di metodi di comunicazione insoliti.
Non conduciamo interviste su WhatsApp, Telegram o SMS.
Tutte le comunicazioni vengono effettuate tramite e-mail e piattaforme aziendali ufficiali.

Azienda e contesto

Ma questo è solo l’inizio: Tether Power: Guidare la crescita sostenibile, le nostre soluzioni energetiche ottimizzano il potere in eccesso per l'estrazione mineraria di Bitcoin utilizzando pratiche eco-friendly nelle strutture all'avanguardia e geo-diverse.

Dettagli ulteriori

Informazioni importanti per i candidati Le truffe di reclutamento sono diventate sempre più comuni.

Vai alla candidatura