AI Ricerca Ingegnere (Model Compression & Quantization) — Tether Operations
CHF 49'500 - 75'000
Tether Operations · Zürich, Zürich (ZH)
- Località
- Zürich
- Contratto
- remote
- Pubblicato
- 9 giorni fa
SalarioCHF 49'500 - 75'000
Panoramica
Unisciti a Tether e dai forma al futuro della finanza digitale In Tether non stiamo solo costruendo prodotti, siamo pionieri di una rivoluzione finanziaria globale.
Le nostre soluzioni all'avanguardia consentono alle aziende, dagli scambi e portafogli ai processori di pagamento e agli sportelli bancomat, di integrare perfettamente token garantiti da riserve attraverso blockchain.
Sfruttando la potenza della tecnologia blockchain, Tether ti consente di archiviare, inviare e ricevere token digitali in modo istantaneo, sicuro e globale, il tutto a una frazione del costo.
- Unisciti a Tether e dai forma al futuro della finanza digitale In Tether non stiamo solo costruendo prodotti, siamo pionieri di una rivoluzione finanziaria globale.
- Le nostre soluzioni all'avanguardia consentono alle aziende, dagli scambi e portafogli ai processori di pagamento e agli sportelli bancomat, di integrare perfettamente token garantiti da riserve attraverso blockchain.
- Le tue responsabilità includono la creazione di robuste pipeline di compressione, la definizione di parametri di prestazioni e fedeltà e la risoluzione dei colli di bottiglia nell'inferenza della produzione.
- L’obiettivo finale è quello di fornire sistemi di intelligenza artificiale scalabili, con poca memoria e a bassa latenza su dispositivi edge (ad esempio smartphone) che mantengano un’alta fedeltà e un valore tangibile nel mondo reale.
- Applicherai e avanzerai tecniche di compressione come quantizzazione, distillazione della conoscenza e potatura per semplificare architetture multimodali complesse che integrano testo, immagini e audio.
- Ci aspettiamo che tu abbia una profonda esperienza nei metodi di compressione dei modelli e un forte background nelle architetture di modelli multimodali.
Responsabilità principali
- Le tue responsabilità includono la creazione di robuste pipeline di compressione, la definizione di parametri di prestazioni e fedeltà e la risoluzione dei colli di bottiglia nell'inferenza della produzione.
- L’obiettivo finale è quello di fornire sistemi di intelligenza artificiale scalabili, con poca memoria e a bassa latenza su dispositivi edge (ad esempio smartphone) che mantengano un’alta fedeltà e un valore tangibile nel mondo reale.
- Responsabilità Suddividere le responsabilità principali in punti elenco.
- È utile renderli attuabili e misurabili.
- Questo potrebbe anche essere raggruppato in categorie per ruoli più complessi.
- Applicare la quantizzazione a bit basso per ridurre le dimensioni del modello e la latenza di inferenza per i modelli di intelligenza artificiale generativa (LLM, VLM, multimodali) mantenendo l'accuratezza e la qualità dell'output.
- Implementare tecniche di potatura per rimuovere parametri ridondanti e punti di attenzione, riducendo il sovraccarico computazionale senza sacrificare le prestazioni delle attività.
Requisiti principali
- Applicherai e avanzerai tecniche di compressione come quantizzazione, distillazione della conoscenza e potatura per semplificare architetture multimodali complesse che integrano testo, immagini e audio.
- Ci aspettiamo che tu abbia una profonda esperienza nei metodi di compressione dei modelli e un forte background nelle architetture di modelli multimodali.
- Adotterai un approccio pratico e orientato alla ricerca per sviluppare, testare e implementare nuove strategie di compressione che bilanciano le dimensioni del modello, la latenza, la velocità effettiva e l'accuratezza.
- Sfruttare la distillazione della conoscenza per trasferire le capacità da modelli di insegnanti più grandi a modelli di studenti più piccoli, consentendo un ragionamento multimodale efficiente attraverso input di testo, immagini e audio.
- Analizzare i compromessi tra efficienza del modello (dimensioni, latenza, memoria) e accuratezza attraverso metodi di quantizzazione, distillazione e potatura; proporre miglioramenti basati su risultati empirici.
- Ricercare e applicare la quantizzazione a precisione mista e altre strategie di compressione avanzate (ad esempio, programmi di potatura adattivi, distillazione con corrispondenza di caratteristiche intermedie) per ottimizzare l'equilibrio accuratezza-prestazioni.
- Rimani aggiornato sulle ultime ricerche sulla compressione dei modelli, comprese le tecniche emergenti per architetture multimodali e generative.
- Documentare metodologie, esperimenti e risultati in modo chiaro per supportare la riproducibilità, la collaborazione interna e la comunicazione con le parti interessate.
- Autore documenti tecnici e pubblicare risultati in conferenze di alto livello (ad esempio NeurIPS, ICML, ICLR, CVPR, ACL, AAAI) per far avanzare il campo della compressione dei modelli per l'IA multimodale.
- Elenca le qualifiche, le certificazioni e l'esperienza necessarie per il ruolo.
- Se necessario, puoi suddividerlo in sezioni obbligatorie e preferite.
- Una laurea in Informatica o settore correlato.
Cosa offre l’azienda
- Tether Education: democratizzando l’accesso all’apprendimento digitale di alto livello, consentiamo alle persone di prosperare nelle economie digitali e gig economy, guidando la crescita e le opportunità globali.
- Tether Evolution : At the intersection of technology and human potential, we are pushing the boundaries of what is possible, crafting a future where innovation and human capabilities merge in powerful, unprecedented ways.
- Perché unirsi a noi?
- Il nostro team è una potenza globale di talenti, che lavora in remoto da ogni angolo del mondo.
- Se la tua passione è lasciare il segno nel settore fintech, questa è la tua occasione per collaborare con alcune delle menti più brillanti, spingendo oltre i confini e stabilendo nuovi standard.
- Siamo cresciuti rapidamente, siamo rimasti snelli e ci siamo assicurati il posto di leader nel settore.
- Se hai eccellenti capacità di comunicazione in inglese e sei pronto a contribuire alla piattaforma più innovativa del pianeta, Tether è il posto che fa per te.
- Sei pronto a far parte del futuro?
Contatti
- sul lavoro Come membro del nostro team di ricerca sull'intelligenza artificiale, guiderai l'innovazione nella compressione dei modelli e nell'implementazione efficiente di sistemi di intelligenza artificiale multimodali avanzati, inclusi modelli linguistici di grandi dimensioni (LLM) e modelli di linguaggio visivo (VLM).
- Il tuo lavoro si concentrerà sulla riduzione dell'ingombro del modello e dei costi computazionali preservando al contempo l'accuratezza, consentendo all'intelligenza artificiale ad alte prestazioni di funzionare in modo efficiente su dispositivi edge con risorse limitate.
- importanti per i candidati Le truffe nel reclutamento sono diventate sempre più comuni.
- Per proteggerti, tieni presente quanto segue quando fai domanda per un ruolo:
- Candidati solo attraverso i nostri canali ufficiali.
- Non utilizziamo piattaforme o agenzie di terze parti per il reclutamento se non chiaramente indicato.
- Tutti i ruoli aperti sono elencati sulla nostra pagina ufficiale delle carriere: https://tether.recruitee.com/
- Verifica l'identità del reclutatore.
- Tutti i nostri reclutatori hanno profili LinkedIn verificati.
- Prestare attenzione ai metodi di comunicazione insoliti.
Azienda e contesto
- Ma questo è solo l’inizio: Tether Power: guidando la crescita sostenibile, le nostre soluzioni energetiche ottimizzano l’energia in eccesso per l’estrazione di Bitcoin utilizzando pratiche ecocompatibili in strutture all’avanguardia e geodiversificate.
Dettagli ulteriori
- Informazioni sul lavoro Come membro del nostro team di ricerca sull'intelligenza artificiale, guiderai l'innovazione nella compressione dei modelli e nell'implementazione efficiente di sistemi di intelligenza artificiale multimodali avanzati, inclusi modelli linguistici di grandi dimensioni (LLM) e modelli di linguaggio visivo (VLM).
- Informazioni importanti per i candidati Le truffe nel reclutamento sono diventate sempre più comuni.
- Se qualcuno chiede informazioni finanziarie personali o un pagamento in qualsiasi momento durante il processo di assunzione, si tratta di una truffa. Per favore segnalatelo immediatamente.
Note e contenuto originale
- Se qualcuno chiede informazioni finanziarie personali o un pagamento in qualsiasi momento durante il processo di assunzione, si tratta di una truffa.
- Per favore segnalatelo immediatamente.