As a serviceIntelligenza Artificiale

DeepL: mix di IA e persone per traduzioni sempre più precise in ogni settore verticale

di pubblicata il , alle 14:29 nel canale data DeepL: mix di IA e persone per traduzioni sempre più precise in ogni settore verticale

DeepL è uno dei sistemi di traduzione più efficaci sul mercato, soprattutto in ambiti molto specifici come quello finanziario, legale, sanitario. Ma cosa lo distingue dalle tante soluzioni presenti sul mercato? Ce lo spiega David Parry-Jones, Chief Revenue Officer dell’azienda

 

Con il diffondersi dei LLM, tradurre testi oggi è un gioco da ragazzi, che richiede pochissimo tempo, anche in caso di testi lunghi e molto complessi. Un enorme passo avanti rispetto a sistemi come Google Translate o simili che, pur essendo di grande aiuto, non avevano la potenza e le capacità dei moderni sistemi di IA. Non a caso i sistemi di traduzione automatizzata sono stati fra le prime applicazioni di IA a venire introdotte in azienda, e spesso le più usate.

I Large Language Model generici, però, non hanno soppiantato i sistemi pre-esistenti, anzi: alcuni di questi sono apprezzatissimi e utilizzatissimi anche oggi. Un esempio è DeepL, che a lungo è stato considerata una delle soluzioni più efficaci per tradurre testi, soprattutto in ambito professionale. Il suo punto di forza è l’approccio che pur facendo leva sin da quanto è nato sull'intelligenza artificiale, non delega tutto alle macchine, ma fa affidamento anche sulle persone. E ha continuato a farlo anche da quando ha iniziato ad appoggiarsi ai LLM, addestrandoli però in maniera specifica proprio sulle traduzioni e non sulla generazione di testi o altro. 

Così DeepL evolve per adeguarsi all’era dell’IA

David Parry-Jones

Abbiamo lanciato DeepL 6 o 7 anni fa, facendo affidamento alla tecnologia che c’era ai tempi. Già allora utilizzavamo un mix di macchine e persone per fare traduzioni di alta qualità”, dice David Parry-Jones, Chief Revenue Officer dell’azienda. “Oggi proseguiamo su questa strada, ma usiamo nuove tecnologie, e continuiamo ad affidarci alle persone”. Per quanto riguarda la tecnologia, anche DeepL oggi utilizza i Large Language Model per le sue elaborazioni, ma si tratta di modelli affinati internamente, specifici per questo tipo di applicazione, che Parry-Jones definisce dei TLM, Translation Language Model. A fare la differenza rispetto ai LLM classici è il set di dati usato per l’addestramento, ed è qui che entrano in gioco le persone. Che si occupano di sviluppare e tenere aggiornati i dizionari specifici per ogni settore verticale, che contengono tutti i lemmi tecnici e non usati nei vari ambiti, come potrebbe essere il settore legale, quello finanziario, anche quello minerario. In questi ambiti, infatti, non sempre è facile trovare il termine più corretto per tradurre una parola o un concetto usando traduttori generici: avere dei dizionari specifici è un supporto di enorme importanza per traduzioni di qualità di documenti legali, finanziari e in generale tecnici.

Continueremo a investire su questo fronte”, spiega Parry-Jones, “sviluppando non solo dizionari specifici per settori industriali, ma anche dedicati a specifici clienti, soprattutto se questi lavorano in grandi aziende operanti in settori verticali. Così facendo, la nostra tecnologia è in grado di capire immediatamente il contesto in cui opera”. Ed è proprio questo che secondo il CRO differenzia DeepL dai tanti traduttori generici disponibili sul mercato che usano “Large Language Model e non Translation Language Model come facciamo noi”.

Ma che modello usa DeepL? “Abbiamo sviluppato il nostro modello internamente appoggiandoci a un’infrastruttura open source e sullo stack di NVIDIA. E abbiamo addestrato questo modello in maniera specifica sulle traduzioni. Possiamo definirlo un modello generico, o più correttamente industry standard, ma la fase di training è stata molto specifica sulle nostre esigenze”.

Un aspetto interessante del mix fra tecnologia e persone è il concetto di human in the loop: in pratica una persona che va a verificare i risultati proposti dal modello assicurandosi che il testo tradotto sia corretto e accurato. Un aspetto di estrema importanza su documenti sensibili come quelli legali e finanziari. Con l’evoluzione della tecnologia “il tempo speso dalle persone in questi controlli è in costante diminuzione. Questo significa che ora è possibile tradurre interi archivi, cosa che prima sarebbe stata proibitiva in termini di costi. Questo apre anche la strada a nuovi casi d’uso, per esempio agli information provider”, che possono tradurre in più lingue quantità enormi di testi.

deepl-translator-hero-image

Con più tempo a disposizione, però, l’obiettivo non è quello di ridurre il personale, che invece verrà utilizzato per altre attività, come il training del modello, la realizzazione e l’aggiornamento dei dizionari, “e anche per far sembrare più umane e meno robotiche le nostre traduzioni. Sono proprio le traduzioni e le modifiche fatte dagli umani che ci distinguono dalla concorrenza”, afferma Parry-Jones.

Non solo testi: DeepL traduce anche le conversazioni

Negli anni DeepL è stato dotato di nuove funzionalità, e fra queste spicca la traduzione vocale in tempo reale, che può essere usata anche durante conversazioni fra persone che non parlano la stessa lingua.

deepl Voice

Per assicurarsi che la qualità sia adeguata, anche in tempo reale, l’azienda ha eseguito svariati benchmark interni, facendo anche test A/B in cieco con le soluzioni di traduzione di altri produttori. “Siamo piuttosto sicuri di posizionarci fra i migliori sul mercato per qualità delle traduzioni e accuratezza. Se siamo i primi, i secondi o che è un fatto molto soggettivo e dipende molto dal contenuto che si sta traducendo e l’interpretazione che ne si dà”.

0 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - info

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.
^