| No comment yet

Le lingue salvate dai bit

Poteva sembrare un esempio illustrativo: Amit Singhal, senior vice president di Google, aveva raccontato a un giornalista di Slate che Star Trek era una fonte d'ispirazione nei progetti di ricerca dell'azienda californiana. Le intuizioni del telefilm di fantascienza hanno plasmato l'immaginario di generazioni. E hanno alimentato idee come il traduttore universale che abilita discussioni in qualsiasi lingua e in tempo reale. 
È una frontiera che non sembra così distante. Anzi. Già Peter Norvig, director of research di Google, aveva dimostrato che le metodologie analitiche rese accessibili attraverso le infrastrutture informatiche del colosso hi-tech erano in grado di elaborare traduzioni veloci e affidabili. L'impegno dei data scientist è stato decisivo nei progressi raggiunti.

Franz Josef Och guida il team di Google dedicato alla machine translation: ha dichiarato in una recente intervista con Der Spiegel di avere ottenuto un "salto quantistico". A fare la differenza ha contribuito anche il web con il suo immenso archivio di documenti che permettono agli algoritmi di apprendere e migliorare. Sono 60-70 le lingue che Google Traduttore può convertire nella sua pagina online oppure attraverso app. È un frammento dei territori esplorati dai data scientist del gigante di Mountain View accanto agli algoritmi di deep learning delle reti neurali sviluppati da Geoffrey Hinton e alle indagini sull'intelligenza artificiale di Ray Kurzweil.

Non resta un traguardo racchiuso tra le mura dei laboratori di ricerca. Sui dispositivi mobili sono già accessibili molte applicazioni software come Vocre e Jibbigo per traduzioni vocali di brevi frasi: è sufficiente parlare nella propria lingua e ascoltare successivamente la pronuncia in un altro idioma. Word Lens converte in tempo reale un testo visualizzato dalla fotocamera di uno smartphone o di un tablet. Sono app utilizzate per esempio durante viaggi all'estero e dai turisti. Duolingo invece ha coinvolto una vasta community dedicata all'apprendimento mediante le traduzioni dai siti web e i suggerimenti di altri iscritti più esperti.

Ethnologue ha censito 7.105 lingue vive: 906 risultano in via di estinzione e 1.481 sono in difficoltà. Tutte fanno parte dell'enorme "language cloud" dell'umanità che abbraccia migliaia di visioni del mondo condensate in parole. Da quando la rete internet è stata aperta ai cittadini ha viaggiato di pari passo con la globalizzazione. Nei primi anni Novanta era diffusa la convinzione che avrebbe generato un appiattimento delle culture. Anni dopo sappiamo che non è stato così.

I social media hanno dimostrato di essere un luogo di memoria attiva. Indigenous Tweets (http://indigenoustweets.com) raccoglie i messaggi su Twitter condivisi dalle minoranze: rivela che piccole comunità linguistiche non superiori a poche decine o centinaia di persone coltivano la pratica delle loro parole grazie al web. Nel tempo hanno elaborato scaffali digitali che sono visibili al pubblico online frammentati in una scia di micropost. È un'agorà di conversazione dove sperimentare l'equilibrio delle identità locali con lo spazio aperto di internet.

La diffusione di laptop, smartphone e tablet alimenta una biblioteca online accessibile a chiunque con video, immagini e audio. YouTube è una miniera di informazioni per trovare testimonianze altrimenti difficili da acquisire: sono registrate da ricercatori e documentaristi. Contribuiscono inoltre blogger e citizen journalist. Quella di Global Voices (http://globalvoicesonline.org) è una comunità globale per discussioni che include dialoghi in swahili e malese. Il crowdsourcing incoraggia l'ampliamento di testi e video in lingue meno diffuse grazie alla partecipazione di volontari come avviene nella community di Ted mediante l'Open Translation Project. E le nuvole digitali del cloud computing sono costellate di arche destinate a preservare i saperi e a renderli vivi. 
Anche i big data portano alla luce una straordinaria complessità. MyMemory è un'Api (application programming interface) progettata dall'italiana Translated.net che ha collaborato con molti giganti dell'hi-tech: semplifica le traduzioni di testi e ha standard elevati di qualità. Nella vetrina di Mashape è la prima all'interno della classifica di Api della sua categoria. Le opportunità che derivano dall'incontro di data scientist e umanisti sono appena intraviste. Il traduttore universale è più vicino che mai.
| No comment yet

Tecnica matematica per rendere 'quasi' perfette traduzioni Google

Una nuova tecnica matematica potrebbe migliorare notevolmente le traduzioni automatiche di Google. Chiunque abbia provato BabelFish o Google Translate sa che forniscono servizi di traduzione utili, ma ben lungi dall'essere perfetti. L'idea di base di questi sistemi e' quella di confrontare un corpus di parole di una lingua con lo stesso corpus di parole tradotte in un altro idioma: parole e frasi che condividono proprieta' statistiche simili sono considerati equivalenti. Il problema, naturalmente, e' che le traduzioni iniziali si basano su dizionari che devono essere compilati da esperti umani e questo richiede tempo e fatica.
  Ora pero', Tomas Mikolov e colleghi di Google a Mountain View, come si legge su arXiv, hanno sviluppato una tecnica che genera automaticamente dizionari e tabelle di frasi che convertono una lingua in un'altra. Il nuovo metodo non si fonda su versioni in diverse lingue di uno stesso documento ma utilizza tecniche di 'data mining' per creare un modello della struttura di una lingua che poi viene paragonato alla struttura di un'altra lingua. Il nuovo approccio e' relativamente semplice: si basa sul fatto che ogni lingua descrive un insieme simile di idee e le parole che vi appartengono devono necessariamente essere simili. Per esempio, la maggior parte dei linguaggi avra' parole per animali comuni come cane, gatto, mucca e cosi' via.
  E queste parole saranno usate nello stesso modo in frasi come 'il gatto e' un animale piu' piccolo del cane'. Il nuovo trucco e' rappresentare un'intera lingua usano le relazioni fra le parole. L'insieme di tutte le relazioni, il cosiddetto 'spazio del linguaggio', puo' essere pensato come un insieme di vettori che vanno da una parola all'altra. Negli ultimi anni, i linguisti hanno scoperto che e' possibile gestire questi vettori matematicamente. Per esempio, l'operazione 're'-'uomo' + 'donna' risulta in un vettore che e' simile a 'regina'. Si e' scoperto che diversi linguaggi condividono similitudini in questo spazio vettoriale: il processo di conversione da una lingua all'altra si riduce allora a trovare la trasformazione matematica che trasforma uno spazio vettoriale nell'altro. Un problema linguistico diventa quindi di tipo matematico e gli studiosi di Google hanno trovato una opportuna applicazione che colleghi i due spazi vettoriali. "Il nostro metodo e' estremamente efficace: abbiamo raggiunto finora una precisione del 90 per cento nelle traduzioni fra inglese e spagnolo", ha commentato Mikolov.
| No comment yet

Francesco Pannofino coinvolto in AC: Blackflag


Ubisoft annuncia la collaborazione con Francesco Pannofino, attore, doppiatore e direttore del doppiaggio italiano, che in Assassin’s Creed® IV Black Flag darà la voce a Edward Teach, meglio noto come “Barbanera”, pirata che dominò lo scenario caraibico tra il 1716 e il 1718.

Nel gioco Barbanera collaborerà con Edward Kenway, protagonista del quarto capitolo di Assassin’s Creed®, addestrato militarmente dalla British Royal Navy, che in età più matura abbandonerà per placare la sete di fama e di oro, portandolo ad issare sul proprio veliero il vessillo dei pirati.

Barbanera avrà un ruolo assolutamente fondamentale nel gioco, il suo rapporto con Kenway sarà infatti molto fitto ed intrecciato, al punto da renderlo un protagonista dell’intera storia. Da qui la scelta di utilizzare una delle voci più apprezzate dell’intero scenario del mondo del doppiaggio italiano: Francesco Pannofino, che tra gli altri è famoso per aver doppiato attori del calibro di George Clooney, Denzel Washington, Kurt Russel, Mickey Rourke, Jean-Claude Van Damme e interpretato uno dei protagonisti della serie televisiva Boris.

“Mi sono divertito davvero molto – ha dichiarato Francesco Pannofino – nel doppiaggio di Barbanera, far rivivere in un videogioco un personaggio realmente esistito con il carisma che ha contraddistinto il Re dei pirati ha sicuramente molto fascino, e spero che i videogiocatori appassionati di Assassin’s Creed® IV Black Flag apprezzino la mia interpretazione”.

Assassin’s Creed® IV Black Flag introdurrà un nuovo eroe ed uno scenario inedito, ma soprattutto darà vita al più vasto e ricco mondo che sia mai stato creato nell’universo di Assassin’s Creed.

In fase di sviluppo da circa due anni, il gioco è prodotto da uno dei team più esperti nel franchise di Assassin’s Creed, il celebre studio Ubisoft di Montreal, con il supporto degli studi di Annecy, Bucarest, Kiev, Quebec City, Singapore e Sofia.   
Assassin’s Creed® IV Black Flag sarà disponibile per Xbox 360® e PlayStation®3 dal 31 ottobre 2013, mentre le versioni per PlayStation®4, Nintendo Wii U™, Xbox One e Windows PC saranno acquistabili nei negozi a partire dal 21 novembre 2013.
| No comment yet

Scarlett Johansson: “A nessuno piaceva la mia voce”

L'attrice ripercorre gli inizi di carriera al magazine “Interview”



Scarlett Johansson si tuffa nel viale dei ricordi nel corso di un'intervista senza filtro al magazine “Interview”. La protagonista di “Lost in Translation” non fatica a trovare la paura che l'attanagliava a inizio carriera: “Da piccola la mia voce ricordava quella di un'idiota che beve whisky e fuma sigarette una dopo l'altra. Sono sempre stata pessima con le pubblicità perché la mia voce è molto profonda. A 9 anni – spiega l'attrice sex symbol - sembrava che fossi un ubriacone. Con quella voce non potevo neanche fare pubblicità per vendere dolci”.

Forse l'artista neworkese stava solo cercando di bruciare le tappe. Un'operazione che gli riuscì poco tempo dopo attraverso il debutto cinematografico a soli 10 anni nella pellicola “Genitori Cercasi” di Rob Reiner. Il tutto a dispetto di un'iniziale presunta diffidenza dell'industria dei sogni nei confronti della futura enfant prodige: “C'era qualcuno nella classe di mio fratello maggiore che aveva partecipato a qualche pubblicità e faceva teatro. Quindi mia madre mi portò da quell'agente per bambini visto che io amavo i musical. Non mi vollero però. Ero devastata. Pensavo – conclude la Johansson - fosse la fine della mia carriera”.
| No comment yet

Etruscan alphabet

Etruscan

The Etruscan alphabet developed from a Western variety of the Greek alphabet brought to Italy by Euboean Greeks. The earliest known inscription dates from the middle of the 6th century BC. Most Etruscan inscriptions are written in horizontal lines from right to left, but some are boustrophedon (running alternately left to right then right to left).
More than 10,000 Etruscan inscriptions have been found on tombstones, vases, statues, mirrors and jewellery. Fragments of an Etruscan book made of linen have also been found. Etruscan texts can be read: i.e. the pronunciation of the letters is known, though scholars are not sure what all the words mean.
No major literary works in Etruscan have survived, however there is evidence for the existence of religious and historical literature and drama. It is also possible that the Etruscans had a notation system for music.
The Etruscan language was spoken by the Etruscans in Etruria (Tuscany and Umbria) until about the 1st century AD, after which it continued to be studied by priests and scholars. The emperor Claudius (10 BC - 54 AD) wrote a history of the Etruscans in 20 volumes, none of which have survived, based on sources still preserved in his day. The language was used in religious ceremonies until the early 5th century.
Etruscan was related to Raetic, a language once spoken in the Alps, and also to Lemnian, once spoken on the island of Lemnos. It was also possibly related to Camunic, a language once spoken in the northwest of Italy.

Archaic Etruscan alphabet (7th-5th centuries BC)

Archaic Etruscan alphabet

Neo-Etruscan alphabet (4th-3rd centuries BC)

Neo-Etruscan alphabet

Sample text in Etruscan

Sample text in Etruscan