I
motori di ricerca: istruzioni per l'uso di Roberto Arcangeli e Francesca Marchei |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Nel redigere questo articolo, abbiamo attinto moltissime informazioni da alcuni siti che trattano con grande perizia di questo argomento, realizzati dai colleghi Susan Larsson (htt://home.ncia.com/~slarsson/sitejour.html), Manon Bergeron (http://www.mabercom.com) e Manten van Steenbergen (che potete contattare all'indirizzo <manten@mindspring.com>), i quali ci hanno gentilmente consentito di utilizzarli. Abbiamo cercato di estrapolare, dalla gran massa di idee, dati e riferimenti disponibili, quelli che più di altri possono servire a rendere le ricerche in rete più rapide ed efficaci. Trattare dei motori di ricerca porta spesso a due situazioni estreme: o si presenta una panoramica in pillole dell'argomento (utile per dare le prime, essenziali indicazioni) o se ne scrive un libro intero (completo da tutti i punti di vista, ma che forse pochissimi hanno il tempo e la pazienza di leggere). Abbiamo cercato di trovare una via di mezzo fra il troppo e il troppo poco, limitandoci a trattare soltanto delle ricerche che interessano noi traduttori. Poiché il tema è amplissimo, lo affrontiamo con la seguente organizzazione schematica, basata su quattro domande chiave: Cosa stiamo
cercando? 1. COSA
STIAMO CERCANDO? Ricerca conoscitiva:
è quella da compiere quando affrontiamo argomenti nuovi o sui quali
non abbiamo una precedente preparazione scolastica o professionale, dando
per scontato che alla maggior parte di noi piace capire quello che sta
traducendo. La ricerca conoscitiva si potrebbe aggirare se il cliente
ci fornisse un'adeguata documentazione di riferimento, meglio ancora se
in entrambe le lingue. Ma sappiamo bene che spesso e volentieri si tratta
solo di un desiderio utopistico e l'infarinatura sull'argomento non resta
che farcela in proprio. La ricerca conoscitiva va fatta verso siti tecnici
e commerciali, oltre che verso glossari monolingue, i quali non ci forniscono
la traduzione che cerchiamo, ma di solito contengono una succinta spiegazione
del termine. Il vantaggio dei siti commerciali, rispetto ai glossari monolingue,
è di avere anche immagini e delucidazioni di vario tipo e non solo
un testo nudo e crudo. +"hydraulic shovel" +machines Otteniamo 35 pagine, ma a colpo d'occhio vediamo il sito del noto costruttore di macchine da cantiere Komatsu e quindi, in pochi secondi, siamo in grado di trovare una pagina dove, con l'ausilio di fotografie e nel giro di una manciata di minuti, capiamo quali sono le differenze principali tra un "hydraulic shovel", un "mining dozer", un "dumper" e così via. Ricerca mirata:
è quella che, senza farci perdere altro tempo con spiegazioni e
fotografie, ci permette di ottenere la traduzione italiana del termine
quando abbiamo già un'idea abbastanza precisa dell'argomento e
dell'oggetto che stiamo trattando (per esperienza o per aver appena completato
una ricerca conoscitiva come quella sopra descritta). Ricerca comparativa:
ora che sappiamo cos'è un "hydraulic shovel" e come si
dice in italiano, potremmo sentire il bisogno di avere conferme, di fare
paragoni, di cercare rassicurazioni. Diciamo, per esempio, che pur confidando
nella qualità di Eurodicautom, ci resta qualche piccolo dubbio.
Si dirà davvero "escavatore" o forse il termine di più
largo impiego è "escavatrice", visto che il soggetto
sottinteso è "macchina"? Allora facciamo una ricerca
comparativa, proviamo cioè a cercare in rete quanti siti usano
la versione maschile e quanti usano quella femminile. Cercando su Altavista,
lingua italiana, host:it, i due soggetti, otteniamo risultati molto chiari.
Da notare che, nella valutazione dei risultati raggiunti, non ci si dovrà
limitare solo a una pura comparazione aritmetica ma si dovrà esaminare
anche la pertinenza dei siti trovati, nell'una o nell'altra versione della
parola. Quasi tutte le ricerche del traduttore rientrano in una delle tre categorie suddette. Avere chiaro se s'intende fare una ricerca conoscitiva, mirata o comparativa è importantissimo, perché da questa scelta nasce poi quella successiva, relativa al tipo di motore di ricerca da adoperare. 2. QUALE
MOTORE DI RICERCA ADOPERARE? Gli indici e le directory utilizzano un programma (che si chiama robot o spider) per esplorare la rete. I siti così trovati vengono memorizzati in un'enorme banca dati, che costituisce la base di ricerca per l'utente. Una breve descrizione dei quattro tipi può essere la seguente: Gli indici (come Altavista, Google, Fast, HotBot, Lycos e Northern Light) sono i motori di ricerca più utili per i traduttori perché, nonostante la selezione e la valutazione sui siti eseguita alla fonte sia minima, di fatto offrono un numero elevatissimo di informazioni. Sta poi al traduttore evitare di perdersi nella miriade di siti che spesso compaiono sullo schermo. Questo obiettivo si raggiunge basandosi sulla razionalità della propria ricerca e sull'abilità nell'usare gli strumenti di affinamento della ricerca. Non meno importante è una capacità d'intuizione che è in parte innata e in parte sviluppabile acquisendo gradualmente conoscenze approfondite sugli argomenti di cui ci si occupa. I motori cercano ciò che noi diciamo loro di cercare. Sta a noi dare le indicazioni corrette per ottenere risultati soddisfacenti. Le directory (per esempio, Yahoo! e About.com) forniscono anche una classificazione delle informazioni. I risultati che offrono in genere sono più attinenti alla ricerca eseguita, rispetto a quelli ottenuti con un indice, poiché queste banche dati sono organizzate per categoria o per argomento. Purtroppo però sono molto più piccole di quelle degli indici. I motori di metaricerca non compilano una banca dati propria, ma combinano quelle degli altri motori, scorrendole contemporaneamente da un'interfaccia unica. Tra i più utilizzati figurano Copernic, Meteor, InferenceFind e Ixquick. Si potrebbero definire "i motori dei motori", in quanto esaminano le banche dati di molti altri indici. Le ricerche eseguite con i motori di metaricerca ottengono il numero più elevato di risultati ma, rispetto a quelle fatte mediante gli indici, hanno strumenti meno selettivi. Mancano dello strumento "language" che, come vedremo in seguito, si rivela spesso prezioso per il buon esito delle ricerche. I database specializzati in genere sono costruiti manualmente a partire da contenuti non reperibili altrimenti in rete. Sono strumenti ideali per i traduttori che cercano informazioni specifiche. Alcuni esempi sono Europa, LawCrawler, Edgar, Medline, Eurodicautom. La domanda,
a questo punto, è: quando utilizzare cosa?
Riassumendo al massimo (con tutte le generalizzazioni che questo può comportare), i criteri base per decidere a quale motore di ricerca affidarsi sono: a) Ricerca conoscitiva, di argomenti generici: directory (Yahoo!, About.com, ecc.) o database specializzati (raggiungibili mediante una ricerca mirata) b) Ricerca mirata: indici (Altavista, Google, Fast, HotBot, Lycos, Northern Light, Virgilio, Ragno, ecc.) c) Ricerca comparativa: indici (vedi sopra), link d) Ricerca di parole molto rare: motori di metaricerca. 3. IN
CHE MODO FORMULARE LA STRINGA DI RICERCA? Noi traduttori lavoriamo sotto la costante pressione dei tempi di consegna, spesso strettissimi. Quand'anche ci siano concessi margini più comodi, resta il fatto che il nostro tempo, come quello del medico, dell'ingegnere o dell'avvocato, vale molto. Il suo valore non è solo esprimibile in termini economici rilevanti, ma anche in prospettiva personale e privata. Due ore impiegate in una ricerca in rete dispersiva e inconcludente, oltre che generare un senso di frustrazione, risultano essere due ore perse per il lavoro produttivo oppure, non meno importante, per la famiglia, le attività ricreative e sociali, il riposo e tutte quelle attività importanti della vita che spesso la professione ci costringe a centellinare. Per essere
soddisfacente, una ricerca deve quindi essere efficace, risolvendo il
problema immediato di traduzione nel modo più esauriente possibile
e nel tempo più breve possibile. Concentrazione 1) Per concentrazione intendiamo la capacità di elaborare una stringa di ricerca centrata sull'argomento che si sta cercando, evitando dispersioni semantiche, ricerche troppo generiche, uso improprio degli strumenti di ricerca. Inoltre la concentrazione è preziosa anche nel corso della ricerca, perché spesso saltare da una pagina all'altra finisce per allontanarci dalla meta iniziale, facendoci perdere tempo prezioso. Come tanti piccoli Ulisse, dobbiamo procedere legati all'albero della nave, affinché il canto delle sirene non ci trascini fuori rotta, sugli scogli. Per esempio: spesso, in una traduzione, non è un interrogativo singolo che ci arrovella. Stiamo cercando una parola o un concetto (A) ma sappiamo anche che, più avanti nel testo, se ne trovano altri parimenti oscuri (B, C). Cominciamo la ricerca del termine (A) e invece capitiamo su un sito che parla di (B). Interessati, cominciamo ad approfondire l'argomento (B) e approdiamo su pagine che trattano di (C). Certo, tutti e tre gli argomenti ci interessano, ma così facendo abbiamo perso di vista l'obiettivo dal quale eravamo partiti, cioè (A) e non abbiamo risolto definitivamente nessuno dei tre interrogativi. La concentrazione è anche fondamentale per poter rapidamente estrarre, dal contenuto di un sito, solo quello che realmente c'interessa, tralasciando tutto quello che, sia pur colorato, attraente e interessante, non serve al raggiungimento del nostro scopo. 2) Per immaginazione
intendiamo quella che si può considerare la dote più impalpabile,
ma a volte anche la più importante del cacciatore d'informazioni
in rete. Capita qui a proposito una bellissima frase di Albert Einstein:
"L'immaginazione è più importante della conoscenza.
La conoscenza è limitata, mentre l'immaginazione abbraccia il mondo." Per rendere il concetto in italiano, il traduttore deve innanzitutto capire di cosa si tratti. I dizionari cartacei non ci aiutano, né la stringa ["balboan discovery"] su Altavista dà alcun risultato. Zero assoluto. Allora qui comincia a mettersi in moto l'intuito. Se è una "discovery", cioè una scoperta, significa che è stata fatta da qualcuno. L'aggettivo "balboan", quindi, ha buone possibilità di derivare da un cognome, in questo caso "Balboa". Potrebbe essere? Perché no... in fondo, gli appassionati di cinema ricorderanno che proprio questo era il cognome del pugile Rocky, interpretato da Sylvester Stallone (anche i "link mentali" sono preziosi, non solo quelli informatici). Il quale, però, menava pugni, non scopriva nulla, quindi è chiaro che non è di lui che si parla. E allora quali altri Balboa sono giunti mai, nel corso della storia, ad essere più o meno famosi? Riformuliamo la stringa su Altavista, stavolta come [+Balboa +discovery] e troviamo subito, al termine della prima videata, una pagina che s'intitola "Balboa, Vasco Nunez de - Famous Spaniard explorer". Ecco qualcuno che potrebbe avere a che fare con una scoperta! Difatti, leggendo la biografia di questo avventuriero, si capisce che la sua presunta scoperta e presa di possesso dei mari del Sud (cioè dell'oceano Pacifico) era una non-scoperta, in quanto tutto quello che vide lui dei mari del Sud (così chiamati perché ci arrivò da nord, attraversando la giungla panamense) fu una spiaggia e dell'acqua. Una volta chiarito il concetto originario, poi è compito del traduttore trovare la definizione italiana più adatta, anche in base al contesto dell'articolo. 3) Per tecnica intendiamo la capacità, importantissima per fare ricerche razionali e concrete, di usare nel modo migliore gli strumenti tecnici che i vari motori di ricerca ci mettono a disposizione. Questi strumenti sono molteplici, e si possono organizzare in una serie vastissima di combinazioni. Quelli più usati, però, non sono poi molti, quindi suggeriamo di dedicare un po' di tempo all'apprendimento e alla sperimentazione di questi strumenti, perché il loro uso appropriato consente risparmi di tempo notevolissimi e risultati migliori dal punto di vista della traduzione. Le righe che seguono elencano gli strumenti esistenti nei vari motori di ricerca e le loro modalità d'impiego, suddividendo l'argomento nei seguenti punti: Ricerca semplice Ricerca semplice Maiuscole/minuscole Ricerca per
frase Jolly Associazione/Esclusione Uso dei campi Language:
seleziona la lingua base in cui un sito è redatto. Questo fattore
è molto utile perché circoscrive la ricerca eliminando dai
risultati siti che, comunque, sarebbero per noi incomprensibili. Ma soprattutto
è utile al traduttore perché spesso consente di "fare
centro al primo colpo". Soprattutto nei siti tecnici e commerciali,
non è insolito che il catalogo prodotti di una ditta italiana sia
riportato anche in inglese all'interno dello stesso sito, o viceversa.
Esempio: se si sta traducendo dall'inglese all'italiano un testo tecnico
e si trova l'espressione "steering wheel" si può impostare
la ricerca ["steering wheel" Language: Italiano]. Si otterranno
moltissime pagine bilingue dalle quali si ottiene subito la traduzione
italiana. Title: trova pagine contenenti la parola o frase specificata nel titolo di una pagina, che compare nella barra in quasi tutti i browser (disponibile in AV, Fast, HotBot, Lycos, Northern Light). Url: trova pagine contenenti la parola o frase specificata nell'URL (disponibile in AV, Fast, Google, HotBot, Lycos, Northern Light). Host: limita la ricerca alle pagine presenti su un computer specifico (disponibile in AV, Fast, Google, HotBot, Lycos, Northern Light). Domain: limita
la ricerca alle pagine presenti all'interno del dominio specificato. Alcuni
esempi di domini che è utile conoscere sono: Image: trova
pagine contenenti immagini con uno specifico nome di file (disponibile
in AV, HotBot). Text: trova pagine che non contengono il testo specificato nei tag delle immagini, dei link o nell'URL (disponibile in AV, Fast, HotBot, Northern Light). Anchor: trova pagine contenenti la parola o frase specificata nel testo di un collegamento ipertestuale (disponibile in AV, Fast, Lycos) Applet: trova pagine contenenti il Java applet specificato (disponibile in AV, Fast, Lycos). Esempio di
ricerca Messaggi
di errore Se invece
compare uno dei messaggi seguenti, significa che per vari motivi la pagina
non è disponibile in quel momento, ma potrà esserlo più
tardi, quindi si può memorizzare l'indirizzo e ritentare: Tabella riepilogativa
Ricerche
di e nei glossari La parola glossario deve essere inserita tra le parole chiave, nella lingua in cui eseguiamo la ricerca. Se non troviamo niente con glossario, tentiamo qualche sinonimo (lessico, dizionario, enciclopedia, "le parole del*" ecc.). Spesso poi ci interessa ottenere una definizione o una spiegazione di un determinato concetto. In questo caso, oltre a considerare l'ampiezza del database del motore di ricerca, può essere importante scegliere tra quelli che gestiscono i segni di interpunzione in modo ottimale unitamente alla ricerca per frasi, come Altavista, Fast e Lycos. Nel caso di termini particolarmente rari, anche i motori di metaricerca come Ixquick e Meteor ci possono dare una mano, dato che comprendono molti dei motori principali e possono gestire sia il segno + sia le ricerche per frasi tra virgolette (" "). Può capitare che non esista un glossario con l'espressione che ci interessa: in tal caso possiamo fare una ricerca per frasi nel tentativo di trovare una spiegazione efficace. Esempio: "brick and mortar significa", oppure "brick and mortar means", "brick and mortar refers to", "click and mortar is" (che ci avrebbe portati alla stessa pagina citata sopra), e via discorrendo. Nel caso
di glossari bilingue, usando i caratteri jolly possiamo trovare le informazioni
che ci servono lasciando aperta la possibilità che il sito sia
stato redatto nell'una e/o nell'altra lingua della combinazione di nostro
interesse. Tuttavia, il sistema più efficace in genere è quello di inserire una stessa parola chiave nelle due lingue: per esempio, per trovare un glossario italiano-inglese sulle ferrovie, potremmo inserire +railway +ferrovie +glossar*, oppure +railroad +ferroviari* +glossar*. 4. COME
VALUTARE I RISULTATI OTTENUTI? Va sottolineato che anche quando i risultati ottenuti sono moltissimi, quelli pertinenti sono al massimo una trentina, quindi non vale la pena di scorrere 20 pagine di indirizzi, ma basta limitarsi a esaminare i primi 30. In genere
i motori di ricerca forniscono varie informazioni sulla pagina dei risultati. L'URL è un dato essenziale, in quanto ci dice immediatamente in quale paese o dominio è registrato il sito. Inoltre ci aiuta a eliminare i doppioni o le pagine estratte da uno stesso sito. Se poi vediamo che si tratta di un sito non pertinente, possiamo raffinare la ricerca escludendolo (p. es. +benz -url:www.mercedes.com). La data della pagina si riferisce alla creazione o all'ultima modifica. Tuttavia, essendo fissata dal webmaster, non sempre indica un aggiornamento di contenuto. La dimensione della pagina (size) è importante in quanto è preferibile aprire le pagine meno pesanti, tra i vari siti ugualmente promettenti. La percentuale di pertinenza ovviamente indica il grado di attinenza alla richiesta. Tuttavia, non sempre l'indicazione fornita dal motore di ricerca corrisponde a quella che faremmo noi, sulla base delle nostre esigenze. La lingua indicata è quella in cui è scritta la pagina dell'URL. Bisogna però tenere conto del fatto che i criteri di selezione della lingua 'ufficiale' di un sito multilingue non sono sempre chiari. Se i risultati ottenuti sono troppi, possiamo raffinare la ricerca aggiungendo altre parole chiave che riteniamo possano comparire nei siti che ci interessano (esempio: +london +map +zoom) o escludere parole chiave che compaiono in siti ovviamente non attinenti alla ricerca (esempio: +london +map -hotel). Infine, come abbiamo visto prima, possiamo escludere un URL. Un'altra
soluzione può essere quella di fare la stessa ricerca con altri
motori. I primi risultati di Google di solito sono più attinenti
all'argomento che ci interessa rispetto a quelli restituiti, per esempio,
da Altavista. Inoltre con Google si possono visualizzare fino a 100 risultati
sulla stessa pagina e le parole chiave vengono evidenziate in neretto
o in un colore diverso - nel contesto in cui compaiono. Se invece
i risultati sono troppo pochi, bisogna modificare le parole chiave inserite. Possiamo poi eliminare parole chiave non essenziali, oppure cambiare la combinazione (associazioni ed esclusioni diverse), o utilizzare dei sinonimi. Il passo
successivo è controllare la qualità dei risultati, per essere
certi di poterci fidare. Nel caso di un termine, per esempio, guarderemo
se il contesto è quello giusto, se la fonte è ragionevolmente
autorevole e se il sito nel suo complesso è caratterizzato da un
buon livello stilistico. Un altro indicatore è il livello di 'popolarità' del sito trovato: utilizzando la funzione link: (link:indirizzo del sito senza www) troveremo tutti i siti che contengono un collegamento ipertestuale alla pagina su cui stiamo lavorando, ed è ragionevole ritenere che più sono le persone che hanno visitato e apprezzato quella pagina al punto da inserirla tra i link consigliati, più è affidabile ciò che vi troviamo scritto. CONCLUSIONE Si tratta essenzialmente dell'hardware (computer, stampanti, fax, modem, scanner, ecc.), del software (soprattutto programmi di elaborazioni testi e di traduzione assistita) e di Internet (soprattutto ricerca di informazioni in rete). Questo articolo
ha trattato dell'ultimo di questi tre fattori, ormai divenuti essenziali
nel lavoro di ogni traduttore. La bibliografia reperibile in rete o su
carta è piuttosto ampia. Abbiamo cercato di operare una sintesi
che presentasse, all'interno di un testo non eccessivamente lungo, tutti
gli aspetti principali, le informazioni e i suggerimenti per compiere
ricerche efficaci in rete e trovare spunti interessanti per razionalizzare
il proprio lavoro.
|