Guido Vetere discute sulle conseguenze della dichiarazione di Erick Schmidt, il capo di Google, secondo la quale il motore di ricerca deve passare dalle parole ai significati per consentire agli utenti di trovare le informazioni che veramente cercano. Per Vetere questo significa passare dal “detto” al “fatto”. Oggi, dice Vetere, Google cerca tra le parole che i siti dicono. Sta agli utenti valutare se ci sono informazioni vere o sbagliate. Ma se Google vuole andare al loro significato e restituire agli utenti quello che veramente cercano, alla fine dovrà cercare tra i fatti ai quali i siti si riferiscono. Qualcosa, dice Vetere, che Wolfram Alpha sta tentando di fare.
Ne aveva parlato anche Marco Varone. Un accenno pure in questo blog.
Se il dominio di senso afferente è del linguaggio scientifico allora la semantica vero-funzionale è efficace. In quel caso la validità della funzione di pertinenza del significato=referente reale non è altro che astrazione per dati su categorie non ambigue. Molti termini linguistici esulano dall’univocità e assumono significato a prescindere dal referente fattuale, come quelli concettuali, quelli fantastici, quelli sociali che prendono senso solo in ambito linguistico, come i ruoli e le convenzioni per non parlare dei valori etici. Anche senza scomodare la semantica testuale, per cui le singole occorrenze hanno significati potenziali che solo l’inserimento in un determinato discorso attualizza. Confido nella potenza della statistica per le funzioni di riduzione della complessità, come quella che esprimerebbe un data mining programmato per circoscritti domini di conoscenza o significato, già elaborati e disponibili in memoria. Quelli che Guido Vetere menziona come “fatti” nell’algoritmo di Wolfram Alpha assomigliano più al modello di semantica a prototipi, con forti delimitazioni del contesto afferente che la renderebbe applicabile. Di certo non “fatti” referenziali ma connettori di pertinenza categoriale. Che sia una delle vie più percorribile è evidente, infatti le categorie del linguaggio scientifico sono le più univoche rispetto al polisemantismo delle lingue naturali. Se si riuscisse a proceduralizzare la differenza di significato tra il termine “tigre” nei due rispettivi domini di senso, artistico e scientifico e in un solo testo, saremmo arrivati già a buon punto. Già si può fare, ma ricorrendo a strategie posizionali, ovvero si assume che il lessema “come” vicino a “tigre” sia sufficiente per una semantizzazione metaforica e quindi non scientifica. Apparte il metodo rozzo, altro problema è che i domini di senso non sono due e opposti come arte-scienza ma innumerevoli. Raggiungere traguardi nella semantica applicata sarà una delle poche vere innovazioni a ricaduta generale.
Arrivare a comprendere il significato pieno di una frase nel suo contesto può essere per Google & Concorrenti un obiettivo commerciale per piazzare meglio la pubblicità, ma sfugge a questi ricercatori che un motore semantico molto avanzato sarebbe poi applicato in molti contesti lavorativi, con la conseguente sparizione di tanti lavori che oggi “sembrano” intellettualmente impegnativi semplicemente perchè non c’è un programma in una macchina capace di replicarlo.
Credo che i politici si dovranno porre a breve (entro 5/10 anni?) il problema di che farne di milioni di colletti bianchi.
La fretta fa presupporre erratamente. L’articolo di Guido Vetere assume la condizione di verità individuale nel riferimento, non quella della semantica a prototipi in effetti. Altra cosa ancora.
@Roberto per Sacconi i laureati dovrebbero cercare lavori da sbianchino, i colletti bianchi magari potrebbero ingegnarsi nell’agronomico, in concorrenza con gli extracomunitari.
Effettivamente sarà un problemino, già ora lo è se applicano la famosa digitalizzazione completa della PA. Non a caso è dal 2001 che se ne parla ma non vedo grossi progressi.