Un nuovo tool per cercare dati: WolframAlpha

/ Articolo / Un nuovo tool per cercare dati: WolframAlpha
  • Condividi

WolframAlpha è un nuovo strumento per cercare informazioni in rete, molto diverso da quelli cui siamo abituati. Ha ottime capacità di interpretazione della lingua naturale, calcolo, disegno di grafici e presentazione dei risultati e promette di essere un ottimo complemento a Google e Wikipedia.

WA è specializzato nel trattare informazioni numeriche o scientifiche, per cui non è un concorrente di Google più di quanto i tapis roulant lo siano delle biciclette. Infatti anzichè "search engine" si autodefinisce un "computational knowledge engine".

Il servizio è attivo da pochi giorni (è stato lanciato il 15 maggio) e Stephen Wolfram (famoso per Mathematica) giura che migliorerà col tempo, ma già ora ha capacità impressionanti (video).

'<h' . (('4') + 1) . '>'Cosa fa
'</h' . (('4') + 1) . '>'

La forza di questo prodotto è nella grande quantità di dati (soprattutto scientifici) catalogati in base al loro significato ed alla capacità di interpretare il linguaggio corrente per cercarli. Per esempio è in grado di identificare come tali, e dare informazioni dettagliate e grafici su, azioni, pianeti, città, molecole, telescopi orbitanti, inclusi gli andamenti temporali, la posizione in cielo rispetto al punto (stimato) da cui ci colleghiamo, le coordinate, la struttura, la posizione corrente. Risponde anche a domande tipo capital of burundi, distance earth moon, weather in rome (ora o alla nascita di Napoleone), ed essendo basato su Mathematica è forte in confronti e calcoli, integrali compresi. Ovviamente conosce anche il senso della vita :).

'<h' . (('4') + 1) . '>'Cosa non fa'</h' . (('4') + 1) . '>'

Non ricerca siti web, per cui cercare cose come travel, sex o news porta a definizioni da dizionario o valori azionari. Del vino o dei tartufi mi da i valori nutrizionali ma ignora l'aspetto gastronomico, e conosce solo i dettagli minimi dei film più famosi. Insomma, è pressochè inutile per gran parte delle cose che cerchiamo di solito in Google.

'<h' . (('4') + 1) . '>'Problemi (ovvero: cosa dovrebbe fare ma non fa)
'</h' . (('4') + 1) . '>'

Mentre sa dividere l'altezza dell'Everest per la lunghezza del Golden Gate, per qualche motivo non riesce a dividere la distanza Terra-Venere per quella Terra-Luna (pensa ad una cittadina texana di nome Venus!), semplicemente non capisce "distance earth venus / distance earth mars" e capisce ma non calcola "distance milan rome / 2". Curiosa poi la risposta a tax: la interpreta come "Crema, Lombardy | total sales tax rate" e mi informa che il dato non è disponibile. La risposta è chiaramente dipendente dalla mia posizione geografica.

'<h' . (('4') + 1) . '>'Note legali'</h' . (('4') + 1) . '>'

Come nota groklaw WA reclama il copyright su cio che produce: chi ne riproduce un risultato deve attribuirne la fonte (pare che in futuro vogliano anche specificare quali icone usare all' uopo...)

'<h' . (('4') + 1) . '>'Conclusione'</h' . (('4') + 1) . '>'

Sono rimasto molto impressionato dalla quantità delle informazioni disponibili, la qualità della presentazione grafica e la flessibilità nell'interpretare la lingua inglese. Mi sembra un ottimo strumento per cercare dati da enciclopedia (solo dati, non un articolo come su wiki) e non dubito che ne farò uso piuttosto spesso, ma sono scettico sui possibili miglioramenti (eccetto per la soluzione dei problemi accennati sopra, chiaramente pecche di gioventù).

La forza dello strumento viene soprattutto dalla abilità di interpretazione semantica delle informazioni, che può essere automatizzata per cose come metereologia, cartografia, mercati azionari, genetica o chimica, ma richiederebbe un intervento umano diretto per classificare tutta una serie di altre cose disponibili in rete (news, letteratura, commercio al dettaglio). Qualcosa si potrà forse fare per i dati statistici, se chi li raccoglie ha interesse a divulgarli gratuitamente. Sarà anche molto complicato ottenere la stessa capacità di capire il linguaggio naturale in altre lingue, lo sforzo richiesto è un'altro ordine di grandezza rispetto a quello per una semplice traduzione.

Insomma, credo sia un gran bel giocattolo. Come altri ho dei dubbi su quanto possa essere utile per usi seri o esteso ad informazioni meno strutturate. Spero che sia economicamente sostenibile perchè è molto efficiente nel reperire certe informazioni.

Un'ultima nota: lo sforzo di rendere più semanticamente rilevanti le informazioni reperibili in rete non è un'esclusiva di Wolfram: da anni si parla di "semantic web" e si cerca di promuovere l'uso di XML al posto di HTML. Dovrebbe essere quasi sempre possibile sostituire HTML con XML e stilesheets, ma funziona solo nei browser moderni, e non perfettamente, per cui per ora le applicazioni sono rare. Inoltre altre società, tra cui Google, stanno cercando di migliorare l' interpretazione semantica delle informazioni disponibili, di regola in modo meno radicale.

Indietro

Commenti

Ci sono 29 commenti

Basta aggiunger un planet :)

http://www68.wolframalpha.com/input/?i=distance+earth+planet+Venus+%2F+distance+earth+planet+mars

P.S.

L'inserimento dei link con firefox su mac osx non mi funziona. Succede anche ad altri?

P.P.S.

Ho scoperto che Adblock plus interferisce con il popup per l'inserimento dei link. Magari potete inserire una nota nella finestra dei commenti visto che è un'estensione di firefox abbastanza diffusa.

 

sei cremasco!?!

 

www72.wolframalpha.com/input/ (pazzesco, fa anche le simpatiche riccati...)

 

Lumezzanese, ma non è la prima volta che il mio IP passa per cremasco.

Quanto alle riccati non le conosco, ma Alpha è basato su Mathematica, il calcolo simbolico (e non) è il suo pane.

Assuming "tax" is referring to cities | Use as a word instead

 

basta cliccare su "a word" per avere la definizione di tax e varie altre invormazioni:

 

tax | charge against a citizen's person or property or activity for the support of government

@checcot

grazie, bel trucco.Per la verità non ho nemmeno controllato la pagina con le istruzioni su come affinare le query.

Proverò il plus (col normale funziona), mi sa che se è mac specific sarà dura.

@Vincenzo

Ok, grazie della segnalazione.Però "Crema,Lombardy | total sales tax rate" non è una città, e comunque per termini abbastanza comuni un po' più di euristica non guasterebbe.

Sono "letti" da tutti i browsers ormai da anni ovvero la praticamente totalità dei naviganti può leggere siti fatti in questa maniera.

Il problema della ancora scarsa diffusione é più imputabile a chi i siti li realizza più che allo stato attuale delle tecnologie; é uno standard pubblicato nel 1999 ma adottato dagli sviluppatori solo di recente (3/4 anni per noi italioti, anche 6/7 per gli States). Più rimane il "parco siti" vecchi, ormai da rottamare (gli euro 0 del web per interderci) , fatti anni fa e che fa diminuire la percentuale dei siti XHTML sul totale.

Tuttavia nel 2009 nessuno, con un minimo di compentenza, si sogna di svilluppare più in HTML ma solo in XHTML.


PS. il anche vostro sito é in XHTML (anche se non passa la validazione)

Forse (e sottolineo forse) Marcello non si riferiva ad XHTML + CSS, ma ad XML + XSL, che è una cosa completamente diversa. Inoltre anche sul fronte XHTML c'è ancora molto da fare, tant'è che questo sito (che, come giustamente ricordi, è in XHTML) suggerisce come content type "Text/HTML". E non potrebbe fare altrimenti visto che, con il content type giusto terrebbe fuori IE (almento fino alla 7 lo avrebbe interpretato come XML, con la 8 non so); inoltre ci sarebbero problemi in caso di errori di validazione (come in questo caso).

 

Tuttavia nel 2009 nessuno, con un minimo di compentenza, si sogna di svilluppare più in HTML ma solo in XHTML.

 

Non è proprio così: la home page di Google è in HTML (nota nei sorgenti i tag br non autochiudenti).

Premesso che mi occupo di tutt'altro (SAP) e mi interesso di queste cose solo a livello amatoriale, sono d'accordo che il problema è più nella cultura degli sviluppatori che nella tecnologia,ma con alcuni caveat:

  1. come suggerisce Paolo, pensavo più a XML+XSL che ad XHTML+CSS (che ha poco a che fare con la semantica dei contenuti).E' una tecnologia molto meno diffusa di XHTML.
  2. sulla carta la tecnologia è matura, ma molti browser hanno problemi di rendering. Già sui CSS ricordo vagamente dei test che mettevano in crisi sia firefox 2 che IE 7.Errori minori, certo, ma molti utenti usano ancora cose tipo IE6

Ovviamente poi molti non hanno interesse a rendere facilmente interpretabili le informazioni che pubblicano, e molti altri son basati su applicativi o toolkit basati su vecchia tecnologia e non hanno un buon motivo per cambiare.

PS. il anche vostro sito é in XHTML (anche se non passa la validazione) 

Premetto che mi occupo di altro (Economics) e seguo queste cose solo in modo amatoriale :) ... voglio precisare che è pressoché impossibile avere un sito con XHTML che passa la validazione e allo stesso tempo aperto a contributi di lettori che fanno copy/paste da altri siti (che hanno a cuore XML come i cavoli a merenda) nei commenti, o collaboratori che inseriscono, spesso, articoli incollati da documenti word  (curioso osservare un caso recente in cui word ha inserito kilobites di codice "nascosto" all'inizio dell'articolo rendendo la homepage semi-invisibile a chi la aprisse con alcune versioni recenti di internet explorer). 

Non voglio iniziare una diatriba sull'uso di XML, ma la home page di google e' in HTML, so what? A cosa servirebbe XML/XHTML in quel caso, se non a sprecare risorse (bandwidth) in modo inutile? Il punto che voglio fare è che XML/XHTML non è la lingua della bibbia o di dio, e serve ad uno scopo preciso: facilitare lo scambio di dati e l'interoperabilità fra diversi siti. Questo però non è lo scopo primario della homepage di Google ne' di nfa, quindi non cerco scuse se il sito non è costituito al 100% da xhtml valido. Renderlo valido comporterebbe l'uso, anzi, lo spreco, di risorse che non abbiamo. Per quanto mi riguarda, l'interoperabilità fra nfa e altri siti si fa tramite rss feed. Se il feed non è xml valido, avrei piacere di saperlo, ma credo lo sia, quindi per quanto mi riguarda sono a posto con la coscienza. 

 

 

Ovviamente è già partita la caccia alle Easter eggs... cose tipo "To be or not to be?", "what's the meaning of life?", "hello", etc...  :o)

Temo che una delle ragioni per la lenta diffusione/adozione di XML siano problemi di questo tipo. Questa volta il brevetto ha punito MS, di solito va dall'altro lato. Ma, be it as it may, l'effetto si vede.

Sui brevetti siamo d'accordo, ma non credo contino molto in questo caso: la tecnologia rilevante è stata pubblicata da W3C anni fa, XML è abbastanza neutrale alla questione, tranne per il fatto che promette molto da anni e probabilmente un sacco di gente si è affannata a brevettare l'acqua calda per poter poi denunciare qualcuno che ci si lava.

Volevo solo segnalare che c'é un nuovo add on per Firefox che permette di visualizzare i risultati di una query su Google e Wolfram Alpha sulla stessa pagina contemporaneamente.

Inoltre se qualcuno e'interessato a dati riguardanti l'America, c'e' un nuovo sito mi sembra molto promettente: www.data.gov