martedì 27 maggio 2008

Searching e finding: le caratteristiche di un sistema di information retrieval

Il capitolo dedicato al search e al finding del libro Information Architecture for Information Professional di Sue Batley comincia con questa considerazione: dato che durante la ricerca e il finding l’utente attua molteplici strategie-tattiche e che maggiori sono le sue competenze per performarle maggiore sarà la probabilità di ottenere risposte soddisfacenti allora il migliore sistema di information retrieval è quello che supporta il maggior numero e tipo di strategie in modo user friendly.

Il modello detto 'berrypicking' proposto da Marcia Bates (The design of browsing and berrypicking techiques for on-line search interface) infatti incorpora sia le strategie di analytical searching che quelle di finding (browsing or foreging).

Le strategie di analytical searching sono ulteriormente descritte nell’approccio building block e pearl-growing di Harter, e la tecnologia a supporto di questo tipo di strategia è il motore di ricerca, Google ad esempio. E’ una strategia iterativa e il successo dipende sia dai feedback del motore di ricerca che, come già accennato, dalla capacità del searcher di interagire col sistema.

Le tecniche base che un motore di ricerca deve consentire sono

A) Poter combinare i termini (ricerca logica, di frase e prossimità)

B) Modificare i singolo termini:wildcards e troncamento

C) Restringere il campo della ricerca: campi e limiti

Queste sono discusse tutte in modo esaustivo dall’autrice attraverso esempi

Il finding, il trovare, è invece basato sulla struttura che organizza l’informazione. L’informazione e i contenuti vengono organizzati in strutture e navigando tra queste noi troviamo ciò che cerchiamo. Le strutture si basano sui sistemi di classificazione o-e sulle tassonomie, possiamo affermare dunque la tecnologia che supporta questo tipo di strategie è appunto la tassonomia, quanto migliore è la sua costruzione tanto più alta la possibilità di trovare ciò che cerchiamo.

Un esempio è Open Directory, ‘the most widely distributed data base of Web content classified by humans’, un altro esempio sono i menu che consultiamo in quasi tutti i siti web.

Una delle possibili strategie del finding è il browsing, termine derivato dalla esplorazione degli scaffali disposti nelle biblioteche, la Batley preferisce invece riferirsi al ‘foraging’ (NdR:modello si strategie formalizzato da Peter Pirolli in Information Foraging: A Theory of Adaptive Interaction With Information).

Secondo la teoria del foraging, il browsing è precisamente una delle possibili strategie di ricerca, attività razionale e sistematica: esiste dunque il browsing esploratorio, il browsing per serendipità (cioè guidato dal caso e dall’intuizione), il purposeful browsing (che di potrebbe tradurre con intenzionale ovvero attivato dal bisogno di trovare informazione su un soggetto specifico.

L’architetto dell’informazione deve essere consapevole della complessità dei meccanismi coinvolti per fornire i tools più adatti a supportare il foreging.

Dunque è importante considerare le caratteristiche dei diversi sistemi di classificazione poiché ogni sistema possiede pregi e difetti rispetto all’espressività e all’ospitalità, proprietà vitali della classificazione, ma purtroppo affermarla Bates, mutualmente esclusive.

I sistemi di classificazione possono essere:

  • enumerativi per esempio, Library of Congress (difetti: 1. quelli puri non gestiscono le multidisciplinarietà, la possibilità che uno stesso oggetto possa appartenere a diverse classi, nella tassonomia digitale invece un oggetto può avere differenti link da diversi punti della struttura ad albero, l’importante che sia organizzati logicamente, sequenzialmente o alfabeticamente 2. non sono ospitali, ma NB LLC non è puro cioè non è gerarchico )
  • a faccette, sono dotate di ospitalità, nuovi soggetti possono essere inseriti: Universal Decimal Classification, le faccette sono usate per indicare la relazione tra i concetti classificati indipendentemente; Bliss Bibliographic Classification dove lo stesso soggetto è accessibile da percorsi differenti. Può fallire sul fronte dell’espressività
  • ibridi, enumerativi + faccette, per esempio la Dewey Decimal Classification soddisfa l’ospitalità, ma ha una gerarchia troppo profonda e quindi non ideale per il browsing (lo schema è reperibile nel sito Online Computer Lybrary Center, OCLC). Si rischia anche di avere tassonomie troppo sbilanciate con l’aggiunta di nuovi soggetti perdendo efficienza quale tool per trovare l’informazione.

Inoltre anche se la tassonomia, come della Open Directory Project, facilita il finding, l’utente infatti, deve semplicemente riconoscere tra i link proposti quello più interessante, tuttavia emergono alcuni limiti dovuti all ‘indicizzatore’ umana quando assegna i documenti ad una data categoria (lentezza-costi e consistenza), o dovuti all’uso del poli-gerarchia quindi al disorientamento dell’utente.

Si sta tentando dunque di sostituire il lavoro umano con la classificazione automatica (come nel progetto OCLC), ma sembra che una alternativa soddisfacente alla classificazione manuale non sia stata ancora trovata, in particolare per quanto riguarda l’indicizzazione e la classificazione di tutte le informazione che passano nel web.


Considerazioni relative alle soluzioni di Intellisemantic

Sulla base di questa lettura ho potuto notare che si stanno diffondendo sistemi ibridi che minimizzino cercano di minimizzare i limiti e massimizzare i vantaggi primi discussi, e che la facet classification effettivamente offre un supporto alla foreging o browsing più adatto, in particolare quando il dominio della conoscenza è abbastanza omogeneo o quando per diversi domini si possono adottare diverse faccette. (Per approfondire la classificazione a faccette si consiglia la lettura del saggio di Claudio Gnoli, Vittorio Marino e Luca Rosati ‘Organizzare la conoscenza. Dalle biblioteche all’architettura dell’informazione per il web’ )

L’approccio di Intellisemantic allo sviluppo dei sistemi di information retrieval risponde ai requisiti suggeriti dalla Bates: in primo luogo fornendo all’utente il maggior numero di supporti alle strategie di searching e finding integrando la funzionalità di ricerca analitica con quella deputata al browsing-foreging, nel nostro caso con classificazione-navigazione a faccette (analitico-sintetica); in secondo luogo adotta per la classificazione un sistema ibrido cioè è presente sia classificazione gerarchico enumerativo che a faccette, in terzo luogo limita i problemi di consistenza adottando vocabolari controllati e thesaurus quando è possibile, in quarto luogo consente un certo livello di classificazione automatica dei contenuti per mezzo del mapping semantico della piattaforma H-Dose, per ultimo, ma forse più importante progetta i sistemi adattandoli a specifici bisogni degli utenti e delle organizzazioni e migliorandoli costantemente.

lunedì 26 maggio 2008

Information Architecture for Information Professional Designer di Sue Batley, breve recensione

Information Architecture for Information Professional Designer di Sue Batley, esperta di Information Retrieval Systems alla London Metropolitan University, è un libro che si propone di dare delle guideline pratiche per sviluppare, valutare e mantenere efficiente un sistema informativo che ha l’ obiettivo di rendere accessibile l’informazione.

Come afferma l’autrice, infatti:

‘The aim of a information architecture is to create well-structurated, attractive and one deployed, well-maintained information system that allow user to search for and retrieve information quickly and efficentely’.


In questa ottica la progettazione del sistema deve essere basata sui core concepts dell’architettura dell’informazione: indicizzazione, classificazione, catalogazione e user-center design. I primi tre concetti riguardano l’organizzazione dell’informazione, il quarto discute il modo in cui deve essere resa accessibile agli utenti.

E’ una analisi dunque indirizzata alle diverse professionalità che si occupano dell’organizzazione e gestione della conoscenza e delle informazioni in generale, e delle biblioteche in particolare. Le figure professionali e le specifiche competenze (skills) degli architetti dell’informazione sono illustrate negli ultimi paragrafi, al fine di ricapitolare tutte le questioni implicate nella progettazione.

L’autrice dopo avere fornito una definizione di architettura dell’informazione (Cap 1) nei successivi 6 capitoli spiega come affrontare le singole ‘fasi’ della progettazione, ognuna delle quali ha un ‘esperto ideale’

2. Conoscere profondamente gli utenti, Information Audit and Task Analysis

3. Le funzioni di searching e finding

4. Descrizione dei documenti e gestione del contenuto, Dubline Core e Thesauri

5. Design dell’interfaccia

6. Gestione e manutenzione dell’architettura dell’informazione

7. Metodi per valutare architettura, applicati in tutte le fasi in modo iterativo

Normalmente ‘i professionisti dell’informazione’ entrano nel merito delle diverse fasi anche se difficilmente possono padroneggiarle, la materia è troppo vasta. Quindi questo libro si rivela utile per avere una visione d’insieme e un linguaggio comune dell’intero processo progettuale. Ogni ‘fase’ è discussa evidenziando i fondamenti e lo stato dell’arte, fornendo sia le basi teoriche che le applicazioni pratiche.

Molto utili sono anche i riferimenti argomentati nel testo alle più importanti organizzazioni che sviluppano e-o adottano determinati sistemi di information retrieval e che sono facilmente accessibili on-line. Ulteriore risorse per approfondire sono suggerite alla fine di ogni capitolo, i guru del settore relativo, oltre alla usuale bibliografia di riferimento.

Ho trovato ovvio, ma non superficiale, il capitolo dedicato all’interface design, proprio perché è il tema con cui ho maggiore familiarità, mentre in ognuno degli altri ho sempre colto stimoli nuovi per ulteriori approfondimenti. Diversamente, un bibliotecario potrà rimanere ‘folgorato’ dal concetto di affordance di Norman e sorvolare sulle caratteristiche della classificazione della Library of Congress.

Il libro si apre e conclude con due cattive notizie: prima di tutto, non esiste un sistema ideale preconfezionato e universalmente valido, il Capitolo 2 e 3 argomentano questa criticità e ci illustrano i metodi per fare il meglio possibile a seconda del contesto; in secondo luogo, il sistema deve essere continuamente monitorato e aggiornato perché l’informazione è una materia vivente e la conoscenza sempre in evoluzione,a questo proposito ho trovato il capitolo 6 ‘ Management and Maintenance, con la gerarchia del processo di McKeever’s ‘semplice’ e illuminante.

Nel prossimo post un approfondimento sul capitolo dedicato al finding e searching

lunedì 19 maggio 2008

I fondamentali dell’E-Commerce: non solo marketing. Le strategie dell’utente, cosa cerca come e perché.

Si enfatizza molto il ruolo del posizionamento del sito web sui motori di ricerca e il pay per click, quando ciò che conta è il tasso di conversione e di fidelizzazione ovvero il fatturato. Sempre più diffusi i tools che consentono di valutare e comparare le specifiche campagne marketing (come i web analytics), e-o i comportamenti degli utenti, (i web-tracking), per poi scoprire che la user experience è il fattore più importante.

Con piacere ho constatato che al Forum sul e-commerce, organizzato da Netcomm il 14 giungo a Milano, gli interventi hanno affrontato la ‘questione e-commerce’ come sistema e processo complesso da pesare costantemente intorno all’utente, in questo caso al consumatore.

Nei paesi anglosassoni, dove è nato lo user center design, la user experience è al centro delle strategie dello sviluppo del web e sappiamo che il web 2.0 ha il suo core nell’intelligenza collettiva più che nel marketing e nella tecnologia di per sé. Certo si continua a parlare di marketing e tecnologia, ma come viral marketing, marketing esperienziale e co-design ovvero includendo sempre l’utente, i suoi bisogni ludici, informativi, creativi, partecipativi.

Ma ciò che è fondamentale per un sito e-commerce è la capacità di supportare le strategie di ricerca dell’utente, al tempo stesso idiosincratiche e cognitivamente determinate.
Per essere esatti l’utente cerca e trova, e qualsiasi sia la natura del sito queste azioni imprescindibili.

Quindi come responsabile del marketing di prodotto di Intellisemantic devo approfondire tutti gli aspetti che riguardano l’information retrieval. Non è sufficiente conoscere i bisogni di business dei nostri partner e il mercato di riferimento, ma occorre avere una visione completa delle problematiche legate a questo universo, aggiornarsi per discernere i fads, le soluzioni ‘alla moda’ e quelle davvero sostanziali.

E’ anche vero che l’Italia presenta un quadro diverso, e mi si può obbiettare che l’arretratezza italiana giustifichi la trascuratezza della progettazione, eppure sono convinta che sia tale superficialità nel design a contribuire allo scoramento di tanti potenziali utenti del web.

Quindi voglio condividere questo approccio con le letture ed eventi che mettono al centro l’utente, e i metodi e le tecnologie per un information retrieval system efficace e user friendly.

Il prossimo post è dedicato al libro Information Architecture for Information Designer di Sue Batley Senior Lecturer in Information Managemented ed esperta di Information Retrieval Systems alla London Metropolitan University.

domenica 30 marzo 2008

Blog


Con il rinnovo del sito, IntelliSemantic Srl presenta un'altra novità: l'apertura di un suo blog. Attraverso il blog comunicheremo news sulle nostre attività, sui nostri prodotti e sulle applicazioni semantiche e i brevetti in generale. Potrete anche intervenire commentando i post, oltre che contattandoci direttamente.

Buona navigazione dallo staff di IntelliSemantic!