1. Obtenció de dades
AgendaOberta accedeix a fonts d’informació diverses d’arreu dels Països Catalans.
Això vol dir que disposem d’un gran nombre de dades però que al tenir procedències diverses no són compatibles: ni a nivell de format de les dades, ni a nivell de tipus d’informació que proporcionen.
2. Geolocalització
Un cop obtingudes aquestes dades, n’extreiem sempre que sigui possible la informació geogràfica.
Aquesta unificació en el format de la localització ens permet mostrar tots els esdeveniments sobre un mapa, fer cerques per zona georgràfica, per proximitat…
És molt recomanable que si sou els administradors d’una agenda faciliteu la ubicació de l’esdeveniment en un format estàndard, ja que la fiabilitat serà màxima. En cas contrari, intentem desxifrar-ne la ubicació però el marge d’error és més gran.
3. Categorització i etiquetatge
Una altra tasca d’AgendaOberta és la de categoritzar els esdeveniments, ja que en molts casos no disposem d’aquestes dades.
A través de l’anàlisi semàntic de la informació de l’esdeveniment n’extreiem les categories, de manera que és molt més senzill buscar només esdeveniments d’un tipus o establir relacions entre ells.
Altra vegada, quan més ben categoritzada i etiquetada estigui la informació de l’agenda, més fiable serà la seva incorporació a AgendaOberta.
4. Republicació en formats estàndard
Finalment, aquesta informació enriquida és republicada al web d’AgendaOberta per ser consultada directament i també en formats estàndards perquè tothom que ho desitgi la pugui reutilitzar.
A més, AgendaOberta disposa d’una API que permet crear aplicacions a tercers basades en les dades que recollim: api.oberta.cat