Motores de Recuperacion de informacion XML/RDF
Recuperacion y acceso a la informacion
Introduccion a los Motores de recuperacin de documentos XML/RDF
En un principio la World Wide Web fue ideada para uso humano, por lo que la recuperacion y organizacion de la informacion contenidos en ella estaba sujeta al dificil proceso de automatizacion de busquedas satisfactorias para los usuarios. Fue necesario dotar a las paginas Web de metadatos, es decir, informacion sobre los datos contenidos en el documento, como medio de describir e informar sobre los recursos ofrecidos por la Web.
Disponiendo ya de webs que proporcionan informacion en los metadatos acerca de sus contenidos, surgio la necesidad de automatizar el proceso de recuperacion de informacion que describia los diferentes recursos. Como respuesta a esto se realizo la especificacion XML/RDF, dejando como ultimo hito para conseguir una recuperacion eficaz de informacion sobre los contenidos la implementacion de motores de recuperacin de documentos XML/RDF
El ambito de busqueda de estos motores no es la World Wide Web tradicional, sino una extension de la misma denominada Web Semantica, es decir, un entorno al que se le han anadido datos semanticos. Estos, expresados en un lenguaje formal como XML/RDF, permiten describir el contenido, el significado y la relacion de los datos, facilitando su procesamiento automatico.
La adicion de semantica permitira dotar a la Web de una base de conocimiento que satisfara de forma exacta las solicitudes de informacion de los usuarios: Supongamos que un usuario utiliza en la actualidad alguno de los motores de recuperacin de informacion para encontrar los vuelos entre Madrid y Londres que salen esta tarde. Los buscadores actuales devuelven un amplio abanico de resultados, desde webs de aerolineas, informacion sobre Madrid o Londres, y demas informacion descontextualizada. La unica posibilidad para el usuario pasa por refinar su busqueda sobre esos resultados, o incluso redefinir la consulta. La adicion de semantica y su utilizacion por parte de los motores ofrecera a los usuarios una respuesta exacta: vuelos que salen esta tarde de Madrid a Londres. Gracias a la semantica palabras como tarde podran ser interpretadas y el origen geografico podra omitirse al detectarse y contextualizarse adecuadamente.
Por tanto, la ventaja de la dotar a la Web de contenido semantico es que permite ofrecer soluciones a problemas habituales de la recuperacion y organizacion de la informacion, al servirse de una infraestructura mediante la cual la transmision y el procesamiento de informacion se realizan de forma sencilla. La informacion no se procesa por los motores de recuperacion en terminos de entradas y salidas, sino en funcion de la semantica y apoyandose en una redefinicion tanto de los operadores como de los datos.
Las siguientes secciones ofrecen una profundizacion en el concepto de Web semantica, los motores de recuperacion utilizados en la misma y enlaces a documentacion adicional.
Enlaces
Pagina realizada por David Rivera Perez para la asignatura Recuperacion y acceso a la informacion
![Validate my RSS feed [Valid RSS]](valid-rss.png)
