Los buscadores son, sin duda, los instrumentos más utilizados para
localizar información en Internet. Un buscador es, en realidad, una herramienta
que gestiona bases de datos de URLs con distintos contenidos. Existen distintos
tipos de buscadores:
Índices temáticos: suelen gestionar recursos de
información completos compuestos de una o más páginas web. Funcionan
a modo de catálogos o directorios por categorías.
Metabuscadores: agrupan o combinan las
potencialidades de varios motores de búsqueda.
- recogida y análisis de datos (indización y/o clasificación por categorías)
- búsqueda propiamente dicha
- recuperación
Tanto la recogida de datos como el análisis de los mismos
pueden hacerse bien de forma manual, bien de forma automática.
Para la recogida de datos manual, los Índices suelen
presentar un cuestionario
en línea para que la persona u organización que
quiera darse de alta identifique y clasifique su página web. La mayor parte de
los formularios de alta que ofrecen los distintos buscadores piden unos datos
obligatorios que suelen ser: el título de la página, URL, descripción y
clasificación del recurso; pero también pueden solicitar otro tipo de datos
como descriptores o palabras clave, persona o entidad responsable de la página,
tipo de información (académica, comercial, personal, informativa, etc.),
localización geográfica, idioma, etc. La clasificación tiene como fin la
inclusión del recurso en alguna categoría jerarquizada de las que luego se
presentarán en el índice temático. Los responsables del buscador suelen
analizar y evaluar si la información que provista y el contenido real se
ajustan o no.
Los motores de búsqueda suelen utilizar la recogida de
datos automática rastreando la red, otros piden la dirección URL para darse de
alta. Disponen de un robot que visita y analiza la página principal y todas las
páginas enlazadas y que suele ser capaz de leer las etiquetas META o
metadatos y extraer
toda la información contenida en ellas mediante el lenguaje HTML. Sin embargo,
muchas páginas no disponen de tales etiquetas. Con dicha información, el
buscador es capaz de indizar palabras clave como el título, idioma,
autor, propietario, localización, temas, etc.
Existen sistemas de búsqueda que mezclan estas dos
funciones y ofrecen tanto búsquedas por medio de un índice temático y búsquedas
libres por palabras clave.
Un buen sistema de búsqueda debe permitir flexibilidad en
las búsquedas
ofreciendo la posibilidad de elegir entre búsquedas mediante
clasificación temática o por medio de formularios. Los formularios deben
ofrecer tanto búsquedas sencillas como búsquedas más complejas que permitan
algún tipo de herramientas como truncado de palabras, operadores booleanos, términos
compuestos, acotación de búsquedas, etc. y con diferentes campos de búsqueda
en los que se requiera lenguaje libre o controlado (título, palabras clave,
idioma, localización, tipo de información, etc.). También deben ser capaces
de controlar el vocabulario para deshacer ambigüedades, sinonimias, polisemias,
etc. Además, los sistemas de búsqueda, deben presentar los resultados de la búsqueda
de una forma también flexible permitiendo varios criterios de aparición y
ordenación de los datos y ofreciendo diferentes formatos para que el usuario
elija el que se ajusta a su gusto y necesidades.
No hay comentarios:
Publicar un comentario