lunes, 21 de diciembre de 2015

MOTORES DE BUSQUEDA

Los buscadores son, sin duda, los instrumentos más utilizados para localizar información en Internet. Un buscador es, en realidad, una herramienta que gestiona bases de datos de URLs con distintos contenidos. Existen distintos tipos de buscadores:

 Índices temáticos: suelen gestionar recursos de información completos compuestos de una o más páginas web. Funcionan a modo de catálogos o directorios por categorías.


 Motores de búsqueda: suelen gestionar páginas. Se trata de buscadores por contenido.

 Metabuscadores: agrupan o combinan las potencialidades de varios motores de búsqueda.


El proceso llevado a cabo por cualquier sistema de búsqueda se puede resumir en las siguientes fases:
  •  recogida y análisis de datos (indización y/o clasificación por categorías)
  •  búsqueda propiamente dicha
  •  recuperación
Tanto la recogida de datos como el análisis de los mismos pueden hacerse bien de forma manual, bien de forma automática.
Para la recogida de datos manual, los Índices suelen presentar un cuestionario en línea para que la persona u organización que quiera darse de alta identifique y clasifique su página web. La mayor parte de los formularios de alta que ofrecen los distintos buscadores piden unos datos obligatorios que suelen ser: el título de la página, URL, descripción y clasificación del recurso; pero también pueden solicitar otro tipo de datos como descriptores o palabras clave, persona o entidad responsable de la página, tipo de información (académica, comercial, personal, informativa, etc.), localización geográfica, idioma, etc. La clasificación tiene como fin la inclusión del recurso en alguna categoría jerarquizada de las que luego se presentarán en el índice temático. Los responsables del buscador suelen analizar y evaluar si la información que provista y el contenido real se ajustan o no.
Los motores de búsqueda suelen utilizar la recogida de datos automática rastreando la red, otros piden la dirección URL para darse de alta. Disponen de un robot que visita y analiza la página principal y todas las páginas enlazadas y que suele ser capaz de leer las etiquetas META o metadatos y extraer toda la información contenida en ellas mediante el lenguaje HTML. Sin embargo, muchas páginas no disponen de tales etiquetas. Con dicha información, el buscador es capaz de indizar palabras clave como el título, idioma, autor, propietario, localización, temas, etc. 
Existen sistemas de búsqueda que mezclan estas dos funciones y ofrecen tanto búsquedas por medio de un índice temático y búsquedas libres por palabras clave.
Un buen sistema de búsqueda debe permitir flexibilidad en las búsquedas logos buscadoresofreciendo la posibilidad de elegir entre búsquedas mediante clasificación temática o por medio de formularios. Los formularios deben ofrecer tanto búsquedas sencillas como búsquedas más complejas que permitan algún tipo de herramientas como truncado de palabras, operadores booleanos, términos compuestos, acotación de búsquedas, etc. y con diferentes campos de búsqueda en los que se requiera lenguaje libre o controlado (título, palabras clave, idioma, localización, tipo de información, etc.). También deben ser capaces de controlar el vocabulario para deshacer ambigüedades, sinonimias, polisemias, etc. Además, los sistemas de búsqueda, deben presentar los resultados de la búsqueda de una forma también flexible permitiendo varios criterios de aparición y ordenación de los datos y ofreciendo diferentes formatos para que el usuario elija el que se ajusta a su gusto y necesidades.

No hay comentarios:

Publicar un comentario