¿QUE ES UN BUSCADOR?
.Un buscador es una página web en la que se ofrece
consultar una base de datos en la cual se relacionan direcciones de páginas web
con su contenido. Su uso facilita enormemente la obtención de un listado de
páginas web que contienen información sobre el tema que nos interesa
La necesidad de los
buscadores
Cuando necesitamos de
Internet, normalmente buscamos información sobre un tema concreto, y es difícil
acceder a una página que la contenga, simplemente pinchando vínculos. Como
solución a este problema surgieron los buscadores. Un buscador es una página
web en la que se ofrece consultar una base de datos en la cual se relacionan
direcciones de páginas web con su contenido. Su uso facilita enormemente la
obtención de un listado de páginas web que contienen información sobre el tema
que nos interesa
El primer buscador fue "Wandex", un índice (ahora
desaparecido
.) realizado por la World Wide Web Wanderer, un robot
desarrollado por Mattew Gray en el MIT, en 1993. Otro de los primeros
buscadores, Aliweb, también apareció en 1993 y todavía está en funcionamiento.
El primer motor de búsqueda de texto completo fue WebCrawler, que apareció en
1994. A diferencia de sus predecesores, éste permitía a sus usuarios una
búsqueda por palabras en cualquier página web, lo que llegó a ser un estándar
para la gran mayoría de los buscadores. WebCrawler fue también el primero darse
a conocer ampliamente por el público. También apareció en 1994 Lycos (que
comenzó en la Carnegie MellonUniversity).
1994, año en el que una pareja de universitarios
norteamericanos (David Filo y Jerry Yang) decidieron crear una página web en la
que se ofreciera un directorio de páginas interesantes clasificadas por temas,
pensando siempre en las necesidades de información que podrían tener sus
compañeros de estudios. Había nacido Yahoo!. El éxito de esta página fué tan
grande que una empresa decidió comprarla y convertirla en el portal que hoy
conocemos. Además del buscador, hoy Yahoo! ofrece muchos más servicios
Los creadores del
popular sitio de búsqueda de la Internet fueron a buscar un nombre para su
creación en la historia reciente de la Matemática y lo hallaron en la palabra
googol que fue creada en 1930 para designar un número formado por un uno
seguido de cien ceros.
El dominio
"Google" fue registrado el 15 de septiembre de 1997
Alrededor de 2001, el buscador Google adquirió prominencia.
Su éxito estaba basado en parte en el concepto de popularidad basado en
PageRank, bajo la premisa de que las páginas más deseadas eran más enlazadas
por otras páginas que el resto. Esta idea permitió a Google disponer las
páginas de una determinada búsqueda en función de su importancia, basada en
este algoritmo, esto es, las páginas más enlazadas por otras páginas se
mostraban en primer lugar
El mercado está ahora
dominado por Google, Yahoo y Microsoft. El resto de grandes buscadores tienden
a ser portales que muestran los resultados de otros buscadores y ofrecen,
además, otro tipo de contenidos que tienen mayor o menor importancia en la
página como hace el propio Yahoo!
Tipos de buscadores
Se pueden clasificar en dos tipos:
Índices de búsqueda
Es el primer tipo de buscador que surgió. En los índices de búsqueda, la
base de datos con direcciones la construye un equipo humano. Es decir, un grupo
de personas va rastreando la red en busca de páginas. Vistas éstas son
clasificadas por categorías ó temas y subcategorías en función de su contenido.
De este modo, la base de datos de un índice de búsqueda contiene una lista de
categorías y subcategorías relacionadas con un conjunto de direcciones de
páginas web que tratan esos temas.
La consulta de un índice se realiza, pues,
a través de categorías. Por ejemplo, si buscamos información sobre el Museo del
Prado deberemos pinchar sobre una secuencia de categorías y subcategorías como
la siguiente: Arte / museos / pinacotecas y seguro que dentro de ésa última
subcategoría hay algún enlace que hace referencia al museo del Prado.
El primer índice de búsqueda que apareció fue Yahoo! que
sigue ofreciendo sus servicios. La ventana de su versión en castellano tiene el
aspecto de la imagen.
Se puede observar que, a pesar de tratarse
de un índice de búsqueda, ofrece también un espacio para introducir palabras
clave (bajo el título de la web). Esto se debe a que todos los buscadores que
ofrecen servicios en la red tienden a satisfacer al máximo las necesidades de
los navegantes, de forma que intentan abarcar toda la gama de posibilidades.
Ejemplos de directorios: Antiguos directorios, Open Directory Project, Yahoo!, Terra (antiguo Olé).
Ahora, ambos utilizan tecnología de búsqueda jerárquica, y Yahoo! conserva su
directorio. Buscar Portal, es un directorio, y la mayoría de motores hispanos
son directorios.
Motores de búsqueda: Son sistemas de búsqueda por
palabras clave. Son bases de datos que incorporan automá
- Motores de búsqueda
Temporalmente,
los motores de búsqueda son posteriores a los índices. El concepto es
diferente: en este caso, el rastreo de la web lo hace un programa, llamado
araña ó motor (de ahí viene el nombre del tipo de buscador). Este programa va
visitando las páginas y, a la vez, creando una base de datos en la que
relaciona la dirección de la página con las 100 primeras palabras que aparecen
en ella. Como era de esperar, el acceso a esta base de datos se hace por
palabras clave: la página del buscador me ofrece un espacio para que yo escriba
la ó las palabras relacionadas con el tema que me interesa, y como resultado me
devuelve directamente un listado de páginas que contienen esas palabras clave.
Por ejemplo, si utilizo un motor de búsqueda para localizar información sobre
el Museo del Prado, simplemente tendré que escribir "Museo del Prado"
en el espacio de búsqueda y pinchar en el botón Buscar. A continuación se me
devolverá otra página con los resultados de la búsqueda: un listado con enlaces
a las páginas solicitadas.
Un buen ejemplo de motor de búsqueda es Google. En el
apartado 2 de esta unidad veremos con detalle cómo realizar búsquedas con él.
De momento, aquí tenemos el aspecto de su página principal.
Observando esta ventana vemos que, en la parte
central-derecha hay una pestaña con el nombre Directorio. Si hacemos clic sobre
ella nos llevará a otra página en la que se nos ofrece realizar la búsqueda por
categorías. Como en el caso de los índices, los motores también tienden a
ofrecer todos los servicios posibles al usuario, y le dan la posibilidad de
realizar una búsqueda por categorías.
Metabuscador
Permite lanzar varias búsquedas en motores seleccionados
respetando el formato original de los buscadores. Lo que hacen, es realizar
búsquedas en auténticos buscadores, analizan los resultados de la página, y
presentan sus propios resultados, según un orden definido por el sistema
estructural del metabuscador1.2.3.- Metabuscadores
Los metabuscadores
son páginas web en las que se nos ofrece una búsqueda sin que haya una base de
datos propia detrás: utilizan las bases de varios buscadores ajenos para
ofrecernos los resultados. Un ejemplo de metabuscador es Metacrawler.
enviar la
cadena de búsqueda a una serie de motores de búsqueda e índices temáticos
previamente definidos. Una vez realizada la consulta a los buscadores
prefijados, el
El metabuscador es un
sistema que localiza información en los motores de búsqueda más usados y carece
de base de datos propia y, en su lugar, usa las de otros buscadores y muestra
una combinación de las mejores páginas que ha devuelto cada uno. Un buscador
normal recopila la información de las páginas mediante su indexación, como Google o bien mantiene un amplio directorio temático, como Yahoo.
La definición simplista sería que un metabuscador es un buscador en buscadores.
Ventajas
La
ventaja principal de los metabuscadores es que amplían de forma notoria el
ámbito de las búsquedas que realizamos, proporcionando mayor cantidad de
resultados. La forma de combinar los resultados depende del metabuscador
empleado.
Puesto
que muchos multibuscadores muestran
en los resultados la posición de la web en los
buscadores nos permite evaluar la relevancia de cada web mostrada.
Hay que
tener en cuenta que cada buscador utiliza
su propia estrategia a la hora de recoger la información y ordenar
los resultados de las búsquedas, por lo que las páginas de mayor relevancia en
un buscador no tienen por qué coincidir con las del resto, aportando puntos de
vista distintos.
Desventajas
Una de
las desventajas importantes es que mientras que cada buscador dispone de su
propia sintaxis de búsqueda los metabuscadores no distinguen entre las
diferentes sintaxis. Por lo tanto, al buscar información muy específica es
mejor emplear buscadores de los que conozcamos la sintaxis osea que se puede
conectarse con varias maquinas.
Es de
notar que no resultan muy claros los criterios empleados por los diversos
multibuscadores para la ordenación de sus resultados.
Al buscar
en varias fuentes, la obtención de resultados suele ser más lenta que en un
buscador normal. Muchos de los multibuscadores permiten establecer un tiempo
máximo para realizar la búsqueda
Como funcionan los buscadores
Llevamos varios posts en los que comentamos trucos para
mejorar la indexación de contenido de un sitio web, que los buscadores nos
puntúen mejor para salir mejor posicionados en los resultados de las búsquedas,
etc. Pero, como funcionan los buscadores, como indexan los contenidos que
fluyen libres por el ciberespacio y sobre todo, como llega a nuestro sitio un
buscador para poder indexar su contenido.
Bueno, a parte de un entramado de complejos algoritmos y
demás historias que solo los propios trabajadores de los respectivos motores de
búsqueda conocen, hay tres componentes básicos que impulsan los motores de
búsquedas.
- La exploración,
también conocido como Crawling.
- La indexación.
- Rango
de páginas.
La exploración
Posiblemente habéis oído hablar de las “arañas” o “spiders“.
Estas arañas son robots (códigos complejos) que los motores de búsqueda envían
a explorar la red en busca de nueva información, recopilarla y enviarla al
motor de búsqueda para que luego pueda ser procesada. El modus operandi de
estas arañas es arrastrarse (crawl, por eso también se conocen como crawling),
es decir, las arañas entran en un sitio web y recopilan la nueva información
que encuentren desde su última visita, y si se encuentran un enlace o link lo
siguen a ver donde les lleva. Y de este modo viajan de enlace en enlace hasta
cubrir todas las páginas del sitio.
La indexación
Los spiders al localizar información nueva la recolectan
para enviársela al motor de búsqueda, donde será procesada o lo que es lo
mismo, donde sera indexada. Indexar simplemente quiere decir “clasificar“.
Si el sitio web tiene como temática las películas, el contenido nuevo que se
encuentre se clasificará bajo la temática de películas. Posteriormente al
emplear ciertas palabras clave para realizar una búsqueda este contenido será
mostrado en una cierta posición en base a una serie de algoritmos tan complejos
como desconocidos.
Rango de páginas
Sin duda uno de los momentos más cruciales para un motor de
búsqueda es la manera en que decide entregar los resultados a los buscadores
(usuarios). Esto lo hacen en función de sus algoritmos siguiendo unos criterios
en los que definen que es para ellos “una página relevante“. Cuanto más
se cree y diseñe un sitio web acorde a estos criterios mayores serán las
posibilidades de aparecer en las primeras posiciones de los buscadores para
determinadas palabras clave.
El buscador Google utiliza el algoritmo del
"Pagerank" (rango de página), para presentar en los primeros puestos
del resultado de una Búsqueda, a las páginas webs que mejor se relacionan con
dicha búsqueda. El concepto es muy sencillo: Si una página web es enlazada por
muchas otras personas, entonces la página debe de ser buena. Mientras más gente
enlacen la página, mejor es. Y si una página enlazada tiene un buen PageRank,
entonces los enlaces de dicha página a otros sitios webs también obtienen valor
importante.
El Pagerank es uno de los criterios decisivos
para determinar en qué posición aparecerá una página web en el resultado de una
búsqueda.
Por ahora, este concepto de PageRank es
utilizado sólamente por Google, pero en algunos otros buscadores pueden existir
conceptos similares. Pero como Google es en la actualidad el buscador más
significativo en la red, es común que uno se ocupe del concepto utilizado en
dicho buscador.
En resumen, uno de los factores más
singnificativos para situarse entre las primeras posiciones de Google, es el
Pagerank. A partir de un Pagerank = 3, se puede decir que la página es buena,
pero sólo a partir de 5, diríamos que está entre las mejores. Para mejorar el
Pagerank de la página es necesario que un enlace hacia la misma, se encuentre
en muchos otros sitios en la red. Estos sitios pueden ser directorios,
buscadores, anuncios clasificados, foros y otras páginas webs.