viernes, 8 de junio de 2012

BUSCADORES

¿QUE ES UN BUSCADOR?
.Un buscador es una página web en la que se ofrece consultar una base de datos en la cual se relacionan direcciones de páginas web con su contenido. Su uso facilita enormemente la obtención de un listado de páginas web que contienen información sobre el tema que nos interesa


 La necesidad de los buscadores
 Cuando necesitamos de Internet, normalmente buscamos información sobre un tema concreto, y es difícil acceder a una página que la contenga, simplemente pinchando vínculos. Como solución a este problema surgieron los buscadores. Un buscador es una página web en la que se ofrece consultar una base de datos en la cual se relacionan direcciones de páginas web con su contenido. Su uso facilita enormemente la obtención de un listado de páginas web que contienen información sobre el tema que nos interesa

El primer buscador fue "Wandex", un índice (ahora desaparecido
.) realizado por la World Wide Web Wanderer, un robot desarrollado por Mattew Gray en el MIT, en 1993. Otro de los primeros buscadores, Aliweb, también apareció en 1993 y todavía está en funcionamiento. El primer motor de búsqueda de texto completo fue WebCrawler, que apareció en 1994. A diferencia de sus predecesores, éste permitía a sus usuarios una búsqueda por palabras en cualquier página web, lo que llegó a ser un estándar para la gran mayoría de los buscadores. WebCrawler fue también el primero darse a conocer ampliamente por el público. También apareció en 1994 Lycos (que comenzó en la Carnegie MellonUniversity).


Yahoo:
1994, año en el que una pareja de universitarios norteamericanos (David Filo y Jerry Yang) decidieron crear una página web en la que se ofreciera un directorio de páginas interesantes clasificadas por temas, pensando siempre en las necesidades de información que podrían tener sus compañeros de estudios. Había nacido Yahoo!. El éxito de esta página fué tan grande que una empresa decidió comprarla y convertirla en el portal que hoy conocemos. Además del buscador, hoy Yahoo! ofrece muchos más servicios


Los creadores del popular sitio de búsqueda de la Internet fueron a buscar un nombre para su creación en la historia reciente de la Matemática y lo hallaron en la palabra googol que fue creada en 1930 para designar un número formado por un uno seguido de cien ceros.
 El dominio "Google" fue registrado el 15 de septiembre de 1997
Google:

Alrededor de 2001, el buscador Google adquirió prominencia. Su éxito estaba basado en parte en el concepto de popularidad basado en PageRank, bajo la premisa de que las páginas más deseadas eran más enlazadas por otras páginas que el resto. Esta idea permitió a Google disponer las páginas de una determinada búsqueda en función de su importancia, basada en este algoritmo, esto es, las páginas más enlazadas por otras páginas se mostraban en primer lugar
 El mercado está ahora dominado por Google, Yahoo y Microsoft. El resto de grandes buscadores tienden a ser portales que muestran los resultados de otros buscadores y ofrecen, además, otro tipo de contenidos que tienen mayor o menor importancia en la página como hace el propio Yahoo!




Tipos de buscadores 

Se pueden clasificar en dos tipos:
 Índices de búsqueda
 Es el primer tipo de buscador que surgió. En los índices de búsqueda, la base de datos con direcciones la construye un equipo humano. Es decir, un grupo de personas va rastreando la red en busca de páginas. Vistas éstas son clasificadas por categorías ó temas y subcategorías en función de su contenido. De este modo, la base de datos de un índice de búsqueda contiene una lista de categorías y subcategorías relacionadas con un conjunto de direcciones de páginas web que tratan esos temas.
La consulta de un índice se realiza, pues, a través de categorías. Por ejemplo, si buscamos información sobre el Museo del Prado deberemos pinchar sobre una secuencia de categorías y subcategorías como la siguiente: Arte / museos / pinacotecas y seguro que dentro de ésa última subcategoría hay algún enlace que hace referencia al museo del Prado.

El primer índice de búsqueda que apareció fue Yahoo! que sigue ofreciendo sus servicios. La ventana de su versión en castellano tiene el aspecto de la imagen.
Se puede observar que, a pesar de tratarse de un índice de búsqueda, ofrece también un espacio para introducir palabras clave (bajo el título de la web). Esto se debe a que todos los buscadores que ofrecen servicios en la red tienden a satisfacer al máximo las necesidades de los navegantes, de forma que intentan abarcar toda la gama de posibilidades.


Ejemplos de directorios: Antiguos directorios, Open Directory Project, Yahoo!, Terra (antiguo Olé). Ahora, ambos utilizan tecnología de búsqueda jerárquica, y Yahoo! conserva su directorio. Buscar Portal, es un directorio, y la mayoría de motores hispanos son directorios.



Motores de búsqueda: Son sistemas de búsqueda por palabras clave. Son bases de datos que incorporan automá

- Motores de búsqueda
  Temporalmente, los motores de búsqueda son posteriores a los índices. El concepto es diferente: en este caso, el rastreo de la web lo hace un programa, llamado araña ó motor (de ahí viene el nombre del tipo de buscador). Este programa va visitando las páginas y, a la vez, creando una base de datos en la que relaciona la dirección de la página con las 100 primeras palabras que aparecen en ella. Como era de esperar, el acceso a esta base de datos se hace por palabras clave: la página del buscador me ofrece un espacio para que yo escriba la ó las palabras relacionadas con el tema que me interesa, y como resultado me devuelve directamente un listado de páginas que contienen esas palabras clave. Por ejemplo, si utilizo un motor de búsqueda para localizar información sobre el Museo del Prado, simplemente tendré que escribir "Museo del Prado" en el espacio de búsqueda y pinchar en el botón Buscar. A continuación se me devolverá otra página con los resultados de la búsqueda: un listado con enlaces a las páginas solicitadas.

Un buen ejemplo de motor de búsqueda es Google. En el apartado 2 de esta unidad veremos con detalle cómo realizar búsquedas con él. De momento, aquí tenemos el aspecto de su página principal.

Observando esta ventana vemos que, en la parte central-derecha hay una pestaña con el nombre Directorio. Si hacemos clic sobre ella nos llevará a otra página en la que se nos ofrece realizar la búsqueda por categorías. Como en el caso de los índices, los motores también tienden a ofrecer todos los servicios posibles al usuario, y le dan la posibilidad de realizar una búsqueda por categorías.

Metabuscador
Permite lanzar varias búsquedas en motores seleccionados respetando el formato original de los buscadores. Lo que hacen, es realizar búsquedas en auténticos buscadores, analizan los resultados de la página, y presentan sus propios resultados, según un orden definido por el sistema estructural del metabuscador1.2.3.- Metabuscadores

    Los metabuscadores son páginas web en las que se nos ofrece una búsqueda sin que haya una base de datos propia detrás: utilizan las bases de varios buscadores ajenos para ofrecernos los resultados. Un ejemplo de metabuscador es Metacrawler.
enviar la cadena de búsqueda a una serie de motores de búsqueda e índices temáticos previamente definidos. Una vez realizada la consulta a los buscadores prefijados, el

El metabuscador es un sistema que localiza información en los motores de búsqueda más usados y carece de base de datos propia y, en su lugar, usa las de otros buscadores y muestra una combinación de las mejores páginas que ha devuelto cada uno. Un buscador normal recopila la información de las páginas mediante su indexación, como Google o bien mantiene un amplio directorio temático, como Yahoo. La definición simplista sería que un metabuscador es un buscador en buscadores.

Ventajas

La ventaja principal de los metabuscadores es que amplían de forma notoria el ámbito de las búsquedas que realizamos, proporcionando mayor cantidad de resultados. La forma de combinar los resultados depende del metabuscador empleado.
Puesto que muchos multibuscadores muestran en los resultados la posición de la web en los buscadores nos permite evaluar la relevancia de cada web mostrada.
Hay que tener en cuenta que cada buscador utiliza su propia estrategia a la hora de recoger la información y ordenar los resultados de las búsquedas, por lo que las páginas de mayor relevancia en un buscador no tienen por qué coincidir con las del resto, aportando puntos de vista distintos.

Desventajas

Una de las desventajas importantes es que mientras que cada buscador dispone de su propia sintaxis de búsqueda los metabuscadores no distinguen entre las diferentes sintaxis. Por lo tanto, al buscar información muy específica es mejor emplear buscadores de los que conozcamos la sintaxis osea que se puede conectarse con varias maquinas.
Es de notar que no resultan muy claros los criterios empleados por los diversos multibuscadores para la ordenación de sus resultados.
Al buscar en varias fuentes, la obtención de resultados suele ser más lenta que en un buscador normal. Muchos de los multibuscadores permiten establecer un tiempo máximo para realizar la búsqueda



Como funcionan los buscadores
Llevamos varios posts en los que comentamos trucos para mejorar la indexación de contenido de un sitio web, que los buscadores nos puntúen mejor para salir mejor posicionados en los resultados de las búsquedas, etc. Pero, como funcionan los buscadores, como indexan los contenidos que fluyen libres por el ciberespacio y sobre todo, como llega a nuestro sitio un buscador para poder indexar su contenido.
Bueno, a parte de un entramado de complejos algoritmos y demás historias que solo los propios trabajadores de los respectivos motores de búsqueda conocen, hay tres componentes básicos que impulsan los motores de búsquedas.
  • La exploración, también conocido como Crawling.
  • La indexación.
  • Rango de páginas.
La exploración
Posiblemente habéis oído hablar de las “arañas” o “spiders“. Estas arañas son robots (códigos complejos) que los motores de búsqueda envían a explorar la red en busca de nueva información, recopilarla y enviarla al motor de búsqueda para que luego pueda ser procesada. El modus operandi de estas arañas es arrastrarse (crawl, por eso también se conocen como crawling), es decir, las arañas entran en un sitio web y recopilan la nueva información que encuentren desde su última visita, y si se encuentran un enlace o link lo siguen a ver donde les lleva. Y de este modo viajan de enlace en enlace hasta cubrir todas las páginas del sitio.

La indexación
Los spiders al localizar información nueva la recolectan para enviársela al motor de búsqueda, donde será procesada o lo que es lo mismo, donde sera indexada. Indexar simplemente quiere decir “clasificar“. Si el sitio web tiene como temática las películas, el contenido nuevo que se encuentre se clasificará bajo la temática de películas. Posteriormente al emplear ciertas palabras clave para realizar una búsqueda este contenido será mostrado en una cierta posición en base a una serie de algoritmos tan complejos como desconocidos.


Rango de páginas
Sin duda uno de los momentos más cruciales para un motor de búsqueda es la manera en que decide entregar los resultados a los buscadores (usuarios). Esto lo hacen en función de sus algoritmos siguiendo unos criterios en los que definen que es para ellos “una página relevante“. Cuanto más se cree y diseñe un sitio web acorde a estos criterios mayores serán las posibilidades de aparecer en las primeras posiciones de los buscadores para determinadas palabras clave.



El buscador Google utiliza el algoritmo del "Pagerank" (rango de página), para presentar en los primeros puestos del resultado de una Búsqueda, a las páginas webs que mejor se relacionan con dicha búsqueda. El concepto es muy sencillo: Si una página web es enlazada por muchas otras personas, entonces la página debe de ser buena. Mientras más gente enlacen la página, mejor es. Y si una página enlazada tiene un buen PageRank, entonces los enlaces de dicha página a otros sitios webs también obtienen valor importante. 

El Pagerank es uno de los criterios decisivos para determinar en qué posición aparecerá una página web en el resultado de una búsqueda. 


Por ahora, este concepto de PageRank es utilizado sólamente por Google, pero en algunos otros buscadores pueden existir conceptos similares. Pero como Google es en la actualidad el buscador más significativo en la red, es común que uno se ocupe del concepto utilizado en dicho buscador. 

En resumen, uno de los factores más singnificativos para situarse entre las primeras posiciones de Google, es el Pagerank. A partir de un Pagerank = 3, se puede decir que la página es buena, pero sólo a partir de 5, diríamos que está entre las mejores. Para mejorar el Pagerank de la página es necesario que un enlace hacia la misma, se encuentre en muchos otros sitios en la red. Estos sitios pueden ser directorios, buscadores, anuncios clasificados, foros y otras páginas webs. 


7 comentarios:

  1. Interesante el pequeño resumen, hay algo muy importante que es necesario saber: el buscador Google utiliza 900.000 servidores con un consumo del 1 por ciento del gasto energético mundial.
    y por cada búsqueda que hacemos se gasta la cantidad de energía que una casa gastaría durante un año.... interesante no!!!!

    ResponderEliminar
  2. Muy buena informacion entre la diferencia entre buscadores y metabuscadores y "no savia lo que comento Alex; buen dato"

    ResponderEliminar
  3. guaooo si que esta interesante esa informacion??,,,,donde la cosiguio??

    ResponderEliminar
  4. buenísima información seria bueno saber la dirección en donde la encontró

    ResponderEliminar
  5. Que interesante la informacion compañero.....

    ResponderEliminar