En los comienzos de internet, la manera más práctica de catalogar, organizar y brindar acceso a los contenidos publicados se lograba a través de directorios. Allí, los sitios web se daban de alta y se podía encontrar un tipo de contenido buscando en secciones y subsecciones de esos directorios. Con el paso del tiempo, la cantidad de sitios creció de manera tan estrepitosa que se hizo imposible mantener esos directorios con un nivel razonable de actualización. Fue entonces cuando aparecieron los buscadores. Estos sitios tienen como finalidad rastrear los contenidos publicados en la web. Esto se consigue mediante programas autónomos y con cierta inteligencia, denominados spiders o bots. Estos nombres provienen de la referencia a la ‘telaraña mundial’, nombre que se le suele dar a internet (spider significa araña en inglés), y de una forma abreviada de la palabra robot. Inicialmente, su funcionamiento se basaba en leer el contenido de una página, indexarlo y darle una clasificación, para luego leer los enlaces publicados en la misma y seguirlos, gracias a la ayuda de los bots. Las nuevas páginas eran indexadas y le indicaban a los bots qué nuevas páginas podían visitar. El gran éxito de Google radicó en encontrar un algoritmo matemático que daba a los sitios web una relevancia con respecto a los términos y frases buscadas, basada en la cantidad y calidad de los enlaces que hacían referencia a esos sitios web.

En la actualidad, además de esa mecánica, los buscadores implementan algunas funciones avanzadas que les permite a los bots predecir dónde y qué tipo de información encontrarán en una URL (dirección de internet).

Estas son algunas sugerencias para optimizar y especificar los contenidos que deseamos encontrar en la web. Funcionan en la mayoría de los buscadores, como Bing o Yahoo!, aunque algunos sólo son compatibles con Google.


Las más conocidas

Entre las opciones más comunes para filtrar los resultados encontramos las siguientes. Escribir el texto buscado entre comillas para encontrar una coincidencia exacta. Anteponer un signo + a las palabras que queremos que aparezcan obligadamente en los resultados. Anteponer un signo – a una palabra para excluir los resultados que la contengan.


Intervalos

En algunos buscadores es posible definir intervalos numéricos para abarcar una serie de cifras intermedias. El parámetro que se usa en este caso es .. (dos puntos seguidos). Para encontrar, por ejemplo, información relativa a las olimpiadas celebradas durante el siglo 20, podemos escribir:

olimpiadas 1900..2000 (sin espacios entre los números y los puntos)


Palabras o frases

Para reemplazar una o varias palabras podemos utilizar el comodín * (asterisco). Por ejemplo: aquellos * años mostrará páginas coincidentes con aquellos hermosos años, aquellos primeros años y aquellos locos años entre otras opciones.


Herramientas especiales

En lugar de buscar páginas para convertir medidas, podemos utilizar Google para el mismo fin. Si en la barra de búsqueda ingresamos:

100 libras a kilogramos, el buscador nos mostrará el resultado


También podemos usar el parámetro define para buscar definiciones.
Por ejemplo define:plancton mostrará su definición en primer lugar de los resultados de búsqueda.


Delimitar los dominios

El parámetro "site" hace posible buscar coincidencias en dominios específicos, como por ejemplo en las organizaciones sin fines de lucro o instituciones educativas. También permite acotar la búsqueda a un sitio web.

curso de japonés site:.edu buscará coincidencias sólo en sitios cuyo URL (dirección de internet) termine en .edu

fiestas patrias site:.ar mostrará sólo sitios con dominios de Argentina, juegos site:micrsoft.com buscará todas la referencias a juegos que figuren en el sitio microsoft.com


Sitios similares

Cuando queremos encontrar sitios similares a uno conocido podemos emplear el parámetro related. Por ejemplo related:yahoo.com encontrará otros portales similar a Yahoo!.


Búsquedas más acertadas

Cuando buscamos una palabra o frase, el buscador nos devuelve como resultado todas aquellas páginas que contengan el texto buscado en cualquier parte de su contenido. Sin embargo, es más probable que la página contenga información relevante si el texto buscado está en el título principal de la misma. Para esto utilizamos el parámetro allinurl. Por ejemplo, allinurl:san juan muestra aquellas páginas que tienen a San Juan como parte importante de su contenido.


Versiones históricas

Google guarda en caché (una especie de memoria temporal) capturas de los sitios que visita. Mediante el parámetro caché podemos acceder a esas versiones anteriores de los sitios y encontrar cosas realmente interesantes. Esta misma función puede usarse para ver contenido de un sitio cuando este, por algún motivo, no se encuentra disponible.

cache:stitiodejemplo.com mostrará la última instantánea tomada por Google de ese sitio web.


Tipos de archivo

Para buscar un formato de archivo específico podemos usar el parámetro filetype. Por ejemplo, si escribimos tutorial de html filetype:pdf el buscador nos mostrará archivos con ese formato que podemos descargar.