El engaño Google (20 page)

Authors: Gerald Reischl

Tags: #Ensayo

BOOK: El engaño Google

9.49Mb size Format: txt, pdf, ePub

Más difícil resulta habituarse a Quintura.
^[40]Este buscador se dirige sobre todo a la generación Web 2.0. Cuando se introduce un término en el cuadro de búsqueda, no se muestra una lista de resultados tradicional, sino que los resultados aparecen en dos campos: en una lista de resultados (derecha) y en forma de nube conceptual (izquierda). La «nube de
tags
», como se denomina esta nube conceptual, muestra conceptos relacionados con la palabra introducida. Si, pongamos por caso, introducimos las palabras «Albert Einstein» en el cuadro de búsqueda, se muestra una nube compuesta por los conceptos «Imagen», «Nacido», «Biografía» y «Honores recibidos». De este modo se accede más rápidamente a la información buscada.

Snap
^[41]también es muy práctico, aunque también aquí resulta difícil distinguir la publicidad de los resultados convencionales. Lamentablemente, tanto en la parte superior como en la inferior se muestran enlaces patrocinados. Lo práctico de Snap es que se obtiene una lista de resultados en forma de texto: al pasar por encima con el ratón se abre una ventana con la página web correspondiente.

El buscador Kartoo
^[42]emplea un sistema totalmente distinto. Tampoco muestra listas de resultados, sino nubes de resultados que representan la página web en formato reducido. Si ciertas páginas tienen un contenido similar, éstas se muestran más cerca. Asimismo, en la nube o cerca de ella aparecen conceptos relacionados. Al hacer clic en un enlace, se muestran las relaciones entre los resultados por medio de líneas. Además de la nube conceptual, se muestra una lista de temas. Al hacer clic en uno de ellos, empiezan a girar esferas en los enlaces de la nube que tratan ese tema concreto. Si, por ejemplo, se busca el Nokia Communicator E90, a la izquierda se muestra el concepto «precio». Si se hace clic sobre él, se destacan las páginas en las que se aborda el precio del E90.

Una página alemana de pies a cabeza es Mister Wong.
^[43]En esta página, los usuarios pueden buscar en un catálogo de páginas web que —no olvidemos que estamos en la era de la Web 2.0— está adaptada a los usuarios de Internet. Sin embargo, sólo se encuentra una página si un usuario de Internet la ha señalado como
favorita
* Éste asigna palabras clave a la página y la recomienda, de esta manera, a otros usuarios. De este modo, el buscador de la Web 2.0 evita el
spam
y las páginas de comparativas de precios, dado que este tipo de páginas no son recomendadas por los usuarios.

Con Clusty
^[44]existe también un buscador perfectamente capaz de competir
con
Google, pues —como su nombre indica— forma
clusters o
agrupaciones de búsqueda. Además de la lista de resultados, situada a la derecha, en Clusty aparecen
clusters
de búsqueda a la izquierda en los que se desglosa nuevamente el concepto buscado. Si por ejemplo, se introducen las palabras «Apple iPhone», se muestran a la derecha los resultados convencionales y, a la izquierda, diez
clusters
, desde «Móviles» hasta «Valoraciones», «Ventas», «Tienda» o «Rumores». El inconveniente de Clusty es que el buscador sólo está disponible en inglés.

También el servicio de búsqueda Web.de
^[45]domina la formación de
clusters
y añade una función más. A la izquierda de la lista de resultados se ofrece la posibilidad de afinar la búsqueda. Se muestran varios términos genéricos, bajo los cuales se recoge información más detallada. Aunque Web.de recurre al motor de búsqueda de Yahoo!, valora los resultados de forma distinta, de modo que se diferencian de los de éste buscador. Hay un detalle interesante: en Web.de existe también d área «Uve Suche» (Búsqueda en directo), donde se listan todas las solicitudes de búsqueda que otros usuarios están introduciendo en esos momentos. Las solicitudes de búsqueda se actualizan cada diez segundos.

El buscador Seekport
^[46]está considerado como pionero en tecnología en el mercado alemán de motores de búsqueda. «Nos tomamos en serio la protección de la infancia. Por este motivo, por medio de procedimientos automáticos, filtramos de nuestra búsqueda en Internet normal, accesible también a los niños, los contenidos dirigidos exclusivamente al público adulto», se lee nada más acceder a la página principal. Si se desea,
Seekport.de
limita la búsqueda a las páginas de noticias, los diccionarios en línea (de referencia) y los limita la búsqueda a las páginas de noticias, los diccionarios en línea (de referencia) y los
blogs
, aunque únicamente del área europea. Asimismo, Seekport ofrece un buen servicio para propietarios de
blogs
y páginas web. Por medio de la función
«Seekbot»
puede comprobarse si la página web figura en los resultados de los motores de búsqueda.

Este otro buscador
^[47]tiene un nombre divertido, pero es muy eficaz, pues resume los resultados de Google, Yahoo! y MSM: jux2
^[48]combina los resultados y, además, muestra cuál de los motores de búsqueda llega a un mayor número de resultados y qué resultados obtiene cada uno. Es recomendable echar un vistazo al apartado
«differ»
, en el que se desglosa mediante estadísticas cuál es el grado de coincidencia de los resultados en las primera página de la lista (diez primeros resultados).

A principios de
2008 entró
en el negocio de los buscadores el inventor de Wikipedia, Jimmy Wales, quien quiere competir con Google y compañía por medio de Wikia.
^[49]Wales cree poder hacer frente a la competencia con «la sabiduría de muchos», es decir, con los 1.300 millones de personas que componen la comunidad de internautas. Wikia funciona por medio de un sistema similar al de la enciclopedia en línea Wikipedia, en la que el texto de las entradas lo escriben los propios usuarios de Internet. En Wikia, los usuarios valoran los resultados de la búsqueda, lo que genera un sistema de valoración y una lista de resultados supuestamente objetivos. No obstante, en enero de 2008, los resultados eran todavía de poca calidad, lo que se advertía, incluso, en la propia página web. Cabe preguntarse si realmente se puede animar a la comunidad de internautas a colaborar en un buscador
open source
de este tipo.

En Las profundidades de La Red

El 90% de lo que hay en la Red no lo encuentra siquiera Google, ya que éste, como todos los buscadores existentes, se queda en la superficie. Google sondea sólo la denominada
«Visible Web»
, es decir, la «Red visible». Aquellas áreas que contienen información fundada, en las que está almacenado el saber, no se sondean.

Sobre la verdadera dimensión de la llamada «Deep
Web
», la Red profunda, sólo existen estimaciones. Ni siquiera el investigador de Google y gran perfeccionista Peter Norvig se atreve a responder esta pregunta: «Nadie lo sabe con exactitud». Se cree que la Red profunda es hasta 50 veces mayor que la Red superficial; algunas estimaciones parten incluso de la idea de que es hasta 500 veces mayor que la Red visible en la que busca Google. La Red proftinda está compuesta principalmente por grandes bases de datos, como los bancos de datos y las páginas web científicos y médicos, a los que sólo se puede acceder registrándose. Google no busca en bases de datos de trabajos científicos. Tampoco puede acceder por medio de sus motores de búsqueda a áreas en las que, por poner un caso, sólo tienen acceso los lectores abonados de un diario. En todas aquellas páginas a las que sólo se puede acceder por medio de una
contraseña
. Google no puede entrar. Esto significa que Google se queda sólo en la superficie.

Pero no se trata
únicamente de Google
: todos los buscadores sondean sólo esta Red visible. Hace años que se debate en Europa sobre la creación de un buscador que pueda hacer frente a Google. Hasta el momento, todos los proyectos se han quedado en papel mojado. En el año 2004 se lanzó Quaero, un proyecto conjunto de alemanes y franceses que, sin embargo, nunca llegó a ponerse en práctica. Investigadores alemanes intentan ahora poner en marcha un buscador semántico llamado Theseus: 400 millones de euros han sido asignados a este proyecto. El Instituto Fraunhofer, dedicado al procesamiento de datos gráficos (IGD), fija para su buscador semántico ConWeaver el objetivo de «ser tan simple como Google, pero mucho más eficiente». ConWeaver aún no es un buscador en el sentido convencional, pues de momento se ofrece sobre todo a grandes empresas. «Basta un solo término de búsqueda para que el sistema sondee un sinnúmero de bases de datos, directorios y redes buscando no sólo el término de búsqueda, sino sus traducciones y vínculos temáticos. Al hacer clic se muestra toda la información relevante, como, por ejemplo, personas de contacto, descripciones y documentos, de forma bien estructurada y en una sola página», promete ConWeaver.

«Los métodos semánticos cambiarán profundamente la Red tal y como la conocemos hoy en día», señaló el director de eco Harald Summa el 18 de agosto de 2007 en
Heise.de
. El tiempo dirá si su predicción es acertada, pues para una búsqueda semántica se requiere información detallada sobre los usuarios. Se da por seguro que, en el futuro, todos los buscadores incluirán este componente semántico. Pero más importante que cualquier buscador semántico sería un buscador capaz de buscar en la Red profunda, es decir, esa parte de Internet 500 veces mayor que Google no alcanza. Eso sí que sería un reto y un método con el que competir seriamente con Google.

¿Buscadores especializados?

Existen muchas propuestas sobre nuevas tecnologías de búsqueda. Por ejemplo, el profesor de la Universidad Técnica de Graz, Hermann Maurer, recomienda el desarrollo de buscadores especializados. Éstos podrían emplearse para distintas áreas temáticas, por ejemplo, medicina, ingeniería industrial o carpintería. La explotación de estos buscadores debería asignarse, en opinión de Maurer, a entidades sin ánimo de lucro o universidades. No obstante, este planteamiento no tiene mucho sentido, pues habría que pensar primero en qué buscador se puede encontrar lo que se quiere. Esto no simplifica, precisamente, la vida en la Red. Además, plantea otro problema: si los buscadores son gestionados por una universidad (pública o controlada por el Estado), no se está muy lejos del control estatal. Dejando a un lado la cuestión de que se impondría la censura de las autoridades de la universidad o entidad educativa de que se trate, debe tenerse en cuenta que en la actualidad ya existen en Europa medidas muy estrictas de supervisión y control. Por todas partes surgen bases de datos y leyes con las que se pretende controlar y registrar el tráfico de telecomunicaciones y de Internet. Un buscador bajo control del Estado incrementaría el riesgo de que se derive hacia un Estado policial. La única opción razonable son empresas privadas que cumplan la legislación.

Buscadores que encuentran

El futuro está en los buscadores no sólo semánticos, sino basados en el contexto. Éstos operan por medio de reglas matemáticas: no sólo comparan elementos textuales, sino que, con la ayuda de distintos métodos, establecen relaciones directas entre la imagen, el vídeo, el texto y el término buscado.

Existe un motivo por el que los científicos intentan descubrir nuevos métodos de búsqueda; tan sólo un 20% de los contenidos digitales está estructurado, puede consultarse de forma sistemática y, por tanto, ser localizado por un buscador. Una búsqueda puramente textual no basta para hacer accesible el 80% de los datos.

Pongamos por caso el vídeo: es cierto que Google y Yahoo! cuentan con un sistema de búsqueda de vídeos, pero éste está basado igualmente en la búsqueda de elementos textuales, porque los vídeos tienen asignadas palabras clave. ¿Pero cómo encontrar un vídeo que no tiene asignado ningún término?

Mike Lynch, director de la empresa angloestadounidense Autonomy, ha inventado un algoritmo capaz de encontrar un contenido por medio del contexto, se trate de vídeos, imágenes o textos. El
«Autonomy Engine»
de Lynch emplea análisis de imagen y vídeo, reconocimiento de voz y cara y sistemas de escaneado de texto y contenidos. Si se introduce, por ejemplo, «Bush en Irak» en el cuadro de búsqueda, aparece una lista con toda la información (vídeos, fotos,
blogs
noticias) relacionada con el término buscado. Pronto sólo existirán «buscadores que encuentran»; el método de Google estará entonces superado.

Un anticipo de cómo funciona este tipo de buscadores puede encontrarse en
www.blinkx.com
. Además de la búsqueda de vídeos, que ofrece ya resultados muy respetables (sobre todo en inglés), en el apartado
«Looking for Pico
?» se puede descargar uno en su ordenador el buscador más pequeño del mundo. Mientras se teclea el texto de un documento, Pico busca en segundo plano si existe nueva información sobre el tema en Internet, sean vídeos, noticias, música,
blogs
o una entrada de Wikipedia.

Navegación segura: cómo navegar sin dejar huella

Cuando se critica a Google en un foro suele encontrarse esta frase: «Nadie te obliga a usar Google», Esta afirmación es cierta. Sin embargo, Google, como ya hemos señalado varias veces, es un buscador muy práctico, fácil de utilizar y sin fruslerías; si no fuera por ese ansia de recabar datos, Pero ésta se puede contrarrestar.

Como ya hemos mencionado, todo usuario de Internet deja huellas cuando navega por una página de
Internet o
utiliza un servicio en la Red. El gestor de la página web identifica la dirección IP, es decir, el distintivo con el que nos movemos por la autopista de la información, y otros muchos datos (hora, versión del navegador, ubicación geográfica del ordenador, etc.). Y si en esos momentos hay un «espía» circulando por la Red, también podrá registrar esta información confidencial. Los datos se almacenan en un archivo y pueden ser valorados y clasificados.

Aun así, sólo uno de cada dos usuarios de Internet conoce la existencia de este tipo de servicios que permiten buscar de forma anónima. Esto es lo que indica una encuesta encargada a Marketagent para el presente libro. Servicios como Anonymizer,
^[50]The Onion Router
^[51]o JAP
^[52]sólo son conocidos por tres de cada cien usuarios de Internet.

Other books

Where the Shadows Lie by Michael Ridpath

Match Made in HeVan by Lucy Kelly

First to Kill by Andrew Peterson

The Dark Meadow by Andrea Maria Schenkel

Follow Me (Corrupted Hearts) by Tiffany Snow

A Deniable Death by Seymour, Gerald

The Day the Rabbi Resigned by Harry Kemelman

Effi Briest by Theodor Fontane

The Waiting by Hunter Shea

Case File 13 #3 by J. Scott Savage