¿Cómo funciona un buscador? – Capítulo 1

Para mi proyecto final de carrera estoy programando un buscador. No es una tarea fácil, pero gracias a lo que estoy aprendiendo ya no veo a Google como algo tan misterioso. Tengo pensado escribir unos cuantos artículos para divulgar lo que vaya aprendiendo, es importante saber como funciona un buscador para hacer que sea más fácil para ellos encontrar información en nuestros blogs y páginas webs.

Clasificar información para luego encontrarla con facilidad es una tarea que lleva realizando la humanidad desde hace muchos siglos, el problema es que cada vez disponemos de más cantidad de información escrita. Necesitamos mejores métodos para organizar la información y luego obtenerla con facilidad. Uno de los métodos más potentes que existe hoy en día consiste en obtener la información de forma automática.

Dentro de la obtención de información de forma automática se pueden definir varios enfoques según la finalidad y modo de funcionamiento:

  • Recuperación de información (Information Retrieval)
  • Extracción de información (Information Extraction)
  • Búsqueda de respuestas (Question answering)

La Recuperación de información consiste en indicar al usuario en qué documentos puede haber información relevante. Un sistema de Recuperación de información nos indica en que documentos hay apariciones de las palabras que hemos puesto en nuestra búsqueda y los ordena según una puntuación. Un ejemplo de este tipo de sistemas son los típicos buscadores como Google, Yahoo etc.

La Extracción de información consiste en hacer lo mismo que la Recuperación de información pero en vez de mostrar los resultados al usuario se generan una serie de archivos con los datos más importantes que se han encontrado. Estos sistemas eliminarían la tarea del usuario de tener que seleccionar los resultados realmente importantes. Aun no existe ningún sistema de este tipo realmente efectivo en entornos abiertos como Internet, solo se han hecho pruebas con colecciones de datos de temas concretos.

La Búsqueda de respuestas consiste en responder a una pregunta concreta del usuario. A un sistema de búsqueda de respuestas le podemos hacer peticiones del tipo ¿Cuándo nació Einstein? ¿Dónde está la plaza roja? y debe ser capaz de respondernos con una frase concreta. Puede sonar a ciencia ficción pero ya hay sistemas que son capaces de responder a preguntas sencillas.

Mis compañeros y yo estamos construyendo por ahora un sistema de Recuperación de información que utilizaremos para intentar crear encima un sistema de Búsqueda de respuestas sencillo.


Carl Sagan

“Nosotros somos la encarnación local del Cosmos, que ha crecido hasta tener consciencia de sí. Hemos empezado a contemplar nuestros orígenes: sustancia estelar que medita sobre las estrellas; conjuntos organizados de decenas de miles de billones de billones de átomos que consideran la evolución de los átomos y rastrean el largo camino a través del cual llegó a surgir la consciencia, por lo menos aquí. Nosotros hablamos en nombre de la Tierra. Debemos nuestra obligación de sobrevivir no sólo a nosotros sino también a este Cosmos, antiguo y vasto, del cual procedemos.” Cosmos de Carl Sagan.

Si os ha gustado el párrafo anterior disfrutaréis leyendo cualquier libro de Carl Sagan. Su libro más famoso es Contact (Novela), adaptado a película hace unos años. Otros libros suyos son Cosmos (Astronomía) , Dragones del Edén (Antropología), Miles de Millones (Divulgación) o El cerebro de Broca (Divulgación).


Stardust y el aerogel

El Stardust es una de las misiones de la Nasa en las que más espectativas tienen puestos los científicos ya que nos permitirá conocer la estructura interna y la verdadera naturaleza de los cometas y así poder entender algo más sobre la formación de nuestro universo. Fue lanzado en el 99 y su misión es capturar partículas acercándose a la cola del cometa Comet P/Wild 2. Lo curioso es que para capturar estas partículas se utiliza un nuevo material que ha creado la NASA. Se trata del Aerogel, el sólido con menos densidad que existe. De hecho el 99,8% está vacío, pero aún así es sólido por muy raro que parezca.

En esta primera foto vemos al profesor Peter Tsou (Vaya pinta de científico loco que tiene) manejando un cubo de aerogel.

Fijaros en la rayante que es la última imagen donde se ve como es capaz de mantener objetos encima. Las imágenes no son fakes, están sacadas por la Nasa

Más imágenes, vídeos e información en la web de la misión Stardust


Arte matemático

Una de las disciplinas matemáticas que más llaman la atención a todos es la de crear imágenes a partir de fórmulas más o menos complicadas, o a partir de paradojas y leyes geométricas. Uno de los pioneros en estos temas fue Escher en los años 60-70, luego vinieron los fractales de Mandelbrot en los 80-90 y hoy en día donde la imaginación de los matemáticos ya no tiene límite a la hora de crear arte a partir de fórmulas.


Os dejo unos enlaces para que os deleitéis con las últimas creaciones en esta disciplina:

  • GeorgeHart: atentos a las construcciones manuales que hace de sus modelos.
  • KerryMitchel: fractales y teselaciones
  • Graphica: modelos 3D muy originales (Imprescindible)

El pelo de los osos polares no es blanco

El pelaje de un oso polar parece blanco porque tiene muchas diminutas burbujas de aire para su aislamiento. Esas burbujas de aire, como las partículas de polvo en suspensión, dispersan la luz que llega y hacen que el pelaje aparezca blanco. Las fibras del pelaje en sí carecen de color. Del mismo modo, los ojos de un niño recién nacido son azules porque pequeñas particulas de materia de iris dispersan preferencialmente luz azul, como las moléculas en el aire. El color de los ojos de un niño pueden cambiar tras varios meses de su nacimiento cuando su cuerpo empieza a manufacturar el pigmento que finalmente coloreará sus ojos.