Kirai en Technorati San Francisco – Parte 2

Sigo vivo por USA :), pero ocupado al 100%. Mil gracias por todos vuestros comentarios e emails que últimamente no tengo tiempo ni de contestar. Gracias también a la gente de Bitacoras.com que ha estado trabajando estos días para que a partir de ahora todo funcione mucho mejor.

También gracias a todos vosotros ahora mismo Kirai es finalista en el concurso de blogs del diario 20minutos. Hoy sale esta entrevista en la edición impresa del 20minutos.

Por lo demás sigo aprendiendo y conociendo a un montón de gente interesante. Por ejemplo, ayer estuve todo el día trabajando con Kevin Marks en el «spider» de Technorati. Kevin Marks estuvo varios años trabajando en Apple y fue uno de los desarrolladores pioneros del famoso «Podcasting» y uno de los ingenieros principales en el desarrollor de Quicktime. Ahora mismo es el encargado de programar el «spider» de Technorati en general y yo estoy desarrollando «parsers» específicos para el idioma Japonés.

Spider
Kevin y yo mostrando el status actual del spider de Technorati. Sí, ya se que esta foto es el colmo de lo geek, los dos con las gafotas y sonrisa friki.

Spider
Kevin con Fumi-san y Sato-san.

Para los no entendidos, un «spider» es un programa de ordenador que busca información nueva por Internet y la almacena. Un ¨parser¨es un programa de ordenador que procesa texto decidiendo que hacer con cada trozo, por ejemplo si el parser encuentra un patrón que parece ser el título de una entrada en un blog le dirá al spider «oye esto es el título». Google tiene sus spiders, Yahoo tiene sus spiders, Excite tiene sus spider, todos los buscadores tiene sus spiders funcionando y buscando información por Internet cada segundo. Ellos son los que deciden la información que es útil guardar, y cómo guardarla.

Kirai en Technorati San Francisco – Parte 1

Esta semana estoy trabajando en las oficinas centrales de Technorati en San Francisco. Es la primera vez que piso suelo Estado Unidense, y también es la primera vez que estoy de viaje de «negocios». Más que negocios lo podríamos llamar viaje de intercambio de conocimientos ingenieriles. Así que la verdad es que todavía no he tenido ni un minuto para pasearme por la ciudad.

Lo que si he tenido tiempo es de conocer a toda la panda de geeks que crean y mantienen Technorati. Nada más entrar en las oficinas me encontré de cara con Sifry, el CEO de Technorati, charlando tranquilamente con el arquitecto jefe Ian Kallen y a partir de ahí todo han sido reuniones, hablar sobre blogs, buscadores y sesiones de «coding». Por ejemplo, trabajando con Jorge Barrios en un par de horitas hemos creado un Top con los vídeos más populares de youtube.

A ver si saco algunas fotacos y mañana os cuento más cosas.

Más información sobre Technorati: Technorati ¿Qué está pasando en Internet ahora? – Capítulo 1 y Trabajando en Technorati.

Technorati ¿Qué está pasando en Internet ahora? – Capítulo 1

Desde que anuncié que me unía a Technorati, mucha gente me ha estado preguntando ¿Qué es Technorati? ¿Cómo se usa Technorati? La primera pregunta la puedo contestar correctamente pero la segunda la verdad es que aunque esté trabajando en Technorati quizás no sea la persona más adecuada para explicarlo, al igual que un ingeniero de F-1 no es la persona más adecuada para explicar cómo conducir un Fórmula 1.

Yo conocí Technorati a través de Minid hace ya más de dos años y al principio tampoco me enteré del tema. Poco a poco lo fui usando a nivel de usuario, luego hice mis pinitos programando cosas con el API, y al final terminé trabajando para ellos siendo actualmente el trabajador más joven de los 30 trabajadores (27 en USA y 3 en Japón). Concretamente en Technorati Japan programando/adaptando el spider para que capture de forma más inteligente los datos de la blogosfera japonesa y también mejorando los filtros de spam.

¿Qué es Technorati? Digamos que Technorati es un buscador de blogs en tiempo «real». ¿Qué quiere decir esto? Pues que con Technorati puedes buscar datos dentro de blogs teniendo en cuenta los últimos cambios que se han producido en ellos. ¿Y nuevamente, qué quiere decir esto? Pues veámoslo con un ejemplo:

Si buscamos «en japón hay pocos gordos» con Google aparecen datos desactualizados de hace varios meses, por ejemplo aparece una entrada que escribí hace casi una año sobre vivir hasta los 100 años.

Technorati

En cambio si buscamos con Technorati obtendremos como resultado la entrada que escribí ayer mismo sobre lo delgados que son los japoneses.

Technorati

Technorati

Con Technorati puedes saber lo último, puedes saber lo qué está pasando en internet ahora. En realidad no es «ahora», digamos que el retraso medio del «spider» (el programa de ordenador que «viaja» por Internet en busca de datos nuevos) está entre 5 y 10 minutos. Los buscadores tradicionales tipo Google o Yahoo tardan entre 2 y 15 días dependiendo del tipo de página web. Por ejemplo, esto que estoy escribiendo ahora mismo será capturado por el «spider» de Technorati en unos minutos y estará disponible en los resultados de búsqueda. Mientras que el «spider» de Google tardará aproximadamente un par de días.

¿Para qué nos puede servir hacer búsquedas sobre los datos más frescos? Por ejemplo, si necesitamos encontrar la web de una empresa usaremos un buscador tradicional, si estamos haciendo un trabajo sobre abalones de Vietnam usaremos un buscador tradicional pero si queremos saber las opiniones de la gente sobre Zapatero y Rajoy usaremos Technorati, si queremos saber las impresiones de la gente sobre la última carrera de Alonso usaremos Technorati, si queremos ver las últimas fotos de las Fallas de Valencia usaremos Technorati.

Uno de los problemas de Technorati es que solo está disponible en Inglés y Japonés. Pero aunque la interfaz de usuario no se pueda ver in Español tenéis la opción de filtrar los resultados por idioma.

Technorati

Technorati

Espero que con esto le podáis sacar alguna utilidad y comencéis a familiarizaros con Technorati. Seguiré hablando sobre Technorati explicando caracterísiticas más avanzadas y sobre el funcionamiento del que se considera el buscador más rápido en encontrar información nueva en Internet, y también el buscador con más blogs almacenados (Más de treinta millones).

Por cierto, no somos los únicos en el negocio de búsqueda de blogs. El lugar en el que más competencia tenemos es en Japón donde ahora mismo hay ¡más de 40 buscadores de blogs! ¿Cuántos buscadores de blogs «en tiempo real» españoles conocéis?