Buscando los blogs que no amaban los recortes en la Ciencia

Conocí la iniciativa La ciencia en España no necesita tijeras y al seguir su evolución el día 7 de octubre  pude ver  el fuerte respaldo que alcanzó. Enseguida se me pasó por la cabeza averiguar cuál sería el barrio de blogs que no amaban los recortes en la ciencia y me puse manos a la obra.

La siguiente imagen es el tag cloud de los títulos de los 794 795 posts que se escribieron para la campaña en la que participaron 898 899 blogs, entre ellos el mío.

la-ciencia-no-necesita-tijeras

Para buscar este barrio de blogs tuve que realizar algunas tareas automáticas y otras manuales. Siempre luchado contra el paso del tiempo que entierra los post en el subsuelo de las homepages y complica la búsqueda. Estos son las pasos que seguí para descubrir los blogs.

1. Fuentes  existentes de la información

  1. Comentarios del post de la convocatoria: La forma de apuntarse a la iniciativa era dejar un comentario en el post de la convocatoria indicando el blog que se adhería.
  2. Lista de los primeros 650 blogs:  El blog que lanzó la campaña confeccionó la primera lista con 650 Blogs.
  3. Web Cienciastijeras:  Después de esta primera recopilación se siguieron apuntando más blogs y se pidieron colaboradores para seguir anotándolos, esta web recogió todos los blogs que apoyaban la campaña.

2. Fuentes usadas

  • Para la lista de los posts publicados

  • Lista de los primeros 650 blogs: se obtuvieron fácilmente las urls de esta lista.
  • Comentarios del post de la convocatoria: se extrajeron las urls de los blogs que no estaban en la lista anterior
  • Fuentes usadas para las visualizaciones

  • Comentarios del post de la convocatoria: se extrajeron las 1012 urls de los blogs que dejaron su comentario junto con su fecha y hora para poder realizar timelines. En las visualizaciones están excluidos los blogs que no dejaron comentario en el post de la convocatoria aunque estuvieran en la lista de La Aldea Irreductible por no tener certeza de su timestamp.

3. Verificación de la información y filtrado de errores

  • Corrección de errores de sintaxis de las urls
  • Conversión de urls cortas a su nombre real.
  • Normalización de la url de la página principal.
  • Eliminación de urls repetidas
  • Descarte de  las urls que no eran blogs: fickr, youtube, linkedin,etc..

4. Herramientas de obtención del Barrios de blogs

  • Lestat: Se utilizó una versión reducida para analizar solo la página principal obteniendo de cada blog:
  • Lista de los enlaces internos y externos clasificados según el contexto del blog: Cabecera, lateral, post, pié de post, archivo de históricos y pie de blog.e
  • Lista de las  urls de los feeds
  • Lista de las urls que podrían pertenecer al blogroll
  • Lista de las urls de usuarios twitter
  • Posproceso de la información generada por lestat
  • Obtención de los enlaces salientes pertenecientes al conjunto de blogs estudiado
  • Obtención del post escrito para la campaña.  Al no estar familiarizada con una herramienta de parseo de feeds, por razones de tiempo los post se obtuvieron analizando las urls del código html. Para los siguientes experimentos se considera imprescindible poder analizar feeds.

5. Revisión de los resultados y corrección manual de los errores

  • Resolver problemas con los caracteres de más de 7 bits ( acentos, ñ, etc..)
  • Completar las urls de los posts que no habían sido encontradas por:
  • No estar ya en la página principal
  • No haberse publicado. Algunos blogs pusieron el logo de la campaña pero no escribieron el post
  • No contener en la url el título del post. Los blogs de Blogia y algunos WordPress codifican el enlace de las entradas con un código numérico.
  • No estar accesibles por: ser privados, tener control de acceso para adultos o  estar temporalmente fuera de servicio.

Resultados de esta primera fase:

  • Lista de blogs con el enlace al post publicado para la campaña, accesible en esta página.
  • Data set obtenido en formato xls.

Siguientes pasos a seguir:

  • Visualizar las relaciones de los blogs que han participado en la campaña, a ser posible de forma dinámica para ver como se ha propagado la iniciativa.
  • Obtención de la correspondencia blog-twitter para visualizar las relaciones de estos blogs en twitter
  • Obtención de conclusiones sobre la propagación de la campaña.

También te podría gustar...

9 Respuestas

  1. Aitziber dice:

    Hola M. Luz, no te preocupes por lo de no encontrarme en la lista. No creo que sea tarea fácil, la verdad, así que mucho ánimo.

    Yo seguiré evangelizando, desde luego :-), pero como bien dices también he aprendido que a veces más vale omitir ciertas cosas, seguro.

    Un saludo,

  2. Aitziber: Me alegra saber de tí. Perdona la omisión de tu blog en la lista. Los datos de los participantes los saqué del comentarios del post de Aldea irreductible donde la gente de adhería a la convocatoria. No sé si no estabas allí o si me paso en la captura de la información. Pero eso tiene fácil arreglo y ahora lo arreglo.

    Estoy haciendo una visualización de la propagación de la campaña y me está costando mucho hacerla.

    Estoy de acuerdo contigo que es cuestión de tiempo pero también hay un problema de valores, lo del compartir en la ciencia, tan necesario para avanzar, se reduce a minúsculos grupos.

    Esperemos que el señor tiempo lo ponga todo en su sitio y mientras evangelizaremos y aportaremos nuestro granito de arena.

    No sé si en ciertos ambientes debieras omitir lo del blog :-)

  3. Aitziber dice:

    Por cierto, se me ha olvidado añadir que les comenté que yo misma tenía un blog… (y de ahí su escepticismo)

  4. Aitziber dice:

    No había podido leer los comentarios hasta ahora. Aquí en Alemania, en los centros de investigación más relevantes y universidades, todavía entre los científicos y académicos el uso de las nuevas herramientas que ofrece Internet, como blogs, twitter, etc. lo ven de un modo escéptico. Sin embargo, mi impresión es que se debe más a la ignorancia o al desconocimiento que a otra cosa. Digamos que se crean clichés sobre la gente que usa esas herramientas pero, al mismo tiempo, cada vez son más los científicos y académicos que las usan. Yo creo que es cuestión de tiempo.

    Como anécdota: hace poco tuve una entrevista de trabajo como responsable de prensa para un centro de investigación muy destacado a nivel internacional y cuando les hablé de las posibilidades que ofrecen los nuevos medios de comunicación como Internet para divulgar las informaciones e investigaciones del centro, me miraron con una mezcla de sorpresa y escepticismo: como las vacas al tren, más o menos. Y, por el contrario, hay otros tantos ejemplos de sitios donde ya se usan estas herramientas y donde los propios científicos escriben en blogs. Vamos, cuestión de tiempo.

    Un saludo a los madriles,

    Pdta: por cierto, no conseguí el trabajo :-/

  5. Aitziber dice:

    Hola M. Luz, qué tal?

    Excelente trabajo. Te he verlinkeado en mi blog. Por cierto, no me he encontrado en el listado ;-)

    Un saludo,

  6. Te dejo ser malo, no faltaba más!

    Pues a mi me sorprendió el seguimiento. No recuerdo en mi corta vida 2.0 un seguimiento tan masivo ante una convocatoria.

    Los blogs que se han adherido son muy variopintos, un par de ellos de contenidos solo para adultos. He visto blogs de Madri+d y algunos académicos, pero pocos. La divulgación en Internet es una asignatura pendiente en la Universidad. Yo hago mi apostolado hasta en el desayuno.
    Es una pena el agujero negro del conocimiento académico.

  7. Déjame ser malo: eso es lo que pasa cuando la divulgación de la ciencia se deja en manos de agencias de innovación.

    De todos modos, la campaña indica dos cosas: una, que la ciencia importa poco (¿<1000 posts?), otra, que a los propios científicos el blogging les suena a chino: ahí tienes otra estadística: ¿cuántos de esos blogs salieron de los departamentos universitarios y los laboratorios?

  8. No te vi en la lista y me extrañó. No se difundió bien a campaña al sur de Islandia.
    Podría poner la lista de los que protestaron sin protestar :-)

  9. ¿Yo aparezco por algún lado? Ya sabes que soy un cascarrabias paradójico, así que participé sin particiar…

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *