Alberto Cairo y una clase magistral sobre visualización de datos

La Global Investigative Journalism Network (GIJN), una organización internacional que promueve el periodismo de investigación, llevó a cabo el webinario “Visualizar los datos del COVID-19: Consejos y Trampas”. Las exposiciones estuvieron a cargo de Amanda Makulec, Líder Senior de Visualización de Datos de Excella, una compañía de soluciones tecnológicas; Danielle Ivory, periodista de investigación de The New York Times y Alberto Cairo, periodista, diseñador y docente de la Universidad de Miami.

Imagen: captura del evento de GIJN.

Alberto Cairo es uno de los grandes referentes en visualización de datos de la actualidad, es por eso que en este post transcribir algunos fragmentos de su intervención que creo que son de gran utilidad para la materia Periodismo de Datos de la Universidad Nacional de Avellaneda -UNDAV-.

Imagen: captura del evento de GIJN.

 

Las visualizaciones de datos y la pandemia

“Las visualizaciones son una de las ganadores de esta crisis. Si hay una buena noticia, es que las visualizaciones se están volviendo más populares”.

“Tenemos mucha evidencia que muestra que a los lectores les encanta ver visualizaciones. Muchas de las piezas más populares publicadas en los últimos meses son visualizaciones de datos, incluida la famosa pieza del The Washington Post, que simula una epidemia y parece que se convirtió en la nota más popular de toda la historia online de The Washington Post. A la gente realmente le gusta ver información presentada visualmente”.

Preguntas y respuestas sobre visualizaciones

“Durante muchos años, la visualización se ha enseñado como un campo basado en un conjunto de reglas: ‘Esto se hace así’; ‘Esto no se hace’; ‘Los gráficos circulares son malvados, por lo tanto, hay que usar gráficos de barras’, etc. Todo eso es basura, está mal”.

¿Por qué visualizar? Esa es una pregunta crítica. Cada vez que diseñamos un gráfico, necesitamos preguntarnos por qué debería existir mi visualización”.

“Veo dos tipos de visualizaciones. A la primera la llamaría ‘visualizaciones por qué no’: digamos que descargás una base de datos sobre las diferentes especies de pingüinos y qué tan grandes son, o lo pequeños que son. Ese es un set de datos divertido y visualizarlo no tiene consecuencias en la vida de nadie”.

“Así que voy a crear una visualización sobre los pingüinos y me preguntaré por qué no visualizarlo. La respuesta es porque es divertida y la gente se va a reir”.

“Pero hay otro tipo de visualizaciones que llamo ‘visualizaciones por qué’. Las visualizaciones sobre el coronavirus están en este tipo de visualizaciones”.

“La segunda pregunta que debo hacer es cómo visualizar correctamente. Cómo visualizar los datos una vez que concluiste que los datos son claros, que entendés lo que estás viendo, que los datos están bien. Entonces, decidís que vale la pena mostrar ese conjunto de datos en particular. ¿Cómo se muestran bien?».

“En el caso del coronavirus representar los datos tanto en escalas lineales como en escalas no lineales es esencial porque la escala lineal muestra la cantidad total de casos pero las escalas logarítmicas -o no lineales en general- son útiles no para mostrar el número de casos, sino para mostrar la tasa a la cual se multiplican. Para eso son las escalas logarítmicas”.

“Necesitamos explicar cómo leer los gráficos correctamente y debemos explicar a las personas por qué los estamos usando. También necesitamos ordenar correctamente los datos”.

“Cuando pensamos en cómo diseñar un gráfico, tenemos que pensar en el propósito de ese gráfico: qué es lo que querés mostrar con ese gráfico en particular. Eso es esencial”.

“Debemos considerar y revelar la incertidumbre de los datos, revelar el nivel de confianza; necesitamos discutir las limitaciones de los datos”.

“La incertidumbre de los datos es una término muy amplio; hay ciertos tipos de incertidumbre que pueden cuantificarse. Cuando trabajamos con intervalos de confianza y márgenes de error, eso es incertidumbre cuantificada y eso se puede mostrar visualmente en un gráfico”.

“Los periodistas deberían acostumbrarse a mostrar más que la incertidumbre cuantificada varía de valores posibles que cierta la realidad puede adoptar. Pero también hay fuentes de incertidumbre no cuantificable que están relacionados con la forma en que se generan los datos. Esas son las limitaciones de los datos y no se pueden visualizar. Lo que podemos hacer es hablar y escribir sobre eso”.

“Eso me lleva a la última pregunta: qué palabras deberían ponerse en un gráfico”.

“Algo que yo pienso que los periodistas pueden hacer más a menudo es no solo mostrar los datos sino explicar los datos y reforzar el mensaje principal de un gráfico”.

“Algunos diseñadores dirán: ‘Bueno, pero eso es redundante, los diseñadores deben mostrar, no contar’. Bueno, eso es completamente errado.

“Tenemos que mostrar y contar, porque si mostrás y contás, la gente no se perderá la idea principal de un gráfico. Algunas personas pueden ver la idea principal del gráfico directamente, pero otras personas, no. Entonces, si también explicás la idea o ideas principales que el gráfico quiere transmitir, entonces todos lo entenderán; y no solo eso: al agregar al gráfico esta capa de explicación, la gente entenderá el gráfico mejor”.

La capa de anotaciones

“El problema con las anotaciones es que muchas personas que hacen visualizaciones piensan que la capa de anotaciones es algo para hacer al final: primero diseñan el gráfico y luego, si hay tiempo, pensarán en el título, la introducción, la explicación. No hagan eso: hay que escribir la explicación del gráfico al mismo tiempo que se diseña el gráfico”.

“De hecho, los mejores diseñadores de visualizaciones dirían que la capa de anotaciones es la parte más importante de cualquier visualización”.

Pensar en la audiencia

“El propósito de una visualización es proporcionar información sobre los datos que presentamos. Y no importa si lo hacemos a través de un gráfico, un texto o con una combinación de ambos, en tanto se logre el objetivo de informar a la gente sobre algo”.

“Tenés que adaptarte a tu audiencia. Si tu audiencia no sabe nada sobre visualizaciones, tendrás que empezar haciendo visualizaciones que son fáciles de entender y explicar: mapas simples, gráficos simples de barras, de líneas, etc”.

“Pero las personas son personas inteligentes, así que hay que tratar de desafiar a tus lectores un poco con visualizaciones más complejas; pero cada vez que uses un gráfico que creés que tendrá dificultades para entenderse, tenés que explicarle a la gente cuál es el valor de ese gráfico”.

“Como periodistas, no solo somos quienes informamos a las personas sobre cosas, también somos educadores, en cierto sentido, y necesitamos ayudar a las personas a expandir sus horizontes de conocimiento”.

Mentir con visualizaciones

“Hay un viejo dicho sobre las estadísticas: ‘Es fácil mentir con estadísticas, pero es mucho más fácil mentir sin estadísticas’. Lo mismo se aplica a las visualizaciones: es fácil mentir con visualizaciones, pero es mucho más fácil mentir sin la visualización porque una visualización es a menudo la mejor vía para detectar ciertas características como valores extremos o tendencias en los datos. Sin una visualización eso no se verá. Decir sin mostrar hace mucho más fácil mentir”.

Habilidades y conocimientos para el periodismo de datos

“En principio, para hacer gráficos interactivos no se necesita saber programación. El inconveniente con las herramientas estándar de visualización es que imponen sus limitaciones. Si querés diseñar visualizaciones de datos interactivas totalmente personalizadas, necesitás aprender un poco de lenguajes basados en la web: HTML, CSS, JavaScript, D3 y otras bibliotecas relacionadas con visualizaciones”.

“Si trabajás en periodismo y, en particular, si trabajás en periodismo de datos y visualizaciones es útil estar familiarizado con literatura sobre ética en ingeniería, ética en ciencia de datos, ética en estadísticas y ética en experiencia del usuario. Hay un desarrollo creciente de todo ese tipo de literatura. Eso es útil para guiar tus decisiones en la visualización de datos”.

“No crean que para este tipo particular de periodismo alcanza con buscar, extraer, limpiar y visualizar datos. Eso es sólo el final del proceso. El 90% del tiempo debe gastarse en comprender los datos y para hacer eso tenés que aprender sobre pensamiento cuantitativo, pensamiento probabilístico, pensamiento científico y epistemología, porque esos temas son absolutamente esenciales para eso actualmente. Y, además, muchas veces también se necesita trabajar junto a expertos que saben mucho más sobre los datos que estás manejando”.

Trabajo práctico: entrevista a periodistas de datos de América Latina

El trabajo práctico consiste en realizar una entrevista en profundidad a un/a periodista que haga periodismo de datos en algún medio de América Latina.

Puede utilizarse el listado que vimos la primera clase para seleccionar el medio y buscar contactos a entrevistar.

Deberán informar a qué medio o periodista tratarán de entrevistar a fin de que no se repitan los/as entrevistados/as.

La fecha de entrega es el lunes 7 de octubre. Debe publicarse «en bruto» (sin mayores ediciones de estilo, en formato pregunta-respuesta) en el blog http://ejerciciosdedatos.blogspot.com/

Las entrevistas, ya sea a periodistas locales como a internacionales, pueden hacerse de manera digital por skype, whatsapp, email (no recomendado por lo extenso del cuestionario) o cualquier otra vía.

Se deben hacer todas las preguntas del cuestionario de investigación, salvo que se considere que ya fueron respondidas como parte de la respuesta a otra pregunta.

Al publicar la entrevista se deberá indicar nombre y apellido del/la periodista entrevistado/a, medio y país.

Cuestionario para las entrevistas:

– ¿Cómo trabajan notas de periodismo de datos?

– ¿Cómo se conforma el equipo de trabajo?

– ¿Por qué elijen el periodismo de datos como método de trabajo?

– ¿Qué diferencial creés que aporta hacer periodismo de datos?

– ¿El periodismo de datos ayuda a que información compleja pueda ser entendida
por amplios públicos? ¿De qué manera, específicamente?

– ¿Cómo ven el periodismo de datos en su país y en la región? (crece?, es escaso?)

– ¿Cómo ven a los medios más grandes del país con respecto al periodismo de datos?

– ¿Hicieron periodismo de datos con medios de otros países? ¿Cómo ven la posibilidad de hacer periodismo de datos transnacional?

– ¿Qué dificultades encuentran a la hora de hacer periodismo de datos?

– ¿Cómo es el acceso a la información pública en el país?

– ¿Qué respuesta del público pudieron constatar?

– ¿Qué importancia tienen las visualizaciones en las notas?

– ¿Ven que el público se siente especialmente atraído por las visualizaciones?

– ¿Qué tienen en cuenta a la hora de hacer visualizaciones para las notas?

– ¿Qué tecnologías y herramientas utilizan para el periodismo de datos?

– ¿Cómo se financia el periodismo de datos?

Bases de datos de museos, teatros y cines porteños

Bases de datos a utilizar:

Periodismo de Datos: primera clase del segundo cuatrimestre de 2019 (TM)

Estimades, bienvenides a Periodismo de Datos en la UNDAV. por favor, completen la encuesta de inicio de clases accesible desde este enlace.

Presentación de la materia e introducción al periodismo de datos:


En este enlace acceden a un listado de ejemplos de periodismo de datos de América Latina.

Acceso a la información pública

  • Texto completo de la Ley de Acceso a la Información Pública
  • Lecturas para la próxima clase: