¿Hay diferencias entre Twitter y LinkedIn en cuanto al nivel cultural de sus usuarios? El ejemplo de Antoni Gaudi

Estatua de Gaudí, en El Capricho, Comillas (Cantabria). https://es.wikipedia.org/wiki/Antoni_Gaud%C3%AD

El otro día se me ocurrió una idea. Se trataba de aplicar una Tabla de Contingencia y la Prueba χ² de Pearson a las redes sociales. Se me ocurrió hacer una pregunta de cultura general relacionada con un aspecto de la vida del famoso arquitecto Antoni Gaudí. Podemos leer, por ejemplo en Wikipedia, su trágica muerte: “El 7 de junio de 1926 Gaudí se dirigía a la iglesia de San Felipe Neri, que visitaba a diario para rezar y entrevistarse con su confesor, mosén Agustí Mas i Folch; pero al pasar por la Gran Vía de las Cortes Catalanas, entre las calles Gerona y Bailén, fue atropellado por un tranvía,​ que lo dejó sin sentido.​ Siendo tomado por un mendigo, al ir indocumentado y a causa de su aspecto descuidado, con ropas gastadas y viejas, no fue socorrido de inmediato, hasta que un guardia civil paró un taxi que lo condujo al Hospital de la Santa Cruz. Al día siguiente lo reconoció el capellán de la Sagrada Familia, mosén Gil Parés, pero ya era tarde para hacer nada por él. Murió el día 10 de junio de 1926,​ a los 73 años de edad, en la plenitud de su carrera“.

Todo el que está interesado en la arquitectura normalmente ha conocido parte de la obra de este genial arquitecto, incluso ha visto documentales, leído libros o artículos que hablan de él. Su trágica muerte puede considerarse como un hecho que llama la atención, por tanto, puede ser una buena pregunta de cultura general.

El caso es que hice una pequeña encuesta en redes sociales, tanto en Twitter como en LinkedIn. Con los datos que he obtenido se pueden hacer varias reflexiones e, incluso, un análisis estadístico. Los resultados os los pongo en las figuras siguientes:

Como podéis observar, en ambas redes sociales la mayoría abrumadora ha respondido la opción correcta, que es Antoni Gaudí. Sin embargo, es curioso observar algunas cosas:

a) Para el mismo periodo de respuesta, en LinkedIn ha conseguido casi seis veces más de respuestas que en Twitter. Eso a pesar de que en Twitter tengo unos 21500 seguidores y en LinkedIn poco más de 11000. Se podría interpretar como que la red LinkedIn es más profesional y especializada que Twitter, lo cual era algo que ya sabíamos de antemano.

b) Lo curioso es que en Twitter este tuit tuvo 968 impresiones y solo 112 contestaron la encuesta (11,6%), pero en LinkedIn hubo 14482 visualizaciones y solo votaron 664 (4,6%). El resto, o no estaba interesado, o no sabía la respuesta. Por tanto, en LinkedIn hubo más impacto, pero un porcentaje menor de respuestas.

c) En LinkedIn ha sido el porcentaje de aciertos (86%) superior al de Twitter (72,4%), lo cual puede reforzar la conclusión anterior sobre la profesionalidad y especialización de estas dos redes sociales.

d) Con los datos anteriores se puede construir una Tabla de Contingencia (ver tabla siguiente). En esta tabla se puede ver que la respuesta esperada de la solución correcta en Twitter es de 106,45 aciertos, frente a los 92. En cambio, en LinkedIn la respuesta correcta esperada (556,55) es inferior a la realmente obtenida (571).

e) Por último, haciendo la Prueba χ² de Pearson, el p-valor obtenido con MINITAB es de 0,000. Como p-valor > 0,05, existen evidencias sólidas para rechazar la hipótesis nula de que las proporciones entre las poblaciones son las mismas. Es decir, diremos que las redes sociales analizadas no son homogéneas.

Es evidente que esta pequeña prueba no sirve para nada más que para lo que he comentado. Para una sola pregunta y para un solo caso, sí que se han visto diferencias significativas entre Twitter y LinkedIn. Pero no se puede generalizar. Para ello se podría proponer otro tipo de cuestionarios, con una mejor estratificación muestral y con mayor amplitud de miras. Pero eso es otra historia. Igual hasta hay posibilidad de hacer un trabajo de investigación sobre este tema.

 

Licencia de Creative Commons
Esta obra está bajo una licencia de Creative Commons Reconocimiento-NoComercial-SinObraDerivada 4.0 Internacional.

Tablas de contingencia aplicadas al hormigón

Figura 1. ¿Depende la calidad del hormigón de un proveedor determinado?

En ocasiones nos encontramos con un par de variables cualitativas que, a priori, no sabemos si se encuentran relacionadas entre sí, o si pertenecen a una misma población estadística. Recordemos que las variables cualitativas son aquellas cuyo resultado es un valor o categoría de entre un conjunto finito de respuestas (tipo de defecto, nombre del proveedor, color, etc.).

En el ámbito del hormigón, por ejemplo, podríamos tener varios proveedores de hormigón preparado en central y un control del número de cubas-hormigonera aceptadas, aceptadas con defectos menores o rechazadas. Otro ejemplo sería contabilizar el tipo de incumplimiento de una tolerancia por parte de un equipo que está encofrando un muro de contención. En estos casos, se trata de saber si existe dependencia entre los proveedores o los equipos de encofradores respecto a los defectos detectados. Esto sería interesante en el ámbito del control de la calidad para tomar medidas, como pudiese ser descartar a determinados proveedores o mejorar la formación de un equipo de encofradores.

Así, podríamos tener un problema como el siguiente: Teniendo en cuenta el punto 5.6 del Anejo 11 de la EHE, donde se definen las tolerancias de muros de contención y muros de sótano, se quiere comprobar si tres equipos de encofradores producen de forma homogénea en la ejecución de muros vistos, o por el contrario, unos equipos producen más defectos de un tipo que otro. Todos los equipos emplean el mismo tipo de encofrado. Las tolerancias que deben cumplirse son:

1. Desviación respecto a la vertical
2. Espesor del alzado
3. Desviación relativa de las superficies planas de intradós o de trasdós
4. Desviación de nivel de la arista superior del intradós, en muros vistos
5. Tolerancia de acabado de la cara superior del alzado, en muros vistos

Los equipos han estado trabajando durante año ejecutando este tipo de unidad de obra. Durante este tiempo el número de defectos en relación con la tolerancia dimensional ha sido pequeño, pero se han contabilizado 375 defectos. El control de calidad ha dado como resultado el conteo de la tabla de la Figura 2.

Figura 2. Conteo de incumplimientos según el equipo de encofradores. En paréntesis figura el valor esperado.

En la Figura 2 se ha representado también la frecuencia esperada para cada uno de los casos. Por ejemplo, la fracción esperada del incumplimiento “1” es de 89/375, mientras que la fracción esperada de defectos del equipo A es de 150/375. Ello implica que el valor esperado de incumplimientos del tipo “1” para el equipo de encofradores “A” sería: (89/375)·(150/375)·375=89·150/375=35,60.

La pregunta que nos podríamos hacer es la siguiente: ¿Influye el tipo de proveedor en la calidad de la recepción del hormigón? Para ello plantearíamos la hipótesis nula: El tipo de proveedor no influye en la calidad de la recepción del hormigón. La hipótesis alternativa sería que sí que existe dicha influencia o dependencia entre las variables cualitativas.

Para ello necesitamos una prueba estadística, en este caso es la prueba χ². El fundamento de la prueba χ² es comparar la tabla de las frecuencias observadas respecto a la de las frecuencias esperadas (que sería la que esperaríamos encontrar si las variables fueran estadísticamente independientes o no estuvieran relacionadas). Esta prueba permite obtener un p-valor (probabilidad de equivocarnos si rechazamos la hipótesis nula) que podremos contrastar con el nivel de confianza que determinemos. Normalmente el umbral utilizado es de 0,05. De esta forma, si p<0,05 se rechaza la hipótesis nula y, por tanto, diremos que las variables son dependientes. Dicho de forma más precisa, en este caso no existe un nivel de significación suficiente que soporte la independencia de las variables.

Las conclusiones que se obtienen de la prueba son sencillas de interpretar. Si no existe mucha diferencia entre los valores observados y los esperados, no hay razones para dudar de que las variables sean independientes.

No obstante, hay algunos problemas con la prueba χ², uno de ellos relacionado con el tamaño muestral. A mayor número de casos analizados, el valor de la χ² tiende a aumentar. Es decir, si la muestra es excesivamente grande, será más fácil que rechacemos la hipótesis nula de independencia, cuando a lo mejor podrían ser las variables independientes.

Por otra parte, cada una de las celdas de la tabla de contingencia debería tener un mínimo de 5 observaciones esperadas. Si no fuera así, podríamos agrupar filas o columnas (excepto en tablas 2×2). También se podría eliminar la fila que da una frecuencia esperada menor de 5.

Por último, no hay que abusar de la prueba χ². Por ejemplo, podríamos tener una variable numérica, como la resistencia característica del hormigón, y agruparla en una variable categórica en grupos tales como 25, 30, 35, 40, 45 y 50 MPa. Lo correcto cuando tenemos una escala numérica sería aplicar la prueba t-Student, siendo incorrecto convertir la escala numérica en una ordinal o incluso binaria.

A continuación os dejo el problema anterior resuelto, tanto con el programa SPSS como con MINITAB.

Descargar (PDF, 326KB)

Os dejo un par de vídeos explicativos, que espero os sean de interés.

Licencia de Creative Commons
Esta obra está bajo una licencia de Creative Commons Reconocimiento-NoComercial-SinObraDerivada 4.0 Internacional.