La cerveza, la estadística y Gosset

William Sealy Gosset, 1876-1937.

Hoy día se conoce ampliamente la distribución t de Student, que surge del problema de estimar la media de una población normalmente distribuida cuando el tamaño de la muestra es pequeño. Esta distribución permite realizar la denominada prueba t de Student a dos muestras para probar si existe o no diferencia entre las medias, pudiendo ser dichas muestras desaparejadas o en parejas. Sin embargo, poca gente conoce a este Student. Este fue el seudónimo que utilizó William S. Gosset (1876-1937) para publicar sus descubrimientos. En efecto, para evitar exposiciones de información confidencial, Guinness -que era la empresa donde Gosset trabajaba- prohibió a sus empleados la publicación de artículos independientemente de la información que contuviesen. De ahí el uso de su pseudónimo Student en sus publicaciones, para evitar que su empleador lo detectara.

Distribución t de Student

Gosset empezó a trabajar en 1899 como técnico en la fábrica de cerveza Guinness, justo después de licenciarse en la Universidad de Oxford. Allí empezó a realizar experimentos y comprendió la necesidad de utilizar la estadística para comprender sus resultados. En los inicios del siglo XX, los métodos de inferencia se reducían a un versión de las pruebas z para las medias, pues incluso entonces los intervalos de confianza eran desconocidos. El interés de Gosset en el cultivo de la cebada le llevó a pensar que el diseño de experimentos debería dirigirse no sólo a mejorar la producción media, sino también a desarrollar variedades poco sensibles a las variaciones en el suelo y el clima. Como los experimentos que realizaba eran con pocas observaciones, se dio cuenta que las conclusiones que obtenía con este tipo de inferencia no eran precisas. Con la nueva distribución t se pudo diseñar una prueba que identificó la mejor variedad de cebada y Guinness, rápidamente, adquirió toda la semilla disponible. Para que luego se ponga en duda la importancia de la investigación en las empresas y su rentabilidad económica.

Os dejo a continuación un vídeo explicativo de esta importante función de distribución.

 

¿Qué es la metodología de la superficie de respuesta?

La Metodología de la Superficie de Respuesta (RSM) es un conjunto de técnicas matemáticas y estadísticas utilizadas para modelar y analizar problemas en los que una variable de interés es influenciada por otras.  El propósito inicial de estas técnicas es diseñar un experimento que proporcione valores razonables de la variable respuesta y, a continuación, determinar el modelo matemático que mejor se ajusta a los datos obtenidos. El objetivo final es establecer los valores de los factores que optimizan el valor de la variable respuesta. Esto se logra al determinar las condiciones óptimas de operación del sistema.

La diferencia entre (RSM) y un diseño experimental corriente estriba en que un diseño experimental por si solo tiene como objetivo localizar el tratamiento “ganador” entre todos aquellos que se han probado. En cambio, RSM pretende localizar las condiciones óptimas de operación del proceso. Ello supone un reto para el investigador, requiere una estrategia más completa e incluye la posibilidad de efectuar varios experimentos secuenciales y el uso de técnicas matemáticas más avanzadas.

Os dejo a continuación un vídeo explicativo que espero os aclare la metodología.

Referencias:

  • Box, G. E. P., Wilson, K. G. (1951), On the experimental attainment of optimum conditions,Journal of the Royal Statistical Society, B 13, 1-45
  • Cornell, John A. (1984), How to apply Response Surface Methodology, American Society for Quality Control, Milwaukee, WI.
  • Kuehl, Robert O. (2001) Diseño de Experimentos, 2a. Edición, Thomson Learning.
  • Melvin T. A. Response Surface Optimization using JMP Software, < http://www2.sas.com/proceedings/sugi22/STATS/PAPER265.PDF>
  • Montgomery, D. C. (2002), Diseño y Análisis de Experimentos, Editorial Limusa, Segunda Edición.
  • http://www.cicalidad.com/articulos/RSM.pdf
  • http://catarina.udlap.mx/u_dl_a/tales/documentos/lii/peregrina_p_pm/capitulo2.pdf

Diseño de experimentos en cuadrado latino

En el diseño en cuadrado latino se tienen cuatro fuentes de variabilidad que pueden afectar a la respuesta observada: los tratamientos, el factor de bloque I (columnas), el factor de bloque II (filas) y el error aleatorio. Se llama cuadrado latino porque se trata de un cuadrado que tiene la restricción adicional de que los tres factores involucrados se prueban en la misma cantidad de niveles, y es latino porque se utilizan letras latinas para denotar a los tratamientos o niveles de factor de interés.

Veamos un ejemplo práctico: se trata de averiguar si la resistencia característica del hormigón a compresión (MPa) varía con cuatro dosificaciones diferentes (D1, D2, D3, D4). Para ello se han preparado amasadas en 4 amasadoras diferentes y los ensayos se han realizado en 4 laboratorios diferentes. Los resultados obtenidos se han representado en la tabla que sigue.

TIPO DE AMASADORA
1 2 3 4
Laboratorio 1 26,7 (D3) 19,7 (D1) 28,0 (D2) 29,4 (D4)
Laboratorio 2 23,1 (D1) 20,7 (D2) 24,9 (D4) 29,0 (D3)
Laboratorio 3 28,3 (D2) 20,1 (D4) 29,0 (D3) 27,3 (D1)
Laboratorio 4 25,1 (D4) 17,4 (D3) 28,7 (D1) 34,1 (D2)

 

En este caso, la variable de respuesta es la resistencia característica del hormigón a compresión (MPa), el factor es la dosificación, y los bloques son las amasadoras y los laboratorios. Se supone que no existe interacción entre el factor y los bloques entre sí. El ANOVA trata de comprobar los efectos de los tratamientos (las dosificaciones).

Referencias:

  • Gutiérrez, H.; de la Vara, R. (2004). Análisis y Diseño de Experimentos. McGraw Hill, México.
  • Vicente, MªL.; Girón, P.; Nieto, C.; Pérez, T. (2005). Diseño de Experimentos. Soluciones con SAS y SPSS. Pearson, Prentice Hall, Madrid.
  • Pérez, C. (2013). Diseño de Experimentos. Técnicas y Herramientas. Garceta Grupo Editorial, Madrid.

 

Diseño de experimentos por bloques completos al azar

El diseño en bloques completos al azar trata de comparar tres fuentes de variabilidad: el factor de tratamientos, el factor de bloques y el error aleatorio. El adjetivo completo se refiere a que en cada bloque se prueban todos los tratamientos. La aleatorización se hace dentro de cada bloque.

Para ilustrar el diseño, supongamos que queremos determinar si cuatro laboratorios miden la misma resistencia característica del hormigón a compresión. Para ello se han considerado 5 amasadas diferentes que han sido analizadas por cada uno de los laboratorios. A los 28 días, se han roto las probetas a compresión simple y los resultados son los que hemos recogido en la tabla que sigue.

 

AMASADA
1 2 3 4 5
Laboratorio 1 63,5 63,2 62,3 65,6 65,0
Laboratorio 2 64,1 64,2 63,0 64,2 64,9
Laboratorio 3 65,9 65,0 63,9 66,0 65,8
Laboratorio 4 64,9 65,2 64,1 65,9 67,9

 

En este caso, la variable de respuesta es la resistencia característica del hormigón a compresión (MPa), el factor es el laboratorio (4 niveles), el bloque es la amasada (no son objeto directo de motivo del estudio). Por otra parte, se considera que no existe interacción entre el laboratorio y la amasada (factor y bloque).

En este tipo de experimento, la medición será el resultado del efecto del tratamiento (laboratorio) donde se encuentre, del efecto del bloque al que pertenece (amasada) y de cierto error que se espera que sea aleatorio. La hipótesis de que las medias son iguales se va a analizar con el análisis de la varianza (ANOVA), con dos criterios de clasificación.

A parte de los suspuesto de normalidad, igualdad de varianzas y de independencia, aquí se añade otro que es que no existe interacción entre el factor y el bloque.

Para los curiosos, después de haber analizado los datos, diremos que en este caso, con una seguridad del 95%, se aprecian diferencias significativas entre las resistencias medidas por los laboratorios 1 y 3, entre los laboratorios 1 y 4,  y entre los laboratorios 2 y 4.

Diseño completamente al azar y ANOVA

El diseño completamente al azar es el más sencillo de los diseños de experimentos que tratan de comparar dos o más tratamientos, puesto que sólo considera dos fuentes de variabilidad: los tratamientos y el error aleatorio.

Para ilustrar el diseño, supongamos que queremos determinar si cuatro dosificaciones de un hormigón A,B,C y D presentan una misma resistencia característica a compresión. Para ello se han elaborado 5 probetas para cada tipo de dosificación y, a los 28 días, se han roto las probetas a compresión simple y los resultados son los que hemos recogido en la tabla que sigue.

DOSIFICACIONES DE HORMIGÓN
A B C D
Resistencia característica a compresión fck (Mpa) 42 45 64 56
39 46 61 55
48 45 50 62
43 39 55 59
44 43 58 60

Para este caso, la variable de respuesta es la resistencia característica del hormigón a compresión (MPa), la unidad experimental es la probeta de hormigón y el factor es la dosificación de hormigón. En este caso se trata de un diseño balanceado porque hemos realizado el mismo número de repeticiones (5) para cada uno de los tratamientos (dosificaciones).

Este tipo de diseño se llama completamente al azar porque todas las repeticiones experimentales se realizan en orden aleatorio completo, pues no se han tenido en cuenta otros factores de interés. Si durante el estudio se hacen N pruebas, éstas se deben realizar al azar, de forma que los posibles efectos ambientales y temporales se vayan repartiendo equitativamente entre los tratamientos.

El número de repeticiones a realizar en cada tratamiento depende de la variabilidad que se espera observar en los datos, a la diferencia mínima que el experimentador considera que es importante detectar y al nivel de confianza que se desea tener en las conclusiones. Normalmente se recomiendan entre 10 y 30 mediciones en cada tratamiento. Con 10 mediciones se podrían detectar diferencias de medias mayores o iguales a  1,5 sigmas con una probabilidad alta, y con 30 mediciones se podrían detectar diferencias mayores o iguales a 0,7 sigmas.

Se utiliza el análisis de la varianza (ANOVA) para comprobar si existen diferencias en las medias. Fundamentalmente este análisis consiste en separar la contribución de cada fuente de variación en la variación total observada. Sin embargo, éste ANOVA está supeditado a los siguientes supuestos que deben verificarse:

  • Normalidad
  • Varianza constante (igual varianza en los tratamientos)
  • Indepedencia

Para los que queráis saber qué ha pasado con nuestro experimento con las amasadas, os diré que que el ANOVA dió como resultado el rechazo de la igualdad de medias, es decir, que la resistencia media se ve afectada por la dosificación. Sin embargo, las cuatro dosificaciones no son igual de efectivas, pues existen diferencias significativas entre las resistencias medias de cada una de ellas. De hecho, las dosificaciones A y B no presentan diferencias significativas entre sí, tampoco entre la C y la D, sin embargo, entre ambos grupos sí que hay diferencias significativas. Asimismo, se ha podido comprobar que se cumplieron los supuestos de normalidad, varianza constante e independencia.

Referencias:

  • Box, G.E.; Hunter, J.S.; Hunter, W.G. (2008). Estadística para investigadores. Diseño, innovación y descubrimiento. Segunda Edición, Ed. Reverté, Barcelona.
  • Gutiérrez, H.; de la Vara, R. (2003). Análisis y diseño de experimentos. McGraw-Hill, México.
  • Vicente, M.L.; Girón, P.; Nieto, C.; Pérez, T. (2005). Diseño de experimentos. Soluciones con SAS y SPSS. Pearson Educación, Madrid.

Licencia de Creative Commons
Esta obra está bajo una licencia de Creative Commons Reconocimiento-NoComercial-SinObraDerivada 4.0 Internacional.

Definiciones básicas del diseño de experimentos

Entendemos por experimento al cambio en las condiciones de operación de un sistema o proceso, que se hace con el objetivo de medir el efecto del cambio en una o varias variables del producto. Ello nos permite aumentar el conocimiento acerca del sistema o del proceso.  Asimismo, entendemos por “diseño de un experimento” la planificación de un conjunto de pruebas experimentales, de forma que los datos generados puedan analizarse estadísticamente para obtener conclusiones válidas y objetivas acerca del problema establecido.

En un experimento es muy importante su reproducibilidad, es decir, poder repetir el experimento. Ello nos proporciona una estimación del error experimental y permite obtener una estimación más precisa del efecto medio de cualquier factor.

 

Veamos algunas definiciones importantes en el diseño de experimentos:

  • Unidad experimental: Es la muestra de unidades que es necesario producir en una condición para obtener una medición o dato representativo. Unidad a la cual se le aplica un solo tratamiento (que puede ser una combinación de muchos factores) en una reproducción del experimento.
  • Variables de respuesta: Es la característica del producto cuyo valor interesa mejorar mediante el diseño de experimentos.
  • Factor: Una variable independiente. En la mayoría de las investigaciones se trata con más de una variable independiente y con los cambios que ocurren en la variable independiente, cuando varia una o mas de las variables independientes.
  • Factores controlables: Son variables del proceso que se pueden fijar en un punto o en un nivel de operación.
  • Factores no controlables: Son variables que no se pueden controlar durante la operación normal del proceso.
  • Factores estudiados: Son las variables que se investigan en el experimento para observar cómo afectan o influyen en la variable de respuesta.
  • Confusión: Dos o más efectos se confunden en un experimento si es posible separar sus efectos, cuando se lleva a cabo el subsecuente análisis estadístico.
  • Error aleatorio: Es la variabilidad observada que no se puede explicar por los factores estudiados;  y resulta del pequeño efecto de los factores no estudiados y del error experimental.
  • Error experimental: Componente del error aleatorio que refleja los errores del experimentador en la planificación y ejecución del experimento.
  • Aleatorización: Consiste en hacer experimentos en orden aleatorio; este principio aumenta la posibilidad de que el supuesto de independencia de los errores se cumpla. Asignación al azar de tratamiento a las unidades experimentales. Una suposición frecuente en los modelos estadísticos de diseño de experimentos en que las observaciones o los errores en ellas están distribuidos independientemente. La aleatorización hace válida esta suposición.
  • Repetición: Es correr más de una vez un tratamiento o combinación de factores
  • Bloqueo: Es nulificar o tomar en cuenta en forma adecuada todos los factores que pueden afectar la respuesta observada. Distribución de las unidades experimentales en bloques, de manera que las unidades dentro de un bloqueo sean relativamente homogéneas, de esta manera, la mayor parte de la variación predecible entre las unidades queda confundida con el efecto de los bloques.
  • Tratamiento o combinación de tratamientos: Conjunto particular de condiciones experimentales que deben imponerse a una unidad experimental dentro de los confines del diseño seleccionado.

 

El error aleatorio describe la situación de no llegar a resultados idénticos con dos unidades experimentales tratadas idénticamente y refleja:

  • Errores de experimentación
  • Errores de observación
  • Errores de medición
  • Variación del material experimental (esto es, entre unidades experimentales)
  • Efectos combinados de factores extraños que pudieran influir las características en estudio, pero respecto a los cuales no se ha llamado la atención en la investigación.

 

El error aleatorio puede reducirse:

  • Usando material experimental más homogéneo o por estratificación cuidadosa del material disponible.
  • Utilizando información proporcionada por variables aleatorias relacionadas
  • Teniendo más cuidado al dirigir y desarrollar el experimento
  • Usando un diseño experimental muy eficiente.

 

Referencias:

  • Box, G.E.; Hunter, J.S.; Hunter, W.G. (2008). Estadística para investigadores. Diseño, innovación y descubrimiento. Segunda Edición, Ed. Reverté, Barcelona.
  • Gutiérrez, H.; de la Vara, R. (2003). Análisis y diseño de experimentos. McGraw-Hill, México.
  • Vicente, M.L.; Girón, P.; Nieto, C.; Pérez, T. (2005). Diseño de experimentos. Soluciones con SAS y SPSS. Pearson Educación, Madrid.

Licencia de Creative Commons
Esta obra está bajo una licencia de Creative Commons Reconocimiento-NoComercial-SinObraDerivada 4.0 Internacional.

¿Qué es el diseño de experimentos?

En el campo de la ingeniería civil resulta extraño el concepto de “diseño de experimentos”. Lo asociamos al campo del control de la calidad y de los laboratorios, pero no tenemos en cuenta que muchas herramientas avanzadas en productividad, mejora de procesos, toma de decisiones y productividad empresarial se basan en este campo del control estadístico de la calidad. Veamos en esta entrada, una pequeña aproximación al concepto.

El diseño de experimentos (DOE) es una técnica estadística que permite identificar y cuantificar las causas de un efecto dentro de un estudio experimental de forma que con el mínimo número de pruebas se consiga extraer información útil para obtener conclusiones que permitan optimizar la configuración de un proceso o producto.

Aunque el diseño de experimentos comenzó a aplicarse en el campo de la agricultura, hoy en día tiene muchas aplicaciones en otros campos, en el que se puede incluir la ingeniería civil. Por ejemplo en control de calidad y en diseño de productos y procesos industriales y en todo tipo de ciencias experimentales. Se puede decir que el diseño de experimentos ocupa un papel crucial en la industria y en la investigación experimental en nuestros días.

En un diseño experimental se manipulan deliberadamente una o más variables, vinculadas a las causas, para medir el efecto que tienen en otra variable de interés. El diseño experimental prescribe una serie de pautas relativas qué variables hay que manipular, de qué manera, cuántas veces hay que repetir el experimento y en qué orden para poder establecer con un grado de confianza predefinido la necesidad de una presunta relación de causa-efecto.

Los pasos básicos a seguir en el diseño de experimentos son los siguientes:

  1. Fijar un cronograma que  defina cuál va a ser la lista de pruebas a realizar. También debemos definir nuestros objetivos, los cuales deben ser claros y se deben aproximar a una realidad alcanzable.
  2. Escoger los factores a analizar, es decir, aquellos parámetros que van a afectar tanto directa cómo indirectamente a nuestra actividad (el proceso o producto que queremos optimizar), siendo estos los que nos van a marcar los límites alcanzables.
  3. Diseñar el plan de pruebas, este plan variará en función del número de factores que hayamos considerado. En este punto hay que ser ambicioso y no descartar cualquier posible experimento por raro que parezca, pues puede que algunos de ellos estén comunicados entre sí y su interacción deba ser tenida en cuenta a la hora de tomar decisiones.

Una vez realizadas las pruebas, los resultados obtenidos permiten extraer conclusiones acerca de qué factores influyen más en los resultados y cómo se debe configurar nuestra actividad para alcanzar los objetivos propuestos. Además, si se usan herramientas informáticas podremos obtener una función de regresión que nos relacione los resultados de la actividad en función de los factores considerados, con ella podremos hacer interpolaciones y calcular virtualmente qué resultado tendrá nuestra actividad para cualquier combinación de factores posibles.

Algunos de los tipos de diseños de experimentos son los siguientes:

  • Diseño unifactorial
  • Diseño por bloques aleatorizados
  • Diseño por cuadrados latinos
  • Diseños factoriales
  • Diseños anidados
  • Diseños cruzados anidados
  • Diseños factoriales 2^k

 

Os dejo un enlace introductorio al tema que espero os guste: http://ocw.univalle.edu.co/ocw/ingenieria-electronica-telecomunicaciones-y-afines/investigacion-i/bibliografia-1/disenoestadisticoexperimentos.pdf

[iframe: src=”http://ocw.univalle.edu.co/ocw/ingenieria-electronica-telecomunicaciones-y-afines/investigacion-i/bibliografia-1/disenoestadisticoexperimentos.pdf” frameborder=”0″ width=”100%” height=”1000″ scrolling=”yes”]

 

Licencia de Creative Commons
Esta obra está bajo una licencia de Creative Commons Reconocimiento-NoComercial-SinObraDerivada 4.0 Internacional.