ASPECTOS CONCEPTUALES GENERALES DEL DISEÑO EXPERIMENTAL POR BLOQUES

ISADORE NABI

Como se señala en (Dey, 2010, págs. 1-2), en determinadas situaciones experimentales, puede haber variaciones sistemáticas presentes entre las unidades experimentales[1]. Por ejemplo, en un experimento de campo, las unidades experimentales suelen ser parcelas de tierra. En un experimento de este tipo, puede haber un gradiente de fecundidad tal que las parcelas del mismo nivel de fecundidad sean más homogéneas que las que tienen distintos niveles de fecundidad. En experimentos con lechones como unidades experimentales, es muy plausible que los lechones pertenecientes a la misma camada estén genéticamente más cercanos entre sí (naciendo del mismo par de padres) que los que pertenecen a diferentes camadas. De manera similar, en experimentos con ganado, pueden estar involucradas diferentes razas (o diferentes edades) y se espera que los animales que pertenecen a la misma raza sean más parecidos que los que pertenecen a diferentes razas. En el contexto de los ensayos clínicos con pacientes que forman las unidades experimentales, el ensayo puede realizarse en diferentes centros (principalmente para obtener un número suficiente de observaciones) y los pacientes del mismo centro pueden ser más parecidos que los de diferentes centros debido a las diferencias en el tratamiento. prácticas y/o procedimientos de gestión seguidos en los diferentes centros. Los ejemplos anteriores, que son meramente ilustrativos y de ninguna manera exhaustivos, demuestran que en muchas situaciones existe una variación sistemática entre las unidades experimentales. En tales situaciones, el uso de un diseño completamente aleatorio no es apropiado. Más bien, se debe aprovechar la información a priori sobre esta variación sistemática mientras se diseña el experimento en el sentido de que esta información se debe utilizar durante el diseño para eliminar el efecto de dicha variabilidad. El impacto de este esfuerzo se verá reflejado en un error reducido, aumentando así la sensibilidad del experimento. Las consideraciones anteriores llevaron a la noción de control o bloqueo local. Los grupos de unidades experimentales relativamente homogéneas se denominan bloques. Cuando el bloqueo se realiza de acuerdo con un atributo, obtenemos un diseño de bloque. En un diseño de bloques, los tratamientos se aplican aleatoriamente a las unidades experimentales dentro de un bloque, y la asignación aleatoria de tratamientos a las unidades experimentales dentro de un bloque se realiza de forma independiente en cada bloque. El más simple entre los diseños de bloques es el diseño de bloques completos al azar.

Adicionalmente, (Batabyal, Sarkar, & Mandal, 2015, pág. 19) señalan que el experimento de gradiente de fertilidad (específicamente el del experimento por ellos analizado) se realizó antes del experimento del cultivo de prueba según la metodología inductiva propuesta por Ramamoorthy et al (1967), durante el verano de 2008-09, dividiendo el campo experimental en tres franjas rectangulares a lo largo del ancho. Los gradientes de fertilidad se crearon aplicando dosis graduadas de fertilizante N, P y K en las tiras como se muestra en la Tabla 1. El maíz forrajero se cultivó exhaustivamente para ayudar a que los fertilizantes se transformaran en el suelo por la planta y los microbios.

Figura 1

Fuente: (Batabyal, Sarkar, & Mandal, 2015, pág. 19).

La referencia anterior permite comprender conceptualmente el concepto gradiente al que se refirió Aloke Day en penúltima referencia realizada, así como también generalizar conceptualmente lo expuesto por este autor. Así, expresando de forma abstracta lo anterior, puede afirmarse que, en ciertas condiciones experimentales, pueden presentarse variaciones sistemáticas entre las unidades experimentales. En tales experimentos, existe variabilidad diferenciada en la distribución de los datos muestrales en las subregiones del espacio de muestra (en la teoría del diseño muestral estas subregiones son conocidas como bloques) a causa de un conjunto de factores subyacentes (por ello se considera la variabilidad de carácter sistemático) y esa variabilidad diferenciada por regiones se expresa matemáticamente como un gradiente, es decir, como una matriz en cuyo interior se contienen las derivadas parciales de primer orden de la función objetivo (la que explica la propagación diferenciada de la variabilidad) evaluadas en las subregiones pertinentes. Esta es la forma usual en que en el contexto de la teoría del diseño de experimentos y los ensayos clínicos se maneja el problema de volatilidad diferenciada de la varianza. El concepto bloque formaliza la noción de control local e implica cierta homogeneidad mínima entre los elementos de cada grupo, tiene como objetivo diseñar el experimento de tal forma que se elimine el efecto de esta variabilidad sistemática. Por supuesto, en otros contextos aplicados distintos de los ensayos clínicos puede desearse analizar el comportamiento del fenómeno estudiado considerando los efectos que la variabilidad diferenciada de la varianza y por ello existen modelos como el de heterocedasticidad condicional autorregresiva. Cuando los bloques han sido organizados alrededor de un atributo se está en presencia de un diseño por bloques y, en tal escenario, las variables explicativas (los tratamientos experimentales, para el caso aplicado) son consideradas como aleatorias (se aplican aleatoriamente sobre las unidades experimentales -pacientes humanos o de otra especie- al interior de un bloque). Esto se establece bajo el supuesto de que la aplicación de tales tratamientos a los elementos de cada bloque es linealmente independiente o, lo que es lo mismo, que al realizar la operación producto vectorial (exterior) entre los vectores que contienen las variables consideradas como estocásticas se genera un sistema de ecuaciones homogéneo de solución no nula.

Como señala (Dey, 2010, pág. 3), el más simple entre los diseños de bloques es el diseño de bloques completos al azar. En tal diseño, se requiere que cada bloque tenga tantas unidades experimentales como el número de tratamientos a evaluar, es decir, el tamaño del bloque sea igual al número de tratamientos. Sin embargo, no siempre es posible adoptar un diseño de bloques completos al azar en cada situación experimental. En primer lugar, si se supone que la variación intrabloque depende directamente del tamaño del bloque, entonces es preferible la adopción de un diseño con bloques de tamaños pequeños a uno que tenga tamaños de bloque grandes. Esto restringe el uso de diseños de bloques completos al azar en situaciones donde el número de tratamientos es grande. Por ejemplo, en los experimentos agronómicos, el experimentador generalmente elige un bloque de tamaño 10-12 y, si se acepta, no se puede adoptar un diseño de bloque completo al azar en situaciones en las que, digamos, se van a comparar 20 tratamientos. Además, en muchas situaciones experimentales, el tamaño del bloque está determinado por la naturaleza del experimento. Por ejemplo, con algunos experimentos en psicología, es bastante común considerar a los dos miembros de un par de gemelos como unidades experimentales de un bloque. En ese caso, claramente no se puede realizar diseño de bloques completos al azar si el número de tratamientos es mayor que dos (puesto que por definición en cada bloque existirá únicamente una observación -. De manera similar, es razonable tomar a los compañeros de camada (por ejemplo, ratones) como unidades de un bloque y el tamaño de la camada puede no ser adecuado para acomodar todos los tratamientos bajo prueba.

Los pocos ejemplos considerados anteriormente muestran claramente que, en muchas situaciones, no se puede adoptar un diseño de bloques completos al azar y, por lo tanto, es necesario buscar diseños en los que no todos los tratamientos aparezcan en cada bloque. Estos diseños se denominan diseños de bloques incompletos. Como señala (Dey, 2010, págs. 3-4), el tipo de diseño más importante del conjunto de diseños balanceados es el diseño de bloques balanceado e incompleto (BIB, por su nombre en inglés) y sobre ellos debe decirse que estos todavía se encuentran útiles en el diseño de experimentos en diversos campos y en los últimos años se han encontrado aplicaciones más nuevas de estos diseños, por ejemplo, en criptografía visual (véase, por ejemplo, Bose y Mukerjee (2006), Adhikary, Bose, Kumar y Roy (2007) y las referencias allí citadas).

Como señala (Wikipedia, 2021), el diseño por bloques es una estructura de incidencia[2] consistente en un conjunto de elementos expresados en familias denominadas bloques, escogidos tal que las frecuencias de los elementos satisfacen ciertas condiciones que permiten que la colección de bloques exhiba simetría (balance de bloques). Si no se dan más especificaciones, usualmente por “diseño de bloques” se hace referencia a un diseño de bloques balanceado e incompleto. Se dice que un diseño está balanceado hasta τ si todos los subconjuntos τ del conjunto original se presentan (como evento estadístico) en la misma cantidad de bloques λ. Cuando τ no está especificado, generalmente se puede suponer que es 2, lo que significa que cada par de elementos se encuentra en el mismo número de bloques y el diseño está “balanceado por pares”. Cualquier diseño equilibrado hasta τ también está equilibrado en todos los valores más bajos de τ (aunque con diferentes valores para λ). Por ejemplo, un diseño balanceado por pares (τ=2) es también regular (τ=1). Cuando falla el requisito de equilibrio, un diseño puede estar parcialmente equilibrado si los subconjuntos τ se pueden dividir en n-ésimas clases, cada una con su correspondiente (y diferente) valor para λ.

Así, señala última fuente referida que, para el caso de τ=2, estos diseños por bloques se conocen como PBIB(n), cuyas clases forman un esquema de asociación[3]. La teoría de los esquemas de asociación generaliza la teoría de los caracteres de representación lineal de grupos (y, por consiguiente, los esquemas de asociación generalizan la noción de grupos). Por lo general, se asume que los diseños están incompletos, lo que significa que ningún bloque contiene todos los elementos del conjunto, descartando así un diseño trivial (esta es otra forma en que se expresa la creencia de la estadística matemática clásica de que, si en un sistema de ecuaciones una ecuación es linealmente dependiente de otra u otras, entonces la variable que es descrita mediante tal ecuación no aporta información relevante). Los diseños por bloques pueden tener (o no) bloques repetidos. Cuando no tienen bloques repetidos, se denominan simples, en cuyo caso la familia de bloques es un conjunto en lugar de un multiconjunto. En estadística, el diseño de bloques se extiende a diseños de bloques no binarios los cuales pueden contener múltiples copias de un elemento de X, lo que implica que un diseño es regular sólo si es también binario. La matriz de incidencia de un diseño no binario (véase más adelante) enlista el número de veces que cada elemento de repite en cada bloque.

Adicionalmente, como señala (Dey, 2010, pág. 4), existen generalizaciones de los diseños BIB. Los diseños BIB son los únicos diseños en la clase de diseños de experimentos binarios[4], equirreplicados[5] y propios[6] que son balanceados (según se definió antes) tanto en varianza como en eficiencia; sin embargo, es posible encontrar otros diseños con equilibrio de varianza y eficiencia si uno expande la clase de diseños a diseños no binarios, no equirreplicados o no apropiados. Los métodos de construcción de diseños balanceados en varianza y eficiencia con replicaciones posiblemente desiguales y tamaños de bloques desiguales son el estado del arte más avanzado en el ámbito de los diseños balanceados.

Además, como se señala en la última fuente referida, existen los diseños de experimentos por bloques parcialmente balanceados, dentro de los cuales los más estudiados y aplicados empíricamente son los diseños de bloques parcialmente balanceados (PBIB, por su nombre en inglés). Los diseños de PBIB se introducen formalmente mediante la noción de esquema de asociación antes definida. Existen diseños con dos o más clases asociadas, así como también otros diseños parcialmente balanceados que no son necesariamente diseños PBIB. Estos incluyen los diseños conocidos como de celosía, cíclico, bloque enlazado, diseños en C y diseños α.

REFERENCIAS

Batabyal, K., Sarkar, D., & Mandal, B. (2015). Fertilizer-prescription equations for targeted yield in radish under integrated nutrient management system. Journal of Horticultural Sciences, X(1), 18-23. Obtenido de blob:resource://pdf.js/782dc541-51e4-4535-9551-8b7db5f35d1b

Dey, A. (2010). Incomplete Block Design. Tob Tuck Link, Singapore: World Scientific Publishing Co. Pte. Ltd.

Gupta, S. C., & Jones, B. (Agosto de 1983). Equireplicate Balanced Block Designs with Unequal Block Sizes. Biometrika, LXX(2), 433-440.

Shah, K. R., & Ashish, D. (Septiembre de 1992). Binary Designs Are Not Always the Bes. The Canadian Journal of Statistics / La Revue Canadienne de Statistique, XX(3), 347-351.

Weisstein, E. W. (19 de Septiembre de 2021). Monoid. Obtenido de MathWorld – A Wolfram Web Resource: https://mathworld.wolfram.com/Monoid.html

Wikipedia. (6 de Julio de 2021). Block design. Obtenido de Design of experiments: https://en.wikipedia.org/wiki/Block_design

Wikipedia. (27 de Septiembre de 2021). Incidence structure. Obtenido de Incidence geometry: https://en.wikipedia.org/wiki/Incidence_structure


[1] La variabilidad diferenciada de la varianza se encuentra en la literatura bajo el nombre de homogeneidad de varianza u homocedasticidad. Sin embargo, debe señalarse que no necesariamente son equivalentes metodológicamente, lo cual se explica por el hecho de que filosófica e históricamente no lo son. La heterocedasticidad tiene su génesis conceptual en el contexto de las estructuras de datos conocidas como series temporales, mientras que la homogeneidad de varianza tiene su génesis histórica en las estructuras de datos de sección cruzada. La posibilidad de su divergencia metodológica puede verificarse si alguna prueba para varianza no se puede hacer para sección cruzada y sí se puede hacer para series temporales (y/o para datos de panel, lo cual sería necesario investigar) o, por supuesto, a la inversa, que se pueda realizar para datos de sección cruzada y/o de panel, mientras que no sea posible para datos de series temporales (o bien, que sea posible para una estructura de datos, mientras que para la otra y su estructura combinada -datos de panel- no sea posible). Si no son diferentes, resulta técnicamente adecuado (con el fin de evitar ambigüedades) hablar de variabilidad diferenciada de la varianza, en lugar de hablar de “homogeneidad de varianza” o “heterocedasticidad” (puesto que los diferenciaría en un contexto en que son equivalentes). Así, aunque la posibilidad de su equivalencia o divergencia conceptual sea una cuestión fundamentalmente filosófica, su diferenciación se encuentra en las minucias metodológicas de las distintas técnicas estadísticas para medir y clasificar la variabilidad de la varianza. Por supuesto, sus diferencias filosóficas están basada en un hecho histórico-técnico concreto innegable: ambas estructuras de datos son distintas.

[2] Como señala (Wikipedia, 2021), una estructura de incidencia es un sistema abstracto consistente en dos tipos de objeto y una relación única entre ellos que se conoce como estructura de incidencia Se consideran una generalización del concepto de plano. Por su definición, son una estructura métrica vinculada a una estructura algebraica.

[3] Un esquema de asociación es un concepto algebraico que generaliza la noción de grupo. Un grupo es un monoide en el que además se cumple que sus elementos son invertibles. Un monoide es un conjunto cerrado (el equivalente matemático de autocontenido) bajo una operación asociativa binaria y con elemento identidad I que pertenece a S tal que para todo elemento a que pertenece a S se cumple que I*a = a*I = a y se diferencia de un grupo en el sentido de que no exige que sus elementos sean invertibles bajo alguna operación. Véase (Weisstein, 2021).

[4] Como se señala en (Shah & Ashish, 1992, pág. 347), un diseño en el que cada tratamiento aparece como máximo una vez en cualquier bloque en particular.

[5] Como se señala en (Gupta & Jones, 1983, pág. 433), un diseño por bloques equirreplicado es aquel en el que las variables independientes (en el contexto de la bioestadística y la psicometría usualmente son los tipos de tratamiento) se repiten en cada bloque la misma cantidad de veces.  

[6] Como se señala en (Wikipedia, 2021), un diseño por bloques es propio cuando todos los bloques tienen el mismo tamaño. También, como se señala en la fuente referida, se estudian también diseños por bloques que no son necesariamente uniformes; para τ=2 se conocen en la bibliografía bajo el nombre general de diseños equilibrados por pares, en donde cada par de elementos de X (cada par de elementos el conjunto de variables independientes) está contenido en exactamente en λ subconjuntos o bloques, en donde λ pertenece a los números naturales.

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Salir /  Cambiar )

Google photo

Estás comentando usando tu cuenta de Google. Salir /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Salir /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Salir /  Cambiar )

Conectando a %s