Clave - Uprm

[Type text]
Efectos Aleatorios y Mixtos. Diseños Anidados
PARTE I
1. La figura abajo es de una isla imaginaria con las localidades de humedales representadas con diamantes y
hexógonos. En la isla hay dos tipos de humedales: alimentados por agua de precipitación (P – los
hexógonos) y alimentados por agua subterraneo (ST – los diamantes). Con el objetivo de determinar si la
fuente de agua alimentando un humedal influía sobre las tasas de producción de metano, se muestrearon tres
humedales de cada tipo de agua. Estos tres humedales (rotulados 1, 2, y 3 en la figura) se eligieron
aleatoriamente de un conjunto grande de humedales que tenían cada tipo de agua. En cada humedal
seleccionado, se obtuvieron 3 muestras de suelo (en lugares aleatoriamente elegidos dentro de cada
humedal). Estas muestras se transportaron al laboratorio y se incubaron a temperatura constante. Las tasas
de producción de metano que se obtuvieron aparecen en la tabla en la próxima página.
2.
a.
b.
c.
d.
¿Son los efectos de tipo de humedal fijos o aleatorios? Fijos
¿Son los efectos de humedal fijos o aleatorios? Aleatorios
La estructura ¿es factorial o anidada? Anidada
Defina los valores de
a=2
b=3
n = 3 (las 3 muestras)
e. Prepare una tabla de anova con las fuentes de variación, los grados de libertad y los cuadrados medios
esperados.
FV
A: Tipo de agua
B(A): Humedal(Tipo de agua)
Error
AGRO 6600 – CLAVE – LAB 9
GL
a-1 = 2-1 = 1
a(b-1) = 2(3-1) = 2
ab(n-1) = 2*3*(3-1) = 12
CME
σ2 + 3σ2β + 3(3)Σαi2/(2-1)
σ2 + 3σ2β
σ2
Page 1
[Type text]
Tipo de
Agua
Humedal
Muestra
producción
metano
(umol/l/hr)
G
1
1
6.63
G
1
2
6.77
G
1
3
5.64
G
2
1
12.4
G
2
2
13.5
G
2
3
11.9
G
3
1
7.64
G
3
2
6.18
G
3
3
5.42
P
1
1
1.74
P
1
2
2.55
P
1
3
2.09
P
2
1
0.59
P
2
2
0.32
P
2
3
0.8
P
3
1
1.98
P
3
2
4.56
P
3
3
3.67
f. Formule y pruebe las hipótesis de interés. Use Infostat y SAS para obtener e interpretar sus
conclusiones. Favor de considerar el ejemplo en la última página de este laboratorio!!
Ho: α1 = α2 = 0
Ha: Al menos un αi es diferente de 0
Conclusión: como p=0.0450, se rechaza Ho.
Ho: σ β2 = 0
Ha: σ β2 > 0
Conclusión: como p<0.0001, se rechaza Ho.
INFOSTAT:
Variable
producción metano um
N
18
R²
0.97
R² Aj CV
0.96 16.08
En este ejemplo, el “error” (denominador en la
prueba F) para probar el efecto de Tipo de Agua
es Humedal/Tipo de Agua (=Tipo de Agua
>Humedal). Sí esto no aparece en su salida,
entonces InfoStat no va a hacer la prueba F
correctamente (va a incorrectamente usar el
residual (Error) en el denominador)
Cuadro de Análisis de la Varianza (SC tipo III)
F.V.
Modelo
Tipo de Agua
Tipo de Agua>Humedal
Error
SC
gl
274.94 5
185.47 1
89.46 4
8.53 12
AGRO 6600 – CLAVE – LAB 9
CM
F
54.99 77.40
185.47 8.29
22.37 31.48
0.71
p-valor
(Error)
<0.0001
0.0450 (Tipo de Agua>Humedal)
<0.0001
Page 2
[Type text]
Total
283.46 17
SAS:
The SAS System
The GLM Procedure
Class Level Information
Class
Levels
Values
tipohum
2
GP
humedal
3
123
Number of Observations Read
18
Number of Observations Used
18
The SAS System
The GLM Procedure
Dependent Variable: prodmetano
Source
DF
Sum of Squares
Mean Square
F Value
Pr > F
Model
5
274.9381333
54.9876267
77.40
<.0001
Error
12
8.5254667
0.7104556
Corrected Total
17
283.4636000
R-Square
Coeff Var
Root MSE
prodmetano Mean
0.969924
16.07537
0.842885
5.243333
Tests of Hypotheses Using the Type III MS for humedal(tipohum) as an Error Term
Source
tipohum
DF
Type III SS
Mean Square
F Value
Pr > F
1
185.4738000
185.4738000
8.29
0.0450
OJO*** Favor de verificar que este cuadro sale en su salida de SAS.
En SAS, la línea “test h=tipohum e=humedal(tipohum);” generó esta tabla
The GLM Procedure
AGRO 6600 – CLAVE – LAB 9
Page 3
[Type text]
t Tests (LSD) for prodmetano
Note: This test controls the Type I comparisonwise error rate, not the experimentwise error rate.
Alpha
0.05
Error Degrees of Freedom
4
Error Mean Square
22.36608
Critical Value of t
2.77645
Least Significant Difference
6.1898
Means with the same letter
are not significantly different.
t Grouping
Mean
N
Tipohum
A
8.453
9
G
B
2.033
9
P
Conclusiones: Hay diferencias significativas en el tipo de agua en la producción promedio de metano: el
humedal alimentado con agua subterránea (8.453 um) produce significativamente más metano que el humedal
alimentado con agua de precipitación (2.033 um). Además, hay variabilidad significativa entre los efectos de
humedal en el mismo tipo de agua.
g. Realice un intervalo de confianza del 95% para la diferencia entre las tasas de producción de metano en
humedales con agua subterránea y con agua de precipitación.
__
__
(Y1•• – Y2••) ± tα/2 √(2CMB(A)/bn) = (8.453 – 2.033) ± 2.776 √(2x22.37/9) =
= (0.231, 12.609)
h. Estime todas las componentes de varianza presentes en este modelo.
Hay 2 varianzas para estimar: 𝝈
̂ 2 (error experimental) y 𝝈
̂ (la varianza de humedales). No
estimamos la varianza de tipo de agua (tipo de humedal) porque es un efecto fijo, no aleatorio.
0.71 = 𝝈
̂ 2 (estimación del error experimental)
CMB( A)  ˆ 2  3ˆ 2
CME  ˆ 2
22.37 = 𝝈
̂ 2 + 3𝝈
̂ 
22.37 = 0.71 + 3𝝈
̂ 
𝝈
̂ 
𝝈
̂  (varianza de humedales dentro de tipos de agua)
3. El Departamento de Transportación desea realizar un estudio para evaluar la erosión del suelo en áreas con
pendiente cercanas a futuras autopistas. Entre las posibles especies a ser usadas, se tomó una muestra
aleatoria de 6 especies vegetales nativas que podrían servir como coberturas (es decir que crecen en forma
AGRO 6600 – CLAVE – LAB 9
Page 4
[Type text]
rastrera y podrían controlar la erosión). En un área con pendiente cercana a una futura autopista se
dispusieron 36 parcelas. En el mes de enero se sembraron 12 de estas parcelas aleatoriamente escogidas (dos
parcelas con cada especie), en el mes de mayo se sembraron otras 12 parcelas aleatoriamente escogidas (dos
parcelas con cada especie), y finalmente en el mes de septiembre se sembraron las 12 restantes (dos con
cada especie). Se midió el porcentaje de cobertura del suelo a los dos años de implantadas las parcelas.
mes
enero
enero
enero
enero
enero
enero
enero
enero
enero
enero
enero
enero
mayo
mayo
mayo
mayo
mayo
mayo
mayo
mayo
mayo
mayo
mayo
mayo
septi
septi
septi
septi
septi
septi
septi
septi
septi
septi
septi
septi
especie
1
1
2
2
3
3
4
4
5
5
6
6
1
1
2
2
3
3
4
4
5
5
6
6
1
1
2
2
3
3
4
4
5
5
6
6
repet
1
2
1
2
1
2
1
2
1
2
1
2
1
2
1
2
1
2
1
2
1
2
1
2
1
2
1
2
1
2
1
2
1
2
1
2
cobertura
63.9
66.6
69.8
68.5
67.2
70.5
66.4
63.5
61.4
65.7
68.1
68.4
69.1
70.1
72.5
70.7
63.9
65.2
71.9
69.9
67.7
67.1
68.7
72
76.5
70.9
74.3
73.8
73.4
72.3
77.4
78.9
75.3
74.6
73.9
75.6
a. ¿Son las especies fijas o aleatorias? aleatorias
b. ¿Son las épocas fijas o aleatorias? Fijas (se considera época como el factor A para poder usar la
tabla en la notas de conferencia – el orden es arbitrario en un factorial)
c. La estructura ¿es factorial o anidada? Factorial
d. Defina los valores de
AGRO 6600 – CLAVE – LAB 9
Page 5
[Type text]
a = 3 (épocas)
b = 6 (especies)
n = 2 (muestras o repeticiones)
e. Prepare una tabla de anova con las fuentes de variación, los grados de libertad y los cuadrados medios
esperados.
FV
A: Época
B: Especie
A*B
Error
GL
a-1 = 3-1 = 2
b-1 = 6-1 = 5
(a-1)*(b-1) = 2*5 = 10
ab(n-1) = 3*6*(2-1) = 18
CME
σ2 + 2 σ2αβ + 2(6)Σαi2/(3-1)
σ2 + 2(3)σ2β
σ2 + 2σ2αβ
σ2
f. Formule y pruebe las hipótesis de interés. Use Infostat para obtener e interpretar sus conclusiones.
Interacción Época x Especie:
Ho: σ 2αβ = 0
Ha: σ 2αβ > 0
Valor p 0.0091 < 0.05 Rechazo Ho, es decir que la variabilidad debida a la interacción entre época y
especie es significativa. Como las especies fueron elegidas aleatoriamente, la interacción también es
aleatoria; por lo tanto, se analizarán las hipótesis de efectos principales.
Ho: σ 2β = 0
Ha: σ 2β > 0
Para la época hubo un valor de p menor que 0.0179; o sea, hay variabilidad significativa entre especies.
Ho: α1= α2= α3=0
Ha: al menos una época es diferente
Como p=0.0004, hay diferencias significativas entre las medias de época.
Variable N
cobertura 36
R²
0.915
Cuadro de Análisis de la
F.V.
SC
Modelo.
572.283
mes
412.685
especie
54.589
mes*especie
105.008
Error
53.245
Total
625.528
AGRO 6600 – CLAVE – LAB 9
R² Aj
0.834
CV
2.451
Varianza (SC tipo III)
gl
CM
F
17
33.664
11.380
2
206.343
19.650
5
10.918
3.691
10
10.501
3.550
18
2.958
35
p-valor
<0.0001
0.0003
0.0179
0.0094
(Error)
(mes*especie)
Page 6
[Type text]
g. Compare las medias de épocas mediante una prueba de Tukey usando α=0.05.
Test:Tukey Alfa=0.05 DMS=3.62654
Error: 10.5008 gl: 10
mes
Medias
n
E.E.
septi
74.74
12
0.94 A
mayo
69.07
12
0.94
enero
66.67
12
0.94
B
B
Medias con una letra común no son significativamente diferentes (p > 0.05)
UD. DEBERÍA SABER COMO HACER EL MISMO CÁLCULO DE ARRIBA (DMS DE
TUKEY), A MANO. El “error” en la fórmula de Tukey es el CM de la interacción (=10.5516), no
el CME (2.95). De igual manera, los grados de libertad para t son los de la interacción (10 gl), no
los gl de error (18 gl).
h. Estime todas las componentes de varianza presentes en este modelo.
2.96 = 𝝈
̂ 2 (estimación del error experimental)
CMB  ˆ 2  6ˆ 2
CMAB  ˆ 2  2ˆ2 
CME  ˆ 2
10.50 = 𝝈
̂ 2 + 2𝝈
̂ 
𝝈
̂ 
(10.50-2.96)/2 = 𝝈
̂ 
3.77 = 𝝈
̂ 
10.92 = 𝝈
̂ 2 + 6𝝈
̂ 
10.92 = 2.96 + 6𝝈
̂ 
(10.92-2.96)/6 = 6𝝈
̂ 
1.33 = 6𝝈
̂ 
Parte II
Para cada una de las siguientes situaciones:
a. decida cuáles son los factores en estudio, y los niveles de cada uno.
b. decida cuál es el diseño experimental usado.
c. decida si cada factor constituye un efecto fijo o aleatorio.
d. decida si los factores están anidados (diseño anidado) o cruzados (experimento factorial).
e. realice un esquema de la tabla de ANOVA que incluya fuentes de variación, grados de libertad y
estadísticos F.
1.
Con el objeto de comparar las tres marcas más comúnmente usadas de aceite para automóvil, se tomaron 24
motores, 12 de cada uno de dos fabricantes (estos dos fabricantes son los dos que normalmente proveen este
tipo de motores. Cada marca de aceite se usó en cuatro motores de cada fabricante (elegidos
aleatoriamente) y luego de esto los motores se vaciaron y se hicieron funcionar sin aceite. Se registró el
tiempo en que cada motor dejó de funcionar.
a. Factor A: Marca aceite con 3 niveles
Factor B: Fabricante motor con 2 niveles
AGRO 6600 – CLAVE – LAB 9
Page 7
[Type text]
b. DCA con arreglo factorial 3x2 y 4 repeticiones
c. Marca aceite: Fijo y Fabricante motor: Fijo
d.
F.V.
A: Marca Aceite
B: Fabricante Motor
A*B: Aceite*Motor
Error
Total
2.
gl
2
1
2
18
23
F
CMA/CME
CMB/CME
CMA*B/CME
Una compañía farmacéutica desea examinar la potencia de un medicamento líquido que se mezcla en
tambores grandes antes de ser embotellado. Para ello se eligen aleatoriamente 4 plantas de producción, y en
cada planta se escogen 5 tambores (también aleatoriamente). De cada tambor se analizan cuatro muestras
aleatoriamente tomadas del líquido.
a. Factor A: Planta de producción (4 niveles). Factor B: Tambor en cada planta (5 niveles)
b. DCA con factores anidados (ambos aleatorios) y 4 repeticiones
c. A, B: Aleatorio
d.
F.V.
gl
F
A: Planta
3
CMA/CMB(A)
B(A): Tambor dentro de
16
CMB(A)/CME
planta
Error
60
Total
79
3.
Después de realizar un cruzamiento de varias líneas de maíz, se desea evaluar la variabilidad genética
generada por estos cruzamientos. Para ello se seleccionan al azar 10 líneas (de las 250 disponibles) y se
siembran de acuerdo a un diseño en bloques completos al azar con 4 repeticiones.
a. Factor A: Línea de maíz con 10 niveles
b. DBCA con modelo de efecto aleatorio y 4 repeticiones
c. Línea: Aleatorio
d.
F.V.
gl
F
A: Línea maíz
9
CMA/CME
B: Bloque
3
CMB/CME
Error
27
Total
39
4.
Se desea comparar la calidad de naranjas de tres variedades cosechadas en tres épocas diferentes (20 de
diciembre, 20 de enero y 20 de febrero) en una estación experimental. Para ello se analizan 10 naranjas de
cada variedad tomadas aleatoriamente en cada una de las fechas y se determina la concentración de azúcar
en cada una.
a. Factor A: Variedad naranja con 3 niveles
Factor B: Época con 3 niveles
AGRO 6600 – CLAVE – LAB 9
Page 8
[Type text]
b. DCA con arreglo factorial 3x3 y 10 repeticiones
c. Variedad naranja: Fijo y Época: Fijo
d.
F.V.
gl
A: Variedad naranja
2
B: Época
2
A*B: Variedad *Época
4
Error
81
Total
89
5.
F
CMA/CME
CMB/CME
CMA*B/CME
Se estudió el consumo de oxígeno de dos especies de ostras bajo distintos niveles de concentración de agua
de mar (50%, 75% y 100%). Para ello se usaron 24 piletas, que se llenaron con agua destilada y de mar en la
concentración respectiva (8 con 50% de agua de mar, 8 con 75%, y 8 con 100%; seleccionadas
aleatoriamente). Se colocaron ostras de la especie A en 12 piletas (cuatro con cada concentración, elegidas
aleatoriamente), y ostras de la especie B en las otras 12 piletas. Se registró el consumo (l O2 / mg de peso
corporal seco / min) a 22C.
a. Factor A: Especie ostras con 2 niveles
Factor B: Concentración agua mar con 3 niveles
b. DCA con arreglo factorial 2x3 y 4 repeticiones
c. Especie ostras: Fijo y Concentración agua mar: Fijo
d.
F.V.
gl
A: Especie ostra
1
B: Concentración agua mar
2
A*B: Especie *Concentración
2
Error
18
Total
23
F
CMA/CME
CMB/CME
CMA*B/CME
6.
En el mes de enero, cinco muestras de suelo se toman aleatoriamente en cada una de 6 localidades (también
escogidas aleatoriamente) dentro de un área contaminada que está siendo limpiada. Las mismas 6
localidades se muestrean nuevamente (5 muestras aleatorias en cada una) durante el mes de junio. Las
muestras se analizan para determinar la concentración de derivados de insecticidas clorados.
a. Factor A: Época con 2 niveles
Factor B: Localidad con 6 niveles
b. DCA con arreglo factorial 2x6 y 5 repeticiones
c. Época: Fijo y Localidad: Aleatorio
d.
F.V.
gl
F
A: Época
1
CMA/CMA*B
B: Localidad
5
CMB/CME
A*B: Época*Localidad
5
CMA*B/CME
Error
48
Total
59
7.
Se compara la producción diaria de leche bajo 12 dietas diferentes. Las 12 dietas son todas las
combinaciones de 3 niveles de vitamina A (0, 10 y 20 mg/kg), 2 fuentes proteicas (harina de pescado y
AGRO 6600 – CLAVE – LAB 9
Page 9
[Type text]
harina de soya), con y sin suplementación mineral. Cuatro vacas se asignaron aleatoriamente a cada una de
las dietas.
a. Factor A: Vitamina A con 3 niveles
Factor B: Fuente proteica con 2 niveles
Factor C: Suplemento mineral con 2 niveles
b. DCA con arreglo factorial 3x2x2 y 4 repeticiones
c. Vitamina A: Fijo, Fuente proteica: Fijo, Suplemento mineral: Fijo
d.
F.V.
gl
F
A: Vitamina A
2
CMA/CME
B: Fuente proteica
1
CMB/CME
C: Suplemento mineral
1
CMC/CME
A*B: Vitamina*Proteína
2
CMA*B/CME
A*C: Vitamina* Suplemento
2
CMA*C/CME
B*C: Proteína*Suplemento
1
CMB*C/CME
A*B*C:
2
CMA*B*C/CME
Vitamina*Proteína*Suplemento
Error
36
Total
47
8.
Se desea comparar el peso de conejos entrampados en distintas semanas en varios bosques de un área de
interés. Para ello se eligen al azar cuatro bosques en el área. En cada bosque se colocan aleatoriamente 10
trampas (cada trampa tiene lugar para exactamente un conejo). Luego de una semana se retiran los conejos
entrampados y se registra su peso. Las 10 trampas vuelven a ubicarse aleatoriamente en el bosque, se espera
una semana y se registra el peso de los conejos entrampados. Este proceso se repite hasta tener cuatro
semanas de datos.
a. Factor A: semana con 4 niveles, Factor B: bosque con 4 niveles
b. DCA con modelo mixto y 10 repeticiones
c. Semana: Fijo, Bosque: aleatorio
d.
F.V.
gl
F
Semana
3
CMA/CMAB
Bosque
3
CMB/CME
Semana x Bosque
9
CMAB/CME
Error
144
Total
159
AGRO 6600 – CLAVE – LAB 9
Page 10