Capítulo 22 Exercícios extra

1. Usando o R e fixando a semente em 123, simule 1000 lançamentos de uma moeda com probabilidade de 0.5 de sair cara. Conte o número de caras em cada lançamento e plote um gráfico de barras dos resultados.

# Fixando a semente
set.seed(123)

# Dimensão da amostra
n <- 1000

# Probabilidade de sair cara
p <- 0.5

# Gerando amostra aleatória de dimensão n
amostra <- rbinom(n,1,p)

# Número de caras
sum(amostra)

# Tabela de frequências
freq_relativa <- table(amostra)/length(amostra)

# Gráfico de barras dos resultados
barplot(freq_relativa, col="lightblue")

2. Usando o R e fixando a semente em 123, gere uma amostra aleatória de 5000 observações de uma variável aleatória binomial com parâmetros \(n = 10\) e \(p = 0.3\). Calcule a média e a variância das observações geradas.

# Fixando a semente
set.seed(123)

# Dimensão da amostra
n <- 5000

# Amostra aleatória
amostra <- rbinom(n, 10, 0.3)

# Média
mean(amostra)

# Variância
var(amostra)

3. Usando o R e fixando a semente em 123, gere uma amostra aleatória de 2300 observações de uma variável aleatória de Poisson com parâmetro \(\lambda = 4\). Calcule a média e o desvio padrão das observações geradas.

# Fixando a semente
set.seed(123)

# Dimensão da amostra
n <- 2300

# Gerando amostra aleatória
amostra <- rpois(n,4)

# Média
mean(amostra)

# Desvio padrão
sd(amostra)

4. Em um processo de qualidade, considere uma variável aleatória \(X\) que representa o número de produtos defeituosos em um lote de 50 produtos, onde a probabilidade de um produto ser defeituoso é 0.1. Usando o R e fixando a semente em 123 gere uma amostra aleatória de 10000 observações de \(X\). Conte a frequência de lotes com exatamente 5 produtos defeituosos. Calcule a proporção de lotes com exatamente 5 produtos defeituosos e compare o valor obtido com a probabilidade \(P(X=5)\), onde \(X \sim \text{Binomial}(50, 0.1)\).

# Fixando a semente
set.seed(123)

# Dimensão da amostra
n <- 10000

# Amostra aleatória
amostra <- rbinom(n, 50, 0.1)

# Contando a frequência de lotes com 5 produtos defeituosos
freq_abs <- sum(amostra == 5)
freq_rela <- freq_abs/length(amostra)
# ou
mean(amostra == 5)

# Probabilidade teórica
prob_teorica <- dbinom(5, 50, 0.1)

# Comparação
data.frame(empirica = freq_rela, teorica = prob_teorica)

5. Usando o R e fixando a semente em 123, gere uma amostra aleatória de 5000 observações de uma variável aleatória \(X\) binomial com parâmetros \(n = 20\) e \(p = 0.7\).

  1. Faça um histograma de frequência relativa associado aos valores amostrais. Sobreponha no gráfico a distribuição de probabilidade de \(X\).

  2. Use a função de distribuição empírica para estimar \(P(X\leq 10)\) e compare com o valor teórico.

# Fixando a semente
set.seed(123)

# Dimensão da amostra
n <- 5000

# Amostra aleatória
amostra <- rbinom(n, 20, 0.7)

# Histograma
hist(amostra, freq = FALSE, col="lightblue")

# Função de probabilidade de X
lines(x=0:20,y=dbinom(0:20,20,0.7), col="magenta", type="p")

# Função de Distribuição Empírica
Fn <- ecdf(amostra)

# Probabilidade estimada
prob_estimada <- Fn(10)

# Probabilidade teórica P(X <= 10)
prob_teorica <- pbinom(10, 20, 0.7)

# Comparação
data.frame(empirica = prob_estimada, teorica = prob_teorica)

6. Usando o R e fixando a semente em 543, gere uma amostra aleatória de 2400 observações de uma variável aleatória \(Y\) de Poisson com parâmetro \(\lambda = 6\).

  1. Faça um histograma de frequência relativa associado aos valores amostrais. Sobreponha no gráfico a distribuição de probabilidade de \(X\).

  2. Use a função de distribuição empírica para estimar \(P(Y > 5)\) e compare com o valor teórico.

# Fixando a semente
set.seed(543)

# Dimensão da amostra
n <- 2400

# Amostra aleatória
amostra <- rpois(n,6)

# Histograma
hist(amostra, freq = FALSE, col = "lightblue")

# Função de probabilidade de Y
lines(x=0:15, y=dpois(0:15,6), col="magenta", type = "p")

# Função de Distribuição Empírica
Fn <- ecdf(amostra)

# Probabilidade Estimada (Y>5)
prob_estimada <- 1-Fn(5)

# Probabilidade Teórica
prob_teorica <- ppois(5,6,lower.tail = FALSE)

# Comparação
data.frame(empirica = prob_estimada, teorica = prob_teorica)

7. Usando o R e fixando a semente em 345, gere uma amostra aleatória de 3450 observações de uma variável aleatória \(Z\) uniforme no intervalo \([0, 1]\). Use a função de distribuição empírica para estimar \(P(Z \leq 0.5)\) e compare com o valor teórico.

# Fixando a semente
set.seed(345)

# Dimensão da amostra
n <- 3450

# Amostra aleatória
amostra <- runif(n,0,1)

hist(amostra, freq=FALSE, col="lightblue")
curve(dunif(x,0,1), col="red", add=TRUE)

# Função de Distribuição Empírica
Fn <- ecdf(amostra)

# Probabilidade Estimada P(Z <= 0.5)
prob_estimada <- Fn(0.5)

# Probabilidade Teórica
prob_teorica <- punif(0.5,0,1)

# Comparação
data.frame(empirica = prob_estimada, teorica = prob_teorica)

8. Usando o R e fixando a semente em 123, gere uma amostra aleatória de 3467 observações de uma variável aleatória \(W\) normal com média \(\mu = 0\) e desvio padrão \(\sigma = 1\).

  1. Faça um histograma de frequência relativa associado aos valores amostrais. Sobreponha no gráfico a distribuição de \(X\).

  2. Use a função de distribuição empírica para estimar \(P(W > 1)\) e compare com o valor teórico.

9. Usando o R e fixando a semente em 123, gere uma amostra aleatória de 1234 observações de uma variável aleatória \(V\) exponencial com parâmetro \(\lambda = 0.5\).

  1. Faça um histograma de frequência relativa associado aos valores amostrais. Sobreponha no gráfico a distribuição de probabilidade de \(X\).

  2. Use a função de distribuição empírica para estimar \(P(V > 2)\) e compare com o valor teórico.

10. O número de acertos num alvo em 30 tentativas onde a probabilidade de acerto é 0.4, é modelado por uma variável aleatória \(X\) com distruibuição Binomial de parâmetros \(n=30\) e \(p=0.4\). Usando o R e fixando a semente em 123, gere uma amostra de dimensão \(n=700\) dessa variável. Para essa amostra:

  1. Faça um histograma de frequência relativa associado aos valores amostrais. Sobreponha no gráfico a distribuição de probabilidade de \(X\).

  2. Calcule a função de distribuição empírica e com base nessa função estime a probabilidade do número de acertos no alvo, em 30 tentativas, ser maior que 15. Calcule ainda o valor teórico dessa probabilidade.

11. Usando o R e fixando a semente em 123, gere amostras de tamanho crescente \(n = 100, 1000, 10000, 100000\) de uma variável aleatória \(X\) com distribuição de Poisson com parâmetro \(\lambda = 3\). Para cada tamanho de amostra, calcule a média amostral e compare-a com o valor esperado teórico. Observe e comente a convergência das médias amostrais.

# Fixando a semente
set.seed(123)

# Dimensão das amostras
tamanhos <- c(100, 1000, 10000, 100000)

# Parâmetro da Poisson
lambda <- 3

# Média teórica
media <- 3

media_amostra <- as.numeric(length(tamanhos))

# Gerando media das amostras
for (i in 1:length(tamanhos)){
  media_amostra[i] <- mean(rpois(tamanhos[i],lambda = lambda))
}

# Comparação
print(data.frame(Tamanho_amostra = tamanhos, 
                 Media_amostra = media_amostra,
                 Media_teorica = media))

12. Usando o R e fixando a semente em 123, gere amostras de tamanho crescente \(n = 100, 1000, 10000, 100000\) de uma variável aleatória \(W\) com distribuição uniforme no intervalo \([0, 1]\). Para cada tamanho de amostra, calcule a média amostral e compare-a com o valor esperado teórico. Observe e comente a convergência das médias amostrais.

13. Um grupo de estudantes de Estatística está realizando uma pesquisa para avaliar o grau de satisfação dos alunos com um novo curso oferecido pela universidade. Cada estudante responde a uma pergunta onde pode indicar se está satisfeito ou insatisfeito com o curso. A probabilidade de um estudante estar satisfeito é de \(0.75\).

  • Usando o R e fixando a semente em 42, simule amostras de tamanho crescente \(n = 100, 500, 1000, 5000, 10000\) de uma variável aleatória \(X\) com distribuição binomial, onde \(X\) representa o número de estudantes satisfeitos. Para cada tamanho de amostra, calcule a proporção de estudantes satisfeitos e compare-a com a probabilidade teórica de satisfação (0.75).

14. Usando o R e fixando a semente em 1058, gere 9060 amostras de dimensão 9 de uma população, \(X\sim \text{Binomial}(41,0.81)\). Calcule a média de cada uma dessas amostras, obtendo uma amostra de médias. Calcule ainda o valor esperado da distribuição teórica de \(X\) e compare com a média da amostra de médias.

# Fixando a semente
set.seed(1058)

# Número de amostras
m <- 9060

# Dimensão de cada amostra
n <- 9

# Gerando amostra aleatória de X
amostra <- matrix(data = rbinom(m*n, 41, 0.81), nrow = m, ncol = 9)

# Calculando a média de cada amostra
media_amostra <- apply(amostra,1,mean)
# ou
media_amostra2 <- rowMeans(amostra)

# Média da amostra de médias
media <- mean(media_amostra)

# Média teórica
media_teorica <- 41*0.81

# Comparação
data.frame(empirica = media, teorica = media_teorica)

15. Em um hospital, o tempo de atendimento de pacientes segue uma distribuição exponencial com média de 30 minutos. Um pesquisador deseja estimar o tempo médio de atendimento coletando amostras de diferentes tamanhos.

  • Usando o R e fixando a semente em 456, simule 1000 amostras de tamanho 50, 100 e 1000 do tempo de atendimento. Para cada tamanho de amostra, calcule a média de cada amostra e plote o histograma das médias amostrais para cada tamanho. Compare essas distribuições com a distribuição normal com média \(E(X)\) e desvio padrão \(\sqrt{V(X)/n}\) e comente sobre a aplicação do Teorema do Limite Central.

16. O tempo de espera (em minutos) para o atendimento no setor de informações de um banco é modelado por uma variável aleatória \(X\) com distribuição (\(a=5, b=20\)). Usando o R e fixando a semente em 1430, gere 8000 amostras de dimensão \(n=100\) dessa variável. Para essas amostras:

  1. Calcule a soma de cada uma das amostras obtendo assim valores da distribuição da soma \(S_{n} = \sum_{i=1}^{n}X_{n}\).

  2. Faça um histograma de frequência relativa associado aos valores obtidos da distribuição da soma e sobreponha no gráfico uma curva com distribuição normal de valor esperado \(nE(X)\) e desvio padrão \(\sqrt{V(X)n}\).

  3. Calcule a média de cada uma das amostras obtendo assim valores da distribuição da média \(\bar{X_{n}}\).

  4. Faça um histograma de frequência relativa associado aos valores obtidos da distribuição da média \(\bar{X_{n}}\). Sobreponha no gráfico uma curva com distribuição normal com valor esperado \(E(X)\) e desvio padrão \(\sqrt{V(x)/n}\).

# Fixando a semente
set.seed(1430)

# Número de amostras aleatórias
m <- 8000

# Dimensão de cada amostra aleatória
n <- 100

# Parâmetros uniforme
a <- 5
b <- 20

# Média teórica
media <- (a+b)/2

# Variância teórica
variancia <- ((b-a)^2)/12

# Amostra aleatória
amostras <- matrix(data = runif(m*n,a,b), nrow = m, ncol = n)

# Calculando a soma de cada amostra
soma_amostras <- apply(amostras, 1, sum)
# ou
soma_amostras2 <- rowSums(amostras)

# Histograma de frequência relativa da Soma + curva normal
hist(soma_amostras, freq=FALSE, col="lightblue")
curve(dnorm(x,n*media,sqrt(variancia*n)), col="red", add=TRUE, lwd=2)

# Calculando a média de cada amostra
media_amostras <- apply(amostras, 1, mean)
# ou
media_amostras2 <- rowMeans(amostras)

# Histograma e curva normal
hist(media_amostras, freq=FALSE, col="lightblue")
curve(dnorm(x,media,sqrt(variancia/n)), col="red", add=TRUE, lwd=2)

17. O tempo de atendimento (em minutos), de doentes graves num determinado hospital, é modelado por uma variável aleatória \(X\) com distribuição Exponencial(\(\lambda=0.21\)). Usando o R e fixando a semente em 1580, gere 1234 amostras de dimensão \(n=50\) dessa variável. Para essas amostras:

  1. Calcule a soma de cada uma das amostras obtendo assim valores da distribuição da soma \(S_{n} = \sum_{i=1}^{n}X_{n}\).

  2. Faça um histograma de frequência relativa associado aos valores obtidos da distribuição da soma e sobreponha no gráfico uma curva com distribuição normal de valor esperado \(nE(X)\) e desvio padrão \(\sqrt{V(X)n}\).

  3. Calcule agora a soma padronizada \[\frac{S_{n}-E(S_{n})}{\sqrt{V(S_{n})}}\] e faça um histograma de frequência relativa associado aos valores obtidos da distribuição da soma padronizada. Sobreponha no gráfico uma curva com distribuição normal de valor esperado 0 e desvio padrão 1.

  4. Calcule a média de cada uma das amostras obtendo assim valores da distribuição da média \(\bar{X_{n}}\).

  5. Faça um histograma de frequência relativa associado aos valores obtidos da distribuição da média \(\bar{X_{n}}\). Sobreponha no gráfico uma curva com distribuição normal com valor esperado \(E(X)\) e desvio padrão \(\sqrt{V(x)/n}\).

18. A altura (em centímetros) dos alunos de uma escola é modelada por uma variável aleatória X com distribuição (\(\mu=170, \sigma=10\)). Usando o R e fixando a semente em 678, gere 9876 amostras de dimensão \(n=80\) dessa variável. Para essas amostras:

  1. Calcule a soma de cada uma das amostras obtendo assim valores da distribuição da soma \(S_{n} = \sum_{i=1}^{n}X_{n}\).

  2. Faça um histograma de frequência relativa associado aos valores obtidos da distribuição da soma e sobreponha no gráfico uma curva com distribuição normal de valor esperado \(nE(X)\) e desvio padrão \(\sqrt{V(X)n}\).

  3. Calcule agora a soma padronizada \[\frac{S_{n}-E(S_{n})}{\sqrt{V(S_{n})}}\] e faça um histograma de frequência relativa associado aos valores obtidos da distribuição da soma padronizada. Sobreponha no gráfico uma curva com distribuição normal de valor esperado 0 e desvio padrão 1.

  4. Calcule a média de cada uma das amostras obtendo assim valores da distribuição da média \(\bar{X_{n}}\).

  5. Faça um histograma de frequência relativa associado aos valores obtidos da distribuição da média \(\bar{X_{n}}\). Sobreponha no gráfico uma curva com distribuição normal com valor esperado \(E(X)\) e desvio padrão \(\sqrt{V(x)/n}\).

  6. Faça um histograma de frequência relativa associado aos valores obtidos da distribuição da média padronizada \[\frac{\bar{X}_{n}-E(\bar{X_{n}})}{\sqrt{V(\bar{X_{n}})}}\] e sobreponha no gráfico com uma curva com distribuição Normal com valor esperado 0 e desvio padrão 1.

19. A chegada de clientes em uma loja durante 1 hora, assumindo uma taxa média de 20 clientes por hora pode ser modelada por uma variável aleatória \(X\) com distribuição de Poisson(\(\lambda=20\)). Usando o R e fixando a semente em 1222, gere 8050 amostras de dimensão 30 de \(X\).

  1. Calcule a soma de cada uma das amostras obtendo assim valores da distribuição da soma \(S_{n} = \sum_{i=1}^{n}X_{n}\).

  2. Faça um histograma de frequência relativa associado aos valores obtidos da distribuição da soma e sobreponha no gráfico uma curva com distribuição normal de valor esperado \(nE(X)\) e desvio padrão \(\sqrt{V(X)n}\).

  3. Calcule agora a soma padronizada \[\frac{S_{n}-E(S_{n})}{\sqrt{V(S_{n})}}\] e faça um histograma de frequência relativa associado aos valores obtidos da distribuição da soma padronizada. Sobreponha no gráfico uma curva com distribuição normal de valor esperado 0 e desvio padrão 1.

  4. Calcule a média de cada uma das amostras obtendo assim valores da distribuição da média \(\bar{X_{n}}\).

  5. Faça um histograma de frequência relativa associado aos valores obtidos da distribuição da média \(\bar{X_{n}}\). Sobreponha no gráfico uma curva com distribuição normal com valor esperado \(E(X)\) e desvio padrão \(\sqrt{V(x)/n}\).

  6. Faça um histograma de frequência relativa associado aos valores obtidos da distribuição da média padronizada \[\frac{\bar{X}_{n}-E(\bar{X_{n}})}{\sqrt{V(\bar{X_{n}})}}\] e sobreponha no gráfico com uma curva com distribuição Normal com valor esperado 0 e desvio padrão 1.