Capítulo 51 Exercícios extra
1. Usando o R e fixando a semente em 123, simule 1000 lançamentos de uma moeda com probabilidade de 0.5 de sair cara. Conte o número de caras em cada lançamento e plote um gráfico de barras dos resultados.
# Fixando a semente
set.seed(123)
# Dimensão da amostra
n <- 1000
# Probabilidade de sair cara
p <- 0.5
# Gerando amostra aleatória de dimensão n
amostra <- rbinom(n,1,p)
# Número de caras
sum(amostra)
# Tabela de frequências
freq_relativa <- table(amostra)/length(amostra)
# Gráfico de barras dos resultados
barplot(freq_relativa, col="lightblue")
2. Usando o R e fixando a semente em 123, gere uma amostra aleatória de 5000 observações de uma variável aleatória binomial com parâmetros \(n = 10\) e \(p = 0.3\). Calcule a média e a variância das observações geradas.
# Fixando a semente
set.seed(123)
# Dimensão da amostra
n <- 5000
# Amostra aleatória
amostra <- rbinom(n, 10, 0.3)
# Média
mean(amostra)
# Variância
var(amostra)
3. Usando o R e fixando a semente em 123, gere uma amostra aleatória de 2300 observações de uma variável aleatória de Poisson com parâmetro \(\lambda = 4\). Calcule a média e o desvio padrão das observações geradas.
# Fixando a semente
set.seed(123)
# Dimensão da amostra
n <- 2300
# Gerando amostra aleatória
amostra <- rpois(n,4)
# Média
mean(amostra)
# Desvio padrão
sd(amostra)
4. Em um processo de qualidade, considere uma variável aleatória \(X\) que representa o número de produtos defeituosos em um lote de 50 produtos, onde a probabilidade de um produto ser defeituoso é 0.1. Usando o R e fixando a semente em 123 gere uma amostra aleatória de 10000 observações de \(X\). Conte a frequência de lotes com exatamente 5 produtos defeituosos. Calcule a proporção de lotes com exatamente 5 produtos defeituosos e compare o valor obtido com a probabilidade \(P(X=5)\), onde \(X \sim \text{Binomial}(50, 0.1)\).
# Fixando a semente
set.seed(123)
# Dimensão da amostra
n <- 10000
# Amostra aleatória
amostra <- rbinom(n, 50, 0.1)
# Contando a frequência de lotes com 5 produtos defeituosos
freq_abs <- sum(amostra == 5)
freq_rela <- freq_abs/length(amostra)
# ou
mean(amostra == 5)
# Probabilidade teórica
prob_teorica <- dbinom(5, 50, 0.1)
# Comparação
data.frame(empirica = freq_rela, teorica = prob_teorica)
5. Usando o R e fixando a semente em 123, gere uma amostra aleatória de 5000 observações de uma variável aleatória \(X\) binomial com parâmetros \(n = 20\) e \(p = 0.7\).
Faça um histograma de frequência relativa associado aos valores amostrais. Sobreponha no gráfico a distribuição de probabilidade de \(X\).
Use a função de distribuição empírica para estimar \(P(X\leq 10)\) e compare com o valor teórico.
# Fixando a semente
set.seed(123)
# Dimensão da amostra
n <- 5000
# Amostra aleatória
amostra <- rbinom(n, 20, 0.7)
# Histograma
hist(amostra, freq = FALSE, col="lightblue")
# Função de probabilidade de X
lines(x=0:20,y=dbinom(0:20,20,0.7), col="magenta", type="p")
# Função de Distribuição Empírica
Fn <- ecdf(amostra)
# Probabilidade estimada
prob_estimada <- Fn(10)
# Probabilidade teórica P(X <= 10)
prob_teorica <- pbinom(10, 20, 0.7)
# Comparação
data.frame(empirica = prob_estimada, teorica = prob_teorica)
6. Usando o R e fixando a semente em 543, gere uma amostra aleatória de 2400 observações de uma variável aleatória \(Y\) de Poisson com parâmetro \(\lambda = 6\).
Faça um histograma de frequência relativa associado aos valores amostrais. Sobreponha no gráfico a distribuição de probabilidade de \(X\).
Use a função de distribuição empírica para estimar \(P(Y > 5)\) e compare com o valor teórico.
# Fixando a semente
set.seed(543)
# Dimensão da amostra
n <- 2400
# Amostra aleatória
amostra <- rpois(n,6)
# Histograma
hist(amostra, freq = FALSE, col = "lightblue")
# Função de probabilidade de Y
lines(x=0:15, y=dpois(0:15,6), col="magenta", type = "p")
# Função de Distribuição Empírica
Fn <- ecdf(amostra)
# Probabilidade Estimada (Y>5)
prob_estimada <- 1-Fn(5)
# Probabilidade Teórica
prob_teorica <- ppois(5,6,lower.tail = FALSE)
# Comparação
data.frame(empirica = prob_estimada, teorica = prob_teorica)
7. Usando o R e fixando a semente em 345, gere uma amostra aleatória de 3450 observações de uma variável aleatória \(Z\) uniforme no intervalo \([0, 1]\). Use a função de distribuição empírica para estimar \(P(Z \leq 0.5)\) e compare com o valor teórico.
# Fixando a semente
set.seed(345)
# Dimensão da amostra
n <- 3450
# Amostra aleatória
amostra <- runif(n,0,1)
hist(amostra, freq=FALSE, col="lightblue")
curve(dunif(x,0,1), col="red", add=TRUE)
# Função de Distribuição Empírica
Fn <- ecdf(amostra)
# Probabilidade Estimada P(Z <= 0.5)
prob_estimada <- Fn(0.5)
# Probabilidade Teórica
prob_teorica <- punif(0.5,0,1)
# Comparação
data.frame(empirica = prob_estimada, teorica = prob_teorica)
8. Usando o R e fixando a semente em 123, gere uma amostra aleatória de 3467 observações de uma variável aleatória \(W\) normal com média \(\mu = 0\) e desvio padrão \(\sigma = 1\).
Faça um histograma de frequência relativa associado aos valores amostrais. Sobreponha no gráfico a distribuição de \(X\).
Use a função de distribuição empírica para estimar \(P(W > 1)\) e compare com o valor teórico.
9. Usando o R e fixando a semente em 123, gere uma amostra aleatória de 1234 observações de uma variável aleatória \(V\) exponencial com parâmetro \(\lambda = 0.5\).
Faça um histograma de frequência relativa associado aos valores amostrais. Sobreponha no gráfico a distribuição de probabilidade de \(X\).
Use a função de distribuição empírica para estimar \(P(V > 2)\) e compare com o valor teórico.
10. O número de acertos num alvo em 30 tentativas onde a probabilidade de acerto é 0.4, é modelado por uma variável aleatória \(X\) com distruibuição Binomial de parâmetros \(n=30\) e \(p=0.4\). Usando o R e fixando a semente em 123, gere uma amostra de dimensão \(n=700\) dessa variável. Para essa amostra:
Faça um histograma de frequência relativa associado aos valores amostrais. Sobreponha no gráfico a distribuição de probabilidade de \(X\).
Calcule a função de distribuição empírica e com base nessa função estime a probabilidade do número de acertos no alvo, em 30 tentativas, ser maior que 15. Calcule ainda o valor teórico dessa probabilidade.
11. Usando o R e fixando a semente em 123, gere amostras de tamanho crescente \(n = 100, 1000, 10000, 100000\) de uma variável aleatória \(X\) com distribuição de Poisson com parâmetro \(\lambda = 3\). Para cada tamanho de amostra, calcule a média amostral e compare-a com o valor esperado teórico. Observe e comente a convergência das médias amostrais.
# Fixando a semente
set.seed(123)
# Dimensão das amostras
tamanhos <- c(100, 1000, 10000, 100000)
# Parâmetro da Poisson
lambda <- 3
# Média teórica
media <- 3
media_amostra <- as.numeric(length(tamanhos))
# Gerando media das amostras
for (i in 1:length(tamanhos)){
media_amostra[i] <- mean(rpois(tamanhos[i],lambda = lambda))
}
# Comparação
print(data.frame(Tamanho_amostra = tamanhos,
Media_amostra = media_amostra,
Media_teorica = media))
12. Usando o R e fixando a semente em 123, gere amostras de tamanho crescente \(n = 100, 1000, 10000, 100000\) de uma variável aleatória \(W\) com distribuição uniforme no intervalo \([0, 1]\). Para cada tamanho de amostra, calcule a média amostral e compare-a com o valor esperado teórico. Observe e comente a convergência das médias amostrais.
13. Um grupo de estudantes de Estatística está realizando uma pesquisa para avaliar o grau de satisfação dos alunos com um novo curso oferecido pela universidade. Cada estudante responde a uma pergunta onde pode indicar se está satisfeito ou insatisfeito com o curso. A probabilidade de um estudante estar satisfeito é de \(0.75\).
- Usando o R e fixando a semente em 42, simule amostras de tamanho crescente \(n = 100, 500, 1000, 5000, 10000\) de uma variável aleatória \(X\) com distribuição binomial, onde \(X\) representa o número de estudantes satisfeitos. Para cada tamanho de amostra, calcule a proporção de estudantes satisfeitos e compare-a com a probabilidade teórica de satisfação (0.75).
14. Usando o R e fixando a semente em 1058, gere 9060 amostras de dimensão 9 de uma população, \(X\sim \text{Binomial}(41,0.81)\). Calcule a média de cada uma dessas amostras, obtendo uma amostra de médias. Calcule ainda o valor esperado da distribuição teórica de \(X\) e compare com a média da amostra de médias.
# Fixando a semente
set.seed(1058)
# Número de amostras
m <- 9060
# Dimensão de cada amostra
n <- 9
# Gerando amostra aleatória de X
amostra <- matrix(data = rbinom(m*n, 41, 0.81), nrow = m, ncol = 9)
# Calculando a média de cada amostra
media_amostra <- apply(amostra,1,mean)
# ou
media_amostra2 <- rowMeans(amostra)
# Média da amostra de médias
media <- mean(media_amostra)
# Média teórica
media_teorica <- 41*0.81
# Comparação
data.frame(empirica = media, teorica = media_teorica)
15. Em um hospital, o tempo de atendimento de pacientes segue uma distribuição exponencial com média de 30 minutos. Um pesquisador deseja estimar o tempo médio de atendimento coletando amostras de diferentes tamanhos.
- Usando o R e fixando a semente em 456, simule 1000 amostras de tamanho 50, 100 e 1000 do tempo de atendimento. Para cada tamanho de amostra, calcule a média de cada amostra e plote o histograma das médias amostrais para cada tamanho. Compare essas distribuições com a distribuição normal com média \(E(X)\) e desvio padrão \(\sqrt{V(X)/n}\) e comente sobre a aplicação do Teorema do Limite Central.
16. O tempo de espera (em minutos) para o atendimento no setor de informações de um banco é modelado por uma variável aleatória \(X\) com distribuição (\(a=5, b=20\)). Usando o R e fixando a semente em 1430, gere 8000 amostras de dimensão \(n=100\) dessa variável. Para essas amostras:
Calcule a soma de cada uma das amostras obtendo assim valores da distribuição da soma \(S_{n} = \sum_{i=1}^{n}X_{n}\).
Faça um histograma de frequência relativa associado aos valores obtidos da distribuição da soma e sobreponha no gráfico uma curva com distribuição normal de valor esperado \(nE(X)\) e desvio padrão \(\sqrt{V(X)n}\).
Calcule a média de cada uma das amostras obtendo assim valores da distribuição da média \(\bar{X_{n}}\).
Faça um histograma de frequência relativa associado aos valores obtidos da distribuição da média \(\bar{X_{n}}\). Sobreponha no gráfico uma curva com distribuição normal com valor esperado \(E(X)\) e desvio padrão \(\sqrt{V(x)/n}\).
# Fixando a semente
set.seed(1430)
# Número de amostras aleatórias
m <- 8000
# Dimensão de cada amostra aleatória
n <- 100
# Parâmetros uniforme
a <- 5
b <- 20
# Média teórica
media <- (a+b)/2
# Variância teórica
variancia <- ((b-a)^2)/12
# Amostra aleatória
amostras <- matrix(data = runif(m*n,a,b), nrow = m, ncol = n)
# Calculando a soma de cada amostra
soma_amostras <- apply(amostras, 1, sum)
# ou
soma_amostras2 <- rowSums(amostras)
# Histograma de frequência relativa da Soma + curva normal
hist(soma_amostras, freq=FALSE, col="lightblue")
curve(dnorm(x,n*media,sqrt(variancia*n)), col="red", add=TRUE, lwd=2)
# Calculando a média de cada amostra
media_amostras <- apply(amostras, 1, mean)
# ou
media_amostras2 <- rowMeans(amostras)
# Histograma e curva normal
hist(media_amostras, freq=FALSE, col="lightblue")
curve(dnorm(x,media,sqrt(variancia/n)), col="red", add=TRUE, lwd=2)
17. O tempo de atendimento (em minutos), de doentes graves num determinado hospital, é modelado por uma variável aleatória \(X\) com distribuição Exponencial(\(\lambda=0.21\)). Usando o R e fixando a semente em 1580, gere 1234 amostras de dimensão \(n=50\) dessa variável. Para essas amostras:
Calcule a soma de cada uma das amostras obtendo assim valores da distribuição da soma \(S_{n} = \sum_{i=1}^{n}X_{n}\).
Faça um histograma de frequência relativa associado aos valores obtidos da distribuição da soma e sobreponha no gráfico uma curva com distribuição normal de valor esperado \(nE(X)\) e desvio padrão \(\sqrt{V(X)n}\).
Calcule agora a soma padronizada \[\frac{S_{n}-E(S_{n})}{\sqrt{V(S_{n})}}\] e faça um histograma de frequência relativa associado aos valores obtidos da distribuição da soma padronizada. Sobreponha no gráfico uma curva com distribuição normal de valor esperado 0 e desvio padrão 1.
Calcule a média de cada uma das amostras obtendo assim valores da distribuição da média \(\bar{X_{n}}\).
Faça um histograma de frequência relativa associado aos valores obtidos da distribuição da média \(\bar{X_{n}}\). Sobreponha no gráfico uma curva com distribuição normal com valor esperado \(E(X)\) e desvio padrão \(\sqrt{V(x)/n}\).
18. A altura (em centímetros) dos alunos de uma escola é modelada por uma variável aleatória X com distribuição (\(\mu=170, \sigma=10\)). Usando o R e fixando a semente em 678, gere 9876 amostras de dimensão \(n=80\) dessa variável. Para essas amostras:
Calcule a soma de cada uma das amostras obtendo assim valores da distribuição da soma \(S_{n} = \sum_{i=1}^{n}X_{n}\).
Faça um histograma de frequência relativa associado aos valores obtidos da distribuição da soma e sobreponha no gráfico uma curva com distribuição normal de valor esperado \(nE(X)\) e desvio padrão \(\sqrt{V(X)n}\).
Calcule agora a soma padronizada \[\frac{S_{n}-E(S_{n})}{\sqrt{V(S_{n})}}\] e faça um histograma de frequência relativa associado aos valores obtidos da distribuição da soma padronizada. Sobreponha no gráfico uma curva com distribuição normal de valor esperado 0 e desvio padrão 1.
Calcule a média de cada uma das amostras obtendo assim valores da distribuição da média \(\bar{X_{n}}\).
Faça um histograma de frequência relativa associado aos valores obtidos da distribuição da média \(\bar{X_{n}}\). Sobreponha no gráfico uma curva com distribuição normal com valor esperado \(E(X)\) e desvio padrão \(\sqrt{V(x)/n}\).
Faça um histograma de frequência relativa associado aos valores obtidos da distribuição da média padronizada \[\frac{\bar{X}_{n}-E(\bar{X_{n}})}{\sqrt{V(\bar{X_{n}})}}\] e sobreponha no gráfico com uma curva com distribuição Normal com valor esperado 0 e desvio padrão 1.
19. A chegada de clientes em uma loja durante 1 hora, assumindo uma taxa média de 20 clientes por hora pode ser modelada por uma variável aleatória \(X\) com distribuição de Poisson(\(\lambda=20\)). Usando o R e fixando a semente em 1222, gere 8050 amostras de dimensão 30 de \(X\).
Calcule a soma de cada uma das amostras obtendo assim valores da distribuição da soma \(S_{n} = \sum_{i=1}^{n}X_{n}\).
Faça um histograma de frequência relativa associado aos valores obtidos da distribuição da soma e sobreponha no gráfico uma curva com distribuição normal de valor esperado \(nE(X)\) e desvio padrão \(\sqrt{V(X)n}\).
Calcule agora a soma padronizada \[\frac{S_{n}-E(S_{n})}{\sqrt{V(S_{n})}}\] e faça um histograma de frequência relativa associado aos valores obtidos da distribuição da soma padronizada. Sobreponha no gráfico uma curva com distribuição normal de valor esperado 0 e desvio padrão 1.
Calcule a média de cada uma das amostras obtendo assim valores da distribuição da média \(\bar{X_{n}}\).
Faça um histograma de frequência relativa associado aos valores obtidos da distribuição da média \(\bar{X_{n}}\). Sobreponha no gráfico uma curva com distribuição normal com valor esperado \(E(X)\) e desvio padrão \(\sqrt{V(x)/n}\).
Faça um histograma de frequência relativa associado aos valores obtidos da distribuição da média padronizada \[\frac{\bar{X}_{n}-E(\bar{X_{n}})}{\sqrt{V(\bar{X_{n}})}}\] e sobreponha no gráfico com uma curva com distribuição Normal com valor esperado 0 e desvio padrão 1.