Wednesday 10 July 2019

Testando odds ratios em stata forex


3. Logit Models em Stata Stata tem vários comandos que podem ser usados ​​para ajustar os modelos de regressão logística pela máxima verossimilhança. Os comandos básicos são logit para dados individuais e blogit para dados agrupados. Existe também um comando logístico que apresenta os resultados em termos de rácios ímpares em vez de probabilidades de log e pode produzir uma variedade de estatísticas de resumo e diagnóstico. Finalmente, pode-se ajustar um modelo de regressão logística como um caso especial de um modelo linear generalizado com Bernoulli ou erros binomiais e logit de ligação, usando o comando glm. Teremos ocasião de usar todos esses comandos, mas enfatizaremos os dois primeiros, usando o blogit para dados agrupados neste log e logit para dados individuais nos conjuntos de problemas. 3.3 A comparação de dois grupos Após as notas da aula, consideraremos a comparação de dois grupos e depois passaremos para mais de dois. Tabela 2 por 2 Considere os dados sobre o uso de anticoncepcionais pelo desejo de mais crianças na Tabela 3.2 (página 14 das notas). Podemos ler esses dados em Stata como 2 observações binomiais. Para tornar a vida mais fácil, vou inserir o desejo de mais filhos como uma variável dummy que leva o valor 1 para as mulheres que não querem mais filhos e 0 de outra forma Testando a Homegeneity, permitam-nos começar ajustando o modelo nulo. Com o blogit, você especifica o resultado em termos do número de sucessos e do denominador binomial, aqui usuários e n. A estimativa da constante é simplesmente o logit da proporção global usando a contracepção, digamos pyn. E o erro padrão é a raiz quadrada de 1y 1 (n-y). Você pode verificar estes resultados manualmente. Statas blogit não calcula o desvio do modelo, mas podemos obtê-lo manualmente, usando o previsão de obter contagens instaladas: então o desvio é 91,67 em uma d. f. Fornecendo ampla evidência de que o modelo nulo não corresponde aos dados. Assim, rejeitamos a hipótese de que a probabilidade de contracepção é a mesma nos dois grupos. Experimente um método similar para calcular Pearsons chi-squared, você deve obter 92.64. Alternativamente, você pode ajustar o modelo usando glm. Que relata o desvio e Pearsons chi-quadrado por padrão. Faço isso silenciosamente e apenas relate os resultados armazenados correspondentes, e (desvio) para o desvio e e (desviancep) para a estatística Pearsons. The Odds Ratio Deixe-nos agora ajustar o modelo com a necessidade de não mais crianças como predictor. Este modelo está saturado para este conjunto de dados, usando dois parâmetros para modelar duas probabilidades: a constante corresponde às probabilidades de registro de contracepção entre quem quer mais filhos e o coeficiente de nomore é a diferença nas probabilidades de log entre os dois Grupos. Exponenciando esse coeficiente, obtemos um odds ratio de cerca de três. Contrariamente à crença popular, isso não significa que as mulheres que não querem mais filhos são três vezes mais propensas a usar contracepção. Existem duas falhas nesta interpretação. Primeiro, e mais importante, é a probabilidade de usar contracepção entre as mulheres que não desejam mais crianças que são três vezes as mulheres que querem mais e não a probabilidade, o que normalmente é entendido pela probabilidade. A interpretação seria aproximadamente correta se o evento em estudo fosse raro, porque se p é pequeno, então 1-p é próximo a um e o odds ratio é aproximadamente o mesmo que o risco relativo. Aqui, as proporções observadas são 0,454 e 0,225, e a proporção é 2,01, de modo que as mulheres que não querem mais filhos são duas vezes mais propensas a usar a contracepção que aqueles que querem mais. Em segundo lugar, mesmo que a probabilidade fosse triplicada, isso tornaria as mulheres três vezes mais prováveis, ou duas vezes mais prováveis, usar a contracepção, e não três vezes mais provável. Neste caso, a probabilidade é dobrada e isso torna as mulheres duas vezes mais prováveis, e não duas vezes mais prováveis. Significado do teste A estatística z é conforme relatado na página 16 das notas. Deixe-nos quadrá-lo: Esta é a estatística de Walds chi-quadrado para a hipótese de que o coeficiente de nomore é zero ou, de forma equivalente, o odds-ratio é um, e pode ser calculado de forma mais simples usando o comando Statas test: A estatística chi2 relatada por Stata Na segunda linha de saída é a razão de verossimilhança chi-squared comparando o modelo atual com o modelo nulo. Você pode explicar por que obtemos 91.67, o que é o desvio do modelo nulo Dica: Qual é o desvio deste modelo Um terceiro teste do efeito de querer não mais é dado pela estatística QuiSons Chi-Quadrado, que calculamos anteriormente como 92.64. Isto é equivalente ao teste z padrão para comparar duas proporções se você usar a proporção agrupada para estimar o erro padrão. As três estatísticas são diferentes, mas são assintoticamente equivalentes. Em nosso exemplo, eles também são de valor próximo e levam à mesma rejeição esmagadora da hipótese de que a probabilidade de usar a contracepção é a mesma nos dois grupos. Intervalos de confiança A Stata é gentil o suficiente para nos dar um intervalo de confiança 95 para os coeficientes logit. Podemos converter o intervalo para o coeficiente de nomore em um IC 95 para o odds ratio, exponenciando os limites de confiança: uma maneira ainda mais fácil é digitar blogit ou. O comando blogit sem variáveis, como todos os comandos de estimativa, simplesmente recupera os resultados do último ajuste. A opção ou é curta para o dds-r atio e faz com que o Stata relate os coeficientes exponenciais. (Versões 12 e anteriores omitem a constante, mas Stata 13 expõe-se também). Assim, as probabilidades de usar contracepção entre as mulheres que querem mais filhos são 0,291 para uma, e para aqueles que não querem mais filhos são 2,85 vezes mais altos, ou 0,830 para um. O erro padrão do odds ratio é calculado pelo método delta, mas os limites de confiança são calculados exponenciando os limites na escala logit, não por adicionar e subtrair duas vezes o erro padrão para o odds ratio. Isso é feito porque a aproximação normal é mais precisa (e faz mais sentido) na escala logit, que não possui restrições de alcance. Exercício . Calcule o teste z convencional para comparar as proporções usando contracepção nos dois grupos e verifique se o quadrado coincide com a estatística de Pearsons chi-quadrado. Copie 2017 Germaacuten Rodriacuteguez, Universidade de PrincetonNOTICE: O grupo de consultoria estatística IDRE irá migrar o site para o WordPress CMS em fevereiro para facilitar a manutenção e criação de novos conteúdos. Algumas de nossas páginas antigas serão removidas ou arquivadas de modo que elas não serão mais mantidas. Vamos tentar manter os redirecionamentos para que os URLs antigos continuem a funcionar da melhor maneira possível. Bem-vindo ao Instituto de Pesquisa e Educação Digital Ajuda ao Grupo de Consultoria Estatística dando um presente Stata FAQ Como interpreto odds ratios na regressão logística Introdução Comece com a probabilidade. As probabilidades variam entre 0 e 1. Digamos que a probabilidade de sucesso é 0,8, portanto, p. 8. A probabilidade de falha é q 1 - p .2. As probabilidades são determinadas a partir de probabilidades e variam entre 0 e infinito. As probabilidades são definidas como a proporção da probabilidade de sucesso e a probabilidade de falha. As chances de sucesso são chances (sucesso) p (1-p) ou pq .8.2 4, ou seja, as chances de sucesso são de 4 para 1. As chances de falha seriam chances (falha) qp .2.8 .25. Isso parece um pouco estranho, mas é realmente dizer que as chances de falha são de 1 a 4. As chances de sucesso e as chances de falha são apenas reciprocais um do outro, ou seja, 14,25 e 1,25 4. Em seguida, vamos adicionar outro Variável para a equação para que possamos calcular um odds ratio. Outro exemplo Este exemplo é adaptado de Pedhazur (1997). Suponha que sete de cada 10 homens sejam admitidos em uma escola de engenharia, enquanto três das 10 mulheres são admitidas. As probabilidades de admissão de um homem são, p 710 .7 q 1 - .7 .3 Se você é do sexo masculino, a probabilidade de ser admitida é de 0,7 e a probabilidade de não ser admitida é de 0,3. Aqui estão as mesmas probabilidades para fêmeas, p 310 .3 q 1 - .3 .7 Se você é feminino é exatamente o oposto, a probabilidade de ser admitida é de 0,3 e a probabilidade de não ser admitida é de 0,7. Agora, podemos usar as probabilidades de calcular as probabilidades de admissão para homens e mulheres, probabilidades (masculino) .7.3 2.33333 probabilidades (feminino) .3.7 .42857 Em seguida, calculamos o odds ratio para admissão, OU 2.3333.42857 5.44 Assim, Para um homem, as probabilidades de serem admitidos são 5,44 vezes maiores do que as chances de uma fêmea ser admitida. Regressão lógica em Stata Aqui estão os comandos de regressão logística do Stata e a saída para o exemplo acima. Neste exemplo, admite-se codificado 1 para sim e 0 para não e o gênero é codificado 1 para homens e 0 para mulheres. Em Stata, o comando logístico produz resultados em termos de odds ratios enquanto o logit produz resultados em termos de escalas de coeficientes em probabilidades de log. Esses dados representam uma tabela 2x2 que se parece com isso: Observe que z 1.74 para o coeficiente de gênero e para o odds ratio para gênero. Sobre os logs Existe uma relação direta entre os coeficientes produzidos pelo logit e os odds ratios produzidos pela logística. Primeiro, let39s definem o que se entende por um logit: um logit é definido como o log base e (log) das probabilidades. 1 logit (p) log (odds) log (pq) O intervalo é infinito negativo para o infinito positivo. Na regressão, é mais fácil modelar os resultados ilimitados. A regressão logística é, na realidade, uma regressão normal usando o logit como variável de resposta. A transformação de logit permite uma relação linear entre a variável de resposta e os coeficientes: 2 logit (p) a bX ou 3 log (pq) a bX Isso significa que os coeficientes na regressão logística são em termos de probabilidades de log, ou seja, O coeficiente 1.694596 implica que uma mudança de unidade em gênero resulta em uma alteração de unidade 1.694596 no log das probabilidades. A Equação 3 pode ser expressa em desacordo ao se livrar do registro. Isso é feito tomando e para o poder para ambos os lados da equação. 4 e log (pq) ea bX ou 5 pq ea bX O resultado final de todas as manipulações matemáticas é que o odds ratio pode ser calculado aumentando e para a potência do coeficiente logístico, 6 OU ebe 1.694596 5.44 O conteúdo desta web O site não deve ser interpretado como um endosso de qualquer site, livro ou produto de software específico da Universidade da Califórnia. IDRE Research Technology Group

No comments:

Post a Comment