Conceitos sobre Significância Estatística em Biociências: Um Guia para a Interpretação do Valor-P
De Jean Faber
()
Sobre este e-book
Esta é uma leitura fundamental para todos que trabalham com pesquisa experimental em Biociências. É um convite para uma reflexão sobre cada técnica estatística que utilizamos para expressar os efeitos investigados e sobre as interpretações que realizamos na construção de novos conhecimentos.
Relacionado a Conceitos sobre Significância Estatística em Biociências
Ebooks relacionados
Questões de Probabilidade a Partir de Dados Sociais Nota: 0 de 5 estrelas0 notasQualidade de ensino em instituições de ensino superior através da espiral do conhecimento Nota: 0 de 5 estrelas0 notasEnfermagem e Enade: O que Dizem os Coordenadores de Cursos? Nota: 4 de 5 estrelas4/5TRI – Teoria de Resposta ao Item: Teoria, Procedimentos e Aplicações Nota: 0 de 5 estrelas0 notasEnsino de estatística Nota: 0 de 5 estrelas0 notasModelagem Matemática de Processos Diversos Nota: 5 de 5 estrelas5/5Publicação De Artigos Científicos Nota: 0 de 5 estrelas0 notasAplicação do modelo de Rasch Nota: 0 de 5 estrelas0 notasTécnicas Multivariadas Exploratórias: Teorias e Aplicações no Software Statistica© Nota: 0 de 5 estrelas0 notasAnálise de Sobrevivência Aplicada Nota: 0 de 5 estrelas0 notasEstatística decodificada Nota: 0 de 5 estrelas0 notasConceitos e análises estatísticas com R e JASP Nota: 0 de 5 estrelas0 notasColetânea em análise multiobjetivo Nota: 0 de 5 estrelas0 notasAnálises Ecológicas No R Nota: 0 de 5 estrelas0 notasProbabilidades Nota: 0 de 5 estrelas0 notasIntrodução à Análise Bayesiana (Com R) Nota: 4 de 5 estrelas4/5Bioestatística para os cursos de graduação da área da saúde Nota: 5 de 5 estrelas5/5Introdução à análise de dados categóricos com aplicações Nota: 0 de 5 estrelas0 notasRiscos e danos ambientais: Aspectos Práticos dos Instrumentos de Prevenção e Reparação Nota: 0 de 5 estrelas0 notasDesenvolvimento Socioeconômico e Sustentabilidade do Cerrado Brasileiro: na Transposição do Século XX para o XXI Nota: 0 de 5 estrelas0 notasProjeto De Pesquisa Nota: 0 de 5 estrelas0 notasCiência de Dados e a Inteligência Artificial na Área da Saúde Nota: 0 de 5 estrelas0 notasSoftware R: Uma Nova Proposta de Ensinar e Aprender Estatística Nota: 0 de 5 estrelas0 notasIntelecções sobre Possibilidades Cuidativas em Saúde no Campo da Interdisciplinaridade:: Vol. 2 Nota: 0 de 5 estrelas0 notasRegistros de Representação Semiótica: Conversão e Tratamento em Vetores Nota: 0 de 5 estrelas0 notasFundamentos Da Física Para A Ciência E Engenharia Dos Materiais Nota: 0 de 5 estrelas0 notasTécnicas de machine learning Nota: 0 de 5 estrelas0 notasMeteorologia Em Tópicos: Volume 3 Nota: 0 de 5 estrelas0 notasSistemas de Informação: gestão e tecnologia na era digital Nota: 0 de 5 estrelas0 notas
Negócios para você
Os 7 hábitos das pessoas altamente eficazes Nota: 4 de 5 estrelas4/5O código da mente extraordinária Nota: 4 de 5 estrelas4/5Coaching Communication: Aprenda a falar em público e assuma o palestrante que há em você Nota: 4 de 5 estrelas4/5O poder da ação: Faça sua vida ideal sair do papel Nota: 4 de 5 estrelas4/5Mapeamento comportamental - volume 1 Nota: 5 de 5 estrelas5/5Do mil ao milhão: Sem cortar o cafezinho Nota: 5 de 5 estrelas5/5Estratégias Gratuitas de Marketing Digital: Alavanque seus ganhos na internet Nota: 4 de 5 estrelas4/5Programação Neurolinguística em uma semana Nota: 4 de 5 estrelas4/5Finanças Organizadas, Mentes Tranquilas: A organização precede a prosperidade Nota: 0 de 5 estrelas0 notasDesvendando O Metodo De Taufic Darhal Para Mega Sena Nota: 4 de 5 estrelas4/5Seja foda! Nota: 5 de 5 estrelas5/5A melhor estratégia é atitude: Bora vender Nota: 5 de 5 estrelas5/5O Estranho Segredo Nota: 5 de 5 estrelas5/5333 páginas para tirar seu projeto do papel Nota: 5 de 5 estrelas5/5Dinheiro: 7 passos para a liberdade financeira Nota: 5 de 5 estrelas5/5Vou Te Ajudar A Fazer As Pessoas Clicar No Seu Link Nota: 5 de 5 estrelas5/510 Dicas de Ouro para ter Sucesso na Venda Direta Nota: 5 de 5 estrelas5/5A ciência de ficar rico Nota: 5 de 5 estrelas5/5Como fazer sua (próxima) carreira decolar Nota: 2 de 5 estrelas2/5Como ser um grande líder e influenciar pessoas Nota: 0 de 5 estrelas0 notasFalando Bonito: Uma reflexão sobre os erros de português cometidos em São Paulo e outros estados Nota: 4 de 5 estrelas4/5Gestão de Empresa: Tópicos Especiais em Gestão Empresarial Nota: 5 de 5 estrelas5/5Assertividade em uma semana Nota: 5 de 5 estrelas5/5O óbvio que ignoramos: Como simples atitudes podem fazer você obter sucesso em tudo que realiza Nota: 0 de 5 estrelas0 notasStorytelling: Histórias que deixam marcas Nota: 3 de 5 estrelas3/5
Avaliações de Conceitos sobre Significância Estatística em Biociências
0 avaliação0 avaliação
Pré-visualização do livro
Conceitos sobre Significância Estatística em Biociências - Jean Faber
COMITÊ CIENTÍFICO DA COLEÇÃO ENSINO DE CIÊNCIAS
AGRADECIMENTOS
Agradeço aos meus alunos-orientandos, que, direta ou indiretamente, contribuíram para a concretização deste livro.
Para minha mãe e minhas irmãs.
No isolated experiment, however significant in itself, can suffice for the experimental demonstration of any natural phenomenon...
Sir Ronald Aylmer Fisher
PREFÁCIO
A maior parte de minha atividade profissional tem sido dedicada à pesquisa em neurociência, e a compreensão, a aplicação e a finalidade da estatística sempre estiveram presentes e foram parte importante na adequada compreensão dos achados oriundos dessa atividade de pesquisa. Entretanto a estatística parece ser, para a grande parte dos pesquisadores em Biociências, um pesadelo ou uma mágica que transforma resultados em algo significativo e que, assim, merecem ser compartilhados.
Lembro-me de situações durante as atividades didáticas e de pesquisa em que estive envolvido. Aqui, alguns poucos exemplos. Durante uma defesa de tese de doutorado, um dos jurados raciocina com o candidato: Ora, se você tivesse anulado alguns resultados, os seus dados poderiam ser significantes e valeria uma publicação
. E o candidato: vamos ver o que acha o meu orientador
. E, ainda, um colega se aproxima e pergunta de supetão: que teste estatístico você recomenda para que o resultado do meu trabalho seja significativo?
. Pode parecer absurdo, mas tais perguntas, em formatos variados, costumam ocorrer com frequência. Assim, o livro Conceitos sobre significância estatística em Biociências, escrito e apresentado pelo Prof. Jean Faber, tem a qualidade de, por intermédio de uma linguagem fácil e exemplos muito claros, facilitar a vida de todos aqueles que desejam fazer pesquisa de boa qualidade no ambiente das Biociências.
Meu primeiro contato com o Prof. Jean Faber, um cientista de formação em Física que se enredou nas pesquisas neurocognitivas, iniciou-se numa discussão sobre a forma mais adequada de analisar os dados oriundos de suas pesquisas e, por que não, nos achados não muito evidentes que um de meus alunos de doutorado estava encontrando em eletrofisiologia do tecido cerebral humano. Foi a partir dessa frutífera colaboração inicial que acabei convidando o Prof. Jean Faber, então professor da Unifesp – ICT –, em São José dos Campos, a transferir-se para a Unifesp – Escola Paulista de Medicina –, numa vaga recém-aberta na Disciplina de Neurociência. Depois de muitos trabalhos em colaboração e muitos cursos de estatística ministrados para os alunos de pós-graduação da Unifesp, a decisão do Prof. Jean Faber de escrever este livro e dividir com todos a sua forma de compreender a estatística para as Biociências traz uma contribuição valorosa para todos nós.
O livro, tendo como linha mestra a interpretação do valor-p, vai desvendando os conceitos e métodos de forma clara e ao alcance de todos aqueles que se esquivam das complicadas fórmulas estatísticas que, ao longo do caminho, revelam o valor-p do trabalho de pesquisa. Só um pesquisador que aprendeu a transitar com facilidade entre as Ciências Exatas e as Ciências da Vida seria capaz de nos presentear com um livro didaticamente brilhante, com esquemas e figuras de fácil compreensão, e que, a partir de perguntas reais, permite-nos, ao final da leitura, termos a sensação de que a estatística é fundamental para nossa compreensão da Biociência. Boa leitura!
Esper A. Cavalheiro
Professor sênior, Escola Paulista de Medicina, Unifesp
São Paulo, Brasil
APRESENTAÇÃO
O valor-p é um índice derivado de Testes de Hipóteses que fornece uma maneira de quantificarmos a evidência sobre um efeito de alguma estimativa estatística (como a média, por exemplo). Se um grupo particular de pessoas possui, em média, altura maior que a média da população, o valor-p pode ser uma boa forma de avaliarmos se a diferença entre a média desse grupo e a média da população é expressiva ou não. É por essa capacidade que encontramos o valor-p em praticamente todos os trabalhos com pesquisa experimental, principalmente nas Biociências. Contudo, a interpretação e o entendimento completo de um Teste de Hipóteses, e do valor-p, é, em geral, tida como um grande mistério. Ainda hoje, há muitos equívocos técnicos e culturais que acabam gerando consequências práticas importantes. Muitas dessas consequências afetam fundamentos sobre a maneira como entendemos e aplicamos a metodologia científica.
Atualmente, vivemos um período na Ciência experimental em que há uma excessiva confiança sobre o que os Testes de Hipóteses dizem. Muitas vezes, busca-se apenas o que o valor-p diz sobre comparações entre efeitos amostrais sem uma avaliação mais cuidadosa sobre o que essas comparações realmente significam. É claro que um dos principais motivos para a criação e utilização do valor-p é justamente a facilitação das decisões sobre os resultados encontrados em testes comparativos. E se bem interpretado, o valor-p é realmente um índice extremamente informativo.
As facilidades de uso e aplicação trazidas pelos testes e softwares também trouxeram várias questões em diferentes domínios. Não é raro vermos pesquisadores trocando a avaliação e interpretação dos dados, e até dos experimentos, por uma busca incessante de um valor-p < 0,05. O pior é que, em muitos casos, essa busca esconde uma carência na própria compreensão sobre o porquê de se buscar esse valor de p < 0,05.
Infelizmente, as consequências desse comportamento são pesquisas cada vez menos reprodutíveis e, ainda mais seriamente, uma Ciência cada vez mais descritiva, já que a discussão sobre os resultados científicos passa a depender de um índice de que não se sabe a origem, tampouco suas consequências reais.
Pesquisas em Biociências ainda dependem muito de experimentos para produzir novos conhecimentos, não apenas como avaliação de correlações, mas também como compreensão sobre regras em si de sistemas biológicos. A maioria das teorias biológicas é de caráter descritivo e não analítica (no sentido matemático). A natureza não linear e altamente complexa dos fenômenos biológicos (e já vou incluir também, sem reducionismo, sistemas sociais, cognição e psicologia experimental) torna a missão de encontrar teorias analíticas, como é realizado na Física, por exemplo, uma tarefa bastante complicada.
Modelos preditivos e generalistas, normalmente, surgem de estrapolações e inferências estatísticas. Nas Biociências, podemos encontrar algumas propostas matemáticas ou computacionais, como em algumas partes da Genética (Bioinformática, principalmente), em alguns aspectos do Darwinismo, na Zoologia, Ecologia e Neurociência. Contudo, a maior parte dessas abordagens configuram-se muito mais como modelos do que como teorias em si. A maioria é inspiração de sistemas físicos e não descrições sobre propriedades, constantes e relações legitimamente biológicas, clínicas, cognitivas ou sociais. Há quem defenda a legitimidade desses modelos alegando que a Física apenas veio primeiro no uso de uma linguagem matematizada, e que muitos fenômenos biológicos também obedeceriam à regras analíticas com aspectos similares. Apesar de ser simpático a essa ideia, na prática, ainda não temos nenhum conjunto de equações ordinárias, tampouco parciais completas que prevejam dinâmicas e constantes biológicas, aos moldes da Física.
Consideremos, por exemplo, as áreas da Ciência que usam modelos animais em testes experimentais. Na maioria dessas pesquisas, é impossível fazer testes biológicos usando-se modelos computacionais, simplesmente porque, para a criação de um modelo computacional, é necessário conhecer as regras de funcionamento do sistema biológico que se deseja estudar. Acontece que os testes experimentais servem justamente para se compreender melhor essas relações. Lembrando que o mesmo princípio vale para ensaios e testes clínicos. Um medicamento novo, antes de ir para o mercado, precisa ser testado exaustivamente em animais, porque não se conhecem todos os efeitos possíveis que essa droga pode causar na espécie humana (nem os diretos, nem os colaterais). Obviamente, todo e qualquer protocolo experimental que envolva o uso de animais deve, irrevogavelmente, ser submetido a um Comitê de Ética em Pesquisa (CEP), para que se garanta autenticidade, segurança, cuidado e boa prática durante os procedimentos envolvidos nas pesquisas.
Desse modo, análises estatísticas são necessárias, porque sistemas biológicos são complexos, com relações totalmente não lineares e estocásticas entre seus componentes, fazendo com que seja difícil (mas não impossível) a previsão sobre como esses sistemas se comportam. É, portanto, a partir da utilização de técnicas estatísticas que conseguimos organizar melhor o pensamento crítico antes, durante e após os experimentos, e assim guiarmo-nos na construção do que entendemos como conhecimento científico.
A ideia aqui, portanto, é justamente tentar desmistificar o conceito por trás do valor-p, a partir de exemplos reais e diagramações que facilitem o entendimento da lógica de um Teste de Hipóteses frequentista. O livro foi escrito com tópicos curtos, para que o leitor avance rapidamente, e está dividido em duas partes. Na Parte I, a ideia é discutirmos, o mais informalmente possível, o modo de construção de um Teste de Hipóteses e como surge e se calcula o valor-p. Nessa abordagem, não usaremos fórmulas matemáticas, apenas diagramas e argumentos para que, aos poucos, possamos construir o raciocínio por trás do valor-p. Na Parte II, a ideia é irmos um pouco além, discutindo de forma um pouco mais profunda os limites, críticas e outros conceitos que fundamentam o valor-p e os Testes de Hipóteses. Tentei criar um texto que permita a desconstrução sobre concepções pensadas conhecidas e que também permitisse novas construções sobre preceitos pouco abordados nos livros tradicionais de Estatística. Espero que gostem!
Jean Faber
Sumário
PARTE I
Princípios sobre Testes de Hipóteses 21
Ciência experimental e índices 21
POR QUE PENSAR ESTATISTICAMENTE? 25
Ciência experimental e métodos 25
CIÊNCIA CLÍNICA E EXPERIMENTAL 27
Como ter confiança nos resultados? 27
UMA AMOSTRA REPRESENTA A POPULAÇÃO? 29
Como avaliar diferenças? 29
QUANTIFICANDO DIFERENÇAS ESTATÍSTICAS 33
Testes de Hipóteses 33
AVALIANDO DIFERENÇAS 37
Como saber se minha pesquisa é significativa? 37
COMO INTERPRETAR O VALOR-p? 39
Entendendo o conceito de probabilidade 39
PROBABILISMO NO MUNDO REAL 43
Sim, Deus joga dados... 43
COMO QUANTIFICAR ALEATORIEDADE? 45
Com probabilidade! 45
COMO MEDIR O ESPALHAMENTO DE ALEATORIEDADE? 49
Distribuição de probabilidade! 49
ESPALHAMENTOS BINÁRIOS 51
Uma moeda tem 50% de chance de apresentar a face cara? 51
FILHOTES DE Roedores COM A CONDIÇÃO X: 55
Existiria diferença em seus tamanhos? 55
QUANTAS DISTRIBUIÇÕES DE PROBABILIDADE? 57
Distribuições Empíricas 57
MODELOS MATEMÁTICOS PARA ALEATORIEDADE 61
Distribuições de probabilidade teórica 61
DE TODAS, A MAIS IMPORTANTE 63
Distribuição Gaussiana de probabilidade 63
DISTRIBUIÇÃO GAUSSIANA OU NORMAL: 67
Um modelo teórico e paramétrico 67
MODELOS DE DISTRIBUIÇÃO 71
Aplicação em tomada de decisão 71
O CÁLCULO DO VALOR-p 73
Interpretando os efeitos significativos 73
INTERPRETANDO O valor-p 75
A escolha de um modelo de distribuição 75
REPRESENTAÇÕES ENTRE MÉDIAS: 79
Usando a Distribuição Gaussiana 79
O LIMITE DA INFORMAÇÃO PARCIAL 81
Médias amostrais representam médias populacionais? 81
REPRESENTAÇÃO DE MÉDIAS POPULACIONAIS 85
Teorema Central do Limite (Ideia Geral) 85
NÃO DIZER UMA MENTIRA NÃO É DIZER A VERDADE! 89
A lógica de um teste de hipótese 89
VALOR-p COMO ÍNDICE DE DISTÂNCIA? 93
Quão perto a média amostral está da média populacional? 93
p É A CHANCE DE OBSERVARMOS O EFEITO 95
Ou um valor mais extremo, quando é verdadeira 95
QUAL O MELHOR VALOR-p? 101
Quanto menor o valor-p, melhor o resultado? 101
ERROS DE ESTIMATIVA 107
Precisão vs. acurácia 107
VALORES-p SÃO AMOSTRA-DEPENDENTES 111
A variância da população importa! 111
QUAIS AS MELHORES ESTIMATIVAS? 119
Valores-p muito pequenos são mais significativos? 119
QUANDO ‘REJEITAR’ A HIPÓTESE NULA? 123
Qual limiar garante minha decisão? 123
POR QUE α É SEMPRE IGUAL A 5% OU 1%? 131
Qual limiar garante melhor minha decisão? 131
ÍNDICES PARA MELHORES DECISÕES 133
Por que então escolher um valor de α igual a 5%? 133
VALORES-p PARA MELHORES DECISÕES 135
Erros de inferência estatística: Tipo I 135
VALORES-p PARA MELHORES DECISÕES 139
Erros de inferência estatística: Tipo II 139
p É A PROBABILIDADE DE OBSERVARMOS O EFEITO 141
Ou um efeito mais extremo, quando Ho é verdadeira 141
O VALOR-p NA DISTRIBUIÇÃO NORMAL PADRÃO 143
A transformação z-score 143
CONCLUSÃO DO TESTE 149
Testes de Hipóteses são guias para tomada de decisão 149
PARTE II
Fundamentos 151
Sobre as incertezas do valor-p 151
HISTÓRICO 153
Primeiras ideias sobre índices 153
ÍNDICE HEURÍSTICO 155
Valor-p de Fisher 155
ÍNDICE E TIPOS DE ERROS 157
Valor-p de Neyman & Pearson 157
TESTES DE HIPÓTESES 159
O valor-p na atualidade 159
MÚLTIPLAS COMPARAÇÕES E CONTROLES: 163
Restringindo as opções para uma 163
O ESTADO DA ARTE DEVE MUDAR? 169
Críticas ao modelo usual 169
ESTATÍSTICA "CAIXA-MÁGICA" 171
Como evitar automatismos metodológicos? 171
LIMIARES ESTATÍSTICOS 173
O que é preciso para um resultado legítimo? 173
LIMIARES METODOLÓGICOS 175
Por uma Ciência além de p < 0,05 175
A CIÊNCIA COMO MÉTODO 183
O valor-p como categorização do conhecimento 183
TEORIAS DA VERDADE 185
Existe limite para o que chamamos de verdade? 185
A VERDADE COMO MÉTODO 189
Testes de Hipóteses como métodos de verdade 189
A CIÊNCIA COMO CONHECIMENTO 191
Testes de Hipóteses como metodologia científica 191
MEDIDAS DIRETAS E INDIRETAS 195
Estatísticas como medidas fenomenológicas
? 195
TÉCNICAS E MEDIDAS 199
A interpretação como conhecimento 199
O CONHECIMENTO COMO ÍNDICES 201
Todo experimento é teoria 201
TESTES DE HIPÓTESES, FINALMENTE 209
Conclusões Induzidas 209
REFERÊNCIAS 211
Índice Remissivo 237
PARTE I
Princípios sobre Testes de Hipóteses
Ciência experimental e índices
Sistemas biológicos são dinâmicos, não lineares, complexos, multifatoriais e multiescala. Dinâmicos porque a passagem do tempo imprime um fator crucial, tanto nas relações entre suas partes quanto na degradação do próprio sistema que necessita de nutrientes para manter sua fisiologia e sua integridade¹–³; complexos porque operam em regimes de transição e instabilidade, entre a ordem e a desordem⁴,⁵; não lineares porque a maioria das relações biológicas amplificam ou atenuam seus processos de forma abrupta e/ou com patamares, em que entender as partes não explica o todo⁴,⁶; multifatoriais porque possuem atividades interativas entre diferentes partes, regimes, fatores, e