Trabalhos Práticos

  1. Metodologia
  2. Trabalho Prático 00 (PDF)
  3. Trabalho Prático 01 (PDF)
  4. Trabalho Prático 02 (PDF)
  5. Trabalho Prático 03 (PDF)
  6. Trabalho Prático 04 (PDF)
  7. Trabalho Prático 05 (PDF) (eatp5_1.sav)
  8. Tabelas Estatísticas (PDF)

Metodologia

Nas sessões práticas serão resolvidos exemplos ilustrativos dos métodos estatísticos explanados nas sessões teóricas, com recurso a dois tipos de equipamento: (i) calculadora de bolso e (ii) computador.

A fase de utilização da calculadora de bolso permite ao estudante concentrar mais a sua atenção na interpretação do procedimento de análise do que nos cálculos aritméticos que lhe estão associados. Por este motivo, este aspecto da aprendizagem será materializado em conjuntos de dados de pequeno tamanho, de modo a que ele não seja assoberbado pelos aspectos computacionais da Estatística. Mas o facto é que, na realidade, a maioria dos projectos de investigação envolve investimentos elevados de tempo e dinheiro, e produz corpos avantajados de dados. Por isso é também comtemplada a  aprendizagem de um sistema profissional de programas de computador para análise estatística (SPSSÒ for Windows, versão 11.0.0), cuja utilização será progressivamente ensinada ao longo do semestre.  

Back to Top

Trabalho Prático 00

Estatística Experimental

Trabalho Prático nº 0: Iniciação ao SPSSâ

 (SPSS for WINDOWS, versão 10.0.5; 27 Nov 1999)

                           1.         Procedimento de entrada e saída no SPSSâ

§         Para fazer correr o SPSS: colocar o cursor sobre o ícone SPSS, e premir o botão esquerdo do rato duas vezes, numa sucessão rápida.

§         Para sair do SPSS: usar a opção File>Exit.

                           2.         A janela de abertura do SPSSâ

Quando termina o processo de carga do programa, é habitual aparecer uma janela de abertura a questionar o utilizador sobre o que pretende fazer (What would you like to do?), oferecendo várias opções (Run the tutorial; Type in data; Run an existing query; Create new query using Database Capture Wizard; Open an existing file; Open another type of file). Por exemplo, se seleccionarmos a opção Type in data e depois fizermos  <OK>, acedemos ao editor de dados (Data Editor). Se a janela de abertura não aparecer (ou se aparecer, mas fizermos <Cancel>), entramos directamente no Data Editor (editor de dados).

                           3.         A  janela Data Editor

§         É nesta janela que se entram, se visualizam, se editam, se transformam e se identificam os dados que se pretendem analisar. A sua estrutura de grelha, com entradas verticais e entradas horizontais, assemelha-se muito à de uma folha de cálculo como o Excel. Cada coluna da grelha representa uma única variável, e cada linha representa uma única observação ou caso. Ao contrário do que acontece com outros tipos de janela do SPSS, só se pode ter uma única janela de dados aberta de cada vez.

§         Em termos operacionais, a folha de dados do SPSS é bastante diferente de uma folha de cálculo do Excel. No SPSS, a estrutura de colunas e linhas é importante e rígida, com as variáveis a figurarem obrigatoriamente nas colunas e as observações nas linhas. No Excel há flexibilidade para se poderem trocar estas categorias. Quando no SPSS se utiliza uma ou mais variáveis para criar uma nova variável, os cálculos são realizados literalmente coluna por coluna. No Excel podemos utilizar duas células individuais da folha para efetivar os cálculos, e depois propagar os cálculos para outras células ou grupos de células visados. No Excel, as células podem armazenar a fórmula de cálculo e recalcular o resultado se o valor original quando os dados originais forem alterados. O SPSS apenas armazena os valores, e se o valor de um dado original for alterado, temos de repetir todo o procedimento de cálculo da nova variável (isto é, toda a coluna).

§         A janela de edição permite visualizar os dados de duas maneiras:

Ø      Data view. Mostra os valores dos dados ou os nomes das variáveis actuamente presentes na folha. É neste modo de visualização que se introduzem os dados.

Ø      Variable view. Mostra toda a informação de definição das variáveis, nomeadamente os respectivo nomes (Name: máximo 8 caracteres), tipos (Type: numérico, alfanumérico, data, moeda etc.), número fixado de casas decimais (Decimals), etiquetas para as variáveis (Label), etiquetas para os valores das variáveis (Values), escalas de medida das variáveis (Measure), etc. É  neste modo de visualização que se podem criar as variáveis, previamente à introdução dos dados.

§         A janela de edição dos dados tem no topo a barra de títulos e, imediatamente por baixo, a barra de menús e a barra de ferramentas. Na parte inferior da janela, localiza-se a barra de estado, com informações sobre o progresso do trabalho.

§         A barra de menús do Data Editor apresenta os seguintes menús:

Ø      File. Abrir um ficheiro pré-existente (criado ou não no SPSS), criar um novo ficheiro, gravar um ficheiro ou imprimir um ficheiro. Os ficheiros poderão ser de dados (Data), de resultados (Output) ou de sintaxe (Syntax).

Ø      Edit. Desfazer a última acção; cortar, copiar e colar texto, dados ou gráficos. O comando Options permite personalizar a utilização do SPSS.

Ø      View. Ligar/desligar a barra de estado, a barra de ferramentas e as linhas da grelha da folha do editor de dados; apresentar as etiquetas das observações em vez dos números de código.

Ø      Data. Fazer alterações de fundo nos ficheiros de dados, tais como transposição de variáveis ou de casos, criar subconjuntos de dados para análise, inserir novas variáveis ou casos, juntar ficheiros (com as mesmas variáveis e casos diferentes; com os mesmos casos e variáveis diferentes), ou ordenar os dados do ficheiro segundo determinado critério. As alterações produzidas são temporárias, a menos que se proceda à gravação subsequente do ficheiro.

Ø      Transform. Alterar variáveis já existentes ou calcular novas variáveis a partir das variáveis pré-existentes no ficheiro. As alterações produzidas são temporárias, a menos que se proceda à gravação subsequente do ficheiro. É também possível gerar números aleatórios, atribuir postos às observações ou recodificar variáveis.

Ø      Analyze. Encontram-se nele todos os procedimentos de análise estatística que o SPSS é capaz de executar (estatística descritiva, tabelas, testes t, análise de variância, regressão, correlação, testes não paramétricos, etc.).

Ø      Graphs. Permite criar gráficos de barras, gráficos de linhas, gráficos circulares, gráficos de áreas, histogramas, diagramas de dispersão, diagramas de caixa e outros tipos de apresentação gráfica, a partir dos dados.

Ø      Utilities. Miscelânea de comandos que parecem não ter cabimento nos outros menús: listagem das variáveis existentes na folha de dados, informação detalhada sobre as características destas variáveis, definição de subconjuntos de variáveis que pretendemos analisar conjuntamente, alteração dos menús utilizando o editor de menús, etc.

Ø      Window. Mudar de uma para outra ou allterar os atributos das diferentes janelas do SPSS (Data Editor, Output, Syntax e Chart).

Ø      Help. Comandos para o sistema de ajuda do SPSS (por tópicos, tutor, guia de sintaxe e “statistics coach”).

                           4.         Outras janelas do SPSS

§         Regra geral, quando se faz correr o SPSS, há duas janelas que abrem automaticamente: Data Editor e Viewer. Se a janela Viewer não abrir nessa altura, abrirá de forma automática quando se solicitar uma análise estatística ou um gráfico. As janelas de outros tipos (por exemplo: Chart Editor e Syntax Editor) só abrem quando solicitado.

Ø      Viewer. É onde todos os resultados, tabelas e gráficos são exibidos. O conteúdo pode ser editado e gravado em ficheiro (extensão .spo).

Ø      Chart Editor. Abre quando se prime duas vezes o botão do rato sobre um gáfico que esteja no Viewer, possibilitando alterar as cores, os padrões, tipos e tamanhos de letra, trocar os eixos e o tipo de gráfico, etc.

Ø      Syntax Editor. É, em termos práticos, uma janela de texto, para onde as escolhas feitas nos menús e nas caixas de diálogo do SPSS podem ser copiadas, aparecendo aí sob a forma de uma sintaxe de comandos. Para esse efeito, basta clicar no botão Paste de cada caixa de diálogo, depois de introduzida/seleccionada toda a informação necessária para a execução do procedimento pretendido. O programa que vai sendo assim construido pode mais tarde ser editado para inserir certas capacidades especiais de análise estatística que só são acessíveis no SPSS em modo programado, e não através das caixas de diálogo. Estes comandos podem ser gravados em ficheiros, e utilizados em sessões de trabalho posteriores. Para se fazer correr um programa de uma janela de sintaxe, basta seleccionar Run na barra de menús do Syntax Editor.

                           5.         Criar um ficheiro de dados no SPSS

§         Suponha que pretendia gerar um ficheiro de dados com o nome “exemplo1”, para armazenar os resultados da contagem do número de frutos presente em  dez plantas de morangueiro, sendo cinco da cultivar a e cinco da cultivar b:

Cultivar

Número de frutos

a

24

a

25

a

23

b

35

a

18

a

20

b

40

b

38

b

38

b

41

 

§         Comece por definir as variáveis, colocando o Data Editor em modo Variable view. Preencha a primeira linha da janela para definir a variável indicadora da cultivar de morangueiro: sob Name escreva cultivar; clique na célula da coluna Type, depois no botão que lá aparece, e escolha a opção string, porque se trata de uma variável alfanumérica; aceite Width=8 e Decimals=0, valores que o SPSS coloca por defeito); sob Label escreva Cultivar de morangueiro (trata-se de uma etiqueta explicativa do que representa a variável cultivar). Clicando na célula da coluna Values e depois no botão que lá aparece, surje uma janela para definir as duas categorias da variável cultivar  (a e b): para cada valor, entre o valor e uma etiqueta explicativa, e depois clique no botão Add para os tornar efectivos. Preencha a segunda linha da janela para definir a variável indicadora do número de frutos: Name=frutos; Type= numeric (trata-se de uma variável que toma valores numéricos); Width=8; Decimals=0; Label=Número de frutos. Repare que o SPSS escreveu automáticamente na última coluna o tipo de escala de medida dos dados: para cultivar, aparece Measure= Nominal e para  frutos Measure= Scale.

§         Para introduzir os dados, coloque o Data Editor em modo Data view. A introdução dos dados tanto se pode fazer linha a linha (isto é, por casos), movimentando-nos de uma célula para a que está situada à sua direita com a tecla Tab (®½), como coluna a coluna (por variáveis), movimentando-nos de uma célula para a que está situada à sua direita com a tecla Enter (¿).

§         Para gravar os dados na sua disquete de trabalho, seleccione as opções File>Save As …. Na caixa de diálogo que então se abre faça Save in=A e File name= exemplo1. O ficheiro será guardado como exemplo1.sav.          

                           6.         Reunir ficheiros com as mesmas variáveis e casos diferentes

§         Suponha que se tinham armazenados os resultados da contagem do número de frutos presentes em plantas de mais duas cultivares de morangueiro (cultivar c e cultivar d) num outro ficheiro, denominado exemplo2.sav, e que pretendíammos reunir os dados das quatro cultivares num único ficheiro de dados SPSS:

Cultivar

Número de frutos

c

42

c

52

c

47

c

49

c

43

d

13

d

14

d

13

d

16

d

18

 

§         Comece por criar um ficheiro SPSS para estes dados. Como o novo ficheiro terá as mesmas variáveis de exemplo1.sav, vamos copiar as respectivas definições para exemplo2.sav. Com o ficheiro exemplo1.sav em Variable view, marque as duas linhas onde estão definidas as variáveis cultivar e frutos e copie o seu conteúdo para o clipboard do Windows, escolhendo as opções Edit>Copy. Seleccione agora File>New>Data para começar a criar o novo ficheiro. Marque as duas primeiras linhas da folha Variable view, e seleccione Edit>Paste: as definições das variáveis aparecem no novo ficheiro. Não se esqueça de ir à coluna Values fazer as correcções necessárias para definir os novos valores da variável cultivar: c e d.

§         Mude para Data view, introduza os dados da tabela acima e  faça File>Save As … para os guardar com o nome de exemplo2.sav.

§         Abra o ficheiro A:\exemplo1.sav, mediante as opções File>Open>Data. Para lhe acrescentar os dados do segundo ficheiro, escolha Data>Merge Files>Add Cases…, e na caixa de diálogos que se abre seleccione A:\exemplo2.sav. Remova as variáveis que não pretenda que integrem o novo ficheiro em Variables da lista de New Working Data File.

§         Grave o ficheiro que reune exemplo1.sav e exemplo2.sav com o nome de exemplo3.sav.

                           7.         Reunir ficheiros com os mesmos casos e variáveis diferentes

§         Suponha que se tinham armazenados os resultados de uma nova variável, peso dos frutos, nas 20 plantas das quatro cultivares de morangueiro (a, b, c e d) para que se registou o número de frutos em exemplo3.sav, e que pretendíammos reunir os dados das duas variáveis número de frutos e peso dos frutos num único ficheiro de dados SPSS. Os dados constam da tabela mais abaixo apresentada.

§         Comece por criar um ficheiro SPSS para estes dados, e grave-o como A:\exemplo4.sav.

§         Para se fazer neste caso a junção dos dois ficheiros, é necessário que ambos se encontrem ordenados em ordem crescente pela variável classificatória dos dados (cultivar). Como nem exemplo3.sav nem exemplo4.sav estão ordenados, para cada um deles seleccione Data>Sort cases, e escolha na caixa de diálogo que se abre a variável cultivar para definir a nova ordenação e o critério ascendente de ordenação (Ascending).

§         Abra o ficheiro A:\exemplo3.sav (ordenado). Para lhe acrescentar os dados do segundo ficheiro, escolha Data>Merge Files> Add Variables..., e na caixa de diálogos que se abre seleccione A:\exemplo4.sav (ordenado).

 

Cultivar

Peso dos frutos

a

459

a

297

a

361

b

626

a

299

a

362

b

745

b

661

b

635

b

702

c

612

c

782

c

658

c

812

c

627

d

327

d

260

d

156

d

214

d

326

 

§         Grave o ficheiro resultante da reunião como A:\exemplo5.sav.

                           8.         Criar uma nova variável num ficheiro, a partir de variáveis pré-existentes

§         Suponha que no ficheiro exemplo5.sav, onde se encontram registados os valores das variáveis número de frutos (frutos) e peso dos frutos (peso) de 20 plantas de quatro cultivares de morangueiro, pretendíamos criar uma uma nova variável, denominada fruto, para traduzir o peso médio dos frutos presentes em cada planta. Os valores desta variáveis virão dados pelo quociente do peso total dos frutos pelo número de frutos de cada planta, isto é,  fruto=peso/frutos.

§         Abra o ficheiro A:\exemplo5.sav. Seleccione as opções Transform>Compute. Na caixa de diálogo que então se abre, entre com o nome da nova variável fruto no campo Target Variable e a fórmula para a calcular (peso/frutos) no campo Numeric Expression. Utilize os botões com operações que estão na caixa de diálogo para construir a expressão de cálculo da nova variável. Quando clicar no botão OK, surgirá uma nova coluna no Data Editor, com os valores desta.

§         Seleccione File>Save para guardar a nova variável no ficheiro exemplo5.sav.

                           9.         Obter um rol de frequências para os valores de uma variável

§         Suponha que pretendia obter uma lista dos valores observados na variável número de frutos (frutos) do ficheiro exemplo5.sav, acompanhados das correspondentes frequência e percentagens.

§         Depois de abrir o ficheiro A:\exemplo5.sav, seleccione as opções Analize>Descriptive Statistics>Frequences … Na caixa de diálogo que se abre, dê entrada à variável frutos no campo Variable(s). Para mover a variável frutos para o campo Variable(s), marque com o cursor frutos no campo da esquerda e depois clique na seta que aponta para o campo Variable(s). Quando posteriormente clicar no botão OK, aparece a janela Viewer do SPSS. Esta janela aparece dividida em duas secções, uma mais larga que a outra. Na secção mais larga (à direita) aparecem os resultados da análise solicitada: uma tabela com o título Statistics, onde figura o número total e o número de dados em falta para a variável; outra com a etiqueta da variável no topo, e com os valores das frequências e das percentagens. Na secção mais estreita (à esquerda) aparce uma lista com as várias componentes do “output” (Title, Statistics, Número de frutos…). Esta lista pode ser usada para ir directamente para uma componente específica do “output”.

§         Se clicar uma vez sobre um título ou uma tabela do “output”, o titulo ou a tabela ficarão seleccionados (aparece uma seta junto à bordadura esquerda), permitindo-lhe então alterar-lhes o tamanho, ou copiá-los, apagá-los ou movê-los para outro local. Experimente premir então o botão direito do rato, para ver o que pode fazer quando os tem seleccionados. Para deixar de os ter seleccionados, clique uma vez numa área em branco, exterior ao título ou à tabela.

§         Para entrar em modo de edição num título ou tabela, basta-lhe clicar duas vezes sobre eles. Para abandonar o modo de edição, clique duas vezes numa área exterior ao título ou à tabela. Experimente a clicar duas vezes  sobre o título Frequences, e escreva aí o seu nome e número de matrícula, seguidos de “Exemplo 9.”

§         Pode imprimir o seu “output” seleccionando File>Print, ou gravá-lo para o utilizar mais tarde seleccionando File>Save As …. Os ficheiros de resultados do SPSS têm a extensão .spo. Experimente a gravar o seu “output” com o nome de exemplo9, depois feche-o com File>Close ,e reabra-o depois mediante File>Open>Output.

                         10.       Obter uma tabela com um sumário das medidas estatísticas descritivas de uma variável

§         Suponha que pretendia obter a média, o desvio padrão, o valor máximo, o valor mínimo, a amplitude, a medida de simetria e a medida de curtose para o conjunto dos valores do peso dos frutos (peso).

§         Seleccione Analize>Descriptive Statistics>Descriptives …. Na caixa de diálogo que então se abre, dê entrada à variável peso no campo Variable(s).

§         Carregue no botão Options …, e seleccione Mean, Std. deviation, Maximum, Minimum, Range, Kurtosis e Skewness. Quando clicar no botão Continue e depois no botão OK, aparece a janela Viewer do SPSS, com a tabela pretendida.

§         Clique duas vezes sobre a célula da tabela onde está escrito Mean, e depois no botão direito do rato. Se no menú que então aparece seleccionar What’s it? surge uma caixa de texto com a explicação do que é uma média. Repita este procedimento para as restantes medidas estatísticas.

§         Coloque o cursor sobre a  tabela e clique no botão direito do rato. Se no menú que então aparece seleccionar Results Coach, abre-se um conjunto iterativo de janelas a explicar o significado de cada um dos elementos que a constituem.

                         11.       Fazer uma análise exploratória dos dados de uma variável, em separado para cada um dos grupos considerados

§         Suponha que pretendia fazer um estudo descritivo exploratório da variável peso dos frutos (peso), incluindo todo o tipo de medidas estatísticas (média, variância, desvio padrão, mediana, valores máximo e mínimo, amplitude, medidas de simetria e de curtose, percentis …), valores extremos, valores atípicos (“outliers”), testes de normalidade de distribuição, representações gráficas (histogramas, diagramas de caule e folha, diagramas de caixa, diagramas de normalidade) em separado para cada uma das quatro cultivares de morangueiro.

§         Seleccione Analize>Descriptive Statistics>Explore …. Na caixa de diálogo que então se abre, dê entrada à variável peso no campo Dependent List e à variável cultivar no campo Factor List.

§         Carregue no botão Plots …, seleccione Stem-and-leaf, Histogram e Normality plots with tests, e clique no botão Continue para regressar à janela original.

§         Carregue no botão Statistics …, seleccione Descriptives, Outliers e Percentiles, e clique no botão Continue para regressar à janela original.

§          Quando clicar no botão OK, aparece a janela Viewer do SPSS, com os resultados pretendidos. Utilize o Results Coach para obter esclarecimentos sobre o que está figurado nas tabelas e What’s it? para obter o significado dos termos que nelas aparecem.

                        12.       Seleccionar dados (casos) específicos de um ficheiro, para lhes aplicar um procedimento de análise estatistica ou construir um gráfico 

§         Suponha que pretendia obter o número de observações, a média, o desvio padrão e a amplitude de variação da variável peso médio dos frutos (fruto), apenas para as cultivares a e d.

§         Tinha, antes de mais, de seleccionar os valores correspondentes a a e d, descartando da análise os das cultivares b e c. Seleccionando as opções Data>Select Cases, abre-se uma caixa de diálogo intitulada Select Cases. Se seleccionar a opção If condition is satisfied e clicar no botão If é apresentada uma nova caixa de diálogo, denominada Select Cases: If.

§         No campo apropriado da caixa de diálogo Select Cases: If construa a expressão condicional que vai isolar os casos pretendidos: cultivar=”a” or cultivar=”b”. Quando clicar no botão Continue e depois no botão OK, aparece na janela Data Editor do SPSS uma nova coluna com uma variável-filtro (filter_$), para a qual os casos das cultivares a e d exibem o valor ”1” e os das cultivares b e d o valor “0”. Repare que na 1ª coluna do Data Editor os números dos casos destas últimas cultivares aparecem marcadas com um traço oblíquo, indicando que eles não estão seleccionados para as operações seguintes. (Nota: para anular a selecção que fez, volte a fazer Data>Select Cases, e escolha a opção All Cases.)

§         Seleccione Analize>Compare Means>Means …. Na caixa de diálogo que então se abre, dê entrada à variável  fruto  no campo Dependent List e à variável  cultivar no campo Independent List.

§         Carregue no botão Options …, e seleccione Number of Cases, Mean, Standard Deviation e Range. Quando clicar no botão Continue e depois no botão OK, aparece na janela Viewer do SPSS uma tabela com os valores pretendidos, numa linha os da cultivar a , noutra os da cultivar d e ainda noutra (Total) os do conjunto dos valores das duas cultivares.

                         13.           Construir um gráfico de barras e um diagrama de dispersão 

§         Para obter um gráfico de barras com os valores médios da  variável peso médio dos frutos (fruto)  das quatro cultivares, seleccione as opções Graphs>Bar, após o que se abre uma caixa de diálogo intitulada Bar Charts. Nesta caixa, seleccione as opções Simple e Summaries for groups of cases, e clique depois no botão Define. Na caixa de diálogo que então se abre (Define Simple Bar), dê entrada à variável cultivar no campo Category Axis. Na secção Bars Represent, seleccione Other summary function e introduza a variável  fruto no campo Variable. Ao fazer esta última operação, aparece escrito no campo Variable “MEAN (fruto)”, indicando que as alturas das barras do gráfico vão representar as médias da variável fruto das cultivares. (Nota: Se quisessemos que a altura das barras representasse outra função que não a média, clicávamos no botão Change Summary, e escolhiamos a função pretendida.)

§         Se clicar duas vezes seguidas sobre o gráfico de barras, abre-se uma janela de edição que lhe permite alterar pormenores do gráfico que o SPSS gerou automaticamente. Experimente a clicar duas vezes sobre a etiqueta do eixo vertical, onde se lê “Mean FRUTO”. Abre-se uma caixa de diálogo, onde no campo Axis Title pode alterar a etiqueta para “Peso médio dos frutos (g)” e centrar a posição desta etiqueta (entrar Center no campo Title Justification). Experimente a utilizar o botão Colors para mudar a cor das barras, o botão Bar Style para criar um efeito 3-D nas barras e o botão Swap Axes para obter um gráfico de barras horizontais em vez de um gráfico de barras verticais.

§         Para obter um diagrama de dispersão com os valores das variáveis peso dos frutos (peso) e número de frutos (frutos), seleccione as opções Graphs>Scatter, após o que se abre uma caixa de diálogo intitulada Scatterplot. Nesta caixa, seleccione a opção Simple e clique depois no botão Define. Na caixa de diálogo que então se abre (Simple Scatterplot), dê entrada à variável peso no campo Y Axis e à variável frutos no campo X Axis. Para que os pontos do diagrama apareçam com simblos diferenciados consoante a cultivar a que dizem respeito e uma legenda explicativa, introduza a variável cultivar no campo Set Markers by. Se pretender que cada ponto do diagrama aparece etiquetado com o nome da cultivar a que diz respeito, comece por introduzir a variável cultivar no campo Label Cases by; clique depois no botão Options e seleccione a opção Display chart with case labels. Edite o gráfico, e experimente utilizar o botão Markers para mudar o simbolo dos pontos do diagrama para “*” (asterisco) de tamanho grande. Se clicar sobre o botão Chart options, abre-se uma janela intitulada Scatterplot options. Na área Fit line seleccione Total, clique no botão Fit Options, e depois em Fit Method escolha Linear regression. Quando clicar em Continue e depois OK, aparece uma linha recta ao longo dos pontos do diagrama de dispersão.

Back to Top

Trabalho Prático 01

Estatística Experimental

 Trabalho Prático nº 1: Estatística Descritiva

 

SPSSÒ

Data ® Sort Cases

Data ® Select Cases

Transform ® Compute

Analyse ® Custom Tables ® Tables of Frequencies

Analyse ® Descriptive Statistics ® Descriptives

Analyse ® Descriptive Statistics ® Explore

Graphs ® Histogram

Graphs ® Scatter

 

1.      A medida da fracção da radiação incidente que é reflectida pelas folhas (reflectância) tem sido utilizada para várias finalidades, nomeadamente para a avaliação da côr das turfas, a estimativa dos teores de azoto foliares e a estimativa de biomassas. Os dados seguintes representam as reflectâncias, medidas por espectrofotometria, de 15 folhas desenvolvidas em determinadas condições experimentais:

 

              15,2  16,8  12,6  13,2  12,8  13,8  16,3  13,0  12,7  15,8  19,2  12,7  7,8  13,5  12,9

 Utilizando uma calculadora:

 a)      Calcule a média, a mediana, o desvio interquartil, a variância e o desvio-padrão da amostra.

b)      Construa o diagrama de caixa-e-bigodes, por forma a figurarem nele eventuais observações atípicas (“outliers”) presentes na amostra.

c)      Remova os “outliers” que detectou na amostra, e volte a calcular a média, a mediana e o desvio-padrão da nova amostra.

d)      Qual das três medidas estatísticas é menos afectada pela presença do “outlier”? E a mais afectada?

 2.      Fizeram-se medições da largura máxima numa amostra de 50 folhas frescas colhidas em duas árvores de Populus deltoides, situadas em dois locais distintos (F=Faro e T=Tavira). Voltaram-se a medir as mesmas folhas após terem sido secas numa estufa a 70º C durante 48 horas. Obtiveram-se os seguintes dados, em milímetros:

 

local

Largura da folha fresca

Largura da folha seca

T

103

97

T

108

103

T

113

110

T

105

102

T

104

99

F

86

80

F

70

65

F

81

78

F

85

83

F

83

78

T

110

105

T

104

100

T

110

106

T

105

97

T

101

98

F

72

67

F

80

75

F

86

84

F

88

87

F

55

52

T

100

95

T

115

109

T

100

95

T

110

105

T

100

97

F

86

83

F

82

77

F

78

75

F

84

78

F

76

71

T

108

102

T

106

104

T

100

96

T

108

102

T

112

106

T

103

98

T

107

104

T

105

100

T

108

103

F

82

80

F

80

76

F

83

81

F

90

88

F

90

84

F

88

86

F

89

85

T

100

98

T

100

96

T

105

98

T

104

99

a)      Crie um ficheiro de dados SPSSÒ para analisar os dados deste estudo,

b)      Obtenha uma listagem dos dados ordenados pelo critério local.

c)      Determine o número de observações, a média, a variância, o desvio padrão, o valor máximo, o valor mínimo e a amplitude da largura da folha fresca  e da largura da folha seca, para o conjunto observações dos dois locais,

d)      Determine o número de observações, a média e o desvio padrão para as observações da largura da folha fresca da árvore de Faro,

e)      Crie no ficheiro uma nova variável, que traduza a retracção percentual de largura que sofrem as folhas com o processo de desidratação (retracção= [(largura da folha fresca – largura da folha seca)/ largura da folha fresca] x 100).

f)        Obtenha o rol de frequências (com percentagens) para a largura da folha seca, em separado para cada um dos locais.

g)      Faça o estudo descritivo completo (incluindo medidas de posição, medidas de dispersão, medidas de forma, percentis, histogramas, diagramas de normalidade de distribuição, de caixa e de caule-e-folha) da variável retracção, em separado para cada um dos locais, Há razões para acreditar que a retracção das folhas é superior num local do que noutro? Detectam-se observações atípicas nalgum dos locais? Em algum dos casos se detectam afastamentos da normalidade de distribuição? Em qual dos locais houve maior variabilidade dos dados?

h)      Construa um histograma para figurar a distribuição do conjunto dos dados da retracção: (i) em que os pontos médios das classes vão de 1 a 8 % por intervalos de 1 % e (ii) em que os pontos médios das classes vão de 1 a 7 %  por intervalos de 2 %.

i)        Construa o diagrama de dispersão da largura da folha seca versus largura da folha fresca: (i) para o conjunto dos dados dos 2 locais; (ii) para cada um dos locais, Afigura-se-lhe razoável admitir que uma linha recta é um modelo apropriado para traduzir a associação das duas variáveis? A associação linear parece-lhe mais precária nalgum dos locais?

 Soluções

 

                                                       1.          a) média=13,887; mediana=13,200; desvio interquartil=3,100; variância=6,644; desvio-padrão=2,578.

       c) média=14,321; mediana=13,350; desvio-padrão=2,025.

       d) o desvio-padrão é o mais afectado e a mediana o menos afectado.

                                                       2.          c)

largura

n

média

variância

desvio-padrão

máximo

mínimo

amplitude

fresca

50

94,96

181,835

13,48

115

55

60

seca

50

90,74

172,564

13,14

110

52

58

                                        d) n=22; média=81,55; desvio-padrão=7,99.

                                        g)

local

média

desvio-padrão

Q1

Q3

mediana

g1

g2

Faro

4,5895

2,0180

2,4096

6,5789

4,7472

-0,153

-1,569

Tavira

4,3941

1,3415

3,3182

5,1087

4,6296

0,080

0,154

     i) Os pontos parecem ajustar-se bem a uma linha recta. A associação linear é mais precária no caso de Tavira.

 

Back to Top

Trabalho Prático 02

Estatística Experimental

Trabalho Prático nº 2: Distribuições de Probabilidade

 1.      Considere a variável aleatória X, cujos valores seguem uma distribuição binomial de parâmetros n=5 e p=0,2. Calcule, primeiro utilizando a expressão teórica da lei binomial e depois com recurso a tabelas:

a)      P (X=3).

b)      P (X³3).

c)      P (X<3).

d)      P (3<X£5).

 2.      A partir de um grande lote de sementes com um poder germinativo de 95%, um produtor de sementes enche saquinhos para venda, cada um com 20 sementes, e garante ao consumidor que pelo menos 18 delas germinam. Calcule, primeiro utilizando a expressão da distribuição teórica aplicável e depois com recurso a tabelas, o risco de o consumidor não ver na prática respeitada esta garantia.

 3.      Considere a variável aleatória X, cujos valores seguem uma distribuição de Poisson de parâmetro m=5. Calcule, primeiro utilizando a expressão teórica da lei de Poisson e depois com recurso a tabelas:

a)      P (X=3).

b)      P (X³3).

c)      P (X<3).

d)      P (3<X£5).

 4.      Admitindo que a variável que representa o número de sementes de infestantes do género Potentilla presentes em amostras de 10 cm3 de semente da gramínea Phleum pratense segue uma lei de Poisson de média igual a 1,14, calcule a probabilidade de uma amostra aleatória de 10 cm3, tomada ao acaso numa tulha:

a)      Conter exactamente uma semente da infestante.

b)      Conter no máximo uma semente da infestante.

c)      Conter pelo menos duas sementes da infestante.

 5.      Seja Z uma variável aleatória com distribuição normal padrão. Calcule as seguintes probabilidades:

a)      P ( Z ³ 2,53 ).

b)      P ( 0 £ Z £ 2,53 ).

c)      P ( -2,53 £ Z £ 2,53 ).

d)      P ( Z £ -0,42 ).

e)      P ( -1,37 £ Z £ 2,50 ).

f)        P ( Z ³ 1,576 ).

6.      Em cada uma das alíneas seguintes, determine o valor da constante c que torna a proposição de probabilidade verdadeira:

a)      P ( Z ³ c ) = 0,0256.

b)      P ( Z £ c ) = 0,0197.

c)      P ( 0 £ Z £ c ) = 0,3078.

d)      P ( -c £ Z £ +c ) = 0,8354.

e)      P (c £ | Z | ) = 0,16.

 7.      O recipiente plástico usado por um fabricante para comercializar um determinado fertilizante líquido foi planeado para conter um volume de 15 litros de líquido. Suponha que a variável que representa a capacidade real de um recipiente deste tipo é normalmente distribuída, com uma média igual a 15 litros e um desvio padrão de 0,2 litros.

a)      Qual a probabilidade de um recipiente escolhido ao acaso ter, no máximo, uma capacidade de 14,6 litros?

b)      Qual a probabilidade de um recipiente escolhido ao acaso ter uma capacidade compreendida entre 14,7 e 15,1 litros?

c)      Qual o valor da variável tal que 33% dos recipientes têm uma capacidade que lhe é igual ou inferior?

d)      Admita que se conseguem fertilizar 250 vasos com cada litro de fertilizante líquido. Calcule qual a probabilidade de se poderem fertilizar 3700 vasos com uma única embalagem do produto.

 8.      Utilize as tabelas das distribuições t de Student para determinar os valores de:

a)      t0,05 (8).

b)      t0,10 (15).

c)      t0,025 (12).

d)      t0,001 (150).

e)      o 90º percentil da distribuição t com 22 graus de liberdade.

f)        o P10 da distribuição t com 22 graus de liberdade.

g)      o valor de t tal que P [-t £  t (25) £ +t ]=0,95.

h)       o valor de t tal que P [ t (20) ³ t ]=0,10.

i)        o valor de t tal que P [ t (16) ³ -t ]=0,05.

j)        P ( | t | > 3,435 ) na distribuição t  com 26 graus de liberdade.

 9.      Utilize as tabelas das distribuições F de Snedecor para determinar os valores de:

a)      F0,05 (5, 8).

b)      F0,10 (10, 9).

c)      P [ F (30, 30) ³ 2,07 ].

d)      P [ F (6, 4) £ 6,16 ].

e)      o 99º percentil da distribuição F com 10 graus de liberdade no numerador e 12 graus de liberdade no denominador.

f)        o P95 da distribuição F com 20 graus de liberdade no numerador e um número infinito graus de liberdade no denominador.

g)      P [ 3,30 £ F (10, 5) £ 13,62 ].

 Soluções

                                    1.           

a)      0,0512.

b)      0,05792.

c)      0,94208.

d)      0,00672.

 

                                    2.          0,07548.

 

                                    3.           

a)      0,14037.

b)      0,87532.

c)      0,12468.

d)      0,35094.

 

                                    4.           

a)      0,36459.

b)      0,68441.

c)      0,31559.

 

                                    5.           

a)      0,00570.

b)      0,49430.

c)      0,98860.

d)      0,3372.

e)      0,90849.

f)        0,0575.

 

                                    6.           

a)      1,95.

b)      –2,06.

c)      0,87.

d)      1,39.

e)      2,41.

 

                                    7.           

a)      0,0228.

b)      0,6247.

c)      14,912 litros.

d)      0,8413.

 

                                    8.           

a)      1,860.

b)      1,341.

c)      2,179.

d)      3,090.

e)      1,321.

f)        –1,321.

g)      2,060.

h)      1,325.

i)        1,746.

j)        0,002.

 

 

                                    9.           

a)      3,69.

b)      2,42.

c)      0,025.

d)      0,95.

e)      4,30.

f)        3,47.

g)      0,095.

 

Back to Top

Trabalho Prático 03

Estatística Experimental

 Trabalho Prático nº 3: Testes de Hipóteses

  

SPSSÒ

Analyse ® Compare Means ® One Sample T Test

Analyse ® Compare Means ® Independent-Samples T Test

Analyse ® Compare Means ® Paired-Samples T Test

 

Resolva cada uma das questões seguintes:

1.      utilizando uma calculadora

2.      utilizando o SPSSÒ

 

 

1.      Um cientista está a investigar a eficácia da aplicação de pó de carvão à superfície do terreno na protecção de solos de pomares contra o enregelamento. No decurso do estudo, registou os seguintes valores para o fluxo de calor do solo, em oito parcelas em que o material foi aplicado:

34,7 35,4 34,7 37,7 32,5 28,0 18,4 24,9

Estudos anteriores mostraram que o fluxo médio de calor em parcelas de terreno cobertas só com erva era igual a 29,0. Assumindo-se que a distribuição do fluxo de calor é aproximadamente normal, pretende-se averiguar se há evidência suficiente nos dados para se concluir que o pó de carvão é mais eficaz que a erva no incremento do fluxo de calor.

[J. L. Devore (1995). Probability and Statistics for the Engineering and the Sciences. Duxbury Press, CA]

 

a)      Formule a hipótese nula e a hipótese alternativa para o problema. O teste é unilateral ou bilateral?

b)      Calcule os valores do estatístico t e da probabilidade que lhe está associada.

c)      Há evidência suficiente para rejeitar a hipótese nula ao nível de significância de 5%, e concluir que a superioridade do pó de carvão sobre a relva simples na prevenção do enregelamento do solo?

d)      Estabeleça o intervalo de confiança a 95% para o fluxo médio de calor, e com base nele tire a conclusão para o teste de hipóteses formulado.

 2.      Um floricultor utiliza habitualmente um dado fertilizante para crescer plantas de uma espécie ornamental, e pretende averiguar se um fertilizante recentemente introduzido no mercado é superior para o fim em vista. Para o efeito, fez crescer 10 plantas da espécie com o fertilizante que actualmente usa e outras 8 com o novo fertilizante, e mediu as alturas das plantas na maturidade:

Planta

Fertilizante

Altura (cm)

Planta

Fertilizante

Altura (cm)

1

Actual

48.2

10

Actual

51.4

2

Novo

52.3

11

Actual

52

3

Novo

57.4

12

Novo

58

4

Actual

54.6

13

Novo

59.8

5

Actual

58.3

14

Novo

54.8

6

Novo

55.6

15

Actual

55.2

7

Novo

53.2

16

Actual

49.1

8

Novo

61.3

17

Actual

49.9

9

Actual

47.8

18

Actual

52.6

 

[J. H. Zar  (1984). Biostatistical Analysis. (2nd Ed.)  Prentice-Hall International, Inc., N.J]

 

Use um teste t para averiguar se há razões para o floricultor acreditar que o novo fertilizante produz um maior crescimento em altura da espécie que o tradicionalmente utilizado. Formule as hipóteses do teste, não se esqueça de verificar a vigência das premissas do método e tire uma conclusão. Quais os valores do estatístico t e da probabilidade que lhe está associada?

3.      No decurso de um estudo destinado a comparar diversos métodos de amostragem de solos, analisam-se para o teor de K2O (em mg por 100 g de terra seca) 20 amostras recolhidas individualmente e, por outro lado, 10 amostras compósitas, obtidas cada uma delas mediante a mistura de 25 amostras individuais:

Amostras individuais

Amostras compósitas

0.80       1.28

0.96

0.84       1.40

1.00

0.88       1.48

1.04

0.88       1.48

1.04

0.92       1.48

1.08

0.92       1.52

1.08

1.00       1.56

1.08

1.04       1.88

1.16

1.20       1.92

1.20

1.24       2.20

1.28

 

Verifique se os dados obtidos satisfazem os requisitos teóricos necessários para efectivar um teste t para a hipótese segundo a qual os dois processos de amostragem conduzem, em média, aos mesmos resultados, contra a alternativa de conduzirem a resultados diferentes. Quais os valores do estatístico t e da probabilidade que lhe está associada? Chegaria a uma conclusão idêntica para o teste se ignorasse a diferença de variâncias existente entre as duas populações?

[P. Dagnelie  (1975). Théorie et Méthodes Statistiques. (Vol 2.)  Les Presses Agronomiques de Gembloux, Gembloux, Belgique]

4.      Mediu-se a altura (h) de um lote de 12 árvores por dois métodos: (i) com a árvore em pé, no local de implantação e (ii) com a árvore no solo, depois de abatida.

 

Árvore

h (de pé)

h (no chão)

Árvore

h (de pé)

h (no chão)

1

20.4

21.7

7

28.7

29.5

2

25.4

26.3

8

29.0

32.0

3

25.6

26.8

9

29.8

30.9

4

25.6

28.1

10

30.5

32.3

5

26.6

26.2

11

30.9

32.3

6

28.6

27.3

12

31.1

31.7

 

[P. Dagnelie  (1975). Théorie et Méthodes Statistiques. (Vol 2.)  Les Presses Agronomiques de Gembloux, Gembloux, Belgique]

 

Suspeita-se que o método de medição in loco das árvores subestima a sua real altura. As amostras são independentes ou associadas? Realize o teste t apropriado e tire uma conclusão. Quais os valores do estatístico t e da probabilidade que lhe está associada?

 

Soluções

1.         

a)      Teste unilateral direito.

b)      t=0,774; probabilidade=0,232.

c)      Não.

d)      IC0,95 (m)= 25,238<m<36,247. Como m0=29,0 não pertençe a IC0,95 (m), não podemos rejeitar H0.

 

2.        O teste é unilateral. Os dados são normalmente distribuídos e as variâncias são iguais (F=0,004; p=0,948). O novo fertilizante é superior ao actualmente em uso: t=-2,988;p=0,0045.

3.        O teste é bilateral. Os dados são normalmente distribuídos e as variâncias são diferentes (F=12,711; p=0,001). Os dois métodos de amostragem não conduzem aos mesmos resultados: t’=2,163; gl’»23; p=0,041. Se não se assimisse a igualdade das variâncias, t=1,580, gl=28, p=0,125; não se poderia rejeitar H0.

4.        As amostras não são independentes porque em cada um dos indivíduos (árvores) são obtidas duas medidas (altura de pé/altura depois de abatida). Trata-se de um cado de amostras emparelhadas. O teste é unilateral. O método de medição in loco subestima a altura das árvores: t=-3,234, p=0,004.

 

Back to Top

Trabalho Prático 04

Estatística Experimental

 Trabalho Prático nº 4: Análise de Variância

  

SPSSÒ

Analyse ® Compare Means ® One-Way Anova

Analyse ® General Linear Model ® Univariate

 

Resolva cada uma das questões seguintes:

1.      utilizando uma calculadora

2.      utilizando o SPSSÒ

 

1.      Fez-se um estudo destinado a comparar os efeitos de seis inóculos de bactérias fixadoras sobre o teor de azoto presente em plantas de trevo vermelho. Cinco dos inóculos (3DOk1, 3DOk4, 3DOk5, 3DOk7 e 3DOk13) eram culturas de Rhizobium trifolii, que é característico do trevo vermelho, e o sexto era uma cultura compósita de 5 linhagens de Rhizobium meliloti, típico da luzerna. Cinco plantas da espécie foram, de forma aleatória, inoculadas com cada um dos 6 inóculos (tratamentos). A experiência foi realizada numa estufa com condições controladas, usando o delineamento experimental completamente aleatorizado, com 5 vasos (réplicas) por tratamento, e a variável medida foi o teor de N em mg planta-1.

 

Inóculos

Vasos

3DOk1

3DOk5

3DOk4

3DOk7

3DOk13

Compósita

1

29.4

22.8

17.0

20.7

16.3

14.3

2

32.6

23.8

19.4

22.0

16.4

19.4

3

27.0

25.0

19.1

20.5

11.8

19.1

4

32.1

25.2

11.9

19.8

11.6

14.9

5

33.0

21.3

15.8

22.5

14.2

20.8

 

[ R. G. D. Steel & J. H. Torrie (1980). Principles and Procedures of Statistics. (2nd Ed.) McGraw-Hill International Editions, N.Y.]

 

a)      Utilize uma ANOVA ao nível a=0,05 para testar a hipótese da igualdade das médias dos 6 tratamentos (inóculos). Não se esqueça de verificar se os dados cumprem os requisitos teóricos de aplicabilidade do procedimento estatístico que utilizou (Aparecem dados atípicos em algum dos grupos experimentais? As populações a comparar são normalmente distribuídas? Há grandes diferenças entre elas no tocante à variabilidade da variável de resposta? O diagrama de caixa dos tratamentos sugere a existência de diferenças significativas entre as médias?).

b)      Utilize os métodos de Duncan e de Tukey para realizar todas as comparações múltiplas de médias dos tratamentos. Faça no fim uma reflexão comparativa dos resultados que obteve pelos dois métodos. Qual é o teste mais “conservador”?

 

2.      Como parte de um projecto de investigação mais amplo sobre a qualidade nutritiva de genótipos de aveia, fez-se um ensaio de campo com seis cultivares da espécie (A,B,C, D, E e F). Com a finalidade de controlar o efeito de um gradiente de fertilidade detectado no terreno de implantação do ensaio, foi adoptado um delineamento experimental de blocos completos casualisados, com seis blocos (I, II, III, IV, V e VI). As cultivares foram aleatoriamente atribuídas às seis parcelas que integram cada bloco. O plano de campo do ensaio (com os valores da proteína no grão em percentagem do peso seco entre parênteses) foi o seguinte:

 

A

(19.09)

 

D

(18.05)

 

C

(17.38)

 

B

(17.57)

 

E

(15.97)

 

C

(17.88)

 

D

(17.50)

 

B

(17.88)

 

A

(20.31)

 

D

(17.64)

 

B

(16.72)

 

F

(21.58)

 

E

(16.25)

 

F

(21.37)

 

E

(15.88)

 

A

(19.60)

 

D

(17.38)

 

E

(16.66)

 

B

(16.28)

 

C

(18.17)

 

B

(16.88)

 

F

(21.22)

 

C

(16.34)

 

A

(20.10)

 

F

(21.09)

 

A

(20.29)

 

D

(17.59)

 

C

(17.53)

 

F

(21.09)

 

B

(17.32)

 

C

(16.31)

 

E

(16.92)

 

F

(21.38)

 

E

(14.78)

 

A

(18.62)

 

D

(18.04)

 

I

 

II

 

III

 

IV

 

V

 

VI

 

¾¾¾¾¾¾¾¾¾¾¾¾¾¾¾¾¾¾¾¾¾¾¾¾¾¾®

Gradiente

 

[ G. K. Bhattacharyya & R. A. Johnson (1977). Statistical Concepts and Methods. John Wyle & Sons, N.Y.]

 

a)      Teste a hipótese de os teores proteicos médios das cultivares serem iguais assumindo que se trata de um delineamento completamente casualisado (isto é, ignorando a organização do ensaio em blocos), não deixando de verificar a vigência das premissas do método que utilizou. Que conclusões se podem tirar nesta fase da análise estatística? Tome nota dos valores do coeficiente de determinação e do quadrado médio residual da ANOVA. Realize comparações emparelhadas das médias com a=0.001, utilizando o teste de Duncan.

b)      Teste agora a hipótese da igualdade das médias incluindo todas as variáveis no modelo (isto é, assumindo a organização do ensaio em blocos completos casualizados). Realize comparações emparelhadas das médias das cultivares com a=0.001, utilizando o teste de Duncan. Que conclusões tira da ANOVA em BCC? Tome nota dos valores do coeficiente de determinação e do quadrado médio residual da ANOVA em Blocos e compare-os com os da ANOVA do delineamento completamente casualisado: a inclusão do factor Blocos foi vantajosa ou prejudicial para a precisão da análise? Comente a diferença de resultados do teste de Duncan obtidos em a) e em b).

 

3.      Três variedades de tomateiro (Harvester, Ife nº1 e Pusa Early Dwarf) e quatro densidades de plantação (10, 20, 30 e 40 milhares de plantas por hectare) foram consideradas para a produção de tomate numa certa região agrícola. Para averiguar de que modo quer a cultivar quer a densidade de plantação afectam a produção, cada uma das combinações possíveis variedade-densidade foi testada em três parcelas de terreno. Registaram-se os seguintes dados:

 

 

Densidade (plantas/hectare)

Variedade

10000

20000

30000

40000

 

10.5

12.8

12.1

10.8

Harvester

9.2

11.2

12.6

9.1

 

7.9

13.3

14.0

12.5

 

8.1

12.7

14.4

11.3

Ife nº 1

8.6

13.7

15.4

12.5

 

10.1

11.5

13.7

14.5

 

16.1

16.6

20.8

18.4

Pusa Early Dwarf

15.3

19.2

18.0

18.9

 

17.5

18.5

21.0

17.2

 

[J. L. Devore (1995). Probability and Statistics for the Engineering and the Sciences. Duxbury Press, CA]

 

a)      Calcule as médias das 12 combinações possíveis dos níveis dos dois factores e utilize-as para fazer os dois gráficos seguintes: 1º) resposta da produção às densidades de plantação, para cada uma das variedades e 2º) resposta da produção às variedades, para cada uma das densidades de plantação. Estes gráficos sugerem-lhe a existência de uma interacção entre os dois factores?

b)      Teste a significância da interacção variedade x densidade, tomando a=0,05. Explique.

c)      Teste a existência de diferenças significativas entre variedades, tomando a=0,05.

d)      Teste a existência de diferenças significativas entre densidades de plantação, tomando a=0,05.

e)      Caso tenha encontrado diferenças significativas em c) e d), realize comparações múltiplas de médias pelos testes de Duncan e de Tukey.

f)        Qual é a combinação variedade-densidade que assegura maiores produções de tomate para a região?

 

4.      Realizou-se uma experiência para estudar o efeito da temperatura da solução (três temperaturas: T1, T2 e T3) e do tempo de exposição (três exposiçõess: e1, e2 e e3) sobre absorção de uma substância química por parte de uma material exposto à solução. Registaram-se os seguintes dados:

 

Quantidade de substância absorvida (mg)

 

 

Temperatura (º C)

Exposição (minutos)

T1

T2

T3

 

35.5

91.2

70.1

E1

29.7

100.7

64.1

 

31.5

82.4

70.1

 

52.5

71.0

79.4

E2

53.3

77.0

77.7

 

55.0

75.6

75.1

 

85.9

87.0

83.0

E3

85.2

86.1

87.0

 

80.2

88.1

78.5

         

 [J.S. Milton & J. C. Arnold (1986). Probability and Statistics in the Engineering and Computing Sciences. McGraw-Hill International Editions, N.Y.]

 

a)      Calcule as médias das 9 combinações possíveis dos níveis dos dois factores e utilize-as para fazer os dois gráficos seguintes: 1º) resposta da absorção ao tempo de exposição, para cada uma das temperaturas e 2º) resposta da absorção à temperatura, para cada um dos tempos de exposição. Estes gráficos sugerem-lhe a existência de uma interacção entre os dois factores?

b)      Teste a significância da interacção temperatura x tempo de exposição, tomando a=0,05. Explique o significado da interacção.

c)      Teste a existência de diferenças significativas entre temperaturas, tomando a=0,05. Caso as encontre, compare-as pelo teste de Duncan.

d)      Teste a existência de diferenças significativas entre tempos de exposição, tomando a=0,05. Caso as encontre, compare-os pelo teste de Duncan.

e)      Quais é a combinação temperatura-tempo de exposição que assegura a maior absorção da substância pelo material ? E a que assegura a menor absorção?

f)        Faça um estudo mais pormenorizado da interacção significativa que encontrou. Mediante ANOVA’s a um critério e o teste de Duncan, analise os efeitos simples de cada factor dentro de cada um dos níveis do outro (isto é, veja se há diferenças entre os tempos de exposição em cada uma das três temperaturas e se há diferenças entre as temperaturas em cada um dos três tempos de exposição).

 

 

Soluções

1.         

a)      Não se detectam “outliers”,  nem há desvios significativos da normalidade em nenhum dos seis grupos. O diagrama de caixa indicia a existência de diferenças significativas entre as médias dos tratamentos. As variâncias são homogéneas. A ANOVA confirma que há diferenças significativas entre as médias: F=32,324, com 5/24 graus de liberdade, p=0,000.

b)      Teste de Duncan

 

3DOk13

(14,060)

3DOk4

(16,640)

Compósita

(17,700)

3DOk7

(21,100)

3DOk5

(23,620)

3DOk1

(30,820)

 

 

 

 

 

 

 

 

 

 

 

 

Teste de Tukey

 

3DOk13

(14,060)

3DOk4

(16,640)

Compósita

(17,700)

3DOk7

(21,100)

3DOk5

(23,620)

3DOk1

(30,820)

 

 

 

 

 

 

 

 

 

 

 

 

 

O Teste de Tukey é mais “conservador”, porque declara menos diferenças de médias como sendo significativamente diferentes.

 

2.         

a)      Não se detectam “outliers”,  nem há desvios significativos da normalidade em nenhum dos seis grupos. O diagrama de caixa indicia a existência de diferenças significativas entre as médias dos tratamentos. As variâncias são homogéneas. A ANOVA confirma que há diferenças significativas entre as médias: F=62,831, com 5/30 graus de liberdade, p=0,000. O quadrado médio do erro é igual a 0,354 e o coeficiente de determinação a 0,913. Os resultados do teste de Duncan  são:

E

(16,077)

B

(17,108)

C

(17,268)

D

(17,700)

A

(19,668)

F

(21,288)

 

 

 

 

 

 

 

 

 

 

 

 

 

b)         Há diferenças significativas entre as médias dos blocos: F=6,183, com 5/25 graus de liberdade, p=0,001. Há diferenças significativas entre as médias das cultivares: F=117,01, com 5/25 graus de liberdade, p=0,000.O quadrado médio do erro é igual a 0,190 e o coeficiente de determinação a 0,961. Os resultados do teste de Duncan são:

E

(16,077)

B

(17,108)

C

(17,268)

D

(17,700)

A

(19,668)

F

(21,288)

 

 

 

 

 

 

 

 

 

 

 

 

A inclusão do factor Blocos aumentou a precisão da análise estatística dos resultados do ensaio: o quadrado médio do erro foi reduzido em mais de 50% e o coeficiente de determinação aumentou ligeiramente. A remoção da variação devida à heterogeneidade do solo tornou possível perceber que a variedade E tem teores proteicos inferiores às variedades B e C, aspecto que não era perceptível em a).

 

 

3.         

a)      Não parece haver uma interacção significativa entre os dois factores: as linhas poligonais de cada um dos dois gráficos são sensivelmente paralelas.

b)      A interacção variedade x densidade não é estatisticamente significativa: F=0,845, com 6/24 graus de liberdade e p= 0,548.

c)      Há diferenças significativas entre as variedades: F=103,343, com 2/24 graus de liberdade e p= 0,000.

d)      Há diferenças significativas entre as densidades de plantação: F=18,231, com 3/24 graus de liberdade e p= 0,000.

e)      Teste de Duncan (variedades)

 

H

(11,333)

I

(12,208)

P

(18,125)

 

 

 

 

 

 

Teste de Tukey (variedades)

 

 

H

(11,333)

I

(12,208)

P

(18,125)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Teste de Duncan (densidades)

 

10

(11,476)

40

(13,911)

20

(14,389)

30

(15,778)

 

 

 

 

 

 

 

 

Teste de Tukey (densidades)

 

10

(11,476)

40

(13,911)

20

(14,389)

30

(15,778)

 

 

 

 

 

f)        As maiores produções de tomate na área são obtidas com a variedade Pusa Early Dwarf, utilizando uma densidade de 30000 plantas/ha (19,933).

 4.         

a)      Os gráficos indiciam a presença de uma interacção significativa entre os dois factores: as linhas poligonais exibem afastamentos notórios do paralelismo, chegando mesmo a intersectar-se.

b)      A interacção variedade x densidade é estatisticamente significativa: F=40,702, com 4/18 graus de liberdade e p= 0,000. Isto significa que a resposta da absorção a uma temperatura varia consoante o tempo de exposição do material que foi considerado, e vice-versa.

c)      Há diferenças significativas entre as temperaturas: F=110,577, com 2/18 graus de liberdade e p= 0,000. O teste de Duncan indica-nos que T1<T2<T3.

d)      Há diferenças significativas entre os tempos de exposição: F=63,591, com 2/18 graus de liberdade e p= 0,000. O teste de Duncan indica-nos que E1<E2<E3.

e)      A maior absorção verifica-se à combinação T2-E1: 91,433 mg. A menor absorção verifica-se à combinação T1-E1: 32,233 mg.

f)        Fixando as temperaturas:

Temperaturas

Resultados do teste de Duncan

T1

E1 < E2 < E3

T2

E1 < (E2 = E3)

T3

E1 < (E2 = E3)

 

Fixando os tempos de exposição:

Tempos

Resultados do teste de Duncan

E1

T1 < T2 < T3

E2

T1 < (T2 = T3)

E3

T1 = T2 = T3

Back to Top

Trabalho Prático 05

Estatística Experimental

 Trabalho Prático nº 5: Regressão e Correlação

 

SPSSÒ

Analyse ® Regression ® Linear

Analyse ® Correlate ® Bivariate

   

1.      Fizeram-se determinações da concentração do azoto proteico solúvel e da concentração de clorofila em 7 folhas da variedade de arroz  IR22:

 

N solúvel (mg/folha)

Clorofila (mg/folha)

0,84

0,55

1,24

1,24

2,10

1,56

2,64

2,52

1,31

1,64

1,22

1,17

0,19

0,04

  [K. A. Gomez & A. A. Gomez (1984). Statistical Procedures for Agricultural Research. (2nd Ed.) Jonh Wiley & Sons, Inc., N.Y.]

 

Utilizando uma calculadora:

a)      Calcule as estimativas de mínimos quadrados do declive e da intercepção da recta de regressão populacional apropriada para fazer predições da concentração foliar de azoto com base na respectiva concentração de clorofila. Escreva a equação da recta de regressão.

b)      Explique o significado do coeficiente de regressão b nesta situação concreta.

c)      Teste a adequação do modelo de regressão, utilizando um teste t ou um teste F.

d)      Qual é a percentagem da variação ocorrente na variável de resposta (concentração de N) que é explicada pela variável preditora (concentração de clorofila)? Que nome tem?

e)      Calcule o valor da concentração de N que o modelo prediz para uma folha cuja concentração de clorofila é igual a 0,98 mg. É legitimo utilizar a equação de regressão para predizer  a concentração de N corresponde a uma concentração de clorofila de 5,5 mg/folha? Porquê?

f)        Calcule o coeficiente de correlação de Pearson e averigue a sua significância.

 

2.      Fez-se uma investigação num fitotrão para estudar a resposta da taxa de fotossíntese da Larrea tridentata à irradiância, à concentração ambiental de CO2 e à resistência da folha à difusão do vapor de água. Os dados obtidos encontram-se num ficheiro SPSSÒ de nome “eatp5-1.sav”.

[ R. G. D. Steel & J. H. Torrie (1980). Principles and Procedures of Statistics. (2nd Ed.) McGraw-Hill International Editions, N.Y.]

 a)      Abra o ficheiro de dados no SPSSÒ  e obtenha os diagramas de dispersão da taxa de fotossíntese (variável  fotos) relativamente à irradiância (variável par), à concentração ambiental de CO2 (variável co2) e à resistência da folha à difusão do vapor de água (variável resfolha). A resposta da fotossíntese a cada uma das três variáveis parece ser de natureza linear?

b)      Estime os coeficientes de correlação entre a taxa de fotossíntese e cada uma das outras três variáveis (irradiância, concentração de CO2 e resistência da folha à difusão do vapor de água). Quais destas estão positiva e significativamente correlacionadas com a taxa de fotossíntese? E negativa e significativamente correlacionadas com ela? Qual a variável mais fortemente correlacionada com a taxa de fotossíntese?

c)      Efectue análises de regressão especificando a taxa de fotossíntese como variável de resposta e, sucessivamente, a irradiância, a concentração ambiental de CO2 e a resistência da folha à difusão do vapor de água como variáveis preditoras. Para cada uma delas, escreva a equação de regressão, indique e interprete os valores do declive, da intercepção e do coeficiente de determinação e conclua sobre a significância (adequação) dos modelos lineares.

d)      Estabeleça a recta de regressão dos mínimos quadrados adequada para predizer os valores da taxa de fotossíntese com base, simultaneamente, nos valores da irradiância, da concentração ambiental de CO2 e da resistência da folha à difusão do vapor de água (regressão linear múltipla, modelo com três variáveis preditoras). Quais são os valores do coeficiente de determinação e da probabilidade deste modelo linear? O modelo é melhor ou pior que os modelos de predição baseados individualmente em cada uma das variáveis?

 

Soluções

1.         

a)      Declive: b=0,949; intercepção: a=0,180. Equação: y=0,180+0,949x.

b)      Por cada variação unitária (isto é, de 1mg) na concentração de clorofila é de esperar, em média, uma variação de 0,949 mg na concentração foliar de N.

c)      t=6,417, com 5 graus de liberdade e p=0,001 ou F=41,181, com 1/5 graus de liberdade e p=0,001 indicam que o modelo de regressão linear ajustado é apropriado para fazer predições da [N] com base em [clorofila].

d)      Aproximadamente 89% de variação explicada (r2=0,892). Coeficiente de determinação.

e)      Para [Clorofila]=0,98 mg, a recta de regressão estima em [N]=1,11 mg. Não é legítimo porque o valor 5,5 mg está for a do intervalo de variação amostral da variável preditora (entre 0,04 e 2,52 mg).

f)        r=0,944 com p=0,001: a correlação entre as duas variáveis é estatísticamente significativa.

 

2.         

b)      r(fotos, par)=0,814, p=0,000; r(fotos, co2)=-0,548, p=0,005 e r(fotos, resfolha)=-0,717, p=0,000. A irradiância está positiva e significativamente correlacionada com a taxa de fotossíntese; a concentração de CO2 e a resistência da folha à difusão do vapor de água estão negativa e significativamente correlacionadas com a taxa de fotossíntese. A irradiância é a variável mais fortemente correlacionada com a taxa de fotossíntese.

c)      Fotos=429,020+0,471 par, r2=0,663; F=45,273, com 1/23 graus de liberdade e p=0,000. Fotos=3211,803-4,006 co2, r2=0,300; F=9,855, com 1/23 graus de liberdade e p=0,005. Fotos=1284,267-0,226 resfolha, r2=0,514; F=24,363, com 1/23 graus de liberdade e p=0,000.

d)      Fotos=150,623-0,415 par+1,036 co2-0,154 resfolha, r2=0,858; F=42,303, com 3/21 graus de liberdade e p=0,000. A regressão múltipla é melhor que quaquer das regressões individuais, com o modelo a explicar cerca de 86% da variação da variável de resposta.

 

Back to Top

Author information goes here.
Copyright © 2001  [OrganizationName]. All rights reserved.
Revised: 09/04/03.