Statistical tool for data analysis: R software commands

Authors

DOI:

https://doi.org/10.14295/bjs.v1i9.155

Keywords:

Position measures, Dispersion measures, Test for normality, Test for homoscedasticity, Kruskal-Wallis test

Abstract

With technological advancement, data analysis has become a less arduous task. However, many researchers, teachers and students have difficulties in the analysis and interpretation of data from their academic activities and research. Thus, the objective of this article is to present the main commands of the R software for descriptive and exploratory analysis, comparison of means and validation of the assumptions of the tests used to analyze sensory data from the article proposed by Teixeira et al. (2020). It is worth noting that the objective of this article is to present the concepts, in a succinct way, of the tests used in the article by Teixeira et al. (2020) and the respective R software commands.

Author Biographies

Daniele de Brito Trindade, Instituto Federal de Educação, Ciência e Tecnologia Baiano, Guanambi, Brasil

Professora EBTT do Instituto Federal de Educação, Ciência e Tecnologia Baiano (IF Baiano) - campus Guanambi. Professora colaboradora do Mestrado Profissional Produção Vegetal no Semiárido (MPPVS) do Instituto Federal de Educação, Ciência e Tecnologia Baiano (IF Baiano) - campus Guanambi. Líder do GPEAHIL_IFBaiano: Grupo de Pesquisa e Extensão em Análise, Histórico e Identidades das Licenciaturas do IF Baiano. Membro do Núcleo de Estudos Afro-Brasileiros e Indígenas (NEABI) do IF Baiano - campus Guanambi. Graduada no curso de Bacharelado em Estatística pela Universidade Federal da Bahia (UFBA), em 2011. Mestra em Estatística pela Universidade Federal de Pernambuco (UFPE), em 2014. Doutora em Estatística pela Universidade Federal de Pernambuco (UFPE), em 2018.

Natália dos Santos Teixeira, Instituto Federal de Educação, Ciência e Tecnologia Baiano, Guanambi, Brasil

Possui graduação em Tecnologia em Agroindústria pelo Instituto Federal de Educação, Ciência e Tecnologia Baiano Campus Guanambi (2019). , atuando principalmente nos seguintes temas: doenças veiculas por alimentos, capacitação, comercialização, micro-organismos e hortaliças.

luzia almeida couto, Universidade Estadual de Santa Cruz, Ilhéus, Brasil

Graduada no curso superior de Tecnologia em Agroindústria, no Instituto Federal de Educação, Ciência e Tecnologia Baiano - Campus Guanambi. Tenho experiência na área de Microbiologia Geral, Microbiologia de Alimentos, Análises Físico-químicas de Alimentos e Estatística Básica, áreas que atuei como monitora durante a graduação. Realizei trabalhos com ênfase em Ciência e Tecnologia de Alimentos. Pós-graduanda em Biologia Celular e Molecular pela Faculdade Venda Nova do Imigrante (FAVENI). Mestranda em Genética e Biologia Molecular na Universidade Estadual de Santa Cruz (UESC).

Jéssica Souza Coqueiro

Graduada do curso de Tecnologia em Agroindústria no Instituto Federal de Educação, Ciência e Tecnologia Baiano - Campus Guanambi. Participou do grupo de monitoria do laboratório de Bromatologia Vegetal desta instituição, com experiência na área de ciência, tecnologia e análise de alimentos. Pós-graduanda em Vigilância Sanitária e Qualidade dos Alimentos pela Faculdade Venda Nova do Imigrante (FAVENI) e Mestranda em Engenharia e Ciência de Alimentos pela Universidade Estadual do Sudoeste da Bahia (UESB).

References

Adriano, N. A. (2007). O retorno acionário como fator determinante da estrutura de capital das empresas brasileiras de capital aberto. Disponível em: https://repositorio.unb.br/handle/10482/3706. Acesso em: 17 jul. 2022.

Alcântara, M, Freitas-Sá, D. G. C. (2018). Metodologias sensoriais descritivas mais rápidas e versáteis – uma atualidade na ciência sensorial. Brazilian Journal of Food Technology, 21. DOI: https://doi.org/10.1590/1981-6723.17916

Anderson, T. W., Darling, D. A. (1954). A Test for Goodness of Fit. J. Amer. Statist. Ass., 49, 765-769. DOI: https://doi.org/10.1080/01621459.1954.10501232

Associação Brasileira de Normas Técnicas – ABNT (1993). Análise sensorial dos alimentos e bebidas: terminologia. 8 pp.

Barbetta, P. A., Reis, M. M., Bornia, A. C. (2010). Estatística Para Cursos de Engenharia e Informática. Editora. Atlas 3º Ed.

Bartlett, M. S. (1937). Properties of sufficiency and statistical tests. Proceedings of the Royal Society, Series A, 160, 268–282. DOI: https://doi.org/10.1098/rspa.1937.0109

Carpinetti, L. C. R. (2009). Planejamento e análise de experimentos. Disponível em: http://repositorio.eesc.usp.br/handle/RIEESC/6043. Acesso em: 17 jul. 2022.

Conceicão, M. J. (2008). Leitura crítica dos dados estatísticos em trabalhos científicos. Revista Brasileira Cirurgia Cardiovascular, 23(3). DOI: https://doi.org/10.1590/S0102-76382008000300018

Conover, W. J., Johnson, E. M., Johnson, M. M. (1981). A Comparative Study of Tests for Homogeneity of Variances, With Applications to the Outer Continental Shelf Bidding Data. Technometrics, 23, 351-361. DOI: https://doi.org/10.1080/00401706.1981.10487680

Dallal, G. E., Wilkinson, L. (1986). "An Analytic Approximation to the Distribution of Lilliefors's Test Statistic for Normality". The American Statistician, 40(4), 294-296. DOI: https://doi.org/10.1080/00031305.1986.10475419

Da Rocha, K. R., Júnior, A. J. B. (2018). Anova medidas repetidas e seus pressupostos: análise passo a passo de um experimento. Revista Eletrônica Perspectivas da Ciência e Tecnologia-ISSN: 1984-5693, 10, 29. DOI: https://doi.org/10.22407/1984-5693.2018.v10.p.29-51

Dunn, O. J. (1961). Multiple comparisons among means. Journal of the American Statistical Association, 56, 52–64. DOI: https://doi.org/10.1080/01621459.1961.10482090

Dunn, O. J. (1964). Multiple comparisons using rank sums. Technometrics, 6, 241–252. DOI: https://doi.org/10.1080/00401706.1964.10490181

Ferreira, P. L. (2005). Estatística descritiva e inferencial: breves notas. Disponível em: https://estudogeral.uc.pt/handle/10316/9961. Acesso em 17 jul. 2022.

Garcia-Marques, T. (1997). A hipótese de estudo determina a anális e estatística: Um exemplo com o modelo ANOVA. Análise Psicológica, 15(1), 19-28.

Kolmogorov, A. (1933). «Sulla determinazione empirica di una legge di distribuzione». Giornale dell'istituto italiano degli attuari. 4, 83-91.

Kruskal, W. H., WALLIS, W. A. Use of ranks in one criterion variance analysis. Journal of the American Statistical Association, v. 47, p. 583-621, 1952. DOI: https://doi.org/10.1080/01621459.1952.10483441

Leotti, V. B., Coster, R., Riboldi, J. Normalidade de variáveis: métodos de verificação e comparação de alguns testes não-paramétricos por simulação. Revista HCPA, 32(2), 227-234.

Levene, H. (1960). Contributions to Probability and Statistics: Essays in Honor of Harold Hotelling, I. Olkin et al. eds., Stanford University Press, pp. 278-292.

Lilliefors, H. W. (1967). On the Kolmogorov-Smirnov Test for Normality with Mean and Variance Unknown". Journal of the American Statistical Association, 62(318), 399–402. DOI: https://doi.org/10.1080/01621459.1967.10482916

Lilliefors, H. W. (1969). On the Kolmogorov-Smirnov Test for the Exponential Distribution with Mean Unknown. Journal of the American Statistical Association, 64(325), 387–389. DOI: https://doi.org/10.1080/01621459.1969.10500983

Morettin, P. A., Bussab, W. de O. Estatística Básica. Saraiva, 5ª Ed, 2004.

Moraes, M. A. C. M. (1993). Métodos para avaliação sensorial dos alimentos. 8.ed. Campinas: UNICAMP. 93 p. (Série Manuais).

Neto, A. A. H., Stein, C. E. (2003). Uma Abordagem dos Testes não Paramétricos com Utilização do Excel. Disponível em: http://www.mat.ufrgs.br/~viali/estatistica/mat2282/material/textos/artigo_11_09_ 2003.pdf. Acesso em 22 mai. 2020.

Paulino, C. D., Da Motta Singer, J. Análise de dados categorizados. Editora Blucher, 2006.

Royston, J. P. (1982). An extension of Shapiro and Wilk's W test for normality to large samples. Journal of the Royal Statistical Society: Series C (Applied Statistics), 31(2), 115-124. DOI: https://doi.org/10.2307/2347973

Ritter, M. N., They, N. H., Konzen, E. (2019). Introdução ao software estatístico R. Universidade Federal do Rio Grande do Sul - UFRGS campus Litoral Norte, Imbé. Disponível em: http://professor.ufrgs.br/sites/default/files/matiasritter/files/apostila_introducao_ao_r_-_ritter_they_and_konzen.pdf. Acesso em 30 jun. 2020.

Rossini, K., Anzanello, M. J., Fogliatto, F. S. (2012). Seleção de atributos em avaliações sensoriais descritivas. Produção, 22, 380-390. DOI: https://doi.org/10.1590/S0103-65132012005000032

Silva, F. de A. S., Azevedo, C. A. V. de. (2009). Principal components analysis in the software Assistat-Statistical Attendance. In: World Congress on Computers in Agriculture, 7., 2009, Orlando. Proceedings... Reno, NV: American Society of Agricultural and Biological Engineers.

Sousa, M. H. de, Silva, N. N. da. (2000). Comparação de softwares para análise de dados de levantamentos complexos. Revista Saúde Pública, 34(6). DOI: https://doi.org/10.1590/S0034-89102000000600013

Shapiro, S. S., Wilk, M. B. (1965). Testing The Normality of Several Samples. (Unpublished Manuscript).

Smirnov, N. (1948). «Table for Estimating the Goodness of Fit of Empirical Distributions». The Annals of Mathematical Statistics, 19(2), 279–281. DOI: https://doi.org/10.1214/aoms/1177730256

Silva, F. de A. S.; Azevedo, C. A. V. de. (2006). A new version of the Assistat -Statistical Assistance Software. In: World Congress on Computers in Agriculture, 4, 2006, Orlando. Proceedings... Reno, RV: American Society of Agricultural and Biological Engineers, 393-396.

Spiegel, M. R., Stephens, L., Nascimento, J. L. (2009). Estatística. Schaum. Bookman.

Teixeira, L. V. (2009). Análise Sensorial na Indústria de Alimentos. Revista da Instituto de Laticínios “Cândido Tostes”, 366, 12-21.

Teixeira, N. S., Trindade, D. B., Abrantes, M. F., Santos, H. C., Souza, M. T. D. (2020). Elaboração, análise descritiva e análise sensorial de biscoito nutritivo com poupa de maracujá (Passiflora edulis). Global Science and Technology, 13(1), 182-197.

Venables, W. N., Smith, D. M. (2005). R DEVELOPMENT CORE TEAM. An Introduction to R. Notes on R: Programming Environment for Data Analysis and Graphics. Version 2.2.0. Áustria.

Xavier, L. H., Dias, C. T. S. (2001). Acurácia do modelo univariado para análise de medidas repetidas por simulação multidimensional. Scientia Agricola, 58(2), 241-250. DOI: https://doi.org/10.1590/S0103-90162001000200005

Published

2022-09-01

How to Cite

Trindade, D. de B., Teixeira, N. dos S., almeida couto, L. A., & Coqueiro, J. S. (2022). Statistical tool for data analysis: R software commands. Brazilian Journal of Science, 1(9), 70–84. https://doi.org/10.14295/bjs.v1i9.155