Type: | Package |
Title: | Pacote Para Analise Multivariada |
Version: | 0.5.0 |
Description: | Package with multivariate analysis methodologies for experiment evaluation. The package estimates dissimilarity measures, builds dendrograms, obtains MANOVA, principal components, canonical variables, etc. (Pacote com metodologias de analise multivariada para avaliação de experimentos. O pacote estima medidas de dissimilaridade, construi de dendogramas, obtem a MANOVA, componentes principais, variaveis canonicas, etc.) |
Imports: | PCAmixdata,magrittr, NbClust, factoextra, gridExtra, rstudioapi, candisc, biotools,corrplot,ggdendro,plotly, crayon,ecodist, ggplot2,methods |
License: | GPL-3 |
Encoding: | UTF-8 |
LazyData: | false |
RoxygenNote: | 7.2.2 |
Language: | pt-BR |
NeedsCompilation: | no |
Packaged: | 2024-04-08 18:01:43 UTC; AlcineiAzevedo |
Author: | Alcinei Mistico Azevedo
|
Maintainer: | Alcinei Mistico Azevedo <alcineimistico@hotmail.com> |
Repository: | CRAN |
Date/Publication: | 2024-04-08 18:40:03 UTC |
Suggests: | rmarkdown, knitr |
VignetteBuilder: | knitr |
Analise de variancia considerando clusters
Description
Esta funcao retorna o resultado da analise de variancia considerando clusters formados por diferentes metodos como dendrograma, kmeans, Tocher, etc.
Usage
AnovaCluster(Cluster,Dados=Dados,design=design,test="Pillai")
Arguments
Cluster |
Vetor contendo os grupos que cada individuo/tratamento pertence. Veja os exemplos. |
Dados |
Matriz contendo os dados para execucao da analise. Para cada modelo o conjunto de dados precisa estar organizado de uma forma apropriada:
|
design |
Valor numerico indicando o delineamento:
|
test |
Nome do teste que se deseja utilizar na manova ("Pillai", "Wilks", "Hotelling-Lawley" ou "Roy"). |
Value
A funcao retorna a ANOVA, para todas as variaveis considerando os clustes criados.
References
PlayList "Curso de Analise Multivariada": https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR
CRUZ, C.D. and CARNEIRO, P.C.S. Modelos biometricos aplicados ao melhoramento genetico. 3nd Edition. Vicosa, UFV, v.2, 2014. 668p. (ISBN: 8572691510)
FERREIRA, D.F. Estatistica Multivariada. (2018) 3ed. UFLA. 624p. (ISBN 13:978 8581270630)
HAIR, J.F. Multivariate Data Analysis. (2016) 6ed. Pearson Prentice HalL. (ISBN 13:978 0138132637)
See Also
Examples
#######################################################
#######################################################
#Dados sem repeticoes considerando o Kmeans
data(Dados.MED)
Km=Kmeans(Dados = Dados.MED,design = 1,nclusters = 4)
AnovaCluster(Cluster = Km$Classe,Dados=Dados.MED,design = 1)
#Dados sem repeticoes considerando o Tocher
dist=Distancia(Dados = Dados.MED,Metodo = 3)
TO=Tocher(Dist = dist)
TO
AnovaCluster(Cluster = TO$Classe,Dados=Dados.MED,design = 1)
#Dados sem repeticoes considerando o Dendrograma
Dendro=Dendrograma(Dissimilaridade = dist,corte="Frey")
Dendro
AnovaCluster(Cluster = Dendro$Classe,Dados=Dados.MED,design = 1)
#######################################################################
#######################################################################
#DIC considerando o Kmeans
data(Dados.DIC)
N=Kmeans_NumeroOtimo2(Dados = Dados.DIC,design = 2)
Km=Kmeans(Dados = Dados.DIC,design = 3,nclusters = N$ClusterNumber)
Km$predict
AnovaCluster(Cluster = Km$Classe,Dados=Dados.DIC,design = 2)
#DIC considerando o Tocher
m=MANOVA(Dados.DIC,Modelo=1)
dist=Distancia(Dados = m$Med,Metodo = 3)
TO=Tocher(Dist = dist)
TO
AnovaCluster(Cluster = TO$Classe,Dados=Dados.DIC,design = 2)
#DIC considerando o Dendrograma
Dendro=Dendrograma(Dissimilaridade = dist,corte="Frey")
Dendro
AnovaCluster(Cluster = Dendro$Classe,Dados=Dados.DIC,design = 2)
#######################################################################
#######################################################################
#DBC considerando o Kmeans
data(Dados.DBC)
n=Kmeans_NumeroOtimo2(Dados = Dados.DBC,design = 3)
Km=Kmeans(Dados = Dados.DBC,design = 3,nclusters = n$ClusterNumber)
Km$predict
AnovaCluster(Cluster = Km$Classe,Dados=Dados.DBC,design = 3)
#DBC considerando o Tocher
m=MANOVA(Dados.DBC,Modelo=2)
dist=Distancia(Dados = m$Med,Metodo = 3)
TO=Tocher(Dist = dist)
dist
TO
AnovaCluster(Cluster = TO$Classe,Dados=Dados.DBC,design = 3)
#DBC considerando o Dendrograma
Dendro=Dendrograma(Dissimilaridade = dist,corte="Mcclain")
Dendro$Classe
AnovaCluster(Cluster = Dendro$Classe,Dados=Dados.DBC,design = 3)
#######################################################################
#######################################################################
#DQL considerando o Kmeans
data(Dados.DQL)
n=Kmeans_NumeroOtimo2(Dados = Dados.DQL,design = 4)
Km=Kmeans(Dados = Dados.DQL,design = 4,nclusters = n$ClusterNumber)
Km$predict
AnovaCluster(Cluster = Km$Classe,Dados=Dados.DQL,design = 4)
#DQL considerando o Tocher
m=MANOVA(Dados.DQL,Modelo=2)
dist=Distancia(Dados = m$Med,Metodo = 3)
dist
TO=Tocher(Dist = dist)
TO
AnovaCluster(Cluster = TO$Classe,Dados=Dados.DQL,design = 4)
#DQL considerando o Dendrograma
Dendro=Dendrograma(Dissimilaridade = dist,corte="Dunn")
Dendro$Classe
AnovaCluster(Cluster = Dendro$Classe,Dados=Dados.DQL,design = 4)
#######################################################################
#######################################################################
#Fat duplo em dic considerando o Kmeans
data("Dados.Fat2.DIC")
n=Kmeans_NumeroOtimo2(Dados = Dados.Fat2.DIC,design = 5)
Km=Kmeans(Dados = Dados.Fat2.DIC,design = 5,nclusters = n$ClusterNumber)
Km$predict
AnovaCluster(Cluster = Km$Classe,Dados=Dados.Fat2.DIC,design = 5)
#Fat2.DIC considerando o Tocher
m=MANOVA(Dados.Fat2.DIC,Modelo=4)
dist=Distancia(Dados = m$Med,Metodo = 3)
TO=Tocher(Dist = dist)
TO$Classe
AnovaCluster(Cluster = TO$Classe,Dados=Dados.Fat2.DIC,design = 5)
#Fat2.DIC considerando o Dendrograma
Dendro=Dendrograma(Dissimilaridade = dist,corte="Dunn")
Dendro$Classe
AnovaCluster(Cluster = Dendro$Classe,Dados=Dados.Fat2.DIC,design = 5)
#######################################################################
#######################################################################
#Fat duplo em dbc considerando o Kmeans
data("Dados.Fat2.DBC")
n=Kmeans_NumeroOtimo2(Dados = Dados.Fat2.DBC,design = 6)
Km=Kmeans(Dados = Dados.Fat2.DBC,design = 5,nclusters = n$ClusterNumber)
Km$predict
AnovaCluster(Cluster = Km$Classe,Dados=Dados.Fat2.DBC,design = 5)
#Fat2.DBC considerando o Tocher
m=MANOVA(Dados.Fat2.DBC,Modelo=5)
dist=Distancia(Dados = m$Med,Metodo = 3)
TO=Tocher(Dist = dist)
TO$Classe
AnovaCluster(Cluster = TO$Classe,Dados=Dados.Fat2.DBC,design = 5)
#Fat2.DBC considerando o Dendrograma
Dendro=Dendrograma(Dissimilaridade = dist,corte="Cindex")
Dendro$Classe
AnovaCluster(Cluster = Dendro$Classe,Dados=Dados.Fat2.DBC,design = 6)
ApplyDissimilaridade
Description
Esta funcao pode ser utilizado para experimentos com dados qualitativos cujos individuos que compoe cada tratamento possuem valores diferentes. Desta forma, obtem se o a porcentagem de cada classificao para os tratamentos.
Usage
ApplyDissimilaridade(Dados,Factor)
Arguments
Dados |
Matriz contendo os dados qualitativos. Nesta matriz deve conter apenas os dados qualitativos. Nao pode ter a identificacao de tratamentos, blocos, etc. |
Factor |
Vetor com os niveis a partir dos quais se pretende obter as porcentagem de cada classificacao. |
Value
A funcao retorna a porcentagem de cada classificao referente aos dados qualitativos para os tratamentos.
References
PlayList "Curso de Analise Multivariada": https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR
CRUZ, C.D. and CARNEIRO, P.C.S. Modelos biometricos aplicados ao melhoramento genetico. 3nd Edition. Vicosa, UFV, v.2, 2014. 668p. (ISBN: 8572691510)
FERREIRA, D.F. Estatistica Multivariada. (2018) 3ed. UFLA. 624p. (ISBN13:9788581270630)
HAIR, J.F. Multivariate Data Analysis. (2016) 6ed. Pearson Prentice HalL. (ISBN13:9780138132637)
See Also
Examples
data(Dados.FMI.Quali)
DadosQuali=ApplyDissimilaridade(Dados.FMI.Quali[,6:10],Dados.FMI.Quali[,2])
Dist=Distancia(DadosQuali,1)
Dist
Dendo=Dendrograma(Dist, 3)
Dendo
Componentes principais
Description
Esta funcao possibilita o estudo dos componentes principais.
Usage
ComponentesPrincipais(D,
padronizar=TRUE,
layout=8,
cols=c(1,2),
xlab="PCA 1",
ylab="PCA 2",
CR=TRUE,
CorPlot=TRUE,
CorCol="red",
VarCol="blue",
Perc=0.1,
NomeTrat=NULL,
NomeVar=NULL,
bty="L")
Arguments
D |
Matriz com os valores para obtencao dos componentes principais.Esta matriz deve conter os valores observados, sendo as variaveis respostas na coluna. Esta matriz nao deve conter a identificacao dos tratamentos na primeira coluna. Se provir de experimento com repeticao, a matriz deve conter apenas as medias dos tratamentos. |
padronizar |
Se for TRUE (default) os dados serao padronizados para ter media 0 e variancia igual a 1. Se for FALSE os componentes principais considerarao os valores originais. |
layout |
Deve ser um numero variando de 1 a 9. Para cada numero teremos um layout diferente. |
cols |
vetor contendo dois numeros indicando os componentes principais que serao utilizados na representacao bidimencional. Default = c(1,2). |
xlab |
Nome do eixo X do grafico de componentes principais. |
ylab |
Nome do eixo Y do grafico de componentes principais. |
CR |
Valor logico.Se for TRUE aparecera a contribuicao relativa dos dois primeiros componentes principais no grafico. |
CorPlot |
Valor logico. Se for TRUE sera apresentado no grafico as correlacoes. |
CorCol |
Indica a cor das setas referente a apresentacao das correlacoes no grafico (default = "red"). |
VarCol |
Cor do nome das variavies na dispersao grafica da correlacao. |
Perc |
Valor entre 0 e 1 indicando o recuo dos eixos. |
NomeTrat |
vetor contendo o nome dos tratamentos/individuos. Se for igual a NULL sera considerado o nome das linhas do objeto D (conjunto de dados) |
NomeVar |
Vetor contendo o nome das variaveis resposta. Se for igual a NULL sera considerado o nome das colunas do objeto D (conjunto de dados) |
bty |
Deve receber um character indicando o tipo de borda desejado no grafico:
|
Value
Esta funcao retorna informacoes importantes para o estudo de componentes princiapais. Sao apresentados autovalores e autovetores da matriz de covariancia, Escores dos componentes principais, correlacao entre as variaveis e eos escores, contribuicao na explicacao de cada componente e o grafico de dispersao dos CPs.
References
PlayList "Curso de Analise Multivariada": https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR
CRUZ, C.D. and CARNEIRO, P.C.S. Modelos biometricos aplicados ao melhoramento genetico. 3nd Edition. Vicosa, UFV, v.2, 2014. 668p. (ISBN: 8572691510)
FERREIRA, D.F. Estatistica Multivariada. (2018) 3ed. UFLA. 624p. (ISBN 13:978 8581270630)
HAIR, J.F. Multivariate Data Analysis. (2016) 6ed. Pearson Prentice HalL. (ISBN 13:978 0138132637)
See Also
Examples
data(Dados.MED)
ComponentesPrincipais(Dados.MED)
#Atribuindo nome aos tratamentos
Trat=paste("T_",1:nrow(Dados.MED),sep="")
ComponentesPrincipais(Dados.MED,NomeTrat = Trat)
ComponentesPrincipais(Dados.MED,NomeTrat = Trat,layout=1)
ComponentesPrincipais(Dados.MED,NomeTrat = Trat,layout=2)
ComponentesPrincipais(Dados.MED,NomeTrat = Trat,layout=3)
ComponentesPrincipais(Dados.MED,NomeTrat = Trat,layout=4)
ComponentesPrincipais(Dados.MED,NomeTrat = Trat,layout=5)
ComponentesPrincipais(Dados.MED,NomeTrat = Trat,layout=6)
ComponentesPrincipais(Dados.MED,NomeTrat = Trat,layout=7)
ComponentesPrincipais(Dados.MED,NomeTrat = Trat,layout=8)
ComponentesPrincipais(Dados.MED,NomeTrat = Trat,layout=9)
ComponentesPrincipais(Dados.MED,NomeTrat = Trat,CorPlot = FALSE)
ComponentesPrincipais(Dados.MED,NomeTrat = Trat,CorPlot = TRUE,
CorCol = "blue",VarCol="red" )
ComponentesPrincipais(Dados.MED,NomeTrat = Trat,CorPlot = TRUE,bty = "n")
Componentes principais para dados mistos (qualitativos e quantitativos)
Description
Esta funcao possibilita o estudo dos componentes principais considerando dados quantitativos e qualitativos simultaneamente.
Usage
ComponentesPrincipais.Misto(Dados,
plot="all",
NomeTrat=NULL,
NomeVar=NULL)
Arguments
Dados |
Dataframe com os valores para obtencao dos componentes principais.Esta matriz deve conter os valores observados, sendo as variaveis respostas na coluna. Esta matriz nao deve conter a identificacao dos tratamentos na primeira coluna. Ha a opcao de colocar o nomes nas linhas para a representacao grafica. Obrigatoriamente, as colunas com as variaveis quantitivas devem ser do tipo "numeric" ou "integer". Ja as colunas com valores dos dados qualitativos devem ser do tipo "logic", "character" ou "factor. |
plot |
Indica o tipo de grafico desejado:
|
NomeTrat |
vetor contendo o nome dos tratamentos/individuos. Se for igual a NULL sera considerado o nome das linhas do objeto D (conjunto de dados) |
NomeVar |
Vetor contendo o nome das variaveis resposta. Se for igual a NULL sera considerado o nome das colunas do objeto D (conjunto de dados) |
Value
Esta funcao retorna informacoes importantes para o estudo de componentes princiapais considerando dados quantitativos e qualitativos simultaneamente.
References
PlayList "Curso de Analise Multivariada": https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR
Package PCAmix: https://cran.r-project.org/web/packages/PCAmixdata/vignettes/PCAmixdata.html
CRUZ, C.D. and CARNEIRO, P.C.S. Modelos biometricos aplicados ao melhoramento genetico. 3nd Edition. Vicosa, UFV, v.2, 2014. 668p. (ISBN: 8572691510)
FERREIRA, D.F. Estatistica Multivariada. (2018) 3ed. UFLA. 624p. (ISBN 13:978 8581270630)
HAIR, J.F. Multivariate Data Analysis. (2016) 6ed. Pearson Prentice HalL. (ISBN 13:978 0138132637)
See Also
Examples
data("Dados.Misto")
NomeTrat=paste("Trat",1:nrow(Dados.Misto),sep="_")
ComponentesPrincipais.Misto(Dados.Misto,NomeTrat = NomeTrat)
ComponentesPrincipais.Misto(Dados.Misto,NomeTrat = NomeTrat,plot = "individuos")
ComponentesPrincipais.Misto(Dados.Misto,NomeTrat = NomeTrat,plot = "correlacao")
Contribuicao das variaveis independentes para o agrupamento
Description
Esta funcao retorna a contribuicao relativa entre as variaveis independentes no agrupamento formado pelo metodo Tocher, Kmeans ou Dendrograma.
Usage
ContribuicaoRelativa(obj,layout=2,theme="default")
Arguments
obj |
Objeto que se obtem como saida pelas funcoes 'Dendrograma()', 'Tocher()' ou 'Kmeans()'. |
layout |
variavel numerica que indica o layout do grafico. Os valores podem variar entre 1 e 5. |
theme |
Tema utilizado para o graficos do 'ggplot2' (Ex.:theme_gray(), theme_bw(), theme_linedraw(), theme_light(), theme_dark(), theme_minimal(), theme_classic(), theme_void(), theme_test()). |
Value
A funcao retorna a contribuicao das variaveis independentes no agrupamento.
References
PlayList "Curso de Analise Multivariada": https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR
CRUZ, C.D. and CARNEIRO, P.C.S. Modelos biometricos aplicados ao melhoramento genetico. 3nd Edition. Vicosa, UFV, v.2, 2014. 668p. (ISBN: 8572691510)
FERREIRA, D.F. Estatistica Multivariada. (2018) 3ed. UFLA. 624p. (ISBN 13:978 8581270630)
HAIR, J.F. Multivariate Data Analysis. (2016) 6ed. Pearson Prentice HalL. (ISBN 13:978 0138132637)
See Also
Kmeans
, Kmeans_NumeroOtimo2
, ContribuicaoRelativa
Examples
#Dados sem repeticao considerando o metodo Kmeans
data("Dados.MED")
Dados=Dados.MED
rownames(Dados)=paste("Genotipo",1:10,sep="_")
no=Kmeans_NumeroOtimo2(Dados,design=1,Metodo = 2)
km=Kmeans(Dados,design=1,nclusters=no$ClusterNumber)
km$predict
ContribuicaoRelativa(km,layout = 2)
#Dados de experimento em dic considerando o dendrograma
data("Dados.DIC")
m=MANOVA(Dados = Dados.DIC,Modelo = 1)
dist=Distancia(Dados=m$Med,Metodo =7,Cov = m$CovarianciaResidual)
Dendro=Dendrograma(Dissimilaridade = dist,corte = "Dunn")
#Dados de experimento em dbc
data("Dados.DBC")
Kmeans_NumeroOtimo(Dados=Dados.DBC,design=3,nboot=100,method="silhouette",NumMax=NULL)
Kmeans(Dados=Dados.DBC,design=3,nclusters=2,iter.max = 20,nstart = 1,
algorithm = "Hartigan-Wong")
#Dados de experimento em DQL
data("Dados.DQL")
Kmeans_NumeroOtimo(Dados=Dados.DQL,design=4,nboot=100,method="silhouette",NumMax=NULL)
Kmeans(Dados=Dados.DQL,design=4,nclusters=2,iter.max = 20,nstart = 1,
algorithm = "Hartigan-Wong")
#Dados de experimento em Esquema fatorial em DIC
data("Dados.Fat2.DIC")
Kmeans_NumeroOtimo(Dados=Dados.Fat2.DIC,design=5,nboot=100,method="silhouette",NumMax=NULL)
Kmeans(Dados=Dados.Fat2.DIC,design=5,nclusters=2,iter.max = 20,nstart = 1,
algorithm = "Hartigan-Wong")
#Dados de experimento em Esquema fatorial em DBC
data("Dados.Fat2.DBC")
Kmeans_NumeroOtimo(Dados=Dados.Fat2.DBC,design=6,nboot=100,method="silhouette",NumMax=NULL)
Kmeans(Dados=Dados.Fat2.DBC,design=6,nclusters=2,iter.max = 20,nstart = 1,
algorithm = "Hartigan-Wong")
Estudo de coordenadas principais
Description
Esta funcao possibilita o estudo dos coordenadas principais.
Usage
CoordenadasPrincipais(Dist, layout = 1,
main = NULL, NomeTrat = NULL, xlab = "PCoA 1", ylab ="PCoA 2",
ColVars = c(1, 2), CR = TRUE, Perc = 0.01, plot = TRUE)
Arguments
Dist |
Matriz com as medidas de dissimilaridade. |
layout |
Deve ser um numero variando de 1 a 8. Para cada numero teremos um layout diferente. |
main |
Titulo do grafico. |
NomeTrat |
Nome dos tratamentos. |
xlab |
Nome do eixo x no grafico. |
ylab |
Nome do eixo y no grafico. |
ColVars |
Numero dos eixos que se pretende apresentar no grafico. O padrao e 'c(1,2)'. |
CR |
Valor logico (TRUE ou FALSE) indicando se aparecera no grafico a contriuicao relativa de cada eixo. |
Perc |
Valor entre 0 e 1 indicando o recuo dos eixos. |
plot |
Valor logico.Se for TRUE o grafico sera apresentado. |
Value
Esta funcao retorna informacoes importantes para o estudo de coordenadas principais.
References
PlayList "Curso de Analise Multivariada": https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR
Cailliez, F. (1983) The analytical solution of the additive constant problem. Psychometrika, 48, 305–308.
CRUZ, C.D. and CARNEIRO, P.C.S. Modelos biometricos aplicados ao melhoramento genetico. 3nd Edition. Vicosa, UFV, v.2, 2014. 668p. (ISBN: 8572691510)
FERREIRA, D.F. Estatistica Multivariada. (2018) 3ed. UFLA. 624p. (ISBN 13:978 8581270630)
Paradis, E.; Schliep, K. ape 5.0: an environment for modern phylogenetics and evolutionary analyses in R. (2019) Bioinformatics. 526-528.
HAIR, J.F. Multivariate Data Analysis. (2016) 6ed. Pearson Prentice HalL. (ISBN 13:978 0138132637)
Lingoes, J. C. (1971) Some boundary conditions for a monotone analysis of symmetric matrices. Psychometrika, 36, 195–203.
See Also
Examples
#Exemplo com dados Quantitativos
data("Dados.MED")
Dist=Distancia(Dados.MED,Metodo=5)
CoordenadasPrincipais(Dist)
#Compare os resultados com os componentes principais
ComponentesPrincipais(Dados.MED,padronizar = TRUE)
#Exemplo com dados Qualitativos
data=data("Dados.CAT")
Dist=Distancia(Dados.CAT,Metodo=10)
CoordenadasPrincipais(Dist)
Estimacao da correlacao e significancia pelo metodo Mantel.
Description
Esta funcao faz a correlacao entre matrizes e estima sua significancia pelo teste Mantel.
Usage
CorrelacaoMantel(Mat1,Mat2,
nperm=999,
alternativa="bilateral",
Plot=TRUE,
xlab="Dist1",
ylab="Dist2",
bty="l")
Arguments
Mat1 |
Objeto contendo a matriz de dissimilaridade. A matriz deve ser quadrada e simetrica. Ou um objeto do tipo 'dist'. |
Mat2 |
Objeto contendo a matriz de dissimilaridade. A matriz deve ser quadrada e simetrica. Ou um objeto do tipo 'dist'. |
nperm |
Numero de permutacoes para identificar a signficancia pelo metodo de Mantel |
alternativa |
Character indicando a hipotese alternativa considerada. Pode ser:
|
Plot |
Valor logico (TRUE ou FALSE) indicando se aparecera o grafico de correlacao entre as matriz cofenetica e de dissimilaridade |
xlab |
nome do eixo x do grafico |
ylab |
nome do eixo y do grafico |
bty |
deve receber um character indicando o tipo de borda desejado no grafico.
|
Value
A funcao retorna resultados do teste Tocher.
References
PlayList "Curso de Analise Multivariada": https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR
Cruz, C.D.; Ferreira, F.M.; Pessoni, L.A. (2011) Biometria aplicada ao estudo da diversidade genetica. Visconde do Rio Branco: Suprema.
Rao, R.C. (1952) Advanced statistical methods in biometric research. New York: John Wiley & Sons.
Sharma, J.R. (2006) Statistical and biometrical techniques in plant breeding. Delhi: New Age International. Silva, A.R. & Dias, C.T.S. (2013) A cophenetic correlation coefficient for Tocher's method. Pesquisa Agropecuaria Brasileira, 48:589-596.
Vasconcelos, E.S.; Cruz, C.D.; Bhering, L.L.; Resende Junior, M.F.R. (2007) Alternative methodology for the cluster analysis. Pesquisa Agropecuaria Brasileira, 42:1421-1428.
Examples
data(Dados.MED)
#Distancia euclidiana.
Mat1=Distancia(Dados.MED,1)
#Quadrado da distancia euclidiana padronizada media (Dados Quantitativos)".
Mat2=Distancia(Dados.MED,6)
CorrelacaoMantel(Mat1,Mat2)
Dados de exemplo (Dados binarios).
Description
Exemplo com um conjunto de dados binarios.
Usage
data(Dados.BIN)
Format
Um data frame com 5 observacoes e 9 variaveis (Cruz et al. 2014).
Author(s)
Alcinei Mistico Azevedo: alcineimistico@hotmail.com
References
PlayList "Curso de Analise Multivariada": <https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR>
Cruz et al., 2014. Modelos biometricos aplicados ao melhoramento de genetico. Vol3. editora UFV. 668p.
Exemplo de dados qualitativos multicategoricos.
Description
Exemplo com um conjunto de dados com 13 variaveis resposta do tipo multicategorico para 9 individuos.
Usage
data(Dados.CAT)
Format
Um data frame com 9 observacoes e 13 variaveis.
Author(s)
Alcinei Mistico Azevedo: alcineimistico@hotmail.com
References
<https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR>
Dados de exemplo de um experimento em DBC.
Description
Exemplo simulado com um conjunto de dados de um experimento em DBC.
Usage
data(Dados.DBC)
Format
Um data frame com 45 observacoes e 11 variaveis. A primeira coluna a identificacao dos tratamentos, a segunda a identificacao de blocos e da terceira em diante as variaveis respostas (dependentes).
Author(s)
Alcinei Mistico Azevedo: alcineimistico@hotmail.com
References
<https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR>
Dados de exemplo de um experimento em DBC com dados quantitativos e mistos.
Description
Exemplo de parte de um exeperimento com clones batata-doce em DBC com dados quantitativos e qualitativos.
Usage
data(Dados.DBC.Misto)
Format
Um data frame. A primeira coluna a identificacao dos tratamentos, a segunda a identificacao de blocos e da terceira em diante as variaveis respostas (dependentes).
Author(s)
Alcinei Mistico Azevedo: alcineimistico@hotmail.com
References
<https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR>
Dados de exemplo de um experimento em DIC.
Description
Exemplo simulado com um conjunto de dados de um experimento no delineamento inteiramente casualizado
Usage
data(Dados.DIC)
Format
Um data frame com 30 observacoes e 9 variaveis. A primeira coluna tem a identificacao dos tratamentos, a segunda a identificacao das repeticoes e da terceira em diante as variaveis respostas (dependentes).
Author(s)
Alcinei Mistico Azevedo: alcineimistico@hotmail.com
References
<https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR>
Dados de exemplo de um experimento em DQL.
Description
Exemplo simulado com um conjunto de dados de um experimento em quadrados latino
Usage
data(Dados.DQL)
Format
Um data frame com 16 observacoes e 7 colunas. A primeira coluna tem a identificacao dos tratamentos, a segunda um vetor com a identificacao das linhas, a terceira coluna com a identificacao das colunas e da quarta em diante as variaveis respostas (dependentes).
Author(s)
Alcinei Mistico Azevedo: alcineimistico@hotmail.com
References
<https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR>
Exemplo de dados qualitativos multicategoricos em um experimento com progenies de meios irmaos.
Description
Exemplo de um experimento com progenies de meios irmaos de couve
Usage
data(Dados.FMI.Quali)
Format
Um data frame com 25925 observacoes e 10 variaveis.
Author(s)
Alcinei Mistico Azevedo: alcineimistico@hotmail.com
References
Brito et al. (2021). Genetic divergence between half-sibling progenies of kale using different multivariate approaches. Horticultura Brasileira 39: 178 185. <http://dx.doi.org/10.1590/s0102 0536 20210208>
Exemplo de dados quantitativos em um experimento com progenies de meios irmaos.
Description
Exemplo de um experimento com progenies de meios irmaos de couve
Usage
data(Dados.FMI.Quanti)
Format
Dataframe.
Author(s)
Alcinei Mistico Azevedo: alcineimistico@hotmail.com
References
Brito et al. (2021). Genetic divergence between half-sibling progenies of kale using different multivariate approaches. Horticultura Brasileira 39: 178 185. <http://dx.doi.org/10.1590/s0102 0536 20210208>
Dados de um experimento em esquema fatorial duplo conduzido em DBC.
Description
Exemplo com um conjunto de dados de um experimento em esquema fatorial duplo conduzido no delineamento em blocos casualizados.
Usage
data(Dados.Fat2.DBC)
Format
Um data frame com 38 observacoes e 14 colunas. A primeira coluna tem a identificacao do fator A, a segunda com a identificacao do fator B, a terceira coluna com a identificacao dos blocos e da quarta em diante as variaveis respostas (dependentes).
Author(s)
Alcinei Mistico Azevedo: alcineimistico@hotmail.com
References
<https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR>
Dados de um experimento em esquema fatorial duplo conduzido em DIC.
Description
Exemplo com um conjunto de dados de um experimento em esquema fatorial duplo conduzido em DIC.
Usage
data(Dados.Fat2.DIC)
Format
Um data frame com 36 observacoes e 7 colunas. A primeira coluna com a identificacao do fator A, a segunda com a identificacao do fator B, a terceira coluna com a identificacao das repeticoes e da quarta em diante as variaveis respostas (dependentes).
Author(s)
Alcinei Mistico Azevedo, alcineimistico@hotmail.com
References
<https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR>
Dados de um experimento em esquema fatorial triplo conduzido em DBC.
Description
Exemplo com um conjunto de dados de um experimento em esquema fatorial duplo conduzido no delineamento em blocos casualizados.
Usage
data(Dados.Fat3.DBC)
Format
Um data frame com 64 observacoes e 9 colunas. A primeira coluna tem a identificacao do fator A, a segunda com a identificacao do fator B, a terceira coluna com a identificacao do fator C, a quarta coluna com a identificacao dos blocos e da quinta em diante as variaveis respostas (dependentes).
Author(s)
Alcinei Mistico Azevedo: alcineimistico@hotmail.com
References
<https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR>
Dados de um experimento em esquema fatorial triplo conduzido em DIC.
Description
Exemplo com um conjunto de dados de um experimento em esquema fatorial duplo conduzido no delineamento em blocos casualizados.
Usage
data(Dados.Fat3.DBC)
Format
Um data frame. A primeira coluna tem a identificacao do fator A, a segunda com a identificacao do fator B, a terceira coluna com a identificacao do fator C, a quarta coluna com a identificacao das repeticoes e da quinta em diante as variaveis respostas (dependentes).
Author(s)
Alcinei Mistico Azevedo: alcineimistico@hotmail.com
References
<https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR>
Dados de um exemplo com variaveis quantitativas.
Description
Exemplo com um conjunto de dados com 7 variaveis resposta quantitativas para 10 individuos.
Usage
data(Dados.MED)
Format
Um data frame com 10 observacoes e 7 variaveis.
Author(s)
Alcinei Mistico Azevedo: alcineimistico@hotmail.com
References
<https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR>
Dados de exemplo de um experimento com dados mistos.
Description
Exemplo simulado com um conjunto de dados de um experimento com dados qualitativos binarios, multicategoricos e quantitativos.
Usage
data(Dados.Misto)
Format
Um data frame com 5 observacoes e 11 colunas.
Author(s)
Alcinei Mistico Azevedo: alcineimistico@hotmail.com
References
<https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR>
Dendrograma
Description
Esta funcao retorna a figura do Dendrograma, distancias feneticas e correlacao cofenetica.
Usage
Dendrograma(Dissimilaridade,
Metodo=3,
layout=2,
nperm=999,
Titulo="",
corte="Mojena1")
Arguments
Dissimilaridade |
Matriz contendo a estimativa das distancias entre tratamentos. |
Metodo |
Valor numerico indicando o metodo a ser utilizado:
|
layout |
Deve ser um numero variando de 1 a 10. Para cada numero teremos um layout diferente. |
nperm |
Numero de permutacoes do teste mantel para testar a significancia pelo teste Mantel. |
Titulo |
Texto com o titulo a ser apresentado no grafico |
corte |
Indica a metodologia considerada para estabelecer a linha de corte no Dendrograma:
|
Value
A funcao retorna o Dendrograma, distancias feneticas e correlacao cofenetica.
References
PlayList "Curso de Analise Multivariada": https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR
CRUZ, C.D. and CARNEIRO, P.C.S. Modelos biometricos aplicados ao melhoramento genetico. 3nd Edition. Vicosa, UFV, v.2, 2014. 668p. (ISBN: 8572691510)
FERREIRA, D.F. Estatistica Multivariada. (2018) 3ed. UFLA. 624p. (ISBN 13:978 8581270630)
HAIR, J.F. Multivariate Data Analysis. (2016) 6ed. Pearson Prentice HalL. (ISBN 13:978 0138132637)
MOJENA, R. Hierarquical grouping method and stopping rules: an evaluation. Computer Journal, v.20, p.359-363, 1977.
See Also
Examples
data(Dados.MED)
rownames(Dados.MED)=paste0("Treatment ",1:10)
Dist=Distancia(Dados.MED,2)
Dendrograma(Dist,Metodo = 2)
Dendrograma(Dist,2,layout =1,corte = "Mojena2")
Dendrograma(Dist,2,layout =2,corte="Cindex")
Dendrograma(Dist,2,layout =3,corte="Frey")
Dendrograma(Dist,2,layout =4,corte="Mcclain")
Dendrograma(Dist,2,layout =5,corte="Dunn")
Dendrograma(Dist,2,layout =6)
Dendrograma(Dist,2,layout =7,corte=3)
Dendrograma(Dist,2,layout =8)
Dendrograma(Dist,2,layout =9)
Dendrograma(Dist,2,layout =10,corte=2)
Determinacao do numero otimo de clusters no dendrograma
Description
Esta funcao retorna informacoes que auxilia na determinacao do numero de clusters a serem considerados no dendrograma.
Usage
Dendrograma_NumeroOtimo(Dissimilaridade,Metodo=3)
Arguments
Dissimilaridade |
Objeto criado pela funcao 'Distancia' |
Metodo |
Metodo Valor numerico indicando o metodo a ser utilizado:
|
Value
A funcao retorna o numero otimo de Clusters.
References
PlayList "Curso de Analise Multivariada": https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR
CRUZ, C.D. and CARNEIRO, P.C.S. Modelos biometricos aplicados ao melhoramento genetico. 3nd Edition. Vicosa, UFV, v.2, 2014. 668p. (ISBN: 8572691510)
FERREIRA, D.F. Estatistica Multivariada. (2018) 3ed. UFLA. 624p. (ISBN 13:978 8581270630)
HAIR, J.F. Multivariate Data Analysis. (2016) 6ed. Pearson Prentice HalL. (ISBN 13:978 0138132637)
See Also
Examples
data(Dados.MED)
rownames(Dados.MED)=paste0("Treatment ",1:10)
Dist=Distancia(Dados.MED,Metodo=3)
Dendrograma_NumeroOtimo(Dissimilaridade = Dist,Metodo = 3)
data("Dados.CAT")
Diss=Distancia(Dados = Dados.CAT,Metodo=10)
Dendrograma_NumeroOtimo(Dissimilaridade = Diss,Metodo = 5)
Distancia de dissimilaridade
Description
Esta funcao retorna a distancia de dissimilaridade.
Usage
Distancia(Dados,Metodo,Cov=NULL)
Arguments
Dados |
Matriz contendo os dados para calculo das distancias. Nas linhas devem estar os tratamentos, e nas colunas as variaveis respostas. Neste arquivo nao deve ter a identificacao dos tratamentos. |
Metodo |
Valor numerico indicando o metodo a ser utilizado:
|
Cov |
matriz quadrada e simetrica contendo as variancias e covariancias (residuais) entre as caracteristicas. Necessaria apenas para calculo da distancia de Mahalanobis. |
Details
Um problema do indice de Gower (Metodo = 21) e que quando as variaveis binarias (0 ou 1) indicam a presença ou ausencia de bandas a informação 0-0 (ausencia de bandas em ambos os individuos) indica que os dois individuos sao iguais, o que nao e verdade necessariamente. Caso queira desconsiderar essas informações (0-0) no computo da dissimilaridade, pode-se usar o "indice de Gower 2" (Metodo =22)).
Value
A funcao retorna a distancia estimada entre os tratamentos.
References
PlayList "Curso de Analise Multivariada": https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR
CRUZ, C.D. and CARNEIRO, P.C.S. Modelos biometricos aplicados ao melhoramento genetico. 3nd Edition. Vicosa, UFV, v.2, 2014. 668p. (ISBN: 8572691510)
FERREIRA, D.F. Estatistica Multivariada. (2018) 3ed. UFLA. 624p. (ISBN 13:978 8581270630)
HAIR, J.F. Multivariate Data Analysis. (2016) 6ed. Pearson Prentice HalL. (ISBN 13:978 0138132637)
See Also
Examples
data(Dados.MED)
##########> Dados quantitativos
#1 = Distancia euclidiana.
Distancia(Dados.MED,1)
#2 = Distancia euclidiana media.
Distancia(Dados.MED,2)
#3 = Quadrado da distancia euclidiana media.
Distancia(Dados.MED,3)
#4 = Distancia euclidiana padronizada.
Distancia(Dados.MED,4)
#5 = Distancia euclidiana padronizada media.
Distancia(Dados.MED,5)
#6 = Quadrado da distancia euclidiana padronizada media (Dados Quantitativos)".
Distancia(Dados.MED,6)
#7 = Distancia de Mahalanobis.
data(Dados.DBC)
m=MANOVA(Dados.DBC,2)
Med=apply(Dados.DBC[, -c(1:2)],2,function(x) tapply(x,as.factor(Dados.DBC[,1]),mean))
CRE=m$CovarianciaResidual
Distancia(Med,7,CRE)
#8 = Distancia de Cole Rodgers.
Distancia(Dados.MED,8)
######################>Dados qualitativos: binarios ou multicategoricos
#9 = Frequencia de coincidencia.
data(Dados.CAT)
Distancia(Dados.CAT,9)
#10 = Frequencia de discordancia.
Distancia(Dados.CAT,10)
data(Dados.BIN)
Distancia(Dados.BIN,10)
#11 = indice Inverso de 1+coincidencia > 1/(1+c)
Distancia(Dados.CAT,11)
##############################>Dados qualitativos binarios
data(Dados.BIN)
#12 = Dissimilaridade de Jacard.
Distancia(Dados.BIN,12)
#13 = Dissimilaridade de Sorensen Dice.
Distancia(Dados.BIN,13)
# 14 = Dissimilaridade de Sokal e Sneath: 1-2(a+d)/(2(a+d)+b+c)
Distancia(Dados.BIN,14)
#15 = Dissimilaridade de Roger e Tanimoto: 1-(a+d)/(a+2(b+c)+d)
Distancia(Dados.BIN,15)
#16 = Dissimilaridade de Russel e Rao: 1-a/(a+b+c+d).
Distancia(Dados.BIN,16)
#17 = Dissimilaridade de Ochiai: 1-a/sqrt((a+b)(a+c)).
Distancia(Dados.BIN,17)
#18 = Dissimilaridade de Ochiai II: 1-ab/sqrt((a+b)(a+c)(b+d)(c+d)).
Distancia(Dados.BIN,18)
#19 = Dissimilaridade de Haman: 1-((a+d)-(b+c))/(a+b+c+d).
Distancia(Dados.BIN,19)
#20 = Dissimilaridade de Yule: 1-(ad-bc)/(ad+bc).
Distancia(Dados.BIN,20)
#' ##################>Dados mistos (quantitativos, binarios e multicategoricos)
data(Dados.Misto)
Distancia(Dados.Misto,21)
Grafico de calor para a interpretacao do Dendrograma
Description
Esta funcao apresenta um mapa de calor junto com o Dendrograma.
Usage
HeatPlot(Dendo,Col=NULL,layout=1,cut=1000)
Arguments
Dendo |
Objeto criado pela funcao 'Dendrograma'. |
Col |
Paleta de cores. Veja os exemplos. |
layout |
Deve ser um numero variando de 1 a 3. Para cada numero teremos um layout diferente. |
cut |
Valor do corte no dendrograma para o estabelecimento de cluster. |
References
PlayList "Curso de Analise Multivariada": https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR
CRUZ, C.D. and CARNEIRO, P.C.S. Modelos biometricos aplicados ao melhoramento genetico. 3nd Edition. Vicosa, UFV, v.2, 2014. 668p. (ISBN: 8572691510)
FERREIRA, D.F. Estatistica Multivariada. (2018) 3ed. UFLA. 624p. (ISBN 13:978 8581270630)
HAIR, J.F. Multivariate Data Analysis. (2016) 6ed. Pearson Prentice HalL. (ISBN 13:978 0138132637)
See Also
Examples
################################################
####################################
#PlotHeat
#Distancia euclidiana
data("Dados.MED")
dist=Distancia(Dados.MED,Metodo = 3)
dist
Dendo=Dendrograma(dist)
HeatPlot(Dendo)
#Distancia Mahalanobis
data("Dados.DBC")
m=MANOVA(Dados.DBC,Modelo = 2)
m
dist=Distancia(m$Med,Cov=m$CovarianciaResidual,Metodo = 7)
dist
Dendo=Dendrograma(dist)
HeatPlot(Dendo)
col0 = colorRampPalette(c('white', 'cyan', '#007FFF', 'blue','#00007F'))
col1 = colorRampPalette(c('#7F0000', 'red', '#FF7F00', 'yellow', 'white',
'cyan', '#007FFF', 'blue','#00007F'))
col2 = colorRampPalette(c('#67001F', '#B2182B', '#D6604D', '#F4A582',
'#FDDBC7', '#FFFFFF', '#D1E5F0', '#92C5DE',
'#4393C3', '#2166AC', '#053061'))
col3 = colorRampPalette(c('red', 'white', 'blue'))
col4 = colorRampPalette(c('#7F0000', 'red', '#FF7F00', 'yellow', '#7FFF7F',
'cyan', '#007FFF', 'blue', '#00007F'))
HeatPlot(Dendo,Col=col1)
HeatPlot(Dendo,Col=col3)
HeatPlot(Dendo,Col=col4)
#Dados binarios
data("Dados.BIN")
Dist=Distancia(Dados.BIN,Metodo=12)
Dist
Dend=Dendrograma(Dist)
HeatPlot(Dend)
HeatPlot(Dend,Col=col3)
#Dados cat
data("Dados.CAT")
row.names(Dados.CAT)=paste0("T",1:nrow(Dados.CAT))
Dist=Distancia(Dados.CAT,Metodo=10)
Dist
Dend=Dendrograma(Dist)
HeatPlot(Dend)
Agrupamento K-means
Description
Esta funcao retorna clusters pelo metodo kmeans a partir de uma matriz com dados quantitativos.
Usage
Kmeans(Dados,design=1,nclusters=4,iter.max = 10,nstart = 1,algorithm = "Hartigan-Wong")
Arguments
Dados |
Matriz contendo os dados para execucao da analise. Para cada modelo o conjunto de dados precisa estar organizado de uma forma apropriada:
|
design |
Valor numerico indicando o delineamento:
|
nclusters |
numero desejado de cluster. |
iter.max |
numero de iteracoes permitidas. |
nstart |
numero de conjuntos aleatorios a serem escolhidos. |
algorithm |
Metodo desejado para o agrupamento kmeans:
|
Value
A funcao retorna o numero otimo de clusters a ser considerado no metodo kmeans.
References
PlayList "Curso de Analise Multivariada": https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR
CRUZ, C.D. and CARNEIRO, P.C.S. Modelos biometricos aplicados ao melhoramento genetico. 3nd Edition. Vicosa, UFV, v.2, 2014. 668p. (ISBN: 8572691510)
FERREIRA, D.F. Estatistica Multivariada. (2018) 3ed. UFLA. 624p. (ISBN 13:978 8581270630)
HAIR, J.F. Multivariate Data Analysis. (2016) 6ed. Pearson Prentice HalL. (ISBN 13:978 0138132637)
See Also
Kmeans
, Kmeans_NumeroOtimo2
, ContribuicaoRelativa
Examples
#Dados sem repeticao
data("Dados.MED")
Dados=Dados.MED
rownames(Dados)=paste("Genotipo",1:10,sep="_")
Kmeans_NumeroOtimo(Dados,design=1,nboot=100,method="silhouette",NumMax=NULL)
Kmeans(Dados,design=1,nclusters=3,iter.max = 10,nstart = 1,
algorithm = "Hartigan-Wong")
#Dados de experimento em dic
data("Dados.DIC")
Kmeans_NumeroOtimo(Dados=Dados.DIC,design=2,nboot=100,method="silhouette",NumMax=NULL)
Kmeans(Dados=Dados.DIC,design=2,nclusters=2,iter.max = 20,nstart = 1,
algorithm = "Hartigan-Wong")
#Dados de experimento em dbc
data("Dados.DBC")
Kmeans_NumeroOtimo(Dados=Dados.DBC,design=3,nboot=100,method="silhouette",NumMax=NULL)
Kmeans(Dados=Dados.DBC,design=3,nclusters=2,iter.max = 20,nstart = 1,
algorithm = "Hartigan-Wong")
#Dados de experimento em DQL
data("Dados.DQL")
Kmeans_NumeroOtimo(Dados=Dados.DQL,design=4,nboot=100,method="silhouette",NumMax=NULL)
Kmeans(Dados=Dados.DQL,design=4,nclusters=2,iter.max = 20,nstart = 1,
algorithm = "Hartigan-Wong")
#Dados de experimento em Esquema fatorial em DIC
data("Dados.Fat2.DIC")
Kmeans_NumeroOtimo(Dados=Dados.Fat2.DIC,design=5,nboot=100,method="silhouette",NumMax=NULL)
Kmeans(Dados=Dados.Fat2.DIC,design=5,nclusters=2,iter.max = 20,nstart = 1,
algorithm = "Hartigan-Wong")
#Dados de experimento em Esquema fatorial em DBC
data("Dados.Fat2.DBC")
Kmeans_NumeroOtimo(Dados=Dados.Fat2.DBC,design=6,nboot=100,method="silhouette",NumMax=NULL)
Kmeans(Dados=Dados.Fat2.DBC,design=6,nclusters=2,iter.max = 20,nstart = 1,
algorithm = "Hartigan-Wong")
Numero otimo de clusters
Description
Esta funcao retorna o numero otimo de clusters para o metodo kmeans considerando dieferentes criterios. @name Kmeans_NumeroOtimo
Usage
Kmeans_NumeroOtimo(Dados,design=1,nboot=100,method="silhouette",NumMax=NULL)
Arguments
Dados |
Matriz contendo os dados para execucao da analise. Para cada modelo o conjunto de dados precisa estar organizado de uma forma apropriada:
|
design |
Valor numerico indicando o delineamento:
|
nboot |
numero de reamostragens desejadas para o metodo bootstrap. |
method |
Criterio utilizado para a estimacao do numero otimo de clusters. Pode-se utilizar as seguintes opcoes:
|
NumMax |
Numero maximo de clustes a ser considerado (Obs: Deve ser no minimo 2). |
Value
A funcao retorna o numero otimo de clusters a ser considerado no metodo kmeans.
References
PlayList "Curso de Analise Multivariada": https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR
CRUZ, C.D. and CARNEIRO, P.C.S. Modelos biometricos aplicados ao melhoramento genetico. 3nd Edition. Vicosa, UFV, v.2, 2014. 668p. (ISBN: 8572691510)
FERREIRA, D.F. Estatistica Multivariada. (2018) 3ed. UFLA. 624p. (ISBN 13:978 8581270630)
HAIR, J.F. Multivariate Data Analysis. (2016) 6ed. Pearson Prentice HalL. (ISBN 13:978 0138132637)
See Also
Kmeans
, Kmeans_NumeroOtimo2
, ContribuicaoRelativa
Examples
#Dados sem repeticao
data("Dados.MED")
Dados=Dados.MED
rownames(Dados)=paste("Genotipo",1:10,sep="_")
Kmeans_NumeroOtimo(Dados,design=1,nboot=100,method="silhouette",NumMax=NULL)
Kmeans(Dados,design=1,nclusters=3,iter.max = 10,nstart = 1,
algorithm = "Hartigan-Wong")
#Dados de experimento em dic
data("Dados.DIC")
Kmeans_NumeroOtimo(Dados=Dados.DIC,design=2,nboot=100,method="wss",NumMax=NULL)
Kmeans(Dados=Dados.DIC,design=2,nclusters=2,iter.max = 20,nstart = 1,
algorithm = "Hartigan-Wong")
#Dados de experimento em dbc
data("Dados.DBC")
Kmeans_NumeroOtimo(Dados=Dados.DBC,design=3,nboot=100,method="gap_stat",NumMax=NULL)
Kmeans(Dados=Dados.DBC,design=3,nclusters=2,iter.max = 20,nstart = 1,
algorithm = "Hartigan-Wong")
#Dados de experimento em DQL
data("Dados.DQL")
Kmeans_NumeroOtimo(Dados=Dados.DQL,design=4,nboot=100,method="silhouette",NumMax=NULL)
Kmeans(Dados=Dados.DQL,design=4,nclusters=2,iter.max = 20,nstart = 1,
algorithm = "Hartigan-Wong")
#Dados de experimento em Esquema fatorial em DIC
data("Dados.Fat2.DIC")
Kmeans_NumeroOtimo(Dados=Dados.Fat2.DIC,design=5,nboot=100,method="silhouette",NumMax=NULL)
Kmeans(Dados=Dados.Fat2.DIC,design=5,nclusters=2,iter.max = 20,nstart = 1,
algorithm = "Hartigan-Wong")
#Dados de experimento em Esquema fatorial em DBC
data("Dados.Fat2.DBC")
Kmeans_NumeroOtimo(Dados=Dados.Fat2.DBC,design=6,nboot=100,method="silhouette",NumMax=NULL)
Kmeans(Dados=Dados.Fat2.DBC,design=6,nclusters=2,iter.max = 20,nstart = 1,
algorithm = "Hartigan-Wong")
Numero otimo de clusters pelo metodo do cotovelo
Description
Esta funcao retorna o numero otimo de clusters para o metodo kmeans considerando dieferentes criterios. @name Kmeans_NumeroOtimo2
Usage
Kmeans_NumeroOtimo2(Dados,design=1,nboot=100, Metodo=1,iter.max = 100,
NumMax=NULL,TituloX="Numero de clusters",TituloY=NULL,Theme=theme_classic())
Arguments
Dados |
Matriz contendo os dados para execucao da analise. Para cada modelo o conjunto de dados precisa estar organizado de uma forma apropriada:
|
design |
Valor numerico indicando o delineamento:
|
nboot |
numero de reamostragens desejadas para o metodo bootstrap. |
Metodo |
Criterio utilizado para a estimacao do numero otimo de clusters. Pode-se utilizar as seguintes opcoes:
|
iter.max |
numero de reamostragens desejadas para o metodo bootstrap. |
NumMax |
Numero maximo de clustes a ser considerado (Obs: Deve ser no minimo 2). |
TituloX |
Titulo desejado para o eixo x. |
TituloY |
Titulo desejado para o eixo y. |
Theme |
Tema utilizado para o graficos do 'ggplot2' (Ex.:theme_gray(), theme_bw(), theme_linedraw(), theme_light(), theme_dark(), theme_minimal(), theme_classic(), theme_void(), theme_test()). |
Value
A funcao retorna o numero otimo de clusters a ser considerado no metodo kmeans.
References
PlayList "Curso de Analise Multivariada": https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR
CRUZ, C.D. and CARNEIRO, P.C.S. Modelos biometricos aplicados ao melhoramento genetico. 3nd Edition. Vicosa, UFV, v.2, 2014. 668p. (ISBN: 8572691510)
FERREIRA, D.F. Estatistica Multivariada. (2018) 3ed. UFLA. 624p. (ISBN 13:978 8581270630)
HAIR, J.F. Multivariate Data Analysis. (2016) 6ed. Pearson Prentice HalL. (ISBN 13:978 0138132637)
See Also
Kmeans
, Kmeans_NumeroOtimo2
, ContribuicaoRelativa
Examples
#Sem repeticoes
data("Dados.MED")
Dados=Dados.MED
rownames(Dados)=paste("Genotipo",1:10,sep="_")
Kmeans_NumeroOtimo2(Dados,design=1,nboot=100,iter.max = 100,NumMax=NULL)
#Experimento em DIC
data("Dados.DIC")
Dados=Dados.DIC
Kmeans_NumeroOtimo2(Dados,design=2,Metodo = 2,nboot=100,iter.max = 100,NumMax=NULL)
#Experimento em DBC
data("Dados.DBC")
Dados=Dados.DBC
Kmeans_NumeroOtimo2(Dados,design=3,nboot=100,iter.max = 100,NumMax=NULL)
#Experimento em DQL
data("Dados.DQL")
Dados=Dados.DQL
Kmeans_NumeroOtimo2(Dados,design=4,nboot=100,iter.max = 100,NumMax=NULL)
#Experimento em fatorial no DIC
data("Dados.Fat2.DIC")
Dados=Dados.Fat2.DIC
Kmeans_NumeroOtimo2(Dados,design=5,Metodo = 1,nboot=100,iter.max = 100,NumMax=NULL)
Kmeans_NumeroOtimo2(Dados,design=5,Metodo =2,nboot=100,iter.max = 100,NumMax=NULL)
Kmeans_NumeroOtimo2(Dados,design=5,Metodo =3,nboot=100,iter.max = 100,NumMax=NULL)
#Experimento em fatorial no DBC
data("Dados.Fat2.DBC")
Dados=Dados.Fat2.DBC
Kmeans_NumeroOtimo2(Dados,design=5,Metodo = 1,nboot=100,iter.max = 100,NumMax=NULL)
Kmeans_NumeroOtimo2(Dados,design=5,Metodo =2,nboot=100,iter.max = 100,NumMax=NULL)
Kmeans_NumeroOtimo2(Dados,design=5,Metodo =3,nboot=100,iter.max = 100,NumMax=NULL)
Analise de variancia multivariada
Description
Esta funcao retorna o resultado da analise de variancia multivariada (MANOVA). @name MANOVA
Usage
MANOVA(Dados,Modelo)
Arguments
Dados |
Matriz contendo os dados para execucao da MANOVA. Para cada modelo o conjunto de dados precisa estar organizado de uma forma apropriada:
|
Modelo |
Valor numerico indicando o delineamento:
|
Value
A funcao retorna a MANOVA, a matriz de (co)variancia residual e o numero dos graus de liberdade do residuo.
References
PlayList "Curso de Analise Multivariada": https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR
CRUZ, C.D. and CARNEIRO, P.C.S. Modelos biometricos aplicados ao melhoramento genetico. 3nd Edition. Vicosa, UFV, v.2, 2014. 668p. (ISBN: 8572691510)
FERREIRA, D.F. Estatistica Multivariada. (2018) 3ed. UFLA. 624p. (ISBN 13:978 8581270630)
HAIR, J.F. Multivariate Data Analysis. (2016) 6ed. Pearson Prentice HalL. (ISBN 13:978 0138132637)
See Also
Examples
#Delineamento inteiramente casualizado (DIC)
data("Dados.DIC")
MANOVA(Dados.DIC,1)
#Delineamento em blocos casualizados (DBC)
data(Dados.DBC)
MANOVA(Dados.DBC,2)
#Delineamento em quadrado latino (DQL)
data(Dados.DQL)
MANOVA(Dados.DQL,3)
#Esquema fatorial duplo em DIC
data(Dados.Fat2.DIC)
MANOVA(Dados.Fat2.DIC,4)
#Esquema fatorial duplo em DBC
data(Dados.Fat2.DBC)
MANOVA(Dados.Fat2.DBC,5)
#' #Esquema fatorial triplo em DIC
data(Dados.Fat3.DIC)
MANOVA(Dados.Fat3.DIC,6)
#Esquema fatorial triplo em DBC
data(Dados.Fat3.DBC)
MANOVA(Dados.Fat3.DBC,7)
Media ponderada entre as matrizes de dissimilaridade
Description
Esta funcao faz a padronizacao da matriz de dissimilaridade a fim de retirar a escala, nesta etapa, os valores das matrizes sao calculados, a fim de variar entre 0 e 1. Posteriormente, e feita a media ponderada entre essas matrizes em funcao do numero de variaveis consideradas na estimativa de cada uma dessas dissimilaridade. Essa funcao e importante quando se trabalha com dados mistos.
Usage
MediaDistancia(Distancias,n,Normatizar=TRUE)
Arguments
Distancias |
Objeto do tipo list contendo as matrizes de dissimilaridade. |
n |
Vetor com o numero de variaveis consideradas na estimacao de cada medida de dissimilaridade. |
Normatizar |
Valor Logico. Se TRUE a matriz de dissimilaridade sera normatizada para que os valores variem entre 0 e 1. |
Value
Retorna a media ponderada de duas matrizes de dissimilaridade.
References
PlayList "Curso de Analise Multivariada": https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR
CRUZ, C.D. and CARNEIRO, P.C.S. Modelos biometricos aplicados ao melhoramento genetico. 3nd Edition. Vicosa, UFV, v.2, 2014. 668p. (ISBN: 8572691510)
FERREIRA, D.F. Estatistica Multivariada. (2018) 3ed. UFLA. 624p. (ISBN 13:978 8581270630)
HAIR, J.F. Multivariate Data Analysis. (2016) 6ed. Pearson Prentice HalL. (ISBN 13:978 0138132637)
See Also
Examples
#Obentendo as dados de exemplo
DadosQuanti=matrix(rnorm(100,100,5),ncol=4)
DadosQuali=matrix(round(runif(200,1,5),0),ncol=8)
DadosBin=matrix(round(rbinom(400 ,1,0.5),0),ncol=16)
rownames(DadosQuanti)=rownames(DadosQuali)=rownames(DadosBin)=paste("T",1:25,sep="_")
#Obentendo as matrizes de dissimilaridade
DistQuant=Distancia(DadosQuanti,4)
DistQuali=Distancia(DadosQuali,10)
Distbin=Distancia(DadosBin,12)
#Criando os argumentos
Distancias=list(DistQuant,DistQuali,Distbin)
n=c(ncol(DadosQuanti),ncol(DadosQuali),ncol(DadosBin))
#obentedo a media ponderada das matrizes
Dist=MediaDistancia(Distancias,n,Normatizar = TRUE)
Dist
Diagnostico de multicolinearidade
Description
Esta funcao retorna o diagnostico de multicolinearidade. E indicativo de multicolinearidade a presenca de pelo menos um fator de inflacao de variancia maior que 10 ou numero de condicao maior que 100 (Cruz et al.,2014). @name Multicolinearidade
Usage
Multicolinearidade(Matriz)
Arguments
Matriz |
Matriz na qual se deseja verificar a presenca de multicolinearidade. |
Value
A funcao retorna os autovalores,numero de condicao, fator de inflacao de variancia e a determinante da matriz .
References
PlayList "Curso de Analise Multivariada": https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR
CRUZ, C.D. and CARNEIRO, P.C.S. Modelos biometricos aplicados ao melhoramento genetico. 3nd Edition. Vicosa, UFV, v.2, 2014. 668p. (ISBN: 8572691510)
FERREIRA, D.F. Estatistica Multivariada. (2018) 3ed. UFLA. 624p. (ISBN 13:978 8581270630)
HAIR, J.F. Multivariate Data Analysis. (2016) 6ed. Pearson Prentice HalL. (ISBN 13:978 0138132637)
Examples
data(Dados.MED)
D=cov(Dados.MED)
Multicolinearidade(D)
Pacote Para Analise De Experimentos Com Abordagem Multivariada
Description
Este pacote realiza a analise de experimentos por abordagem multivariada. Com este pacote e possivel fazer analises de variancia multivariada, estimar medidas de disimilaridade, fazer dendogramas,componentes principais, variaveis canonicas, etc.
Author(s)
Alcinei Mistico Azevedo: <alcineimistico@hotmail.com>
References
PlayList "Curso de Analise Multivariada": https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR
CRUZ, C.D. and CARNEIRO, P.C.S. Modelos biometricos aplicados ao melhoramento genetico. 3nd Edition. Vicosa, UFV, v.2, 2014. 668p. (ISBN: 8572691510)
FERREIRA, D.F. Estatistica Multivariada. (2018) 3ed. UFLA. 624p. (ISBN 13:978 8581270630)
HAIR, J.F. Multivariate Data Analysis. (2016) 6ed. Pearson Prentice HalL. (ISBN 13:978 0138132637)
Normatiza a matriz para que os valores variem entre valores pre-estabelecidos.
Description
Esta funcao faz a padronizacao da matriz a fim de retirar a escala. Para isso, os valores das matrizes sao calculados a fim de variar entre um "LimiteInferior" e um "LimiteSuperior".
Usage
Normatiza(DadosEntrada, DadosBase=NULL, LimiteInferior=0, LimiteSuperior=1,Metodo=1)
Arguments
DadosEntrada |
Matriz contendo os dados sendo normatizados. |
DadosBase |
Matriz contendo o conjunto de dados referencia para a normatizacao. Se for "NULL" essa matriz de referencia sera a propria matriz de entrada. |
LimiteInferior |
Numero cujo menor valor devera corresponder. |
LimiteSuperior |
Numero cujo maior valor devera corresponder. |
Metodo |
indica a forma que a normatizacao sera feita. Pode receber o valor 1 ou 2:
|
Value
Retorna a matriz normatizada.
References
PlayList "Curso de Analise Multivariada": https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR
CRUZ, C.D. and CARNEIRO, P.C.S. Modelos biometricos aplicados ao melhoramento genetico. 3nd Edition. Vicosa, UFV, v.2, 2014. 668p. (ISBN: 8572691510)
FERREIRA, D.F. Estatistica Multivariada. (2018) 3ed. UFLA. 624p. (ISBN 13:978 8581270630)
HAIR, J.F. Multivariate Data Analysis. (2016) 6ed. Pearson Prentice HalL. (ISBN 13:978 0138132637)
See Also
Examples
data("Dados.MED")
Dist=Distancia(Dados.MED,3)
Dendrograma(Dist)
DistN=Normatiza((Dist),LimiteInferior = 0,LimiteSuperior = 1,Metodo = 2)
Dendrograma(DistN)
Comparacoes multiplas multivariadas
Description
Esta funcao retorna o resultado da comparacao multiplas (dois a dois) com abordagem multivariada.
Usage
PairComp(MANOVA,adjust="bonferroni",test="Pillai",Sig=0.05)
Arguments
MANOVA |
Resultado da funcao MANOVA |
adjust |
Ajuste da significancia para o teste de comparacao multipla. Pode ser: "holm", "hochberg", "hommel", "bonferroni", "BH", "BY", "fdr" ou "none". |
test |
Teste considerado na MANOVA. Pode ser:"Pillai", "Wilks", "Hotelling-Lawley" ou "Roy" |
Sig |
Significancia a ser considerado. Default e 0.05. |
Value
A funcao as comparações multiplas para os tratamentos.
References
PlayList "Curso de Analise Multivariada": https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR
CRUZ, C.D. and CARNEIRO, P.C.S. Modelos biometricos aplicados ao melhoramento genetico. 3nd Edition. Vicosa, UFV, v.2, 2014. 668p. (ISBN: 8572691510)
Da Silva, A.R.; Malafaia, G.; Menezes, I.P.P. (2017) biotools: an R function to predict spatial gene diversity via an individual-based approach. Genetics and Molecular Research, 16: gmr16029655.
FERREIRA, D.F. Estatistica Multivariada. (2018) 3ed. UFLA. 624p. (ISBN 13:978 8581270630)
Krzanowski, W. J. (1988) Principles of Multivariate Analysis. A User's Perspective. Oxford.
HAIR, J.F. Multivariate Data Analysis. (2016) 6ed. Pearson Prentice HalL. (ISBN 13:978 0138132637)
See Also
Examples
#Delineamento inteiramente casualizado (DIC)
data("Dados.DIC")
Res=MANOVA(Dados.DIC,1)
PairComp(Res)
#Delineamento em blocos casualizados (DBC)
data(Dados.DBC)
Res=MANOVA(Dados.DBC,2)
PairComp(Res)
#Delineamento em quadrado latino (DQL)
data(Dados.DQL)
Res=MANOVA(Dados.DQL,3)
PairComp(Res)
#Esquema fatorial duplo em DIC
data(Dados.Fat2.DIC)
Res=MANOVA(Dados.Fat2.DIC,4)
PairComp(Res)
#Esquema fatorial duplo em DBC
data(Dados.Fat2.DBC)
Res=MANOVA(Dados.Fat2.DBC,5)
PairComp(Res)
#' #Esquema fatorial triplo em DIC
data(Dados.Fat3.DIC)
Res=MANOVA(Dados.Fat3.DIC,6)
PairComp(Res)
#Esquema fatorial triplo em DBC
data(Dados.Fat3.DBC)
Res=MANOVA(Dados.Fat3.DBC,7)
PairComp(Res)
Transformar dados quantitativos em qualitativos
Description
Esta funcao converte dados quantitativos em qualitativos. Para isso, deve-se apenas indicar o numero de classes desejadas. A funcao retorna a classificacao de cada individuo em funcao de intervalos equidistantes formados considerando o numero de classes almejados.
Usage
Quant2Quali(Dados,nclasses)
Arguments
Dados |
Objeto com os dados quantitativos a serem convertidos em qualitativos. |
nclasses |
Numero maximo de classes desejado. |
Value
A funcao retorna a classificacao de cada individuo em funcao de intervalos equidistantes formados considerando o numero de classes almejados.
References
PlayList "Curso de Analise Multivariada": https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR
CRUZ, C.D. and CARNEIRO, P.C.S. Modelos biometricos aplicados ao melhoramento genetico. 3nd Edition. Vicosa, UFV, v.2, 2014. 668p. (ISBN: 8572691510)
FERREIRA, D.F. Estatistica Multivariada. (2018) 3ed. UFLA. 624p. (ISBN 13:978 8581270630)
HAIR, J.F. Multivariate Data Analysis. (2016) 6ed. Pearson Prentice HalL. (ISBN 13:978 0138132637)
See Also
Examples
data(Dados.Misto)
nclasses=5
Dados=Dados.Misto[,c(6,7,10)]
Quant2Quali(Dados,nclasses)
Resumo das informacoes de cada tratamento em funcao da dissimilaridade
Description
Esta funcao apresenta informacoes que resumem a matriz de dissimilaridade.
Usage
SummaryDistancia(Dist,
ndec=2,
plot=TRUE,
layout="shade",
type="full",
title=NULL,
tl.cex =1,
tl.col="black",
col=NULL)
Arguments
Dist |
Matriz de dissimilaridade |
ndec |
Valor numerico indicando o numero de casas decimais. |
plot |
Valor logico (TRUE ou FALSE). Indica se o grafico deve ser apresentado. |
layout |
Valor do tipo character indicando como sera preenchido cada casela:
|
type |
Character, 'full' (default), 'upper' or 'lower', display full matrix, lower triangular or upper triangular matrix.
|
title |
Texto referente ao titulo da figura |
tl.cex |
Valor numerico indicando o tamanho das letras no grafico |
tl.col |
Cor das letras. Default ("black") |
col |
Vetor com a paleta de cores. Estas cores devem ser distribuidas uniformemente. se NULL, a paleta de cores sera colorRampPalette(col2)(200), veja exemplo abaixo. |
Value
Retorna informacoes importantes sobre cada tratamento em relacao aos demais como distancia media, menor distancia, maior distancia, tratamento mais proximo, tratamento mais distante etc.
References
PlayList "Curso de Analise Multivariada": https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR
CRUZ, C.D. and CARNEIRO, P.C.S. Modelos biometricos aplicados ao melhoramento genetico. 3nd Edition. Vicosa, UFV, v.2, 2014. 668p. (ISBN: 8572691510)
FERREIRA, D.F. Estatistica Multivariada. (2018) 3ed. UFLA. 624p. (ISBN 13:978 8581270630)
HAIR, J.F. Multivariate Data Analysis. (2016) 6ed. Pearson Prentice HalL. (ISBN 13:978 0138132637)
See Also
Examples
data(Dados.MED)
Dist=Distancia(Dados.MED,1)
SummaryDistancia(Dist)
#Acrescentando nomes aos tratamentos
Dist=as.matrix(Dist$Distancia)
rownames(Dist)=colnames(Dist)=paste("Trat",1:nrow(Dist))
SummaryDistancia(Dist)
#Diferentes configuracoes
SummaryDistancia(Dist,type ="lower")
#opcoes de paletas de cores
col0 = colorRampPalette(c('white', 'cyan', '#007FFF', 'blue','#00007F'))
col1 = colorRampPalette(c('#7F0000', 'red', '#FF7F00', 'yellow', 'white',
'cyan', '#007FFF', 'blue','#00007F'))
col2 = colorRampPalette(c('#67001F', '#B2182B', '#D6604D', '#F4A582',
'#FDDBC7', '#FFFFFF', '#D1E5F0', '#92C5DE',
'#4393C3', '#2166AC', '#053061'))
col3 = colorRampPalette(c('red', 'white', 'blue'))
col4 = colorRampPalette(c('#7F0000', 'red', '#FF7F00', 'yellow', '#7FFF7F',
'cyan', '#007FFF', 'blue', '#00007F'))
SummaryDistancia(Dist,type = "upper",col=col4(200),title = "Medidas de dissimilaridade")
SummaryDistancia(Dist,type = "lower",layout = "ellipse",col=col3(200))
Agrupamento Tocher
Description
Esta funcao faz o agrupamento pelo metodo Tocher.
Usage
Tocher(Dist,
Metodo="original",
nperm=999,
Plot=1,
xlab="Dissimilaridade",
ylab="Distancia fenetica",
bty="n")
Arguments
Dist |
Objeto contendo a matriz de dissimilaridade |
Metodo |
Um character indicando o algoritimo de agrupamento. Ha duas possibidades: "original" (default) ou "sequential". O ultimo foi proposto por Vasconcelos et al. (2007), tambem chamando de metodo Tocher modificado. |
nperm |
Numero de permutacoes para identificar a signficancia pelo metodo de Mantel |
Plot |
Numero indicando qual grafico devera ser plotado:
|
xlab |
nome do eixo x do grafico. Deve ser utilizado quando o Plot=2. |
ylab |
nome do eixo y do grafico. Deve ser utilizado quando o Plot=2. |
bty |
deve receber un character indicando o tipo de borda desejado no grafico. Deve ser utilizado quando o Plot=2.
|
Value
A funcao retorna resultados do teste Tocher.
References
PlayList "Curso de Analise Multivariada": https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR
Cruz, C.D.; Ferreira, F.M.; Pessoni, L.A. (2011) Biometria aplicada ao estudo da diversidade genetica. Visconde do Rio Branco: Suprema.
Rao, R.C. (1952) Advanced statistical methods in biometric research. New York: John Wiley & Sons.
Sharma, J.R. (2006) Statistical and biometrical techniques in plant breeding. Delhi: New Age International. Silva, A.R. & Dias, C.T.S. (2013) A cophenetic correlation coefficient for Tocher's method. Pesquisa Agropecuaria Brasileira, 48:589-596.
Vasconcelos, E.S.; Cruz, C.D.; Bhering, L.L.; Resende Junior, M.F.R. (2007) Alternative methodology for the cluster analysis. Pesquisa Agropecuaria Brasileira, 42:1421-1428.
Examples
data("Dados.MED")
Dist=Distancia(Dados.MED,Metodo=6)
Tocher(Dist)
Analise de variaveis canonicas
Description
Esta funcao faz a analise dos dados pelo metodo de variaveis canonicas. @name VariaveisCanonicas
Usage
VariaveisCanonicas(Dados,
Modelo=1,
Fator=NULL,
layout=1,
xlab="VC1",
ylab="VC2",
cols=c(1,2),
CR=TRUE,
CorPlot=TRUE,
CorCol="red",
VarCol ="blue",
bty="L",
Perc=0.1,
length = 0.25)
Arguments
Dados |
Matriz contendo os dados para execucao da MANOVA. Para cada modelo o conjunto de dados precisa estar organizado de uma forma apropriada:
|
Modelo |
Valor numerico indicando o delineamento:
|
Fator |
Indica qual fator deve ser estudado na representacao grafica. Tal decisao pode ser feita baseando na significancia da manova. Esse objeto deve receber:
|
layout |
Deve ser um numero variando de 1 a 9. Para cada numero teremos um layout diferente. |
xlab |
nome do eixo x do grafico de variaveis canonicas |
ylab |
nome do eixo y do grafico de variaveis canonicas |
cols |
Numero das variaveis canonicas que se pretende apresentar no grafico. O padrao e 'c(1,2)'. |
CR |
Valor logico (TRUE ou FALSE) indicando se aparecera no grafico a contriuicao relativa de cada eixo. |
CorPlot |
Valor logico. Se for TRUE sera apresentado no grafico as correlacoes. |
CorCol |
Cor das setas na dispersao grafica da correlacao (default = "black") |
VarCol |
Cor do nome das variavies na dispersao grafica da correlacao (default = "red") |
bty |
deve receber un character indicando o tipo de borda desejado no grafico.
|
Perc |
Valor entre 0 e 1 indicando o recuo dos eixos. |
length |
Refere-se ao tamanho da seta. O default e 0.25. |
Value
A funcao retorna resultados associados as variaveis canonicas.
References
PlayList "Curso de Analise Multivariada": https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR
CRUZ, C.D. and CARNEIRO, P.C.S. Modelos biometricos aplicados ao melhoramento genetico. 3nd Edition. Vicosa, UFV, v.2, 2014. 668p. (ISBN: 8572691510)
FERREIRA, D.F. Estatistica Multivariada. (2018) 3ed. UFLA. 624p. (ISBN 13:978 8581270630)
HAIR, J.F. Multivariate Data Analysis. (2016) 6ed. Pearson Prentice HalL. (ISBN 13:978 0138132637)
See Also
Examples
#Delineamento inteiramente casualizado (DIC)
data("Dados.DIC")
VariaveisCanonicas(Dados.DIC,1)
#Delineamento em blocos casualizados (DBC)
data(Dados.DBC)
VariaveisCanonicas(Dados.DBC,2,CorCol = "red",VarCol = "red")
#Delineamento em quadrado latino (DQL)
data(Dados.DQL)
VariaveisCanonicas(Dados.DQL,3,layout=2)
#Esquema fatorial duplo em DIC
data(Dados.Fat2.DIC)
VariaveisCanonicas(Dados.Fat2.DIC,4,Fator="A:B")
VariaveisCanonicas(Dados.Fat2.DIC,4,Fator="A",layout=3)
VariaveisCanonicas(Dados.Fat2.DIC,4,Fator="B",layout=4)
#Esquema fatorial duplo em DBC
data(Dados.Fat2.DBC)
VariaveisCanonicas(Dados.Fat2.DBC,5,Fator="A:B",layout=5)
VariaveisCanonicas(Dados.Fat2.DBC,5,Fator="A")
VariaveisCanonicas(Dados.Fat2.DBC,5,Fator="B")
#Esquema fatorial triplo em DIC
data(Dados.Fat3.DIC)
VariaveisCanonicas(Dados.Fat3.DIC,6,Fator="A:B")
VariaveisCanonicas(Dados.Fat3.DIC,6,Fator="A")
VariaveisCanonicas(Dados.Fat3.DIC,6,Fator="B")
#Esquema fatorial triplo em DBC
data(Dados.Fat3.DBC)
VariaveisCanonicas(Dados.Fat3.DBC,7,Fator="A:B")
VariaveisCanonicas(Dados.Fat3.DBC,7,Fator="A")
VariaveisCanonicas(Dados.Fat3.DBC,7,Fator="B")
Grafico com tres dimensoes
Description
Esta funcao cria um grafico 3d a partir de escores.
Usage
plot3d(Obj,names = NULL,lab=NULL,title=NULL,cols=c(1,2,3),size=1)
Arguments
Obj |
Objeto criado pelas funcoes 'ComponentesPrincipais', 'CoordenadasPrincipais' e 'VariaveisCanonicas'. |
names |
Nomes das Variaveis. |
lab |
Nome dos eixos. |
title |
Titulo do grafico. |
cols |
Numeros dos eixos que aparecera no grafico. |
size |
Tamanho das letras. |
Value
Esta funcao retorna um grafico com tres dimensoes.
References
PlayList "Curso de Analise Multivariada": https://www.youtube.com/playlist?list=PLvth1ZcREyK72M3lFl7kBaHiVh5W53mlR
See Also
Examples
#####################################
##### Matriz
#################################
data("Dados.MED")
data=as.matrix(Dados.MED[,5:7])
plot3d(Obj = data,names = letters[1:10],
lab=c("Retencao 75",
"Retencao 55",
"Retencao fundo"),size =2 )
#####################################
##### Componentes Principais
#################################
data(Dados.MED)
cp=ComponentesPrincipais(Dados.MED,layout = 11,
CorPlot = TRUE,VarCol = "green")
plot3d(Obj = cp,names = letters[1:10],
lab=c("Principal Component 1",
"Principal Component 2",
"Principal Component 3"),size =2 )
#####################################
##### Variaveis canonicas
#################################
data(Dados.DBC)
VC=VariaveisCanonicas(Dados.DBC,2,CorCol = "red",VarCol = "red")
plot3d(VC)
plot3d(VC,names = paste("Var","1:10"),
lab=c("Variable component 1",
"Variable Component 2",
"Variable Component 3"),size =2 )
#####################################
##### Coordenadas Principais
#################################
data=data("Dados.CAT")
Dist=Distancia(Dados.CAT,Metodo=10)
CO=CoordenadasPrincipais(Dist)
plot3d(Obj = CO,names = letters[1:9],
lab=c("PCoA 1",
"PCoA 2",
"PCoA 3"),size =2 )
Definir o diretório do script working directory (Set the script Directory as working directory).
Description
Esta funcao define como o endereco da pasta onde esta o scritp atual como o diretorio de trabalho. (This function set the directory of current script as working directory).
Usage
setwd_script()