NicheToolBox

Welcome to NTB

This application has some tools to analyze and visualize the niche. In this page you will find th NTB settings of the app.

Settings
One of the most important things for your data analysis in NTB is the resolution of the bioclimatic variables that you will use during your analysis. NTB uses the worldclim data at different resolutions.

It's important to check what data set you want to work with. In NTB you can use your own data (uploaded data), the data you will search using the GBIF API (GBIF) or the data that falls in your M (M data). For more detailed information go to the Data tutorial

In order to save what you have done in your session it is important that you enter a name for your session, this will tell the app to save your workflow in a folder with this name and once you have finished with your analysis you can download it.

Citation

Please cite NicheToolbox as:

Osorio-Olvera L., Lira‐Noriega, A., Soberón, J., Townsend Peterson, A., Falconi, M., Contreras‐Díaz, R.G., Martínez‐Meyer, E., Barve, V. and Barve, N. (2020), ntbox: an R package with graphical user interface for modeling and evaluating multidimensional ecological niches. Methods Ecol Evol. 11, 1199–1206. doi:10.1111/2041-210X.13452. https://github.com/luismurao/ntbox

Tutorials
In this part you can find some tutorials that show how to use the app.

NicheToolBox

GBIF data

Here you can request data to the

GBIF API using the spocc package



Loading...


The data set has


                    


Download your clean data

Download Data

Select a grouping variable to clean your data

Or maybe you want only certain species given the inds of the grouping variable




NicheToolBox

This application has some tools to analyze and visualize the niche


Select the format of your species names data Base

Loading...




Download your clean data

Loading...

Download Data

NicheToolBox

GBIF visualizations

GBIF data Calendar
Create an animated map
Download animated Map

NicheToolBox

Dynamic Map

Computation In progress

Download data

History of reccords


NicheToolBox

This application has some tools to analyze and visualize the niche

Select a format and upload your coordinate data

Hit: It would be helpful (but not necessary) if you have your coordinates data in columns called long and lat

Loading...

The data set has


                


Download your clean data

Download Data

Select a grouping variable to clean your data

Or maybe you want only certain species given the inds of the grouping variable



Once your data dosent have duplicates you can generate training and testing data

This app was programed by:

Luis Osorio

luismurao@gmail.com

as part of:

EDUFF

NicheToolBox

Dynamic Map

Computation In progress

Download data

History of reccords


NicheToolBox

This application has some nice tools to analyze, visualize the niche

Select a format and upload your coordinate data

Hit: It would be helpful (but not necessary) if you have your coordinates data in columns called long and lat
Download data

Clipping layers

Clipped Raster

Map of M and data points

NicheToolBox

Dynamic Map

Download data

History of reccords


Calculation In progress

Computation In progress

NicheToolBox

Here you can display the ellipsoid of your niche data. Choose the bioclimatic variables you want to plot
Download Bios & Coords data

Niche ToolBox

In development: The main objective of this function is to see if there are groups in the niche. The groups could be reflecting local adaptations...

Computation In progress

Niche ToolBox

Red boxes represent posible clusters given the values of the bioclimatic variables of the presence data

Computation In progress

Descargar grafica

NicheToolBox

You can visualize the bivariate correlations of the data. Bivariate correlations may help to detect which variables are redundant. In this kind of plot darker colors represent stronger correlations. The oval shapes of the graphs, reflect dispersal

Computation In progress

Download plot

NicheToolBox

Correlation table

Computation In progress

Download table

NicheToolBox

Showing correlations acoording to a threshold given by the user. Bivariate correlations may help to detect which variables are redundant.

Computation In progress

Download

          

NicheToolBox

Principal Components: Scree Plot (Shows the importance of each component)

Computation In progress

Download plot

NicheToolBox

Principal Components: Biplot

Computation In progress

Download

NicheToolBox

Principal components: Triplot

Computation In progress

NicheToolBox

Computation In progress

Principal Component Results

          

NicheToolBox

Ellipsoid Modeling for SDM


Run your model

Computation In progress

Download your model in .asc
Download model
Download plot
Download plot
Enviromental distances to the centroid table
Distance DataTable

Niche model

NicheToolBox

Ellipsoid Modeling for SDM

Computation In progress

Download covariance/shape matrix
Download CovMatrix
Download centroid
Download centroid coords

NicheToolBox


Model prediction data

Upload the model prediction raster in ASCII format

Presence data

Upload your presence data. The data must be in the following format:


Species long lat
sp_name -65.38 -10.38

Computation In progress

Partial ROC parameters

Download table

Distribution of AUC ratios

Descriptive statistics for AUC ratio


          

NicheToolBox

Finding the best threshold cut off

In this section contains a set of functions that will help you to find the best threshold cut off.

Upload the model prediction raster in ASCII format

Validation data

Upload your validation data. The data must be in the following format:


long lat PrecenseAbsence
-65.38 -10.38 1
-62.11 -11.22 0

Computation In progress

Download Binary

User threshold cut off

If you preffer to compute a binary map using your own cut off guess. Please select a threshold:

Download results

Confussion matrix


Kappa

$$Kappa = \frac{((a+d)-(((a+c)*(a+b)+(b+d)*(c+d))/N))}{(N-(((a+c)*(a+b)+(b+d)*(c+d))/N))}$$

TSS

Es la diferencia entre la tasa de aciertos y de errores, si el valor es 0, no discrimina entre aciertos y errores, si es menor a 0 los errores son mayores a los aciertos y si es mayor a 0 los aciertos son mayores a los errores, entre más se acerque a 1 hay mayor discriminación.

$$TSS = \frac{a}{(a+c)} + \frac{d}{(b+d)} - 1$$

Prevalencia

Es la proporción de presencias con respecto al total de los puntos (presencias y ausencias o pseudoausencias). Para ejemplificarlo se usara la figura 3, donde 4 puntos son de presencia y 4 de pseudosuasencia, entonces la prevalencia es de 0.5, ya que la mitad de los datos corresponden a las presencias.



Prevalencia


$$Prevalencia = \frac{(a + c)}{(a+b+c+d)}$$

Tasa de clasificación correcta

Fracción de los puntos de presencia y ausencia o pseudoausencia predichos correctamente: Por ejemplo en la figura 3 tenemos datos de ausencia o pseudoausencia y presencia, en este caso, de los 4 puntos de presencia, 3 se encuentran correctamente predichos, y de los 4 datos de ausencia o pseudoausencia, 3 se encuentra correctamente predichos. Entonces la tasa de clasificación correcta es de 0.75, esto quiere decir que el 75% de datos de ausencia o pseudoausencia y presencia se encuentran correctamente predichos.



PCRate

$$T.C.C = \frac{(a+d)}{(a+b+c+d)}$$

Tasa de clasificación incorrecta

Fracción de los puntos de presencia y ausencia o pseudoausencia predichos incorrectamente. Utilizando la figura 3 como ejemplo, se aprecian 8 puntos (ausencias y presencias), de los cuales 2 están incorrectamente predichos (ausencia dentro del área predicha y presencia fuera del área predicha) y 6 correctamente predichos (presencias dentro del área predicha y ausencias fuera del área predicha). Con estos datos podemos calcular la Misclassification rate, que en este caso es de 0.25, esto quiere decir que el 25% de los datos totales se encuentran incorrectamente predichos.



MissClassRate

$$T.C.I = \frac{(b+c)}{(a+b+c+d)}$$

Poder de predicción negativo

Evalua la probabilidad de que el punto sea una ausencia o pseudoausencia verdadera, dado que el algoritmo lo predijo como ausencia. Utilizando la figura 3 como ejemplo, tenemos 4 puntos fuera del área predicha por el modelo, de los que 3 de estos son ausencias (puntos predichos correctamente) y 1 es una presencia (punto predicho incorrectamente). Entonces para este caso el NPP es de 0.75, esto quiere decir que existe una probabilidad de 0.75 entre 1 de que un punto de los que se encuentran fuera del área predicha por el modelo sea una ausencia pseudoausencia.



NegativePredRate

$$N.P.P = \frac{d}{(c+d)}$$

Poder de predicción positivo

Evalúa la probabilidad de que el punto sea una presencia dado que el algoritmo lo predijo como presencia. Utilizando la figura 3 como ejemplo, tenemos 4 puntos dentro del área predicha por el modelo, en donde 3 de estos son presencias (puntos predichos correctamente) y 1 es una ausencia o pseudoausencia (punto predicho incorrectamente). Entonces para este caso el PPP es de 0.75, esto quiere decir que existe una probabilidad de 0.75 entre 1 de que un punto de los que se encuentran dentro del área predicha por el modelo sea una presencia.



PosiPredRate

$$P.P.P = \frac{a}{(a+b)}$$

Tasa de falsos negativos

$$T.F.N =\frac{c}{(a+c)}$$

Tasa de falsos positivos

$$T.F.P = \frac{b}{(b+d)}$$

Especificidad

Probabilidad de que una ausencia o pseudoausencia sea correctamente predicha: Tomaremos de ejemplo la figura 2, en donde tres ausencias o pseudoausencias están correctamente predichas (caen fuera del área predicha) y una es incorrectamente predicha (caen dentro del área predicha), entonces en este caso la especificidad sería de 0.75, ósea, el 75% de mis datos de ausencia o pseudoausencia se encuentran correctamente predichos.

La especificidad también la podemos calcular restando la fracción de error de comisión a 1. En nuestro caso la fracción de error de comisión fue de 0.25, entonces 1 – 0.25 = 0.75



Especificidad

$$Especificidad = \frac{d}{(b+d)}$$

Sensibilidad

Probabilidad de que un punto de presencia sea correctamente predicho: Tomaremos de ejemplo la figura 1, en donde tres presencias están correctamente predichas, ya que caen dentro del área predicha y una es incorrectamente predicha, se encuentra fuera del área predicha, entonces para este caso la sensibilidad sería de 0.75, ósea, el 75% de mis datos de presencia se encuentran correctamente predichos.

La sensibilidad también la podemos calcular restando la fracción de error de omisión a 1. En nuestro caso la fracción de error de omisión fue de 0.25, entonces 1 – 0.25 = 0.75



Sensibilidad

$$Sensibilidad = \frac{a}{(a+c)}$$

Fracción de error de omisión

Es cuando un punto de presencia se encuentra fuera del área predicha por el algoritmo, también se le llama Tasas de falsos negativos: Por ejemplo en la figura 1 hay un registro de presencia fuera del área predicha por el algoritmo, por lo que es una dato incorrectamente predicho y 3 datos son presencias correctamente predichas, ya que caen dentro del área predicha por el algoritmo.

Con estos datos podemos calcular la fracción de error de omisión, en este caso es de 0.25, ósea, el 25% de mis datos de presencia están incorrectamente predichos.

'

FEOM

$$F.E.O=\frac{c}{(a+c)}$$

Fracción de error de comisión

Cuando una ausencia o pseudoausencia se encuentra dentro de la predicción, también se le llama Tasa de falsos positivos: Por ejemplo en la figura 2 una ausencia o pseudoausencia cae dentro del área predicha por el algoritmo, por lo que es una ausencia o pseudoausencia incorrectamente predicha, mientras que 3 puntos caen fuera , estas son ausencias correctamente predichas.

Con estos datos podemos calcular la fracción de error de comisión, en este caso es de 0.25, ósea, el 25% de mis datos de ausencia o pseudoausencia están incorrectamente predichos.



FECOM

$$F.E.C=\frac{b}{(b+d)}$$

Evaluation metrics for SDMs



            

Binomial Test


            

Niche ToolBox


Confussion matrix

Enter values for: a, b, c y d
Download results

Confussion matrix

Kappa

$$Kappa = \frac{((a+d)-(((a+c)*(a+b)+(b+d)*(c+d))/N))}{(N-(((a+c)*(a+b)+(b+d)*(c+d))/N))}$$

TSS

Es la diferencia entre la tasa de aciertos y de errores, si el valor es 0, no discrimina entre aciertos y errores, si es menor a 0 los errores son mayores a los aciertos y si es mayor a 0 los aciertos son mayores a los errores, entre más se acerque a 1 hay mayor discriminación.

$$TSS = \frac{a}{(a+c)} + \frac{d}{(b+d)} - 1$$

Prevalencia

Es la proporción de presencias con respecto al total de los puntos (presencias y ausencias o pseudoausencias). Para ejemplificarlo se usara la figura 3, donde 4 puntos son de presencia y 4 de pseudosuasencia, entonces la prevalencia es de 0.5, ya que la mitad de los datos corresponden a las presencias.



Prevalencia


$$Prevalencia = \frac{(a + c)}{(a+b+c+d)}$$

Tasa de clasificación correcta

Fracción de los puntos de presencia y ausencia o pseudoausencia predichos correctamente: Por ejemplo en la figura 3 tenemos datos de ausencia o pseudoausencia y presencia, en este caso, de los 4 puntos de presencia, 3 se encuentran correctamente predichos, y de los 4 datos de ausencia o pseudoausencia, 3 se encuentra correctamente predichos. Entonces la tasa de clasificación correcta es de 0.75, esto quiere decir que el 75% de datos de ausencia o pseudoausencia y presencia se encuentran correctamente predichos.



PCRate

$$T.C.C = \frac{(a+d)}{(a+b+c+d)}$$

Tasa de clasificación incorrecta

Fracción de los puntos de presencia y ausencia o pseudoausencia predichos incorrectamente. Utilizando la figura 3 como ejemplo, se aprecian 8 puntos (ausencias y presencias), de los cuales 2 están incorrectamente predichos (ausencia dentro del área predicha y presencia fuera del área predicha) y 6 correctamente predichos (presencias dentro del área predicha y ausencias fuera del área predicha). Con estos datos podemos calcular la Misclassification rate, que en este caso es de 0.25, esto quiere decir que el 25% de los datos totales se encuentran incorrectamente predichos.



MissClassRate

$$T.C.I = \frac{(b+c)}{(a+b+c+d)}$$

Poder de predicción negativo

Evalua la probabilidad de que el punto sea una ausencia o pseudoausencia verdadera, dado que el algoritmo lo predijo como ausencia. Utilizando la figura 3 como ejemplo, tenemos 4 puntos fuera del área predicha por el modelo, de los que 3 de estos son ausencias (puntos predichos correctamente) y 1 es una presencia (punto predicho incorrectamente). Entonces para este caso el NPP es de 0.75, esto quiere decir que existe una probabilidad de 0.75 entre 1 de que un punto de los que se encuentran fuera del área predicha por el modelo sea una ausencia pseudoausencia.



NegativePredRate

$$N.P.P = \frac{d}{(c+d)}$$

Poder de predicción positivo

Evalúa la probabilidad de que el punto sea una presencia dado que el algoritmo lo predijo como presencia. Utilizando la figura 3 como ejemplo, tenemos 4 puntos dentro del área predicha por el modelo, en donde 3 de estos son presencias (puntos predichos correctamente) y 1 es una ausencia o pseudoausencia (punto predicho incorrectamente). Entonces para este caso el PPP es de 0.75, esto quiere decir que existe una probabilidad de 0.75 entre 1 de que un punto de los que se encuentran dentro del área predicha por el modelo sea una presencia.



PosiPredRate

$$P.P.P = \frac{a}{(a+b)}$$

Tasa de falsos negativos

$$T.F.N =\frac{c}{(a+c)}$$

Tasa de falsos positivos

$$T.F.P = \frac{b}{(b+d)}$$

Especificidad

Probabilidad de que una ausencia o pseudoausencia sea correctamente predicha: Tomaremos de ejemplo la figura 2, en donde tres ausencias o pseudoausencias están correctamente predichas (caen fuera del área predicha) y una es incorrectamente predicha (caen dentro del área predicha), entonces en este caso la especificidad sería de 0.75, ósea, el 75% de mis datos de ausencia o pseudoausencia se encuentran correctamente predichos.

La especificidad también la podemos calcular restando la fracción de error de comisión a 1. En nuestro caso la fracción de error de comisión fue de 0.25, entonces 1 – 0.25 = 0.75



Especificidad

$$Especificidad = \frac{d}{(b+d)}$$

Sensibilidad

Probabilidad de que un punto de presencia sea correctamente predicho: Tomaremos de ejemplo la figura 1, en donde tres presencias están correctamente predichas, ya que caen dentro del área predicha y una es incorrectamente predicha, se encuentra fuera del área predicha, entonces para este caso la sensibilidad sería de 0.75, ósea, el 75% de mis datos de presencia se encuentran correctamente predichos.

La sensibilidad también la podemos calcular restando la fracción de error de omisión a 1. En nuestro caso la fracción de error de omisión fue de 0.25, entonces 1 – 0.25 = 0.75



Sensibilidad

$$Sensibilidad = \frac{a}{(a+c)}$$

Fracción de error de omisión

Es cuando un punto de presencia se encuentra fuera del área predicha por el algoritmo, también se le llama Tasas de falsos negativos: Por ejemplo en la figura 1 hay un registro de presencia fuera del área predicha por el algoritmo, por lo que es una dato incorrectamente predicho y 3 datos son presencias correctamente predichas, ya que caen dentro del área predicha por el algoritmo.

Con estos datos podemos calcular la fracción de error de omisión, en este caso es de 0.25, ósea, el 25% de mis datos de presencia están incorrectamente predichos.

'

FEOM

$$F.E.O=\frac{c}{(a+c)}$$

Fracción de error de comisión

Cuando una ausencia o pseudoausencia se encuentra dentro de la predicción, también se le llama Tasa de falsos positivos: Por ejemplo en la figura 2 una ausencia o pseudoausencia cae dentro del área predicha por el algoritmo, por lo que es una ausencia o pseudoausencia incorrectamente predicha, mientras que 3 puntos caen fuera , estas son ausencias correctamente predichas.

Con estos datos podemos calcular la fracción de error de comisión, en este caso es de 0.25, ósea, el 25% de mis datos de ausencia o pseudoausencia están incorrectamente predichos.



FECOM

$$F.E.C=\frac{b}{(b+d)}$$

Mostrando las métricas para los valores de a, b, c y d


            


Binomial Test


            

Niche ToolBox

This is Niche ToolBox report please select a format for the output

Download report