- 69 -

Hombre, Ciencia y Tecnología ISSN: 1028-0871 Vol. 25, No. 2, abr-jun. pp. 67-74, 2021 La base de datos de las abejas solitarias Megachile armaticeps , representa la distribución de

esta especie y contiene 500 observaciones y 24 variables, una de las cuales es binaria. La variable binaria se denomina mapa binario, la cual, representa la variable dependiente dicotómica y sólo toma dos valores, 0 cuando no se encuentra dicha especie en el área y 1 cuando si se encuentra. Las 23 variables restantes denominadas variables independientes o covariables son continuas, las cuales miden en general las características ambientales del área. Estas variables son: temperatura media anual (Bio1), variación diurna promedio (Bio2), isotermalidad (Bio3), estacionalidad de la temperatura (Bio4), temperatura máxima del mes más cálido (Bio5), temperatura mínima del mes más frío (Bio6), variación anual de temperatura (Bio7), temperatura media del trimestre más húmedo (Bio8), temperatura media del trimestre más seco (Bio9), temperatura media del trimestre más cálido (Bio10), temperatura media del trimestre más frío (Bio11), precipitación anual (Bio12), precipitación del mes más seco (Bio13), precipitación del mes más húmedo (Bio14), estacionalidad de las precipitaciones (Bio15), precipitación del trimestre más húmedo (Bio16), precipitación del trimestre más seco (Bio17), precipitación del trimestre más cálido (Bio18), precipitación del trimestre más frío (Bio19), modelo digital de elevación (MDE), pendiente (PEN), distancia a la costa (DISTC) y el índice topográfico (TOPO).

Modelo de regresión logística binaria:

Los modelos de Regresión Logística Binaria son fórmulas estadísticas en las cuales se desea conocer la relación entre una variable dependiente cualitativa, dicotómica y una o más variables explicativas independientes ya sean cualitativas o cuantitativas. El objetivo fundamental es encontrar el mejor ajuste del modelo con el menor número de parámetros y describir la relación entre la variable respuesta y un conjunto de variables explicatorias independientes.

El modelo de Regresión Logística Binaria se define como:

𝑌 = 𝐸 ( 𝑌/ 𝑋) + 𝑒

Donde:

𝐸( 𝑌/ 𝑋) = 𝜋( 𝑋) =

exp ( 𝛼+𝛽 𝑋) 1+exp ( 𝛼+ 𝛽 𝑋)

.

𝑒 tiene distribución Bernoulli con media cero y varianza 𝜋( 𝑋)[1 − 𝜋( 𝑋)] .

La transformación de 𝜋( 𝑋) , conocida como transformación logit o logito, se define mediante

la función 𝑔( 𝑋) = 𝑙𝑛 [

𝜋( 𝑋)

1 − 𝜋( 𝑋)

] = 𝛼 + 𝛽 𝑋 Hosmer y Lemeshow en el 2013 plantearon que es

una función lineal en los parámetros, continua y sus valores se encuentran en toda la recta numérica −  < g ( X ) < +  .

Clásicamente, la exactitud de una prueba diagnóstica se ha evaluado en función de dos características: la sensibilidad y la especificidad. Sin embargo, éstas varían en función del criterio elegido como punto de corte entre la población. Una forma más global de conocer la calidad de la prueba en el espectro completo de puntos de corte es mediante el uso de curvas ROC ( Receiver Operating Characteristic ). Siempre que el problema y el resultado de la prueba diagnóstica puedan plantearse en términos de dicotomía (presencia o ausencia, positivo o negativo), la exactitud de la prueba puede definirse en función de su sensibilidad y especificidad.

El punto de corte es un valor límite que permite resumir los resultados en dos categorías: positivo y negativo, presencia o ausencia de cierta característica.

La sensibilidad ( S ) de una prueba diagnóstica es la probabilidad de que la prueba indique como positivo a aquel que realmente lo es.