- 70 -
Hombre, Ciencia y Tecnología ISSN: 1028-0871 Vol. 25, No. 2, abr-jun. pp. 67-74, 2021 La especificidad ( E ) de una prueba indica la probabilidad de que la prueba clasifique como
negativo a aquel que realmente lo es. No existe ninguna manera teórica de medición de estas dos características de una prueba. El único procedimiento es el experimental, sometiendo a un grupo clasificado mediante un método diagnóstico de referencia exacto e independiente a la prueba que se quiere estudiar.
Una curva ROC es una representación gráfica para una prueba de clasificación binaria según varía el umbral de discriminación, es decir, es el resultado de representar en un eje de coordenadas los puntos (x, y) dados por (1-E, S) para cada punto de corte.
El criterio de información de Akaike (AIC) elige dado un conjunto de modelos candidatos para los datos, el modelo que tiene el valor mínimo.
El criterio de información bayesiano (BIC) es similar al AIC excepto que el término de penalidad es más grande. En estas circunstancias, BIC penaliza modelos complejos más fuerte que AIC, favoreciendo la selección de modelos más simples.
Resultados y Discusión
Ajuste de los datos originales al modelo
El estudio descriptivo permitió constatar de forma general que la base de datos tiene más observaciones de ausencia (444) que de presencia (56), por lo que se espera un modelo que posea mayor predicción en la ausencia. Las variables presentan un alto rango excepto distancia a la costa (DISTC) que posee un máximo de 0,57499999 debido a que los valores tomados por esta variable son muy pequeños, además, distancia a la costa y la pendiente (PEN) poseen un mínimo de 0. La desviación típica es alta, distinta de la unidad, evidenciando la alta dispersión en las observaciones, con excepción de DISTC que tiene una desviación menor a 1, la media en todas las variables es distinta de 0. Debido a los problemas identificados a través del análisis descriptivo es necesario estandarizar las variables con el propósito de generar un modelo con los datos de mejor calidad posible.
Tabla 1: Análisis descriptivo de las covariables.
Covariables |
Rango |
Mínimo |
Máximo |
Media |
Desv. típ. |
Varianza |
Bio1 |
78 |
186 |
264 |
249,51 |
10,100 |
102,010 |
Bio2 |
48 |
76 |
124 |
103,03 |
8,885 |
78,939 |
Bio3 |
12 |
58 |
70 |
64,11 |
2,449 |
5,996 |
Bio4 |
777 |
1444 |
2221 |
1878,03 |
193,493 |
37439,362 |
Bio5 |
89 |
253 |
342 |
325,13 |
12,310 |
151,543 |
Bio6 |
80 |
116 |
196 |
166,02 |
9,769 |
95,426 |
Bio7 |
52 |
126 |
178 |
158,68 |
10,462 |
109,458 |
Bio8 |
76 |
201 |
277 |
265,90 |
10,486 |
109,957 |
Bio9 |
84 |
165 |
249 |
223,68 |
10,512 |
110,503 |
Bio10 |
80 |
205 |
285 |
270,93 |
10,454 |
109,294 |
Bio11 |
76 |
165 |
241 |
222,76 |
10,085 |
101,712 |
Bio12 |
1250 |
825 |
2075 |
1343,05 |
176,957 |
31313,689 |
Bio13 |
190 |
120 |
310 |
212,60 |
29,423 |
865,732 |
Bio14 |
95 |
9 |
104 |
29,56 |
14,921 |
222,643 |