- 70 -

Hombre, Ciencia y Tecnología ISSN: 1028-0871 Vol. 25, No. 2, abr-jun. pp. 67-74, 2021 La especificidad ( E ) de una prueba indica la probabilidad de que la prueba clasifique como

negativo a aquel que realmente lo es. No existe ninguna manera teórica de medición de estas dos características de una prueba. El único procedimiento es el experimental, sometiendo a un grupo clasificado mediante un método diagnóstico de referencia exacto e independiente a la prueba que se quiere estudiar.

Una curva ROC es una representación gráfica para una prueba de clasificación binaria según varía el umbral de discriminación, es decir, es el resultado de representar en un eje de coordenadas los puntos (x, y) dados por (1-E, S) para cada punto de corte.

El criterio de información de Akaike (AIC) elige dado un conjunto de modelos candidatos para los datos, el modelo que tiene el valor mínimo.

El criterio de información bayesiano (BIC) es similar al AIC excepto que el término de penalidad es más grande. En estas circunstancias, BIC penaliza modelos complejos más fuerte que AIC, favoreciendo la selección de modelos más simples.

Resultados y Discusión

Ajuste de los datos originales al modelo

El estudio descriptivo permitió constatar de forma general que la base de datos tiene más observaciones de ausencia (444) que de presencia (56), por lo que se espera un modelo que posea mayor predicción en la ausencia. Las variables presentan un alto rango excepto distancia a la costa (DISTC) que posee un máximo de 0,57499999 debido a que los valores tomados por esta variable son muy pequeños, además, distancia a la costa y la pendiente (PEN) poseen un mínimo de 0. La desviación típica es alta, distinta de la unidad, evidenciando la alta dispersión en las observaciones, con excepción de DISTC que tiene una desviación menor a 1, la media en todas las variables es distinta de 0. Debido a los problemas identificados a través del análisis descriptivo es necesario estandarizar las variables con el propósito de generar un modelo con los datos de mejor calidad posible.

Tabla 1: Análisis descriptivo de las covariables.

Covariables

Rango

Mínimo

Máximo

Media

Desv. típ.

Varianza

Bio1

78

186

264

249,51

10,100

102,010

Bio2

48

76

124

103,03

8,885

78,939

Bio3

12

58

70

64,11

2,449

5,996

Bio4

777

1444

2221

1878,03

193,493

37439,362

Bio5

89

253

342

325,13

12,310

151,543

Bio6

80

116

196

166,02

9,769

95,426

Bio7

52

126

178

158,68

10,462

109,458

Bio8

76

201

277

265,90

10,486

109,957

Bio9

84

165

249

223,68

10,512

110,503

Bio10

80

205

285

270,93

10,454

109,294

Bio11

76

165

241

222,76

10,085

101,712

Bio12

1250

825

2075

1343,05

176,957

31313,689

Bio13

190

120

310

212,60

29,423

865,732

Bio14

95

9

104

29,56

14,921

222,643