En esta investigaci on se muestran los efectos de incorporar funciones c opula a la clasi caci on
supervisada. Las dependencias entre variables en un conjunto de datos pueden ser lineales o
no lineales y las funciones c opula son capaces de modelar diferentes tipos de dependencias por
lo que resultan una herramienta
exible para modelar dichas dependencias.
La clasi caci on supervisada es la que se da cuando se tienen clases identi cadas as como las
caracter sticas de los objetos que forman parte de cada clase, de esa manera si se tienen nuevos
objetos de los cuales se conocen sus caracter sticas pero no la clase, es posible asignar el objeto
a la clase con la que tenga m as similitudes seg un sus caracter sticas.
Por medio de una serie de experimentos que se realizaron con dos bases de datos diferentes: Base
de datos de im agenes de Microsoft [26] y Conjunto de datos de digitos escritos a mano alzada
[15], se exponen los resultados que arroja modelar dependencias en clasi caci on supervisada
entre los pares de variables con dependencias m as importantes identi cados por medio de un
modelo gr a co de cadena. Estos resultados son comparados con un clasi cador que no considera
las dependencias entre variables tambi en conocido como clasi cador ingenuo de Bayes.
Los resultados de las muestras analizadas revelan una mejora de hasta 8.3% en algunos casos
de clasi caci on supervisada cuando se incorporan funciones c opula debido a que el desempe~no
del clasi cador es m as alto cuando se consideran dependencias que cuando no se hace. Este
porcentaje representa una diferencia estad sticamente signi cativa.
This research shows the e ects of incorporating copula functions into supervised classi cation.
The dependencies among variables in a dataset can be linear or non-linear and copula functions
are able to model di erent types of dependencies, which make them a
exible tool for modeling
these dependencies.
Supervised classi cation is the one that occurs when the classes are known as well as the characteristics
of the objects that are part of each class, that way if there are new objects of which
their characteristics are known but not the class, the object can be assigned to the class with
which it has most similarities according to its characteristics.
By means of a series of experiments that were carried out with two di erent databases: Images
database from Microsoft [26] and Handwritten digits dataset [15], the results of modeling
dependencies in supervised classi cation between the pairs of variables with more important
dependencies identi ed by means of a graphic chain model are presented. These results are
compared with a classi er that does not consider dependencies between variables also known
as naive Bayes' classi er.
The results of the analyzed samples reveal an improvement on the average of the experiments
of up to 8.3% in some cases of supervised classi cation when copula functions are incorporated
due to the performance of the classi er which is higher when dependencies are considered than
when they are not. This percentage represents a statistically signi cant di erence.