Saved in:
Bibliographic Details
Main Author: Sosa-Cabrera, Gustavo
Format: Preprint
Published: 2024
Subjects:
Online Access:https://arxiv.org/abs/2403.18685
Tags: Add Tag
No Tags, Be the first to tag this record!
_version_ 1866911816879177728
author Sosa-Cabrera, Gustavo
author_facet Sosa-Cabrera, Gustavo
contents In this work, we analyze the behavior of the multivariate symmetric uncertainty (MSU) measure through the use of statistical simulation techniques under various mixes of informative and non-informative randomly generated features. Experiments show how the number of attributes, their cardinalities, and the sample size affect the MSU. In this thesis, through observation of results, it is proposed an heuristic condition that preserves good quality in the MSU under different combinations of these three factors, providing a new useful criterion to help drive the process of dimension reduction. -- En el presente trabajo hemos analizado el comportamiento de una versión multivariada de la incertidumbre simétrica a través de técnicas de simulación estadísticas sobre varias combinaciones de atributos informativos y no-informativos generados de forma aleatoria. Los experimentos muestran como el número de atributos, sus cardinalidades y el tamaño muestral afectan al MSU como medida. En esta tesis, mediante la observación de resultados hemos propuesto una condición que preserva una buena calidad en el MSU bajo diferentes combinaciones de los tres factores mencionados, lo cual provee un nuevo y valioso criterio para llevar a cabo el proceso de reducción de dimensionalidad.
format Preprint
id arxiv_https___arxiv_org_abs_2403_18685
institution arXiv
publishDate 2024
record_format arxiv
spellingShingle Representatividad Muestral en la Incertidumbre Simétrica Multivariada para la Selección de Atributos
Sosa-Cabrera, Gustavo
Information Theory
Machine Learning
Statistics Theory
In this work, we analyze the behavior of the multivariate symmetric uncertainty (MSU) measure through the use of statistical simulation techniques under various mixes of informative and non-informative randomly generated features. Experiments show how the number of attributes, their cardinalities, and the sample size affect the MSU. In this thesis, through observation of results, it is proposed an heuristic condition that preserves good quality in the MSU under different combinations of these three factors, providing a new useful criterion to help drive the process of dimension reduction. -- En el presente trabajo hemos analizado el comportamiento de una versión multivariada de la incertidumbre simétrica a través de técnicas de simulación estadísticas sobre varias combinaciones de atributos informativos y no-informativos generados de forma aleatoria. Los experimentos muestran como el número de atributos, sus cardinalidades y el tamaño muestral afectan al MSU como medida. En esta tesis, mediante la observación de resultados hemos propuesto una condición que preserva una buena calidad en el MSU bajo diferentes combinaciones de los tres factores mencionados, lo cual provee un nuevo y valioso criterio para llevar a cabo el proceso de reducción de dimensionalidad.
title Representatividad Muestral en la Incertidumbre Simétrica Multivariada para la Selección de Atributos
topic Information Theory
Machine Learning
Statistics Theory
url https://arxiv.org/abs/2403.18685