Evaluación comparativa en el desempeño de modelos de machine learning en la predicción de pagadores del impuesto predial de la ciudad de Tingo María para el año 2019
Para está investigación se recopiló información socioeconómica y de percepción de 372 contribuyentes de Tingo María mediante encuestas telefónicas. Se efectuó un análisis descriptivo y se evaluó la influencia de estos factores en la clasificación de tipo de pagador ‘No pagador’, ‘Impuntual’ y ‘Pa...
| Main Author: | |
|---|---|
| Other Authors: | |
| Format: | Tesis |
| Language: | Español |
| Published: |
Universidad Nacional Agraria de la Selva
2024
|
| Subjects: | |
| Online Access: | https://hdl.handle.net/20.500.14292/2634 |
| _version_ | 1855499947989794816 |
|---|---|
| author | Junco Aranciaga, Antonio Gabriel |
| author2 | Solis Bonifacio, Hubel |
| author_browse | Junco Aranciaga, Antonio Gabriel Solis Bonifacio, Hubel |
| author_facet | Solis Bonifacio, Hubel Junco Aranciaga, Antonio Gabriel |
| author_sort | Junco Aranciaga, Antonio Gabriel |
| collection | Repositorio UNAS |
| description | Para está investigación se recopiló información socioeconómica y de percepción de 372
contribuyentes de Tingo María mediante encuestas telefónicas. Se efectuó un análisis
descriptivo y se evaluó la influencia de estos factores en la clasificación de tipo de pagador ‘No
pagador’, ‘Impuntual’ y ‘Pagador’, mediante la prueba de Chi2
, estos datos recogidos se usaron
para entrenar los modelos de Machine Learning que incluyeron Árbol de Decisión, SVM, KNN,
Naive Bayes, Ensemble y RNN, y se midieron las métricas de exactitud, precisión, sensibilidad
y Puntuación F1. Se aplicó una validación cruzada k-fold de 10 pliegues y se optimizaron
hiperparámetros. Las diferencias en el rendimiento de los modelos se determinaron mediante
ANOVA de Friedman y pruebas post hoc de Nemenyi. Como resultados, los factores
socioeconómicos y percepciones influyeron notablemente en la clasificación de los
contribuyentes (p-valor < 0.01). En la predicción, los modelos KNN y RNN destacaron con
exactitudes de 97.04% ± 0.30 y 96.89% ± 0.14. Para la precisión, RNN lideró en "No
Pagadores" con 93.85 ± 0.25 y KNN en "Impuntuales" con 99.10 ± 0.12, mientras que Naive
Bayes sobresalió en "Pagadores" con 99.90 ± 0.04. En sensibilidad, RNN tuvo 95.55 ± 0.31 en
"No Pagadores" y 99.92 ± 0.04 en "Pagadores"; KNN logró 95.67 ± 0.05 en "Impuntuales".
Para la puntuación F1, KNN y RNN tuvieron los mejores resultados en "No Pagadores" con
99.13 ± 0.15 y en "Pagadores" con 99.73 ± 0.15, respectivamente. Mediante el ANOVA de
Friedman, se concluye que existen diferencias significativas (p-valor < 0.01) entre los
algoritmos en la evaluación de pagadores de impuestos |
| format | Tesis |
| id | UNAS2634 |
| institution | Universidad Nacional Agraria de la Selva (UNAS) |
| language | Español |
| publishDate | 2024 |
| publishDateRange | 2024 |
| publishDateSort | 2024 |
| publisher | Universidad Nacional Agraria de la Selva |
| publisherStr | Universidad Nacional Agraria de la Selva |
| record_format | dspace |
| spelling | UNAS26342024-06-09T22:40:39Z Evaluación comparativa en el desempeño de modelos de machine learning en la predicción de pagadores del impuesto predial de la ciudad de Tingo María para el año 2019 Junco Aranciaga, Antonio Gabriel Solis Bonifacio, Hubel Machine Learning Impuesto predial Métricas de rendimiento Friedman Factores socioeconómicos https://purl.org/pe-repo/ocde/ford#1.02.01 Para está investigación se recopiló información socioeconómica y de percepción de 372 contribuyentes de Tingo María mediante encuestas telefónicas. Se efectuó un análisis descriptivo y se evaluó la influencia de estos factores en la clasificación de tipo de pagador ‘No pagador’, ‘Impuntual’ y ‘Pagador’, mediante la prueba de Chi2 , estos datos recogidos se usaron para entrenar los modelos de Machine Learning que incluyeron Árbol de Decisión, SVM, KNN, Naive Bayes, Ensemble y RNN, y se midieron las métricas de exactitud, precisión, sensibilidad y Puntuación F1. Se aplicó una validación cruzada k-fold de 10 pliegues y se optimizaron hiperparámetros. Las diferencias en el rendimiento de los modelos se determinaron mediante ANOVA de Friedman y pruebas post hoc de Nemenyi. Como resultados, los factores socioeconómicos y percepciones influyeron notablemente en la clasificación de los contribuyentes (p-valor < 0.01). En la predicción, los modelos KNN y RNN destacaron con exactitudes de 97.04% ± 0.30 y 96.89% ± 0.14. Para la precisión, RNN lideró en "No Pagadores" con 93.85 ± 0.25 y KNN en "Impuntuales" con 99.10 ± 0.12, mientras que Naive Bayes sobresalió en "Pagadores" con 99.90 ± 0.04. En sensibilidad, RNN tuvo 95.55 ± 0.31 en "No Pagadores" y 99.92 ± 0.04 en "Pagadores"; KNN logró 95.67 ± 0.05 en "Impuntuales". Para la puntuación F1, KNN y RNN tuvieron los mejores resultados en "No Pagadores" con 99.13 ± 0.15 y en "Pagadores" con 99.73 ± 0.15, respectivamente. Mediante el ANOVA de Friedman, se concluye que existen diferencias significativas (p-valor < 0.01) entre los algoritmos en la evaluación de pagadores de impuestos 2024-01-12T19:47:02Z 2024-01-12T19:47:02Z 2023 info:eu-repo/semantics/bachelorThesis https://hdl.handle.net/20.500.14292/2634 spa info:eu-repo/semantics/openAccess https://creativecommons.org/licenses/by-nc-nd/4.0/ application/pdf application/pdf application/pdf application/pdf Universidad Nacional Agraria de la Selva PE Universidad Nacional Agraria de la Selva Repositorio Institucional - UNAS |
| spellingShingle | Machine Learning Impuesto predial Métricas de rendimiento Friedman Factores socioeconómicos https://purl.org/pe-repo/ocde/ford#1.02.01 Junco Aranciaga, Antonio Gabriel Evaluación comparativa en el desempeño de modelos de machine learning en la predicción de pagadores del impuesto predial de la ciudad de Tingo María para el año 2019 |
| title | Evaluación comparativa en el desempeño de modelos de machine learning en la predicción de pagadores del impuesto predial de la ciudad de Tingo María para el año 2019 |
| title_full | Evaluación comparativa en el desempeño de modelos de machine learning en la predicción de pagadores del impuesto predial de la ciudad de Tingo María para el año 2019 |
| title_fullStr | Evaluación comparativa en el desempeño de modelos de machine learning en la predicción de pagadores del impuesto predial de la ciudad de Tingo María para el año 2019 |
| title_full_unstemmed | Evaluación comparativa en el desempeño de modelos de machine learning en la predicción de pagadores del impuesto predial de la ciudad de Tingo María para el año 2019 |
| title_short | Evaluación comparativa en el desempeño de modelos de machine learning en la predicción de pagadores del impuesto predial de la ciudad de Tingo María para el año 2019 |
| title_sort | evaluacion comparativa en el desempeno de modelos de machine learning en la prediccion de pagadores del impuesto predial de la ciudad de tingo maria para el ano 2019 |
| topic | Machine Learning Impuesto predial Métricas de rendimiento Friedman Factores socioeconómicos https://purl.org/pe-repo/ocde/ford#1.02.01 |
| url | https://hdl.handle.net/20.500.14292/2634 |
| work_keys_str_mv | AT juncoaranciagaantoniogabriel evaluacioncomparativaeneldesempenodemodelosdemachinelearningenlapredicciondepagadoresdelimpuestopredialdelaciudaddetingomariaparaelano2019 |