Aplicación de aprendizaje reforzado en la detección de fuente de contaminación en red de agua superficial.

Rodriguez, Jaime

Repositorio Académico UOH

Bibliotecas Universidad de O'Higgins

dc.contributor.advisor	David Salas	en_US
dc.contributor.author	Rodriguez, Jaime
dc.date.accessioned	2025-10-15T18:49:01Z
dc.date.available	2025-10-15T18:49:01Z
dc.date.issued	2023
dc.identifier.uri	https://repositorio.uoh.cl/handle/611/1062
dc.description	Palabras clave: aprendizaje reforzado, búsqueda en grafos, redes neuronales artificiales, calidad de agua superficial.	en_US
dc.description.abstract	Este trabajo de titulación se enfoca en el modelamiento de una red de distribución de agua superficial, representada como un grafo con un nodo contaminante. La investigación se centra en el entrenamiento de una política cuyo objetivo es identificar el nodo contaminante tomando la menor cantidad de muestras posibles. Una muestra permite saber si el nodo contaminante está aguas arriba o no. Con esta información, una política consiste en crear un árbol de decisión que permite seleccionar el siguiente punto de muestreo usando los resultados de las muestras anteriores. Para crear políticas con aprendizaje reforzado primero se debe probar y testear si las políticas creadas realmente aprenden y así corroborar que funciona la implementación establecida, una buena opción es entrenar políticas para juegos conocidos, donde se conoce su política óptima, por ello se aplicaron técnicas avanzadas de aprendizaje reforzado en el ámbito de juegos estratégicos de dos jugadores, utilizando el juego de tres en línea como escenario de prueba. Durante esta fase experimental, se exploraron diversos algoritmos de aprendizaje reforzado. Se destacó la viabilidad de entrenar una política efectiva para un jugador, mientras se modelaba al segundo jugador como una parte intrínseca del entorno, es decir, el segundo jugador no se entrenó con aprendizaje reforzado, sino que su política se definió previamente. Se logró crear un agente lo suficientemente competente como para ganar en el 99% de las interacciones. Luego se procedió a entrenar políticas en diferentes tipos de entornos con diferentes reglas. Primeramente, se crearon grafos simples, y posteriormente, se avanzó hacia la generación de grafos dirigidos acíclicos aleatorios con diferentes dimensiones, donde una dimensión en un grafo dirigido acíclico viene dada por la cantidad de nodos que tiene el grafo. El entrenamiento de políticas en estos grafos proporcionó valiosas percepciones sobre la escalabilidad de las técnicas de aprendizaje reforzado en contextos más complejos. Finalmente se llevó a cabo un estudio utilizando datos reales de una distribución de agua superficial en la región del Biobío. El grafo dirigido acíclico consta de 127 nodos con grado máximo 5, y la política desarrollada logra encontrar el nodo contaminante en promedio después de 6.4 muestras siendo significativamente mejor que algoritmos de búsquedas en arboles actuales. Este enfoque progresivo desde juegos estratégicos hasta entornos de red de agua demuestra una metodología sistemática y rigurosa.	en_US
dc.description.tableofcontents	Resumen - Introducción - Hipótesis - Preguntas de Investigación - Objetivo General - Objetivos Específicos - Marco Teórico y Revisión de Literatura - Marco Metodológico - Conclusión - Referencias - Anexos.	en_US
dc.format	PDF	en_US
dc.format.extent	64 páginas	en_US
dc.publisher	Universidad de O'Higgins	en_US
dc.title	Aplicación de aprendizaje reforzado en la detección de fuente de contaminación en red de agua superficial.	en_US
dc.type	Tesis	en_US
uoh.carrera	Ingeniería Civil en Modelamiento Matemático de datos	en_US
uoh.direccion	Pregrado	en_US
uoh.escuela	Ingeniería	en_US
uoh.titulo.opta	Título de ingeniería civil en modelamiento matemático de datos	en_US