o “cómo la teoría puede mejorar a las máquinas”
University of Utah, US
Booz Allen Hamilton, US
Pueden descargar la presentación en https://ggv.cl/slides/udd-ene2024
Profesor de Investigación en Epidemiología de la Universidad de Utah.
Lead Scientist en la consultora Booz Allen Hamilton.
Doctor en Bioestadística de la Universidad del Sur de California (USC).
Magíster en Ciencias Sociales del Instituto Tecnológico de California (Caltech).
Magíster en Economía y Poíticas Públicas de la Universidad Adolfo Ibáñez (UAI).
“[L]a capacidad de un sistema para interpretar correctamente datos externos, y así aprender y emplear esos conocimientos para lograr tareas y metas concretas a través de la adaptación flexible.”
– Kaplan and Haenlein (2019)
En términos sencillos, todos los modelos de IA y aprendizaje de máquina funcionan de la siguiente manera:
Obtener datos:
Diseñar modelo (arquitectura):
Qué variables de la BD se utilizarán (selección).
Como se procesarán los datos (hyperpárametros).
Definir criterio para aproximar los datos (función de pérdida).
NVidia tiene una muy buena descripción de estos modelos (Lee 2023):
Revisaremos algunos casos donde la AI/ML ha fallado.
El diario New York Times [NYT] que ChatGPT reproducia contenido literal del diario.
El problema es que aquel contenido estaba protegido por un PayWall.
NYT terminó demandando a OpenAI y Microsoft (dueños de ChatGPT) por violación de derechos de autor (CNNEE 2023; Muñoz-Ledo 2024).
Midjourney is getting crazy powerful—none of these are real photos, and none of the people in them exist. pic.twitter.com/XXV6RUrrAv
— Miles ((mileszim?)) January 13, 2023
Un correo real que recibí durante el 2023:
Estimado Sr. Vega Yon,
Soy un académico en Alemania estudiando difusión en redes. Encontré (o mejor dicho, ChatGPT encontró) que su librería netdiffuseR aparentemente incluía una función llamada “multi.diffusion” para estimar exactamente ese caso. Parece que había un artículo de Wang, Robins y Pattison, “Competing Risks Diffusion in Networks: A Continuation Ratio Model with Time-Varying Effects” así como un Vignette llamado “competingrisks” disponible. Sin embargo, no pude encontrar ninguno de esos.
¿Cuál creen ustedes que fué el problema?…
¡Dicha función + paper + vignette nunca existieron!
En resumen, nuestro trabajo suguiere que los datos utilizados para entrenar los mejores LLM pueden ser extraidos con técnicas simples
– Traducido al español del artículo Nasr et al. (2023)
Utilizando el texto: “fontanero de video juegos”, los autores del artículo lograron extraer la siguiente imagen:
Un texto simple: “captura de pantalla de peliculas populares”
El Aprendizaje de Máquina Mechanistico (mechanistic ML, o MechML)–también conocido como theory-guided data science/machine learning: Un híbrido entre modelos guiados por teoría y modelos guiados por los datos.
El aprendizaje de máquina ayuda a explicar lo que la teoría no puede… pero aún necesitamos teoría (Lazer et al. 2014)!
Warning
Mechanistic Machine Learning no es diseño de variables. Necesitas un modelo completo mecanístico completo para integrar con el modelo predictivo.
Tampoco es lo que se conoce como ML ensamble, donde se mezclan predicciones después de generalas.
Así, PGRNN puede aprovechar las fortalezas de los modelos basados en la física y llena vacíos de conocimiento empleando modelos predictivos de vanguardia que aprenden de los datos. – Jia et al. (2021)
¡Gracias!
George G. Vega Yon, Ph.D.
george.vegayon@utah.edu