El
aprendizaje automático se convertirá en una herramienta aún más importante
cuando los científicos se actualicen al Gran
Colisionador de Hadrones de alta luminosidad.
Obra
de Sandbox Studio, Chicago
¿Cuándo se convierten algunos puntos dispersos en una
línea? ¿Y cuándo se convierte esa línea en una pista de partículas? Durante
décadas, los físicos han estado haciendo este tipo de preguntas.
Hoy,
también lo son sus máquinas.
El aprendizaje automático es el
proceso mediante el cual la tarea de reconocimiento de patrones se subcontrata
a un algoritmo informático. Los humanos son naturalmente muy buenos para
encontrar y procesar patrones. Es por eso que puedes reconocer al instante
una canción de tu banda favorita, incluso si nunca la has escuchado antes.
El aprendizaje automático toma
este proceso muy humano y deja atrás el poder de la computación. Mientras
que un ser humano podría reconocer una banda basada en una variedad de
atributos, como el tenor vocal del cantante principal, una computadora puede
procesar otras características sutiles que un ser humano podría pasar por alto. La
plataforma de transmisión de música Pandora categoriza cada pieza de música en
términos de 450 cualidades auditivas diferentes.
"Las máquinas pueden manejar mucha más
información de la que nuestros cerebros pueden", dice Eduardo Rodrigues, físico de la Universidad de Cincinnati. "Es por eso que pueden encontrar
patrones que a veces son invisibles para nosotros".
El aprendizaje automático comenzó
a ser un lugar común en informática durante la década de 1980, y los físicos de
LHC lo han usado rutinariamente para ayudar a gestionar y procesar datos brutos
desde 2012. Ahora, con las actualizaciones de lo que ya es el acelerador de
partículas más poderoso del mundo en el horizonte, los físicos están
implementando nuevas aplicaciones de aprendizaje automático para ayudarlos con
el inminente diluvio de datos.
"La actualización de alta luminosidad al LHC va a
aumentar nuestra cantidad de datos en un factor de 100 en relación con la
utilizada para descubrir el Higgs", dice Peter
Elmer, físico de la Universidad de Princeton. "Esto nos ayudará a buscar partículas raras y nueva física, pero
si no estamos preparados, corremos el riesgo de quedar completamente inundado
de datos".
Solo una pequeña fracción de las
colisiones del LHC son interesantes para los científicos. Por ejemplo, los
bosones de Higgs nacen en aproximadamente una de cada dos mil millones de
colisiones de protones y protones. El aprendizaje automático está ayudando
a los científicos a clasificar el ruido y aislar lo que es realmente
importante.
"Es como extraer gemas raras", dice Rodrigues. "Mantener
toda la arena y los guijarros sería ridículo, así que usamos algoritmos para
ayudarnos a identificar las cosas que parecen interesantes. Con el
aprendizaje automático, podemos purificar la muestra aún más y de manera más
eficiente ".
Los físicos de LHC usan un tipo
de aprendizaje automático llamado aprendizaje supervisado. El principio
detrás del aprendizaje supervisado no es nada nuevo; de hecho, es la forma
en que la mayoría de nosotros aprende a leer y escribir. Los físicos
comienzan por entrenar sus algoritmos de aprendizaje automático con datos de
colisiones que ya están bien entendidas.
Ellos les dicen: "Así es como se ve un Higgs; esto
es lo que parece una partícula con un quark inferior".
Después de darle a un algoritmo
toda la información que ya conocen sobre cientos de ejemplos, los físicos
retroceden y le asignan tareas a la computadora para identificar las partículas
en colisiones sin etiquetas. Monitorean qué tan bien funciona el algoritmo
y dan correcciones en el camino. Eventualmente, la computadora necesita
solo una guía mínima y puede llegar a ser incluso mejor que los humanos al
analizar los datos.
"Esto está ahorrando mucho tiempo al experimento
LHCb", dice Rodrigues. "En el pasado, necesitábamos meses para dar sentido a nuestros
datos de detectores sin procesar. Con el aprendizaje automático, ahora
podemos procesar y etiquetar eventos dentro de las primeras horas después de
que los grabemos ".
El aprendizaje automático no solo
ayuda a los físicos a comprender sus datos reales, sino que también les ayudará
a crear simulaciones para probar sus predicciones a partir de la teoría.
Utilizando algoritmos en ausencia
de aprendizaje automático, los científicos han creado versiones virtuales de
sus detectores con todas las leyes conocidas de la física pre programadas.
"El experimento virtual sigue las leyes conocidas
de la física a una T", dice Elmer. "Simulamos colisiones protón-protón y
luego predecimos cómo los subproductos interactuarán con cada parte de nuestro
detector".
Si los científicos encuentran una
discrepancia consistente entre los datos virtuales generados por sus
simulaciones y los datos reales registrados por sus detectores, podría
significar que las partículas en el mundo real están jugando con un conjunto de
reglas diferentes a las que los físicos ya conocen.
Una debilidad de las simulaciones
actuales de los científicos es que son demasiado lentos. Utilizan una
serie de algoritmos para calcular con precisión cómo una partícula interactuará
con cada parte del detector que golpea mientras se mueve a través de las muchas
capas de un detector de partículas.
A pesar de que solo se necesitan unos
minutos para simular una colisión de esta manera, los científicos necesitan
simular billones de colisiones para cubrir los posibles resultados de los 600
millones de colisiones por segundo que registrarán con el HL-LHC."No tenemos el tiempo o los recursos para
eso", dice Elmer.
Con el aprendizaje automático,
por otro lado, pueden generalizar. En lugar de calcular cada interacción
individual de partículas con la materia a lo largo del camino, pueden estimar
su comportamiento general en función de sus rutas típicas a través del
detector.
"Es una cuestión de equilibrar la calidad con la
cantidad", dice Elmer. "Todavía utilizaremos los cálculos muy
precisos para algunos estudios. Pero para otros, no necesitamos tales
simulaciones de alta resolución para la física que queremos hacer ".
El aprendizaje automático está
ayudando a los científicos a procesar más datos más rápidamente. Con las
actualizaciones planificadas para el LHC, podría jugar un papel aún grande en
el futuro. Pero no es una bala de plata, dice Elmer.
"Todavía queremos entender por qué y cómo
funcionan todos nuestros análisis para que podamos estar completamente seguros
de los resultados que producen", dice. "Siempre necesitaremos un equilibrio entre las nuevas tecnologías
brillantes y nuestras técnicas de análisis más tradicionales".
Fuente: SYMMETRY 17. julio.2018 – Sara Charley (Rice of the Machines)
Traducción libre de Soca
No hay comentarios:
Publicar un comentario