Temas Científicos - Blog de SOCA: 17 jul 2018

martes, 17 de julio de 2018

LA REBELIÓN DE LAS MÁQUINAS

El aprendizaje automático se convertirá en una herramienta aún más importante cuando los científicos se actualicen al Gran Colisionador de Hadrones de alta luminosidad.

Obra de Sandbox Studio, Chicago

¿Cuándo se convierten algunos puntos dispersos en una línea? ¿Y cuándo se convierte esa línea en una pista de partículas? Durante décadas, los físicos han estado haciendo este tipo de preguntas.

Hoy, también lo son sus máquinas.

El aprendizaje automático es el proceso mediante el cual la tarea de reconocimiento de patrones se subcontrata a un algoritmo informático. Los humanos son naturalmente muy buenos para encontrar y procesar patrones. Es por eso que puedes reconocer al instante una canción de tu banda favorita, incluso si nunca la has escuchado antes.

El aprendizaje automático toma este proceso muy humano y deja atrás el poder de la computación. Mientras que un ser humano podría reconocer una banda basada en una variedad de atributos, como el tenor vocal del cantante principal, una computadora puede procesar otras características sutiles que un ser humano podría pasar por alto. La plataforma de transmisión de música Pandora categoriza cada pieza de música en términos de 450 cualidades auditivas diferentes.

"Las máquinas pueden manejar mucha más información de la que nuestros cerebros pueden", dice Eduardo Rodrigues, físico de la Universidad de Cincinnati. "Es por eso que pueden encontrar patrones que a veces son invisibles para nosotros".

El aprendizaje automático comenzó a ser un lugar común en informática durante la década de 1980, y los físicos de LHC lo han usado rutinariamente para ayudar a gestionar y procesar datos brutos desde 2012. Ahora, con las actualizaciones de lo que ya es el acelerador de partículas más poderoso del mundo en el horizonte, los físicos están implementando nuevas aplicaciones de aprendizaje automático para ayudarlos con el inminente diluvio de datos.

"La actualización de alta luminosidad al LHC va a aumentar nuestra cantidad de datos en un factor de 100 en relación con la utilizada para descubrir el Higgs", dice Peter Elmer, físico de la Universidad de Princeton. "Esto nos ayudará a buscar partículas raras y nueva física, pero si no estamos preparados, corremos el riesgo de quedar completamente inundado de datos".

Solo una pequeña fracción de las colisiones del LHC son interesantes para los científicos. Por ejemplo, los bosones de Higgs nacen en aproximadamente una de cada dos mil millones de colisiones de protones y protones. El aprendizaje automático está ayudando a los científicos a clasificar el ruido y aislar lo que es realmente importante.

"Es como extraer gemas raras", dice Rodrigues. "Mantener toda la arena y los guijarros sería ridículo, así que usamos algoritmos para ayudarnos a identificar las cosas que parecen interesantes. Con el aprendizaje automático, podemos purificar la muestra aún más y de manera más eficiente ".

Los físicos de LHC usan un tipo de aprendizaje automático llamado aprendizaje supervisado. El principio detrás del aprendizaje supervisado no es nada nuevo; de hecho, es la forma en que la mayoría de nosotros aprende a leer y escribir. Los físicos comienzan por entrenar sus algoritmos de aprendizaje automático con datos de colisiones que ya están bien entendidas.

Ellos les dicen: "Así es como se ve un Higgs; esto es lo que parece una partícula con un quark inferior".

Después de darle a un algoritmo toda la información que ya conocen sobre cientos de ejemplos, los físicos retroceden y le asignan tareas a la computadora para identificar las partículas en colisiones sin etiquetas. Monitorean qué tan bien funciona el algoritmo y dan correcciones en el camino. Eventualmente, la computadora necesita solo una guía mínima y puede llegar a ser incluso mejor que los humanos al analizar los datos.

"Esto está ahorrando mucho tiempo al experimento LHCb", dice Rodrigues. "En el pasado, necesitábamos meses para dar sentido a nuestros datos de detectores sin procesar. Con el aprendizaje automático, ahora podemos procesar y etiquetar eventos dentro de las primeras horas después de que los grabemos ".

El aprendizaje automático no solo ayuda a los físicos a comprender sus datos reales, sino que también les ayudará a crear simulaciones para probar sus predicciones a partir de la teoría.

Utilizando algoritmos en ausencia de aprendizaje automático, los científicos han creado versiones virtuales de sus detectores con todas las leyes conocidas de la física pre programadas.

"El experimento virtual sigue las leyes conocidas de la física a una T", dice Elmer. "Simulamos colisiones protón-protón y luego predecimos cómo los subproductos interactuarán con cada parte de nuestro detector".

Si los científicos encuentran una discrepancia consistente entre los datos virtuales generados por sus simulaciones y los datos reales registrados por sus detectores, podría significar que las partículas en el mundo real están jugando con un conjunto de reglas diferentes a las que los físicos ya conocen.

Una debilidad de las simulaciones actuales de los científicos es que son demasiado lentos. Utilizan una serie de algoritmos para calcular con precisión cómo una partícula interactuará con cada parte del detector que golpea mientras se mueve a través de las muchas capas de un detector de partículas.

A pesar de que solo se necesitan unos minutos para simular una colisión de esta manera, los científicos necesitan simular billones de colisiones para cubrir los posibles resultados de los 600 millones de colisiones por segundo que registrarán con el HL-LHC."No tenemos el tiempo o los recursos para eso", dice Elmer.

Con el aprendizaje automático, por otro lado, pueden generalizar. En lugar de calcular cada interacción individual de partículas con la materia a lo largo del camino, pueden estimar su comportamiento general en función de sus rutas típicas a través del detector.

"Es una cuestión de equilibrar la calidad con la cantidad", dice Elmer. "Todavía utilizaremos los cálculos muy precisos para algunos estudios. Pero para otros, no necesitamos tales simulaciones de alta resolución para la física que queremos hacer ".

El aprendizaje automático está ayudando a los científicos a procesar más datos más rápidamente. Con las actualizaciones planificadas para el LHC, podría jugar un papel aún grande en el futuro. Pero no es una bala de plata, dice Elmer.

"Todavía queremos entender por qué y cómo funcionan todos nuestros análisis para que podamos estar completamente seguros de los resultados que producen", dice. "Siempre necesitaremos un equilibrio entre las nuevas tecnologías brillantes y nuestras técnicas de análisis más tradicionales".

Fuente: SYMMETRY 17. julio.2018 – Sara Charley (Rice of the Machines)

Traducción libre de Soca