Absolutamente nada, ni nadie está a salvo de los ciberataques. Ni tan siquiera el prestigioso proyecto de código abierto desarrollado por la Universidad de California, Berkeley, Ray.

Éste es un sistema distribuido que permite escribir aplicaciones de Python paralelas y distribuidas, con un enfoque propio en cargas de trabajo de aprendizaje automático. A diferencia de otros sistemas existentes, Ray proporciona una infraestructura unificada que permite a los desarrolladores hacer uso de bibliotecas especializadas para los diferentes componentes del ecosistema de aprendizaje automático, como son: el entrenamiento de modelos, el procesamiento de datos, la búsqueda de hiperparámetros y el servicio de modelos.

Una de las grandes ventajas de este código abierto es que evita la necesidad de crear sistemas distribuidos propios para cada aplicación. Esto reduce de forma importante la duplicación de esfuerzos acelerando así el tiempo de implementación.

Hace escasos días, el periodista en ciberseguridad Dan Goodin hacia saltar todas las alarmas, Ray había sido atacado. Miles de servidores que almacenan cargas de trabajo de IA y credenciales de red habían sido hackeados en una campaña de ataques dirigidos a una vulnerabilidad reportada en Ray. No hay que olvidar que Ray es utilizado por gigantes como OpenAI, Uber o Amazon, entre otros. Además, dicho ataque había sido llevado a cabo durante al menos siete meses sin que nadie se hubiera percatado de ello.

El resultado, además, conlleva un resultado cuanto menos preocupante: se habrían podido manipular gran cantidad de modelos de IA. Además de comprometer credenciales de red pudiendo acceder con ello a redes internas, bases de datos y tokens con las que acceder a plataformas como OpenAI, Hugging Face, Stripe y Azure.

Por si no fuera poco, los ciberdelincuentes también habrían instalado mineros de criptomonedas y shells inversos. Estos son interfaces basadas en texto para controlar servidores de forma remota.

Un ciberataque se ceba con Ray, el código abierto para aplicaciones de IA emergentes

Ray: la vulnerabilidad de la IA de OpenAI 

Entre la inmensa cantidad de información confidencial comprometida se han podido encontrar cargas de trabajo de producción de IA con la que los atacantes pueden controlar o manipular los modelos durante la fase de entrenamiento y por tanto manipular el resultado final de dichos modelos.

Los clústeres vulnerables exponen un panel central a Internet, una configuración que permite a cualquiera que lo busque ver un historial de todos los comandos introducidos hasta la fecha. Este historial permite a un intruso aprender rápidamente cómo funciona un modelo y a qué datos confidenciales tiene acceso.

Hay que tener en cuenta que, en la configuración predeterminada, Ray no aplica la autenticación, por lo que los atacantes pueden enviar trabajos libremente, eliminar trabajos existentes, recuperar información confidencial y explotar otras vulnerabilidades.

Anyscale, la actual empresa desarrolladora y encargada del mantenimiento de Ray, ha aconsejado que a partir de ahora este código abierto se ejecutará adecuadamente dentro de una red debidamente segura. O lo que es lo mismo, van a evitar el acceso al clúster de Ray desde dispositivos que no son de confianza como por ejemplo la internet pública.

Anyscale es la empresa detrás del proyecto de código abierto Ray. Fue fundada por los creadores originales de Ray, incluido Robert Nishihara, Philipp Moritz, Ion Stoica y otros, con el objetivo de llevar el poder de Ray a empresas y desarrolladores de todo el mundo.

El objetivo desde el principio siempre fue ofrecer una API en Python que facilitara la escritura de aplicaciones distribuidas. Y que, a su vez, permitiera a los usuarios definir tareas paralelas y distribuidas, así como implementar algoritmos de IA/ML en clústeres de computadoras.

AnyScale promueve y apoya el desarrollo de Ray, ofreciendo servicios y productos adicionales en torno a la plataforma Ray para ayudar a las organizaciones a implementar y escalar aplicaciones de IA/ML en entornos de producción.

De momento, un representante de Anyscale  ha afirmado que la compañía planea publicar un script que permita a los usuarios verificar fácilmente si sus instancias de Ray están expuestas a Internet o no.

Deja un comentario

Por favor, introduce tu comentario
Por favor, introduce tu nombre