OpenAI ya perfila cuándo lanzará su nueva versión de ChatGPT; GPT-5. Se espera que sea a mediados de 2024, tal vez durante el periodo estival, cuando la compañía de Sam Altman irrumpa en el mercado con el que promete que será un producto capaz de mejorar a GPT-4. Recordar que éste llegó hace un año y generó un cierto revuelo por su capacidad para imitar la comunicación y el comportamiento humano.
Algunas fuentes señalan que GPT-5 ya está siendo probado entre determinados clientes empresariales, los cuales han aportado su particular feedback a la compañía. Hasta la fecha, se desconoce si será realmente denominada la nueva versión como GPT-5, GPT-4 Turbo o GPT-4.5.
Las claves de GPT-5
Aunque aún no se han desvelado muchos detalles al respecto, las declaraciones recientes de un director ejecutivo, ante su experiencia con una versión de GPT-5, reflejan que se trata de una herramienta realmente buena y materialmente mejor. Además, presenta la capacidad de lanzar agentes de IA desarrollados por OpenAI para realizar tareas automáticamente.
Para probar el nuevo modelo, OpenAI ha utilizado casos de uso y datos exclusivos de su empresa. Será un modelo de lenguaje grande (LLM) multimodal, capaz de aceptar la entrada de texto o visual codificada.
Recordar que los LLM de OpenAI están capacitados en conjuntos de datos masivos extraídos de Internet y con licencia de otras compañías de medios. Solo así podrán responder a las indicaciones de los usuarios de manera humana y racional.
Si GPT-5 fuese capaz de mejorar la generalización, es decir, su capacidad para realizar tareas novedosas, y a su vez reducir las alucinaciones, se traducirá en un avance notable para OpenAI.
Además, tal y como sucede con GPT-4, será un modelo de predicción del siguiente token. De esta forma, generará mejores estimaciones de una secuencia, garantizando tareas como completar una oración o escribir un código completo. A partir de aquí, los modelos GPT pueden impulsar aplicaciones de chatbot conversacionales.
OpenAI sigue trabajando en el entrenamiento del modelo GPT-5, pese a que no se han filtrado demasiados detalles sobre sus mejoras. Se espera que supere las carencias de GPT-4, especialmente en materia de rendimiento y de calidad de respuestas, ya que la versión actual contempla problemas de alucinaciones muy criticados por los usuarios.
Se desconoce también el tamaño de GPT-5. Que no se conozcan estas claves a día de hoy es como consecuencia del cambio de rumbo y estrategia empresarial de OpenAI. Y es que a pesar de nacer como una compañía sin ánimo de lucro, ha ido adoptando un enfoque comercial significativo y, por ende, ahora todos sus proyectos tienen secretos comerciales.
GPT-4 como modelo inspirador
En la reciente Conferencia de Desarrolladores GTC 2024, NVIDIA desveló el dato del tamaño de GPT-4. Se trata de un modelo revolucionario de 1,8 billones de parámetros, es decir, un enrome tipo de lenguaje que es 10 veces más grande que GPT-3 y sus 175.000 millones de parámetros.
La rumorología invita a pensar que OpenAI podría haber utilizado la arquitectura Mixture of Experts (MoE) para abordar problemas como la distribución de la carga computacional en diferentes módulos expertos. De hecho, en GPT-4 se ha confirmado la existencia de un MoE.
Cuando OpenAI lanzó en noviembre de 2023 su modelo GPT-4 Turbo redujo los costos de inferencia (ejecución), aunque estuvo sometido a acusaciones de ‘pereza’. Y es que el modelo, en muchas ocasiones, se negaba a responder indicaciones o completar proyectos de codificación.
En infinidad de ocasiones, la compañía de Sam Altman ha intentado solventar este problema. Y es que la calidad de la información proporcionada por el modelo variará según los datos de entrenamiento utilizados y la tendencia del modelo a inventar información.
La férrea apuesta de Microsoft
Un aspecto que sí ha trascendido es que Microsoft está invirtiendo millones de dólares en sus centros de datos. Los modelos de IA de OpenAI se entrenan y funcionan desde la plataforma de computación en la nube Microsoft Azure AI. Así pues, a las GPU NVIDIA H100 les han seguido ahora las GPU NVIDIA GB200.
GPT-5 se hará esperar
Pese a que la fecha oficial sigue siendo una incógnita, ya que las pruebas podrían retrasar el lanzamiento de GPT-5 al segundo semestre de 2024, es la primera vez que se conoce una posible fecha de lanzamiento de manos de una fuente fiable.
Además, GPT-5 está lo suficientemente completo y preparado como para someterse a pruebas, lo que demuestra que su ejecución de entrenamiento principal está completa. No obstante, se realizarán mejoras en el que se espera que sea el modelo más avanzado de OpenAI.
Una vez completado íntegramente, el modelo será sometido a pruebas de seguridad internas y a numerosos ‘equipos rojos’. Solo de este modo se podrán identificar y abordar problemas previos a su lanzamiento público. De ahí que la fecha pudiese retrasarse en función de la duración del proceso de prueba de seguridad.