Amazon está celebrando esta semana el evento re:Invent de su división Amazon Web Services, en el que compartió las novedades en las que están trabajando en materia de inteligencia artificial (IA) y modelos generativos. En ese marco, la compañía tecnológica presentó Nova, su nueva familia de modelos fundacionales con capacidades multimodales, a los que se suman Nova Canvas y Nova Reels, para generación de imágenes y video a partir de texto.
El catálogo de Amazon Nova se compone de cuatro modelos de IA: Micro, Lite, Pro y Premier. Los tres primeros ya están disponibles para probar a través de la plataforma Amazon Bedrock, mientras que Premier aún continúa en etapa de entrenamiento y la empresa aspira a lanzarlo a comienzos del próximo año como la versión más avanzada entre las que han desarrollado.
Mientras que Amazon Nova Micro solo tiene soporte para procesamiento de texto tanto de entrada como salida, las otras variantes permiten trabajar también con imágenes y videos.
Nova Micro está pensado como la variante más económica de los modelos, prometiendo operaciones a baja latencia. Ofrece soporte para más de 200 idiomas y su ventana de contexto máxima es de 128.000 tokens, con capacidades optimizadas principalmente para labores de traducción, generación de resúmenes y programación.
En cuanto a las versiones Lite y Pro de Nova, Amazon indicó que se trata de modelos multimodales con diferencias de potencia. Ambos soportan también más de 200 idiomas, mientras que la extensión de contexto se eleva hasta 300.000 tokens. El primero fue definido como una IA multimodal de bajo coste, con capacidades especialmente pensadas para labores de aprendizaje automático; mientras que el segundo es el más potente de los tres y destaca por su velocidad y precisión a la hora de cumplir tareas como el análisis de documentos financieros, el desarrollo de software o el razonamiento matemático.
La compañía también hizo una demostración de los modelos Nova Canvas y Nova Reels.
Canvas promete generar imágenes de calidad profesional a través de prompts de hasta 1.024 caracteres de extensión, e incluye también múltiples herramientas integradas para la eliminación de fondos y el ajuste del esquema de colores, entre otras posibilidades de edición.
Reels, por su parte, soporta prompts de hasta 512 caracteres de extensión y ofrece ajustes interesantes para hacer acercamientos, rotaciones y distintos paneos de cámara. También puede usar una imagen fija de referencia para crear clips, que de momento están limitados a seis segundos de duración. Ambos modelos, cabe mencionar, aceptan indicaciones únicamente inglés.
Alianza con Anthropic
La apuesta de Amazon es expandir la oferta de modelos Nova durante el próximo año, y esto demandará que la compañía habilite desarrollos como modelos de voz a voz y con mayores capacidades multimodales para poder competir con líderes de la industria de IA, como OpenAI. Para ello, hicieron un acuerdo con la firma Anthropic, también un destacado jugador en el sector, para fabricar una de las supercomputadoras más potentes del mundo bajo la denominación de proyecto Rainer. Al finalizarla, dijeron desde Amazon, esta computadora será cinco veces más capaz que la utilizada para el modelo más potente de Anthropic hasta la fecha. Además, incorporará cientos de miles de chips Trainium 2, fabricados por el gigante del comercio electrónico, lo que la convertiría en la computadora de IA más grande del mundo.