AWS, la división de computación en la nube de Amazon, presentó este martes una nueva familia de modelos de lenguaje multimodales de inteligencia artificial generativa, Amazon Nova. Lo hizo en el contexto de re:Invent, el evento que realiza todos los años la compañía desde Las Vegas, que es una de las más grandes del sector tecnológico y tiene un fuerte foco en el desarrollo de sistemas, aplicaciones y lanzamientos de productos en la comunidad del cloud computing.
La inteligencia artificial generativa ganó mucho terreno durante 2024 y, con OpenAI (ChatGPT) a la cabeza, todas las tecnológicas salieron con sus propios productos a competir en el mercado. Amazon Bedrock es la plataforma de IA para desarrolladores, que AWS lanzó en abril del año pasado.
En la charla principal (keynote), Matt Garman, CEO de AWS, presentó novedades en el área de cómputo y el procesamiento de datos, para luego introducir a Andy Jassy, CEO de Amazon y sucesor de Jeff Bezos en el puesto, luego de que el fundador de la empresa dejara la conducción en 2021. Jassy fue el encargado de presentar el plato fuerte: cuatro nuevos modelos de IA generativa: Micro, Lite, Pro y Premier.
Estuvimos trabajando en nuestros modelos de frontera, que han avanzado muchísimo en los últimos cuatro o cinco meses. Y pensamos que si nosotros les sacamos partido, probablemente ustedes también”, dijo Jassy durante la presentación.
Cómo es cada modelo de texto
AWS entra fuerte a competir en el mercado de la GenIA pero con el foco en el desarrollo: ahí donde el usuario final entra a ChatGPT para producir un texto o a Midjourney para crear una imagen, el cliente de AWS puede servirse de nuevas implementaciones dentro de Bedrock, su IA.
“Tanto para desarrollar aplicaciones de procesamiento de documentos que necesitan procesar imágenes y texto, como para crear contenido de marketing a escala o creando asistentes de IA que puedan comprender información visual, Amazon Nova proporciona la inteligencia y la flexibilidad que necesita con dos categorías de modelos: comprensión y generación de contenido creativo”, explicó la empresa en un comunicado oficial.
Los nuevos modelos Nova de generación de texto, optimizados para 15 idiomas (con foco principal en inglés), tienen tamaños y capacidades que varían según el uso, explicó Jassy. Micro sólo puede recibir y enviar texto, pero ofrece la latencia más baja de todas (es decir, es más rápido).
Lite es de “muy bajo costo”, dice AWS, y puede procesar imágenes, video y texto, pero ofrece una combinación equilibrada de precisión, velocidad y costo para diversas tareas.
Pro y Premier, al igual que Lite, pueden analizar texto, imágenes y video pero con más capacidades, siendo Premier el más desarrollado y esperado para principios de 2025.
Jassy aseguró que estos modelos son “los más rápidos en su clase”, pero a la vez que son los más baratos para correr. “Hemos optimizado estos modelos para que funcionen con sistemas y API propios, de forma que se puedan realizar múltiples pasos automáticos orquestados de forma mucho más sencilla con estos modelos”, agregó Jassy.
También se presentaron dos modelos de imágenes y videos: Canvas y Reel, el primero para imágenes generadas por IA y el segundo para videos de unos seis segundos.
En este sentido, Jassy se adelantó a una discusión muy fuerte en la inteligencia artificial que es tanto la responsabilidad en la generación del contenido, como en cuanto a la transparencia de que un texto o imagen esté generado con IA.
“Estamos tratando de limitar la generación de contenido dañino”, aseguró, motivo por el cual se aplican las mismas limitaciones que en Bedrock para combatir “desinformación, material de abuso sexual infantil y riesgos químicos, biológicos o nucleares.
En diversas sesiones de re:Invent con periodistas, representantes de la empresa aseguraron que la información de los usuarios no se utiliza para entrenar sus modelos de IA, aunque especialistas en materia de protección de datos personales aseguran que no esto no queda del todo claro.
Por último, dentro de los avances de modelos de IA, Jassy contó que la compañía trabaja en un modelo “speech-to-speech”, que tomaría discursos y produciría una versión transformada, incluyendo interpretación de tono y cadencia, más allá de la semántica, para generar “voces muy naturales” (esto hacia mediados de 2025).
“Se podrá introducir texto, voz, imágenes o video y emitir texto, voz, imágenes o video, este es el futuro de cómo se van a construir y consumir los modelos de frontera”, cerró el CEO de Amazon.
Fue la primera vez que Jassy habló como CEO de Amazon, ya que en ediciones pasadas fue el orador principal por su rol de director de AWS.
Anuncios en América Latina
Además de la sesión principal, re:Invent realiza sesiones con especialistas, analistas y periodistas. En una de ellas, realizada con prensa de América Latina, dieron detalles sobre los casos de uso de AWS más conocidos en la región, como el caso de Boti en la Ciudad de Buenos Aires, que corre sobre AWS, o el de los datos de la Municipalidad de Córdoba.
En una sesión con periodistas de América del Sur, Andrés Tahta, Director General del Sector Público para América Latina de AWS, contó casos en los que se está usando la tecnología para analizar mosquitos e identificar si pueden ser portadores de dengue en el municipio de Vicente López, junto a otro sistema público en Tierra del Fuego para prevenir incendios.
También arrojaron números. Uno de los datos que revelaron fue que la nube “generó 53,000 millones de dólares del PBI de América Latina en 2023”, según datos oficiales de la empresa. “Mirando el potencial y las oportunidades de innovación que tenemos, esta cifra podría superar los USD 700,000 millones en los próximos cinco años”, comentó Paula Bellizia, vicepresidenta para América Latina de AWS, en su primera participación en AWS re:Invent 2024, durante la mañana del lunes.
En este sentido, Brasil y México siguen siendo los principales focos: invertirán más de 6,000 millones USD en América Latina en los próximos años, 5,000 millones en la creación de una nueva Región AWS (conjunto de centros de datos) en México y 1,800 millones para la ampliación y modernización de infraestructura en Brasil.
“Se espera que la industria de tecnologías de la información crezca un 11% en América Latina en 2025. Esto es 5 veces más que el aumento del PIB total de la región. Se espera que los servicios de computación en la nube se expandan un 21%, mientras que el uso de inteligencia artificial sea un 49% mayor”, agregaron en relación a Latinoamérica.
Según Juan-Carlos Gutierrez, director de Tecnología y Arquitectura de Soluciones de AWS para América Latina, la IA generativa “está alcanzando un nuevo punto de madurez: en 2023, las empresas realizaron pruebas de concepto para ver si podían utilizarla, ya este año, empresas de todos los sectores y tamaños comenzaron a utilizarla de manera efectiva en sus procesos. En 2025, el desafío será escalar este uso”.
Sobre re:Invent
re:Invent se realiza desde hace 13 años y es el evento más grande de la compañía. Este año asistieron cerca de 60 mil personas de manera presencial, en el hotel Venetian, y casi medio millón de personas online, según los datos de la compañía.
Durante la charla principal, Matt Garman, CEO de la empresa, aseguró que la compañía sigue con el foco en el cliente, algo en lo que Jeff Bezos siempre hizo hincapié dentro de la cultura de Amazon (la conocida “obsesión por el cliente”).
“En AWS pensamos en construir bloques, cuando un servicio hace algo muy bien, eso se puede combinar con otro servicio para construir cosas aún más interesantes: eso ha sido fundamental durante los 18 años de AWS”, dijo en la apertura de su keynote.
Durante los días de la convención hubo sesiones y charlas con foco en los distintos productos de la empresa, pero por sobre todo en el pilar de la ciberseguridad: “La seguridad siempre tiene que ser nuestra prioridad, es parte de nuestra cultura y lo ha sido desde los inicios”, sentenció Garman.
Las sesiones duran toda la semana, hasta el viernes.