Hace casi una década desde que Amazon Web Services (AWS), la división de computación en la nube de Amazon, anunció SageMaker, su plataforma para crear, entrenar y implementar modelos de inteligencia artificial. Mientras que en años anteriores AWS se ha centrado en expandir en gran medida las capacidades de SageMaker, este año el objetivo fue simplificar.
En su conferencia re:Invent 2024, AWS presentó SageMaker Unified Studio, un único lugar para encontrar y trabajar con datos de toda una organización. SageMaker Unified Studio reúne herramientas de otros servicios de AWS, incluido el existente SageMaker Studio, para ayudar a los clientes a descubrir, preparar y procesar datos para construir modelos.
[[IMG::…]]
“Estamos viendo una convergencia entre análisis e inteligencia artificial, con clientes que utilizan datos de maneras cada vez más interconectadas,” dijo Swami Sivasubramanian, VP de datos e IA en AWS, en un comunicado. “La próxima generación de SageMaker reúne capacidades para dar a los clientes todas las herramientas que necesitan para el procesamiento de datos, el desarrollo y entrenamiento de modelos de aprendizaje automático, y la inteligencia artificial generativa, directamente dentro de SageMaker.”
Utilizando SageMaker Unified Studio, los clientes pueden publicar y compartir datos, modelos, aplicaciones y otros artefactos con miembros de su equipo u organización más amplia. El servicio expone controles de seguridad de datos y permisos ajustables, así como integraciones con la plataforma de desarrollo de modelos Bedrock de AWS.
La inteligencia artificial está integrada en SageMaker Unified Studio: en concreto, Q Developer, el chatbot de codificación de Amazon. En SageMaker Unified Studio, Q Developer puede responder preguntas como “¿Qué datos debería usar para tener una mejor idea de las ventas de productos?” o “Generar SQL para calcular los ingresos totales por categoría de producto”.

AWS explicó en una publicación de blog: “Q Developer [puede] apoyar tareas de desarrollo como descubrimiento de datos, codificación, generación de SQL e integración de datos» en SageMaker Unified Studio.
Además de SageMaker Unified Studio, AWS lanzó dos pequeñas adiciones a su familia de productos SageMaker: SageMaker Catalog y SageMaker Lakehouse.
SageMaker Catalog permite a los administradores definir e implementar políticas de acceso para aplicaciones de IA, modelos, herramientas y datos en SageMaker utilizando un único modelo de permisos con controles granulares. Mientras tanto, SageMaker Lakehouse proporciona conexiones desde SageMaker y otras herramientas a datos almacenados en lagos de datos de AWS, almacenes de datos y aplicaciones empresariales.
AWS dice que SageMaker Lakehouse funciona con cualquier herramienta compatible con los estándares de Apache Iceberg, siendo Apache Iceberg el formato de código abierto para grandes tablas analíticas. Los administradores pueden aplicar controles de acceso a través de los datos en todas las herramientas analíticas y de IA que SageMaker Lakehouse toca, si así lo desean.
En un desarrollo algo relacionado, SageMaker ahora debería funcionar mejor con aplicaciones de software como servicio, gracias a nuevas integraciones. Los clientes de SageMaker pueden acceder a datos de aplicaciones como Zendesk y SAP sin tener que extraer, transformar y cargar esos datos primero.
“Los clientes pueden tener datos distribuidos en múltiples lagos de datos, así como en un almacén de datos, y se beneficiarían de una forma sencilla de unificar todos estos datos”, escribió AWS. “Ahora, los clientes pueden utilizar sus herramientas analíticas y de aprendizaje automático preferidas en sus datos, sin importar cómo y dónde estén almacenados físicamente, para respaldar casos de uso que incluyen análisis SQL, consultas ad hoc, ciencia de datos, aprendizaje automático y IA generativa.”