Publicado el Deja un comentario

Amazon SageMaker AI now supports serverless reinforcement fine-tuning for 12 additional models

Amazon SageMaker AI now supports serverless model customization and reinforcement fine-tuning for 12 additional open-weight models, enabling you to fine-tune and evaluate them without provisioning or managing infrastructure. The newly supported models are: gpt-oss-120b, Qwen2.5 72B Instruct, DeepSeek-R1-Distill-Llama-70B, Qwen3 14B, DeepSeek-R1-Distill-Qwen-14B, Qwen2.5 14B Instruct, DeepSeek-R1-Distill-Llama-8B, DeepSeek-R1-Distill-Qwen-7B, Qwen3 4B, Meta Llama 3.2 3B Instruct, Qwen3 1.7B, and DeepSeek-R1-Distill-Qwen-1.5B. With this expansion, you can customize these models using supervised fine-tuning (SFT), direct preference optimization (DPO), and reinforcement fine-tuning (RFT) techniques including RLVR and RLAIF, and only pay for what you use.

Reinforcement fine-tuning enables you to align models to complex, domain-specific reasoning tasks where techniques such as traditional SFT alone fall short. With RLVR, you can improve model accuracy on verifiable tasks such as code generation, math, and structured extraction by providing reward signals based on correctness. RLAIF uses AI-generated feedback to steer model behavior toward your quality and safety preferences. These techniques are available on previously supported and newly added models, with no cluster setup, capacity planning, or distributed training expertise required.

These models and fine-tuning techniques are available in US East (N. Virginia), US West (Oregon), Asia Pacific (Tokyo), and EU (Ireland). To get started, see the Amazon SageMaker AI model customization product page and visit the Amazon SageMaker AI pricing page (Model Customization tab) to see the full list of models, techniques, and prices. 

 

​Amazon SageMaker AI now supports serverless model customization and reinforcement fine-tuning for 12 additional open-weight models, enabling you to fine-tune and evaluate them without provisioning or managing infrastructure. The newly supported models are: gpt-oss-120b, Qwen2.5 72B Instruct, DeepSeek-R1-Distill-Llama-70B, Qwen3 14B, DeepSeek-R1-Distill-Qwen-14B, Qwen2.5 14B Instruct, DeepSeek-R1-Distill-Llama-8B, DeepSeek-R1-Distill-Qwen-7B, Qwen3 4B, Meta Llama 3.2 3B Instruct, Qwen3 1.7B, and DeepSeek-R1-Distill-Qwen-1.5B. With this expansion, you can customize these models using supervised fine-tuning (SFT), direct preference optimization (DPO), and reinforcement fine-tuning (RFT) techniques including RLVR and RLAIF, and only pay for what you use. Reinforcement fine-tuning enables you to align models to complex, domain-specific reasoning tasks where techniques such as traditional SFT alone fall short. With RLVR, you can improve model accuracy on verifiable tasks such as code generation, math, and structured extraction by providing reward signals based on correctness. RLAIF uses AI-generated feedback to steer model behavior toward your quality and safety preferences. These techniques are available on previously supported and newly added models, with no cluster setup, capacity planning, or distributed training expertise required. These models and fine-tuning techniques are available in US East (N. Virginia), US West (Oregon), Asia Pacific (Tokyo), and EU (Ireland). To get started, see the Amazon SageMaker AI model customization product page and visit the Amazon SageMaker AI pricing page (Model Customization tab) to see the full list of models, techniques, and prices.   

Publicado el Deja un comentario

AWS Batch now supports quota management and preemption for SageMaker Training jobs

AWS Batch now supports quota management with job preemption for SageMaker Training jobs, enabling you to efficiently allocate and share compute resources across your teams and projects. If you’re using GPU capacity in SageMaker Training jobs, you can now intelligently allocate compute resources, prioritize your business-critical training jobs, and automatically preempt lower-priority workloads when your urgent experiments arrive.

With quota management, you can create up to 20 quota shares per job queue that function as virtual queues with dedicated capacity limits and configurable resource sharing strategies. The service automatically uses cross-share preemption to restore borrowed capacity when the original owner submits jobs, and supports in-share preemption to allow high-priority jobs to preempt lower-priority jobs within the same quota share. You can monitor capacity utilization at the queue, quota share, and job-level granularity, update job priorities after submission to influence preemption decisions, and configure preemption retry limits to control behavior. The feature integrates directly with the SageMaker Python SDK via the aws_batch module.

Quota management with job preemption for SageMaker Training jobs is available today in all AWS Regions where AWS Batch is available. For more information, see our Quota Management example notebook on GitHub and the AWS Batch User Guide.

 

​AWS Batch now supports quota management with job preemption for SageMaker Training jobs, enabling you to efficiently allocate and share compute resources across your teams and projects. If you’re using GPU capacity in SageMaker Training jobs, you can now intelligently allocate compute resources, prioritize your business-critical training jobs, and automatically preempt lower-priority workloads when your urgent experiments arrive. With quota management, you can create up to 20 quota shares per job queue that function as virtual queues with dedicated capacity limits and configurable resource sharing strategies. The service automatically uses cross-share preemption to restore borrowed capacity when the original owner submits jobs, and supports in-share preemption to allow high-priority jobs to preempt lower-priority jobs within the same quota share. You can monitor capacity utilization at the queue, quota share, and job-level granularity, update job priorities after submission to influence preemption decisions, and configure preemption retry limits to control behavior. The feature integrates directly with the SageMaker Python SDK via the aws_batch module. Quota management with job preemption for SageMaker Training jobs is available today in all AWS Regions where AWS Batch is available. For more information, see our Quota Management example notebook on GitHub and the AWS Batch User Guide.  

Publicado el Deja un comentario

Amazon Bedrock AgentCore Runtime now supports managed session storage for persistent agent filesystem state (preview)

Amazon Bedrock AgentCore Runtime now offers managed session storage in public preview, enabling agents to persist their filesystem state across stop and resume cycles. Modern agents write code, install packages, generate artifacts, and manage state through the filesystem. Until now, that work was lost when a session stopped. With managed session storage, everything your agent writes to a configured mount path persists automatically, even after the compute environment terminates.

When you configure session storage, each session gets a persistent directory at the mount path you specify. Your agent reads and writes files as normal, and AgentCore Runtime transparently replicates data to durable storage. When the session stops, data is flushed during graceful shutdown. When you resume with the same session ID, a new microVM mounts the same storage and the agent continues from where it left off — source files, installed packages, build artifacts, and git history all intact. No checkpoint logic, no save and restore code, and no changes to your agent application required. Session storage supports standard Linux filesystem operations including regular files, directories, and symlinks, with up to 1 GB per session and data retained for 14 days of idle time. Storage communication is confined to a single session’s data and cannot access other sessions or AgentCore Runtime environments.

Session storage is available in public preview across fourteen AWS Regions: US (N. Virginia, Ohio, Oregon), Canada (Central), Asia Pacific (Mumbai, Seoul, Singapore, Sydney, Tokyo), Europe (Frankfurt, Ireland, London, Paris, Stockholm).

To learn more, see persist files across stop/resume in the Amazon Bedrock AgentCore documentation.

 

​Amazon Bedrock AgentCore Runtime now offers managed session storage in public preview, enabling agents to persist their filesystem state across stop and resume cycles. Modern agents write code, install packages, generate artifacts, and manage state through the filesystem. Until now, that work was lost when a session stopped. With managed session storage, everything your agent writes to a configured mount path persists automatically, even after the compute environment terminates.
When you configure session storage, each session gets a persistent directory at the mount path you specify. Your agent reads and writes files as normal, and AgentCore Runtime transparently replicates data to durable storage. When the session stops, data is flushed during graceful shutdown. When you resume with the same session ID, a new microVM mounts the same storage and the agent continues from where it left off — source files, installed packages, build artifacts, and git history all intact. No checkpoint logic, no save and restore code, and no changes to your agent application required. Session storage supports standard Linux filesystem operations including regular files, directories, and symlinks, with up to 1 GB per session and data retained for 14 days of idle time. Storage communication is confined to a single session’s data and cannot access other sessions or AgentCore Runtime environments.
Session storage is available in public preview across fourteen AWS Regions: US (N. Virginia, Ohio, Oregon), Canada (Central), Asia Pacific (Mumbai, Seoul, Singapore, Sydney, Tokyo), Europe (Frankfurt, Ireland, London, Paris, Stockholm).
To learn more, see persist files across stop/resume in the Amazon Bedrock AgentCore documentation.  

Publicado el Deja un comentario

AWS Backup expands support for Amazon DocumentDB to 12 Regions

AWS Backup now supports Amazon DocumentDB in 12 additional AWS Regions: Asia Pacific (Malaysia, Thailand, Osaka, Hong Kong, Jakarta, Melbourne), Europe (Stockholm, Spain, Zurich), Africa (Cape Town), Israel (Tel Aviv), and Mexico (Central).

This expansion brings policy-based data protection and recovery to your Amazon DocumentDB clusters in these newly supported Regions.

To start protecting your DocumentDB clusters with AWS Backup, add your DocumentDB clusters to your existing backup plans, or create a new backup plan and attach your DocumentDB clusters to it. To learn more about AWS Backup for Amazon DocumentDB, visit the product page, pricing page, and documentation. To get started, visit the AWS Backup console, AWS Command Line Interface (CLI), or AWS SDKs.

 

​AWS Backup now supports Amazon DocumentDB in 12 additional AWS Regions: Asia Pacific (Malaysia, Thailand, Osaka, Hong Kong, Jakarta, Melbourne), Europe (Stockholm, Spain, Zurich), Africa (Cape Town), Israel (Tel Aviv), and Mexico (Central).
This expansion brings policy-based data protection and recovery to your Amazon DocumentDB clusters in these newly supported Regions.
To start protecting your DocumentDB clusters with AWS Backup, add your DocumentDB clusters to your existing backup plans, or create a new backup plan and attach your DocumentDB clusters to it. To learn more about AWS Backup for Amazon DocumentDB, visit the product page, pricing page, and documentation. To get started, visit the AWS Backup console, AWS Command Line Interface (CLI), or AWS SDKs.  

Publicado el Deja un comentario

Empoderar al sector sin ánimo de lucro para afrontar los retos del mañana

Empoderar al sector sin ánimo de lucro para afrontar los retos del mañana

Collage digital que muestra una escena de trabajo colaborativo, enmarcada por un borde con un degradado rosa suave sobre un fondo oscuro y abstracto. Al centro, un grupo de profesionales se encuentra en una oficina moderna, conversando e intercambiando un apretón de manos mientras sostienen tabletas y cuadernos. La luz natural, la vegetación interior y las líneas arquitectónicas limpias transmiten colaboración, confianza y propósito compartido. La composición combina la conexión humana con elementos de diseño contemporáneo para evocar trabajo en equipo, liderazgo e impacto colectivo.

Por: Justin Spelhaug, presidente, Microsoft Elevate.

Al dar la bienvenida a más de 1.500 líderes de organizaciones sin ánimo de lucro de todo el mundo a la Cumbre Global de Líderes de Organizaciones Sin Ánimo de Lucro de Microsoft, recordamos el extraordinario trabajo que realizan cada día las organizaciones para fortalecer comunidades y ampliar las oportunidades. La reunión de hoy llega en un momento crucial, ya que las organizaciones sin ánimo de lucro se enfrentan a un nuevo conjunto de preguntas: ¿Cómo puede la IA ayudarles a servir a sus comunidades de manera más eficaz? ¿Y cómo desarrollan las habilidades y la capacidad para liderar este cambio desde dentro?

Las grandes transiciones tecnológicas rara vez se desarrollan de manera uniforme. A medida que la IA se difunde entre economías y sectores, crea nuevas oportunidades, pero también introduce una disrupción significativa para trabajadores, familias y comunidades. Las organizaciones sin ánimo de lucro están en una posición única para impulsar cambios significativos en el mundo actual. Son las organizaciones a las que la gente recurre primero para apoyar a quienes desarrollan nuevas habilidades, encuentran nuevas vías hacia el empleo y se mantienen conectados con los sistemas que les sostienen.

Para ayudarles a maximizar su impacto con mayor escala y eficiencia, hoy anunciamos Microsoft Elevate for Changemakers, una nueva iniciativa que proporciona a los líderes de organizaciones sin ánimo de lucro credenciales esenciales en IA, acceso a una comunidad de compañeros sólida y recursos de desarrollo de capacidades basados en roles. Este programa está diseñado para empoderar a quienes están a la vanguardia de los desafíos sociales para que lideren la adopción de la IA con confianza, de manera que refleje sus misiones y las comunidades a las que sirven.

Este nuevo programa forma parte de nuestro compromiso más amplio con Microsoft Elevate para garantizar que las personas puedan prosperar en la economía de la IA y refleja el legado de 50 años de Microsoft, en apoyo a organizaciones sin ánimo de lucro. Como organización, estamos orgullosos de colaborar con casi un millón de organizaciones sin ánimo de lucro y sistemas educativos en todo el mundo, y solo en el próximo año entregaremos más de 5.000 millones de dólares en descuentos, donaciones y subvenciones para ayudar a organizaciones sin ánimo de lucro a atender las necesidades de la comunidad.

Respaldado por el compromiso de Microsoft de garantizar que todos tengan oportunidades en la era de la IA, Microsoft Elevate for Changemakers ayuda a garantizar que quienes trabajan más cerca de los desafíos comunitarios sigan a la vanguardia de las soluciones impulsadas por IA.

El nuevo programa Microsoft Elevate for Changemakers incluye:

  • Credencial de IA para organizaciones sin ánimo de lucro: La credencial de IA para organizaciones sin ánimo de lucro es un certificado profesional, desarrollado con LinkedIn y NetHope, que ofrece a los participantes un camino de aprendizaje claro y estructurado, centrado en el trabajo real que se realiza en el sector sin ánimo de lucro. Los beneficiarios reciben un certificado profesional de LinkedIn, que reconoce de manera formal su creciente experiencia y su compromiso con el uso responsable de la IA en sus organizaciones.
  • Formación en IA en vivo y bajo demanda para desarrollar capacidad: Formación práctica en habilidades basadas en el trabajo real de organizaciones sin ánimo de lucro, no en contenido genérico de IA reempaquetado para el sector. Desde los fundamentos de Copilot hasta la gestión del cambio y la gobernanza responsable de la IA, cada módulo está diseñado para simplificar los flujos de trabajo de las organizaciones sin ánimo de lucro y ayudarles a hacer más con facilidad.
  • Una Beca Changemaker, un programa global para profesionales del sector sin ánimo de lucro en organizaciones con proyectos de IA accionables listos para avanzar en sus misiones. Esta beca proporciona los recursos esenciales, la inversión y la orientación experta necesarios para convertir la ambición de la IA en un impacto duradero. Los becarios se unirán a una cohorte mundial, crearán e implementarán planes responsables de adopción de IA, desarrollarán habilidades técnicas y de gestión del cambio críticas, y se conectarán con una red de confianza de líderes de IA sin ánimo de lucro, todo ello con el apoyo de Microsoft y socios de lanzamiento, incluyendo EY y Caribou. La Beca Changemaker está ahora abierta a organizaciones sin ánimo de lucro de todos los procedentes. Quienes estén dispuestos a marcar la diferencia con la IA pueden manifestar su interés hoy en https://aka.ms/MicrosoftElevateforChangemakers

Transformar posibilidades al empoderar a las organizaciones sin ánimo de lucro

En su mejor momento, la IA debería ampliar la agencia humana en lugar de reemplazarla. La verdadera oportunidad es dar a las personas más capacidad para resolver problemas, construir nuevas ideas y fortalecer las comunidades que les rodean.

En todo el sector sin ánimo de lucro, esto ha comenzado a tomar forma de manera práctica:

  • Tiempo enriquecedor del personal. Gran parte de la semana típica de empleados de una organización sin ánimo de lucro no contribuye de manera directa al trabajo misionero. De hecho, investigaciones revelan que casi la mitad de las organizaciones sin ánimo de lucro todavía utilizan la introducción manual de datos y hojas de cálculo para la documentación de cumplimiento, resúmenes de reuniones, notas de casos y otras operaciones. La IA reduce esa carga de formas que ya son reales y medibles, para devolver a las personas más de su semana por el trabajo que vinieron a hacer. ARCare, un proveedor sanitario en comunidades desfavorecidas de Arkansas, Kentucky y Mississippi, ya ha comenzado a ver los beneficios de su uso de tecnología de IA. Con la IA encargándose de las tareas administrativas, el personal dedica menos tiempo a la recogida de datos y más tiempo a la atención al paciente, y estiman que han eliminado entre 6 y 8 horas diarias de tareas manuales.
  • Ofrecer programas más impactantes. La IA da a las organizaciones sin ánimo de lucro la capacidad de escalar lo que funciona sin perder lo que lo hace funcionar. Opportunity International utiliza la IA para escalar el impacto a través de un chatbot en idioma local, con el fin de ofrecer a los agricultores orientación agrícola instantánea, para superar barreras de alfabetización y ampliar de manera importante su alcance. Al hacer accesible el conocimiento crítico, la IA libera a los equipos de primera línea para que se centren en las relaciones, la mentoría y el cambio a largo plazo que los programas tradicionales por sí solos no pueden lograr.
  • Involucrar a los simpatizantes y financiadores de manera más eficaz. Recaudar fondos, obtener subvenciones y construir relaciones con donantes suelen ser las prioridades estratégicas más importantes —y los retos— para las organizaciones sin ánimo de lucro que enfrentan una demanda creciente de servicios en un momento de incertidumbre económica. La IA no reemplaza las relaciones con los donantes. Da a las personas que gestionan esas relaciones más tiempo y capacidad para centrarse en lo que las construye. Head Start Homes descubrió que, a medida que la IA aumentaba su capacidad organizativa, podían escalar programas y atraer nueva financiación.
  • Operaciones de transformación. La IA otorga a las organizaciones sin ánimo de lucro la capacidad de innovar y optimizar su forma de trabajar, para aportar mayor seguridad, datos más precisos y una toma de decisiones más informada a todas las partes de la organización. El resultado es menos tiempo dedicado a gestionar la complejidad y más capacidad dirigida hacia los resultados. La organización de vivienda social, de Alliantie, es un buen ejemplo. El uso de la IA ha permitido a de Alliantie aumentar la eficiencia a través de mantener un enfoque centrado en el ser humano para el apoyo a la vivienda en el centro de todo lo que hacen. Con más de 3.000 llamadas cada semana para apoyo a la vivienda, el uso de un chatbot de IA permitió al personal del centro de llamadas ayudar a más personas, porque el objetivo nunca fue la eficiencia por sí misma. Era para asegurarse de que el beneficio humano siempre fuera lo primero.

Estas historias reales de la IA que empodera a organizaciones con misión son posibles gracias a personas dedicadas dentro de organizaciones sin ánimo de lucro que han dado un paso adelante para liderar cambios transformadores, a menudo sin reconocimiento formal ni mandato oficial. Es su disposición a adoptar nuevas tecnologías, aprender nuevas habilidades y promover la adopción responsable de la IA lo que impulsa el sector hacia adelante.

El trabajo que viene

Los millones de agentes de cambio, voluntarios y líderes globales del sector sin ánimo de lucro redefinen lo que es posible, al asegurar que la IA sirva como herramienta para amplificar la capacidad y el propósito humanos, en lugar de reemplazarlos. Su compromiso y liderazgo son la fuerza motriz detrás de un futuro en el que las organizaciones sin ánimo de lucro aprovechen la IA para lograr un mayor impacto, profundizar las relaciones y fortalecer comunidades.

El camino por seguir estará marcado por la fortaleza y el liderazgo del sector sin ánimo de lucro. Cada día, estas organizaciones demuestran lo que significa permanecer cerca de las comunidades, responder en momentos de cambio y ayudar a las personas a afrontar la incertidumbre con confianza y coherencia.

Eso es lo que hace que este momento sea diferente. A medida que la IA se adopta cada vez más, las organizaciones mejor posicionadas para asegurar que sus beneficios se compartan de manera amplia son las que ya realizan este trabajo.

En Microsoft, construimos sobre una tradición de apoyo a este sector que comenzó hace cinco décadas con nuestro fundador y continúa hoy en día. El nuestro es un compromiso a largo plazo. No solo como socio tecnológico, sino como parte de un esfuerzo más amplio para ayudar a garantizar que los beneficios de la IA lleguen a las comunidades que sirven las organizaciones sin ánimo de lucro. Seguiremos con las inversiones en la capacidad, herramientas y alianzas que apoyan este trabajo y esperamos construir juntos lo que venga a continuación.

The post Empoderar al sector sin ánimo de lucro para afrontar los retos del mañana appeared first on Source LATAM.

 

​The post Empoderar al sector sin ánimo de lucro para afrontar los retos del mañana appeared first on Source LATAM.  

Publicado el Deja un comentario

Amazon EC2 I7ie instances now available in additional AWS regions

AWS is announcing starting today, Amazon EC2 I7ie instances are now available in AWS Asia Pacific (Hong Kong), Asia Pacific (Seoul), Asia Pacific (Melbourne), Asia Pacific (Thailand), Europe (Zurich), Europe (Milan) and Mexico (Central) regions. Designed for large storage I/O intensive workloads, I7ie instances are powered by 5th Gen Intel Xeon Processors with an all-core turbo frequency of 3.2 GHz, offering up to 40% better compute performance and 20% better price performance versus I3en instances.

I7ie instances offer up to 120TB local NVMe storage density for storage optimized instances and offer up to twice as many vCPUs and memory compared to prior generation instances. Powered by 3rd generation AWS Nitro SSDs, I7ie instances deliver up to 65% better real-time storage performance, up to 50% lower storage I/O latency, and 65% lower storage I/O latency variability compared to I3en instances.

I7ie are high density storage optimized instances, ideal for workloads requiring fast local storage with high random read/write performance at very low latency consistency to access large data sets. These instances are available in 9 virtual sizes and deliver up to 100Gbps of network bandwidth and 60Gbps of bandwidth for Amazon Elastic Block Store (EBS).

To learn more, visit the I7ie instances page.

 

​AWS is announcing starting today, Amazon EC2 I7ie instances are now available in AWS Asia Pacific (Hong Kong), Asia Pacific (Seoul), Asia Pacific (Melbourne), Asia Pacific (Thailand), Europe (Zurich), Europe (Milan) and Mexico (Central) regions. Designed for large storage I/O intensive workloads, I7ie instances are powered by 5th Gen Intel Xeon Processors with an all-core turbo frequency of 3.2 GHz, offering up to 40% better compute performance and 20% better price performance versus I3en instances.
I7ie instances offer up to 120TB local NVMe storage density for storage optimized instances and offer up to twice as many vCPUs and memory compared to prior generation instances. Powered by 3rd generation AWS Nitro SSDs, I7ie instances deliver up to 65% better real-time storage performance, up to 50% lower storage I/O latency, and 65% lower storage I/O latency variability compared to I3en instances.
I7ie are high density storage optimized instances, ideal for workloads requiring fast local storage with high random read/write performance at very low latency consistency to access large data sets. These instances are available in 9 virtual sizes and deliver up to 100Gbps of network bandwidth and 60Gbps of bandwidth for Amazon Elastic Block Store (EBS).
To learn more, visit the I7ie instances page.  

Publicado el Deja un comentario

Amazon SageMaker HyperPod now supports continuous provisioning for Slurm-orchestrated clusters

Amazon SageMaker HyperPod now extends continuous provisioning support to clusters using the Slurm orchestrator, enabling greater flexibility and efficiency for enterprise customers running large-scale AI/ML training workloads. AI/ML customers running Slurm-based clusters need to start training quickly, scale seamlessly, perform maintenance without disrupting operations, and have granular visibility into cluster operations. Previously, if any instance group could not be fully provisioned, the entire cluster creation or scaling operation failed and rolled back, causing delays and requiring manual intervention.

With continuous provisioning for Slurm, SageMaker HyperPod automatically provisions remaining capacity in the background while training jobs can begin immediately on available instances. The system uses priority-based provisioning to bring up the Slurm controller node first, followed by login and worker nodes in parallel, so your cluster reaches an operational state as quickly as possible. HyperPod retries failed node launches asynchronously and adds nodes to the Slurm cluster automatically as they become available, ensuring clusters reliably reach their desired scale without requiring manual intervention. You can now perform concurrent, non-blocking scaling operations across multiple instance groups simultaneously — a capacity shortage in one instance group no longer blocks scaling in others. These capabilities help customers reduce time-to-training, maximize resource utilization, and focus on innovation rather than infrastructure management.

This feature is available for new SageMaker HyperPod clusters using the Slurm orchestrator. You can enable continuous provisioning by setting the NodeProvisioningMode parameter to «Continuous» when creating new HyperPod clusters using the CreateCluster API. Continuous provisioning can also be enabled when creating new clusters through the AWS CLI and the SageMaker AI console.

This feature is available in all AWS Regions where Amazon SageMaker HyperPod is supported. To learn more about continuous provisioning for Slurm clusters, see the Amazon SageMaker HyperPod User Guide.

 

​Amazon SageMaker HyperPod now extends continuous provisioning support to clusters using the Slurm orchestrator, enabling greater flexibility and efficiency for enterprise customers running large-scale AI/ML training workloads. AI/ML customers running Slurm-based clusters need to start training quickly, scale seamlessly, perform maintenance without disrupting operations, and have granular visibility into cluster operations. Previously, if any instance group could not be fully provisioned, the entire cluster creation or scaling operation failed and rolled back, causing delays and requiring manual intervention. With continuous provisioning for Slurm, SageMaker HyperPod automatically provisions remaining capacity in the background while training jobs can begin immediately on available instances. The system uses priority-based provisioning to bring up the Slurm controller node first, followed by login and worker nodes in parallel, so your cluster reaches an operational state as quickly as possible. HyperPod retries failed node launches asynchronously and adds nodes to the Slurm cluster automatically as they become available, ensuring clusters reliably reach their desired scale without requiring manual intervention. You can now perform concurrent, non-blocking scaling operations across multiple instance groups simultaneously — a capacity shortage in one instance group no longer blocks scaling in others. These capabilities help customers reduce time-to-training, maximize resource utilization, and focus on innovation rather than infrastructure management. This feature is available for new SageMaker HyperPod clusters using the Slurm orchestrator. You can enable continuous provisioning by setting the NodeProvisioningMode parameter to «Continuous» when creating new HyperPod clusters using the CreateCluster API. Continuous provisioning can also be enabled when creating new clusters through the AWS CLI and the SageMaker AI console. This feature is available in all AWS Regions where Amazon SageMaker HyperPod is supported. To learn more about continuous provisioning for Slurm clusters, see the Amazon SageMaker HyperPod User Guide.  

Publicado el Deja un comentario

Amazon Timestream for InfluxDB is now available in the Mexico (Central), Japan (Osaka), and Brazil (Sao Paulo) AWS regions

You can now use Amazon Timestream for InfluxDB in the Mexico (Central), Japan (Osaka), and Brazil (Sao Paulo) AWS regions. Timestream for InfluxDB makes it easy for application developers and DevOps teams to run fully managed InfluxDB databases on AWS for real-time time-series applications using open-source APIs.

Timestream for InfluxDB offers Multi-AZ high availability, read replicas, enhanced durability, and multi-node scaling — giving you flexible deployment options to match your workload as it evolves. Whether you’re starting with a single-node setup or scaling to a 15-node Enterprise cluster, you can right-size your infrastructure without re-architecting.

You can create your InfluxDB databases using the Amazon Timestream for InfluxDB console. AWS CLI, or AWS SDKs . Amazon Timestream for InfluxDB is available in the following AWS Regions.

For more information, see the Amazon Timestream for InfluxDB documentation and pricing page.

 

​You can now use Amazon Timestream for InfluxDB in the Mexico (Central), Japan (Osaka), and Brazil (Sao Paulo) AWS regions. Timestream for InfluxDB makes it easy for application developers and DevOps teams to run fully managed InfluxDB databases on AWS for real-time time-series applications using open-source APIs. Timestream for InfluxDB offers Multi-AZ high availability, read replicas, enhanced durability, and multi-node scaling — giving you flexible deployment options to match your workload as it evolves. Whether you’re starting with a single-node setup or scaling to a 15-node Enterprise cluster, you can right-size your infrastructure without re-architecting. You can create your InfluxDB databases using the Amazon Timestream for InfluxDB console. AWS CLI, or AWS SDKs . Amazon Timestream for InfluxDB is available in the following AWS Regions. For more information, see the Amazon Timestream for InfluxDB documentation and pricing page.  

Publicado el Deja un comentario

Qué hay de nuevo con Microsoft en código abierto y Kubernetes en KubeCon + CloudNativeCon Europe 2026

Qué hay de nuevo con Microsoft en código abierto y Kubernetes en KubeCon + CloudNativeCon Europe 2026

Cartel con los logo sde KubeCon y CloudNativeCon Europa 2026, en un fondo azul con figuras geométricas en la parte inferior

Por: Brendan Burns, vicepresidente corporativo e investigador técnico, Azure OSS y Cloud Native, Microsoft.

Hay un patrón en cómo madura la tecnología compleja. Al principio, los equipos toman sus propias decisiones: herramientas diferentes, abstracciones distintas, formas distintas de razonar sobre el fracaso. Parece flexibilidad, pero a gran escala se revela como fragmentación.

La solución nunca es tan solo más capacidad; Es una filosofía operativa compartida. Kubernetes lo demostró. No respondió solo a «¿cómo gestionamos los contenedores?» Respondió: «¿Cómo cambiamos los sistemas en funcionamiento de manera segura?» La comunidad construyó esos patrones, los endureció y los convirtió en la base.

La infraestructura de IA sigue en una fase caótica. El cambio de «en funcionamiento frente a rota» a «buenas respuestas frente malas respuestas» es un problema operativo diferente, y no se resolverá con más herramientas. Se resuelve como lo hizo lo nativo en la nube: código abierto que crea las interfaces compartidas y la presión comunitaria que sustituyen el juicio individual por prácticas documentadas y reproducibles.

Eso es hacia lo que avanzamos. Desde mi última actualización en KubeCon + CloudNativeCon Norteamérica 2025, nuestros equipos han seguido con la inversión en infraestructura de IA de código abierto, operaciones multiclúster, redes, observabilidad, almacenamiento y ciclo de vida de clústeres. En KubeCon + CloudNativeCon Europe 2026 en Ámsterdam, compartimos varios anuncios que reflejan ese mismo objetivo: llevar la madurez operativa de Kubernetes a las cargas de trabajo y demandas actuales.

Aprendan más sobre Azure Kubernetes Service

Construir la base de código abierto para la IA en Kubernetes

La convergencia de la infraestructura de IA y Kubernetes significa que las lagunas en la infraestructura de IA y en la infraestructura de Kubernetes son cada vez más las mismas. Una parte significativa de nuestro trabajo upstream para este ciclo ha consistido en construir las primitivas que hacen que las cargas de trabajo respaldadas por GPU sean ciudadanos de primera clase dentro del ecosistema nativo en la nube.

En el ámbito de la planificación, Microsoft ha colaborado con socios del sector para promover estándares abiertos para la gestión de recursos de hardware. Hitos clave incluyen:

  • La Asignación Dinámica de Recursos (DRA, por sus siglas en inglés) ha pasado a disponibilidad general, con el controlador de ejemplo de DRA y el Acceso de Administrador de DRA también enviados como parte de ese trabajo.
  • Workload Aware Scheduling para Kubernetes 1.36 añade soporte para DRA en la API de Workload y facilita la integración en KubeRay, para facilitar que los desarrolladores soliciten y gestionen infraestructuras de alto rendimiento para entrenamiento e inferencia.
  • DRANet ahora incluye compatibilidad upstream para tarjetas de interfaz de red (NIC, por sus siglas en inglés) de Azure RDMA, para extender la gestión de recursos de red basada en DRA a hardware de alto rendimiento donde la alineación de topología GPU-NIC afecta de manera directa al rendimiento del entrenamiento.

Más allá de la programación, hemos seguido con las inversiones en las herramientas necesarias para desplegar, operar y asegurar cargas de trabajo de IA en Kubernetes:

  • AI Runway es un nuevo proyecto de código abierto que introduce una API común de Kubernetes para cargas de trabajo de inferencia, para brindar a los equipos de plataforma una forma centralizada de gestionar los despliegues de modelos y adoptar nuevas tecnologías de servicio a medida que evoluciona el ecosistema. Incluye una interfaz web para usuarios que no deberían necesitar conocer Kubernetes para desplegar un modelo, junto con el descubrimiento integrado de modelos HuggingFace, indicadores de ajuste de memoria GPU, estimaciones de costes en tiempo real y soporte para entornos de ejecución como NVIDIA Dynamo, KubeRay, llm-d y KAITO.
  • HolmesGPT se ha unido a la Cloud Native Computing Foundation (CNCF) como un proyecto Sandbox, que incorpora capacidades de solución de problemas agénticos al ecosistema compartido de herramientas nativas en la nube.
  • Dalec, un proyecto CNCF recién incorporado, define especificaciones declarativas para construir paquetes de sistemas y producir imágenes mínimas de contenedores, con soporte para generación de SBOM y atestados de procedencia en tiempo de compilación. Reducir la superficie de ataque y las vulnerabilidades y exposiciones comunes en la fase de construcción es importante para cualquier organización que intente ejecutar cargas de trabajo de IA de manera responsable y a gran escala.
  • Cilium también recibió un amplio conjunto de contribuciones de Microsoft este ciclo, incluido soporte nativo mTLS ztunnel para comunicación de cargas de trabajo cifradas sin sidecar, controles de cardinalidad de métricas Hubble para gestionar costes de observabilidad a escala, agregación de registros de flujo para reducir el volumen de almacenamiento, y dos Propuestas de Funcionalidades Cilium (CFPs, por sus siglas en inglés) fusionadas para mallas de clúster, que avanzan en redes entre clústeres.

Qué hay de nuevo en Azure Kubernetes Service

Además de nuestras contribuciones ascendentes, me alegra compartir nuevas capacidades en Azure Kubernetes Service (AKS) en redes y seguridad, observabilidad, operaciones multiclúster, almacenamiento y gestión del ciclo de vida del clúster.

Desde controles basados en IP hasta redes conscientes de identidad

A medida que los despliegues de Kubernetes se distribuyen, las redes basadas en IP se vuelven más difíciles de razonar: la visibilidad se degrada, las políticas de seguridad se vuelven difíciles de auditar y la comunicación de carga de trabajo cifrado ha requerido a nivel histórico una malla de servicio completo o una cantidad significativa de trabajo personalizado. Nuestras actualizaciones de red en este ciclo cierran esa brecha trasladando la inteligencia de seguridad y tráfico a la capa de aplicación, donde es más significativo y más fácil de manejar.

Azure Kubernetes Application Network ofrece a los equipos TLS mutuo, autorización consciente de la aplicación y telemetría detallada de tráfico a través de la comunicación de entrada y dentro del clúster, con conectividad multirregión integrada. El resultado es una seguridad consciente de la identidad y una visión real del tráfico sin la sobrecarga de ejecutar una malla de servicio completo. Para los equipos que gestionan la deprecación de ingress-nginx, el enrutamiento de aplicaciones con Meshless Istio proporciona un camino basado en estándares: soporte para la API de Kubernetes Gateway sin sidecars, soporte continuo para configuraciones existentes de ingress-nginx y contribuciones a ingress2gateway para equipos que avanzan de forma incremental.

A nivel de plano de datos, el cifrado WireGuard con el plano de datos Cilium asegura el tráfico nodo a nodo de manera eficiente y sin cambios en la aplicación. Cilium mTLS en Servicios Avanzados de Redes de Contenedores extiende esto a la comunicación pod-a-pod a través de certificados X.509 y SPIRE para la gestión de identidad: tráfico de carga de trabajo autenticado y cifrado sin sidecars. Para rematar, Expansión CIDR en cápsulas elimina una restricción operativa de larga duración al permitir que los clústeres amplíen sus rangos de IP pod en lugar de requerir una reconstrucción, y ahora los administradores pueden deshabilitar HTTP proxy variables para nodos y pods sin tocar la configuración del plano de control.

Visibilidad que se ajuste a la complejidad de los clústeres modernos

Operar Kubernetes a gran escala solo es manejable con una visibilidad clara y consistente de la infraestructura, las redes y las cargas de trabajo. Dos lagunas persistentes que hemos cerrado son la telemetría de GPU y la observabilidad del tráfico de red, ambas se vuelven más críticas a medida que las cargas de trabajo de IA entran en producción.

Los equipos que gestionan cargas de trabajo con GPU a menudo han tenido un punto ciego significativo en la monitorización: la utilización de GPU tan solo no era visible junto a las métricas estándar de Kubernetes sin una configuración manual del exportador. AKS ahora destaca el rendimiento y la utilización de GPU directo en Prometheus y Grafana gestionados, para colocar la telemetría de GPU en la misma pila que los equipos ya utilizan para la planificación de capacidad y alertas. En el lado de la red, ahora está disponible visibilidad L3/L4 por flujo y L7 soportada en tráfico HTTP, gRPC y Kafka, incluyendo IPs, puertos, cargas de trabajo, dirección de flujo y decisiones de política, con una nueva experiencia Azure Monitor que incorpora paneles integrados y la incorporación con un solo clic. Para los equipos que se enfrentan al problema inverso (volumen de métricas en lugar de brechas métricas), los operadores pueden ahora controlar de manera dinámica qué métricas a nivel de contenedor se recopilan a través de recursos personalizados de Kubernetes, para mantener los paneles centrados en señales accionables. La red de contenedores agénticos añade una interfaz web que traduce consultas en lenguaje natural en diagnósticos de solo lectura a través de telemetría en vivo, para acortar el camino de «algo va mal» a «esto es lo que hay que hacer al respecto».

Operaciones más sencillas entre clústeres y cargas de trabajo

Para las organizaciones que ejecutan cargas de trabajo en múltiples clústeres, la red entre clústeres ha significado a nivel histórico fontanería personalizada, descubrimiento de servicios inconsistente y visibilidad limitada a través de los límites del clúster. Azure Kubernetes Fleet Manager ahora aborda esto mediante redes entre clústeres a través de una malla gestionada de Cilium, para brindar conectividad unificada entre clústeres AKS, un registro global de servicios para el descubrimiento de servicios entre clústeres y enrutamiento inteligente con la configuración gestionada de manera central, en lugar de repetida por clúster.

En el lado del almacenamiento, los clústeres pueden ahora consumir almacenamiento de un pool compartido de SAN Elastic en lugar de aprovisionar y gestionar discos individuales por carga de trabajo. Esto simplifica la planificación de capacidad para cargas de trabajo con estado variable y demanda variable y reduce la sobrecarga de aprovisionamiento a gran escala.

Para los equipos que necesitan un punto de acceso más accesible a Kubernetes, AKS de escritorio ya está disponible a nivel general. Aporta una experiencia completa de AKS a su escritorio, para facilitar que los desarrolladores ejecuten, prueben e iteren en cargas de trabajo Kubernetes a nivel local, con la misma configuración que usarán en producción.

Mejoras más seguras y recuperación más rápida

El coste de una mala actualización se acumula con rapidez en la producción, y la recuperación de una ha sido, a nivel histórico, lenta y estresante. Varias actualizaciones de este ciclo se centran en específico en hacer que los cambios de conglomerado sean más seguros, observables y reversibles.

Las actualizaciones del pool de agentes azul-verde crean un pool paralelo con la nueva configuración en lugar de aplicar cambios en su lugar, para que los equipos puedan validar el comportamiento antes de desplazar el tráfico y mantener un camino claro de retroceso si algo parece mal. El rollback del pool de agentes complementa esto al permitir a los equipos revertir un pool de nodos a su versión e imagen de nodos anteriores de Kubernetes cuando surgen problemas tras una actualización (sin una reconstrucción completa). En conjunto, estos ofrecen a los operadores un control real sobre el ciclo de vida de la actualización en lugar de elegir entre «mejorar y tener esperanza» o «quedarse atrás». Para una provisión más rápida durante eventos de escalabilidad, la especificación de imagen preparada permite a los equipos definir imágenes de nodos personalizadas con contenedores precargados, configuraciones del sistema operativo y scripts de inicialización, lo que reduce el tiempo de arranque y mejora la consistencia en entornos que requieren un aprovisionamiento rápido y repetible.

Comiencen con Azure Kubernetes Service

The post Qué hay de nuevo con Microsoft en código abierto y Kubernetes en KubeCon + CloudNativeCon Europe 2026 appeared first on Source LATAM.

 

​The post Qué hay de nuevo con Microsoft en código abierto y Kubernetes en KubeCon + CloudNativeCon Europe 2026 appeared first on Source LATAM.  

Publicado el Deja un comentario

Amazon Polly expands Generative TTS engine with 10 new voices, 2 new regions, and Bidirectional Streaming API

Today, we are excited to announce the general availability of 10 new highly expressive Amazon Polly Generative voices across 8 locales: Tiffany (American English), Brian (British English), Aria (New Zealand English), Jasmine (Singapore English),  Florian (French), Ambre (French), Lorenzo (Italian), Beatrice (Italian), Lennart (German), and Sabrina (Swiss German). 

Alongside these new voices, we have expanded the Generative engine to two new AWS regions in Europe (London) and Canada (Central). We have also introduced the Bidirectional Streaming API support for the Generative engine, allowing customers to stream text to Polly and receive synthesized audio back simultaneously. This makes it easy to feed output directly from a large language model (LLM) into speech synthesis, enabling real-time applications like chatbots and bespoke characters in games.

Amazon Polly is a fully managed service that turns text into lifelike speech. This expansion addresses the growing demand for natural-sounding, lifelike speech generation in conversational AI and content creation. Developers building LLM-based interactive systems and speech-enabled applications can take advantage of the enhanced voice quality and variety, expanded language and feature support, as well as broader AWS region availability. 

To hear how Polly voices sound, go to Amazon Polly Features. For more details on the Polly offerings and use, see the Amazon Polly documentation and pricing page.

 

​Today, we are excited to announce the general availability of 10 new highly expressive Amazon Polly Generative voices across 8 locales: Tiffany (American English), Brian (British English), Aria (New Zealand English), Jasmine (Singapore English),  Florian (French), Ambre (French), Lorenzo (Italian), Beatrice (Italian), Lennart (German), and Sabrina (Swiss German). 
Alongside these new voices, we have expanded the Generative engine to two new AWS regions in Europe (London) and Canada (Central). We have also introduced the Bidirectional Streaming API support for the Generative engine, allowing customers to stream text to Polly and receive synthesized audio back simultaneously. This makes it easy to feed output directly from a large language model (LLM) into speech synthesis, enabling real-time applications like chatbots and bespoke characters in games.
Amazon Polly is a fully managed service that turns text into lifelike speech. This expansion addresses the growing demand for natural-sounding, lifelike speech generation in conversational AI and content creation. Developers building LLM-based interactive systems and speech-enabled applications can take advantage of the enhanced voice quality and variety, expanded language and feature support, as well as broader AWS region availability. 
To hear how Polly voices sound, go to Amazon Polly Features. For more details on the Polly offerings and use, see the Amazon Polly documentation and pricing page.