Publicado el Deja un comentario

Amazon MSK expands Express brokers to Africa (Cape Town) and Asia Pacific (Taipei) regions

You can now create provisioned Amazon Managed Streaming for Apache Kafka (Amazon MSK) clusters with Express brokers in Africa (Cape Town) and Asia Pacific (Taipei) regions.

Express brokers are a new broker type for Amazon MSK Provisioned designed to deliver up to 3x more throughput per broker, scale up to 20x faster, and reduce recovery time by 90% as compared to standard Apache Kafka brokers. Express brokers come pre-configured with Kafka best practices by default, support all Kafka APIs, and provide the same low-latency performance that Amazon MSK customers expect, so they can continue using existing client applications without any changes.

To get started, create a new cluster with Express brokers through the Amazon MSK console or the Amazon CLI and read our Amazon MSK Developer Guide for more information.

 

​You can now create provisioned Amazon Managed Streaming for Apache Kafka (Amazon MSK) clusters with Express brokers in Africa (Cape Town) and Asia Pacific (Taipei) regions.
Express brokers are a new broker type for Amazon MSK Provisioned designed to deliver up to 3x more throughput per broker, scale up to 20x faster, and reduce recovery time by 90% as compared to standard Apache Kafka brokers. Express brokers come pre-configured with Kafka best practices by default, support all Kafka APIs, and provide the same low-latency performance that Amazon MSK customers expect, so they can continue using existing client applications without any changes.
To get started, create a new cluster with Express brokers through the Amazon MSK console or the Amazon CLI and read our Amazon MSK Developer Guide for more information.  

Publicado el Deja un comentario

Amazon Bedrock is now available in Asia Pacific (New Zealand)

Starting today, customers can use Amazon Bedrock in the Asia Pacific (New Zealand) Region to easily build and scale generative AI applications using a variety of foundation models (FMs) as well as powerful tools to build generative AI applications.

Amazon Bedrock is a fully managed service that offers a choice of high-performing large language models (LLMs) and other FMs from leading AI companies like AI21 Labs, Anthropic, Cohere, Meta, Mistral AI, OpenAI, Stability AI, as well as Amazon via a single API. Amazon Bedrock also provides a broad set of capabilities customers need to build generative AI applications with security, privacy, and responsible AI built in. These capabilities help you build tailored applications for multiple use cases across different industries, helping organizations unlock sustainable growth from generative AI while maintaining privacy and security.

With this launch, customers can now use models from Anthropic (Sonnet 4.5, Sonnet 4.6, Opus 4.5, Opus 4.6, Haiku 4.5) and Amazon (Nova 2 Lite) in New Zealand with cross region inference.

To get started, visit the Amazon Bedrock page and see the Amazon Bedrock documentation for more details.

 

​Starting today, customers can use Amazon Bedrock in the Asia Pacific (New Zealand) Region to easily build and scale generative AI applications using a variety of foundation models (FMs) as well as powerful tools to build generative AI applications. Amazon Bedrock is a fully managed service that offers a choice of high-performing large language models (LLMs) and other FMs from leading AI companies like AI21 Labs, Anthropic, Cohere, Meta, Mistral AI, OpenAI, Stability AI, as well as Amazon via a single API. Amazon Bedrock also provides a broad set of capabilities customers need to build generative AI applications with security, privacy, and responsible AI built in. These capabilities help you build tailored applications for multiple use cases across different industries, helping organizations unlock sustainable growth from generative AI while maintaining privacy and security. With this launch, customers can now use models from Anthropic (Sonnet 4.5, Sonnet 4.6, Opus 4.5, Opus 4.6, Haiku 4.5) and Amazon (Nova 2 Lite) in New Zealand with cross region inference. To get started, visit the Amazon Bedrock page and see the Amazon Bedrock documentation for more details.  

Publicado el Deja un comentario

Anunciamos actualización en el liderazgo de Copilot


megaphone

Anunciamos actualización en el liderazgo de Copilot

Satya Nadella, presidente y CEO, y Mustafa Suleyman, vicepresidente ejecutivo y CEO de Microsoft AI, compartieron esta mañana las siguientes comunicaciones con empleados de Microsoft.

MENSAJE DE SATYA NADELLA

Quiero compartir dos cambios que hacemos en la organización de Copilot y en nuestro esfuerzo de superinteligencia.

Está claro que ha comenzado a surgir una nueva era de productividad, ya que las experiencias de IA evolucionan con rapidez, al pasar de responder preguntas y sugerir código, a ejecutar tareas de varios pasos con puntos de control claros para el usuario. Esto se ve en nuestros anuncios de las últimas semanas, como Copilot Tasks y Copilot Cowork, capacidades agénticas en Office y Agent 365. A medida que estas experiencias se conectan de manera más natural entre agentes, aplicaciones y flujos de trabajo, tenemos la oportunidad de ayudar a los clientes a dedicar más tiempo a trabajos de mayor valor y reducir la coordinación manual, al tiempo que ofrecemos a las personas más agencia y empoderamiento, y a las organizaciones los controles de gobernanza y seguridad que necesitan.

Con ese fin, unimos el sistema Copilot entre el sector comercial y el de consumidor como un esfuerzo unificado. Esto abarcará cuatro pilares conectados: la experiencia Copilot, la plataforma Copilot, las aplicaciones de Microsoft 365 y los modelos de IA. Así es como pasamos de ser una colección de grandes productos a un sistema en verdad integrado, uno que sea más sencillo y potente para los clientes.

Jacob Andreou liderará la experiencia Copilot tanto en consumo como en comercial, para impulsar el diseño, producto, crecimiento e ingeniería, como vicepresidente ejecutivo de Copilot, y me va a reportar a mí. Como CVP de Producto y Crecimiento en Microsoft AI, Jacob ha acelerado nuestro marco de creación y crecimiento de productos centrado en IA en el usuario. Antes de eso, fue vicepresidente senior en Snap, donde ayudó a hacer crecer la empresa desde sus primeros días.

El progreso en la capa del modelo de IA es más crítico que nunca para nuestro éxito como empresa durante la próxima década y es fundamental para todo lo que construyamos sobre ella. Redoblamos esfuerzos en nuestra misión de superinteligencia con el talento y la capacidad de cálculo para construir modelos que tengan un impacto real en el producto, en términos de evaluaciones, reducción de COGS, así como avanzar en la vanguardia en cuanto a satisfacer las necesidades empresariales y lograr el próximo conjunto de avances en investigación. Mustafa Suleyman y yo llevamos hemos trabajado en este plan por un tiempo, y él seguirá como líder este trabajo de alta ambición, reportándome a mí. Mustafa está cualificado en especial para impulsar esto, con su profundo enfoque y compromiso de avanzar en las fronteras de la ciencia modelo, para asegurar al mismo tiempo que el control humano, la agencia y la oportunidad económica permanezcan en el centro de estos avances.

Ryan Roslansky, Perry Clarke y Charles Lamanna liderarán las aplicaciones M365 y la plataforma Copilot. Juntos, Jacob, Ryan, Charles, Perry y Mustafa forman el equipo de liderazgo (LT, por sus siglas en inglés) de Copilot y durante las próximas semanas trabajarán para alinear los equipos.

Los límites de nuestra organización reflejarán de manera simple, la arquitectura del sistema y la forma del producto, de modo que podamos ofrecer experiencias más coherentes y competitivas que sigan la evolución con las capacidades del modelo. Y espero con ilusión cómo juntos aplicamos todo esto para empoderar a las personas, las organizaciones y al mundo.

MENSAJE DE MUSTAFA SULEYMAN

Asunto: Una nueva estructura para Microsoft AI

La tecnología y el futuro de nuestra industria se definirán por dos cosas: modelos de frontera y los productos a través de los cuales se experimentan. Durante un tiempo he pensado en cómo afrontar mejor estos grandes desafíos, y hoy estoy entusiasmado de evolucionar nuestra estructura en Microsoft AI, asegurándonos de estar posicionados para triunfar en ambos.

Llegué a Microsoft con una misión principal: crear Superinteligencia que tenga un impacto transformador y positivo para millones de personas. Esto requiere que construyamos modelos de frontera, a escala, al empujar los límites de lo posible. Todo lo demás se deduce de esto. Es la base de nuestro futuro como empresa. Con nuestra ambiciosa hoja de ruta de computación a escala de frontera a largo plazo bloqueada, ahora tenemos todo lo necesario para construir verdaderos modelos SOTA.

Como acabarán de escuchar de Satya, la siguiente fase de este plan es reestructurar nuestra organización para permitirme centrar toda mi energía en nuestros esfuerzos de Superinteligencia y poder ofrecer modelos de clase mundial para Microsoft durante los próximos 5 años. Estos modelos nos permitirán construir líneas de aprendizaje optimizadas para empresas que ayuden a mejorar todos nuestros productos en toda la empresa. También nos permitirán ofrecer las eficiencias COGS necesarias para poder atender cargas de trabajo de IA a la enorme escala que se requiere en los próximos años. Lograr todo esto será un gran desafío, y comprometo todo lo que tenemos – y a nivel personal lo he hecho – para que suceda.

Con ese fin, llevo tiempo en trabajar duro con otros líderes en segundo plano para definir una estrategia que unifique Copilot al unir los esfuerzos de Consumidor y Comercial como uno solo. Todos sabemos que esto tiene sentido. Cada usuario —ya sea en casa o en el trabajo— podrá disfrutar al máximo de lo que todos construimos. Hoy en día, combinamos estas organizaciones en una única organización unificada llamada Copilot. Jacob ha demostrado ser un líder excepcional en la experiencia del producto y está claro posee los instintos de producto, el rango operativo y la convicción para hacer de Copilot un gran éxito.

Jacob mantendrá una línea punteada conmigo, y yo seguiré involucrado de manera directa en gran parte de la operación diaria de MAI, para asistir a Meetups, MMMs, LT y apoyar a Jacob para que impulse todas las áreas de la estrategia de producto. Para garantizar que los modelos que construimos y los productos que lanzamos se refuercen de manera mutua, vamos a establecer un equipo directivo de Copilot que incluye a Jacob, Charles Lamanna, Perry Clarke y Ryan Roslansky. Esto nos permitirá enfocar nuestra estrategia de marca, nuestra hoja de ruta de producto, nuestros modelos y nuestra infraestructura central como uno solo para ofrecer las mejores experiencias posibles a todos nuestros usuarios.

Gracias por todo lo que han hecho en estos últimos años. Sé lo mucho que todos luchan y los sacrificios que muchos de ustedes han hecho para ayudar a la empresa a adaptarse a esta nueva era.

En verdad  tenemos una oportunidad increíble de redefinir Microsoft para esta revolución agéntica.

El correo de Mustafa ha sido ligeramente editado para uso externo.

The post Anunciamos actualización en el liderazgo de Copilot appeared first on Source LATAM.

 

​The post Anunciamos actualización en el liderazgo de Copilot appeared first on Source LATAM.  

Publicado el Deja un comentario

Microsoft en NVIDIA GTC: Nuevas soluciones para Microsoft Foundry, infraestructura de IA Azure e IA física

Microsoft en NVIDIA GTC: Nuevas soluciones para Microsoft Foundry, infraestructura de IA Azure e IA física

Un empleado frente a racks de servidores en un centro de datos de IA de Microsoft

Por: Yina Arenas, vicepresidenta corporativa, Microsoft Foundry.

Un empleado frente a racks de servidores en un centro de datos de IA de Microsoft
Microsoft combina la computación acelerada con la ingeniería a escala de la nube para ofrecer capacidades avanzadas de IA a nuestros clientes. Durante años, hemos trabajado con NVIDIA para integrar hardware, software e infraestructuras para impulsar muchos de los avances más importantes en IA actuales.

Novedades en NVIDIA GTC

  • Ampliación de las capacidades de Microsoft Foundry para construir, desplegar y operar agentes de IA listos para producción en aceleradores NVIDIA y modelos abiertos de NVIDIA Nemotron
  • Nueva infraestructura de IA de Azure optimizada para cargas de trabajo basadas en inferencias y razonamiento, incluida la primera nube hiperescalable para alimentar sistemas NVIDIA Vera Rubin NVL72 de próxima generación
  • Integración más profunda entre las bibliotecas de Microsoft Foundry, Microsoft Fabric y NVIDIA Omniverse, así como frameworks abiertos para apoyar sistemas de IA física desde la simulación hasta las operaciones en el mundo real

Desde modelos Frontier hasta agentes listos para producción

En la base de este sistema está Microsoft Foundry: que sirve como sistema operativo para construir, desplegar y operar IA a escala empresarial. Foundry se basa en Azure para reunir modelos, herramientas, datos y observabilidad en un único sistema diseñado para agentes de producción. Hoy ampliamos esas capacidades a los modelos Foundry Agent Service y NVIDIA Nemotron.

El  servicio de agentes de Foundry de próxima generación y la observabilidad en el plano de control de Foundry están ahora disponibles de forma general, lo que permite a las organizaciones construir y operar agentes de IA a escala de producción. Foundry Agent Service permite a los equipos desarrollar con rapidez agentes que razonan, planifican y actúan a través de herramientas, datos y flujos de trabajo. Una vez creado, Foundry Control Plane proporciona al desarrollador una visibilidad completa del comportamiento del agente, para desbloquear tanto la productividad del desarrollador como la confianza empresarial. Empresas como Corvus Energy ya utilizan Foundry para sustituir los flujos de trabajo de inspección manual por inteligencia operativa impulsada por agentes en toda su flota global.

Simplificamos aún más el camino desde el prototipo hasta la producción con la disponibilidad de la integración de la API Voice Live con Foundry Agent Service, en vista previa pública, que permite a los desarrolladores crear experiencias agénticas multimodales y en tiempo real donde la voz es lo primero. Esto se combina con la disponibilidad general de un portal Microsoft Foundry renovado y ampliaciones de integraciones para Prisma AIRS y Zenity de Palo Alto Networks, para ofrecer experiencias de construcción más profundas y seguridad en tiempo de ejecución a lo largo de todo el ciclo de vida del agente.

Los modelos NVIDIA Nemotron también están ahora disponibles a través de Microsoft Foundry, sumándose a la selección más amplia de modelos en cualquier nube, incluidos los modelos más recientes, Frontier y Open. Esto refuerza nuestro reciente anuncio de colaboración que trae Fireworks AI a Microsoft Foundry, lo que permite a los clientes afinar modelos de peso abierto como NVIDIA Nemotron en activos de baja latencia que pueden distribuirse hasta el entorno.

Escalar la infraestructura de IA para las cargas de trabajo más exigentes del mundo

Las cargas de trabajo de IA de inferencia han comenzado a remodelar los requisitos de coste, rendimiento y diseño del sistema. Para operacionalizar la IA agéntica a gran escala, los clientes necesitan infraestructura diseñada en específico para cargas de trabajo basadas en inferencias y razonamiento, que puedan desplegarse y operarse de manera consistente en entornos globales y regulados.

El enfoque de infraestructura de IA de Microsoft está diseñado para integrar de forma fluida los sistemas NVIDIA de nueva generación en los centros de datos de Azure, diseñados para energía, refrigeración de redes y rápidas actualizaciones generacionales. Esto permite a nuestros clientes moverse con rapidez y agilidad y mantenerse a la vanguardia de generación en generación.

En menos de un año, hemos desplegado cientos de miles de GPUs Grace Blackwell refrigeradas por líquido en toda nuestra huella global de centros de datos, y ahora estamos entusiasmados de ser la primera nube hiperescalable en alimentar la nueva Vera Rubin NVL72 de NVIDIA en nuestros laboratorios. En los próximos meses, Vera Rubin NVL72 se desplegará en nuestros modernos centros de datos Azure refrigerados por líquido.

La innovación en infraestructura de Microsoft con NVIDIA también se extiende a entornos soberanos y regulados para dar a los clientes control tanto sobre dónde se ejecuta la IA como sobre cómo evoluciona con el tiempo. De manera reciente anunciamos soporte de Foundry Local para infraestructuras modernas y grandes modelos de IA, y ahora tenemos soporte inicial para la plataforma NVIDIA Vera Rubin en Azure Local, lo que extiende capacidades de IA acelerada a entornos controlados por el cliente. Este enfoque permite a las organizaciones planificar cargas de trabajo de IA de próxima generación, incluidos sistemas basados en razonamiento y agentes, para mantener al mismo tiempo operaciones, gobernanza y seguridad consistentes con Azure a través de nuestra capa unificada de software con Azure Arc y Foundry Local.

Introducir la IA en el mundo físico

A medida que la IA avanza más allá de las experiencias digitales, Microsoft y NVIDIA colaboran para apoyar la próxima ola de la IA física. En GTC, este trabajo se centra en NVIDIA Physical AI Data Factory Blueprint, con Microsoft Foundry como plataforma para alojar y operar sistemas de IA física en Azure a escala de nube.

Al integrar este plan con los servicios de Azure como parte de una Cadena de Herramientas de IA Física, Microsoft permite a los desarrolladores construir, entrenar y operar flujos de trabajo físicos de IA y robótica que conectan activos físicos, entornos de simulación y entrenamiento en la nube en pipelines repetibles de nivel empresarial. Para apoyarlo, introdujimos un repositorio público de Azure Physical AI Toolchain en GitHub integrado con NVIDIA Physical AI Data Factory y con los servicios principales de Azure.

Para potenciar el impacto de la IA en entornos físicos y reales, hoy Microsoft y NVIDIA profundizan la integración entre las bibliotecas Microsoft Fabric y NVIDIA Omniverse, al conectar datos operativos en vivo con gemelos digitales precisos a nivel físico y simulaciones. Esto permite a las organizaciones ver lo que ocurre en sus sistemas físicos, entenderlos en tiempo real y utilizar la IA para decidir qué hacer a continuación. En la práctica, los clientes de fabricación y operaciones y más allá utilizan este enfoque para ir más allá de los paneles de control y alertas y adoptar acciones coordinadas impulsadas por IA en máquinas, instalaciones y flujos de trabajo.

De la innovación al impacto

Microsoft ofrece una IA fiable a escala de producción al unir su infraestructura global de IA, plataformas y sistemas reales con la última innovación de NVIDIA. Para los clientes, esto significa la capacidad de operar inteligencia de manera continua, al ejecutar cargas de trabajo de IA físicas, basadas en inferencias, basadas en razonamiento, con el rendimiento, la seguridad y la gobernanza requeridos para empresas reales e industrias reguladas.

Ya sea a través de la activación de agentes siempre activos, escalar infraestructuras de IA de próxima generación o desplegar sistemas inteligentes en fábricas, instalaciones energéticas y entornos soberanos, Microsoft y Nvidia ayudan a los clientes a pasar más rápido de la visión a la acción.Yina Arenas lidera la estrategia y ejecución de producto para Microsoft Foundry, supervisa el portafolio integral de productos de IA, infraestructura, experiencias para desarrolladores e integración de modelos de base en OpenAI, Anthropic, Mistral, DeepSeek y otros. Ofrece una plataforma de IA de grado de producción lista para empresas y de confianza para clientes globales para una IA segura, fiable y escalable.

The post Microsoft en NVIDIA GTC: Nuevas soluciones para Microsoft Foundry, infraestructura de IA Azure e IA física appeared first on Source LATAM.

 

​The post Microsoft en NVIDIA GTC: Nuevas soluciones para Microsoft Foundry, infraestructura de IA Azure e IA física appeared first on Source LATAM.  

Publicado el Deja un comentario

Amazon CloudWatch Logs now supports log ingestion using HTTP-based protocol

Amazon CloudWatch Logs now supports HTTP Log Collector (HLC), ND-JSON, Structured JSON and OTEL for sending logs using HTTP-based protocol with bearer token. With this launch, customers can ingest logs where AWS SDK integration is not feasible, such as with third-party or packaged software. The new endpoints are:

  • HTTP Log Collector (HLC) Logs (https://logs .<region>.amazonaws.com/services/collector/event) — for JSON events, ideal for migrating existing log pipelines. 

  • ND-JSON Logs (https://logs.<region>.amazonaws.com/ingest/bulk) — for newline-delimited JSON, where each line is an independent log event. Perfect for high-volume streaming and bulk log ingestion. 

  • Structured JSON Logs (https://logs .<region>.amazonaws.com/ingest/json) — Send a single JSON object or a JSON array of objects.

  • OpenTelemetry Logs (https://logs .<region>.amazonaws.com/v1/logs) — for OTLP-formatted logs in JSON or Protobuf encoding to CloudWatch.

To enable the HLC endpoint, navigate to CloudWatch Settings in the AWS Console and generate an API key. CloudWatch creates the necessary IAM user with service-specific credentials and permissions. API keys can be configured with expiration periods of 1, 5, 30, 90, or 365 days. Customers must enable bearer token authentication on each log group before it can accept logs, which protects from unintended ingestion. Customers can use service control policies to block the creation of service-specific credentials.

These endpoints are available in the following AWS Regions: US East (N. Virginia), US West (N. California), US West (Oregon), and US East (Ohio). To learn more about the HLC endpoint and security best practices, refer to the CloudWatch Logs Documentation

 

​Amazon CloudWatch Logs now supports HTTP Log Collector (HLC), ND-JSON, Structured JSON and OTEL for sending logs using HTTP-based protocol with bearer token. With this launch, customers can ingest logs where AWS SDK integration is not feasible, such as with third-party or packaged software. The new endpoints are:

HTTP Log Collector (HLC) Logs (https://logs .<region>.amazonaws.com/services/collector/event) — for JSON events, ideal for migrating existing log pipelines. 

ND-JSON Logs (https://logs.<region>.amazonaws.com/ingest/bulk) — for newline-delimited JSON, where each line is an independent log event. Perfect for high-volume streaming and bulk log ingestion. 

Structured JSON Logs (https://logs .<region>.amazonaws.com/ingest/json) — Send a single JSON object or a JSON array of objects.

OpenTelemetry Logs (https://logs .<region>.amazonaws.com/v1/logs) — for OTLP-formatted logs in JSON or Protobuf encoding to CloudWatch.

To enable the HLC endpoint, navigate to CloudWatch Settings in the AWS Console and generate an API key. CloudWatch creates the necessary IAM user with service-specific credentials and permissions. API keys can be configured with expiration periods of 1, 5, 30, 90, or 365 days. Customers must enable bearer token authentication on each log group before it can accept logs, which protects from unintended ingestion. Customers can use service control policies to block the creation of service-specific credentials.
These endpoints are available in the following AWS Regions: US East (N. Virginia), US West (N. California), US West (Oregon), and US East (Ohio). To learn more about the HLC endpoint and security best practices, refer to the CloudWatch Logs Documentation.   

Publicado el Deja un comentario

Amazon CloudWatch introduces organization-wide EC2 detailed monitoring enablement

Amazon CloudWatch now allows customers to automatically enable Amazon Elastic Compute Cloud (EC2) detailed monitoring across their AWS Organization. Customers can create enablement rules in CloudWatch Ingestion that automatically enable detailed monitoring for both existing and newly launched EC2 instances matching the rule scope, ensuring consistent metrics collection at 1-minute intervals across their EC2 instances.

EC2 detailed monitoring enablement rules can be scoped to the whole organization, specific accounts, or specific resources based on resource tags to standardize the configuration across EC2 instances. For example, the central DevOps team can create an enablement rule to automatically turn on detailed monitoring for EC2 instances with specific tags, e.g., env:production, and ensure Auto Scaling policies respond quickly to changes in instance utilization.

CloudWatch’s auto-enablement capability is available in all AWS commercial regions. Detailed monitoring metrics will be billed according to CloudWatch Pricing.

To learn more about org-wide EC2 detailed monitoring enablement, visit the Amazon CloudWatch documentation.

 

​Amazon CloudWatch now allows customers to automatically enable Amazon Elastic Compute Cloud (EC2) detailed monitoring across their AWS Organization. Customers can create enablement rules in CloudWatch Ingestion that automatically enable detailed monitoring for both existing and newly launched EC2 instances matching the rule scope, ensuring consistent metrics collection at 1-minute intervals across their EC2 instances.
EC2 detailed monitoring enablement rules can be scoped to the whole organization, specific accounts, or specific resources based on resource tags to standardize the configuration across EC2 instances. For example, the central DevOps team can create an enablement rule to automatically turn on detailed monitoring for EC2 instances with specific tags, e.g., env:production, and ensure Auto Scaling policies respond quickly to changes in instance utilization.
CloudWatch’s auto-enablement capability is available in all AWS commercial regions. Detailed monitoring metrics will be billed according to CloudWatch Pricing.
To learn more about org-wide EC2 detailed monitoring enablement, visit the Amazon CloudWatch documentation.  

Publicado el Deja un comentario

SageMaker HyperPod now supports idle resource sharing for dynamic cluster utilization

Amazon SageMaker HyperPod task governance now supports dynamic resource sharing, allowing teams to borrow unallocated compute capacity in HyperPod clusters beyond their guaranteed quotas. Administrators can also configure borrow limits for specific resource types, such as accelerators, vCPU, or memory, to ensure fair distribution across teams.

Administrators running shared compute clusters for generative AI workloads often face underutilization challenges. When data scientists do not fully consume their allocated quotas, expensive compute instances remain idle. Idle resource sharing solves this by automatically identifying unallocated cluster capacity and making it available for teams to borrow on a best-effort basis. HyperPod task governance monitors your cluster state and automatically recalculates borrowable resources when instances and compute quota policies change, eliminating manual configuration. Eligible instances that are in a ready and schedulable state, including instances with partitioned GPU configurations, contribute to the borrowable pool of unallocated compute capacity. Administrators can also define absolute borrow limits in addition to percentage-based borrow limits of idle compute. This helps administrators maximize compute utilization and maintain fine-grained control over how idle capacity is distributed across teams, while ensuring guaranteed compute quota isolation for each team.

This capability is currently available for Amazon SageMaker HyperPod clusters using the EKS orchestrator across the following AWS Regions: US East (N. Virginia), US East (Ohio), US West (N. California), US West (Oregon), Asia Pacific (Mumbai), Asia Pacific (Singapore), Asia Pacific (Sydney), and Asia Pacific (Tokyo), Asia Pacific (Jakarta), Europe (Frankfurt), Europe (Ireland), Europe (London), Europe (Stockholm), Europe (Spain), and South America (São Paulo).

To learn more, visit SageMaker HyperPod webpage, and HyperPod task governance documentation.

 

​Amazon SageMaker HyperPod task governance now supports dynamic resource sharing, allowing teams to borrow unallocated compute capacity in HyperPod clusters beyond their guaranteed quotas. Administrators can also configure borrow limits for specific resource types, such as accelerators, vCPU, or memory, to ensure fair distribution across teams. Administrators running shared compute clusters for generative AI workloads often face underutilization challenges. When data scientists do not fully consume their allocated quotas, expensive compute instances remain idle. Idle resource sharing solves this by automatically identifying unallocated cluster capacity and making it available for teams to borrow on a best-effort basis. HyperPod task governance monitors your cluster state and automatically recalculates borrowable resources when instances and compute quota policies change, eliminating manual configuration. Eligible instances that are in a ready and schedulable state, including instances with partitioned GPU configurations, contribute to the borrowable pool of unallocated compute capacity. Administrators can also define absolute borrow limits in addition to percentage-based borrow limits of idle compute. This helps administrators maximize compute utilization and maintain fine-grained control over how idle capacity is distributed across teams, while ensuring guaranteed compute quota isolation for each team. This capability is currently available for Amazon SageMaker HyperPod clusters using the EKS orchestrator across the following AWS Regions: US East (N. Virginia), US East (Ohio), US West (N. California), US West (Oregon), Asia Pacific (Mumbai), Asia Pacific (Singapore), Asia Pacific (Sydney), and Asia Pacific (Tokyo), Asia Pacific (Jakarta), Europe (Frankfurt), Europe (Ireland), Europe (London), Europe (Stockholm), Europe (Spain), and South America (São Paulo). To learn more, visit SageMaker HyperPod webpage, and HyperPod task governance documentation.  

Publicado el Deja un comentario

Amazon Neptune now supports reading S3 data using openCyper

Amazon Neptune now supports reading data from Amazon S3 within openCypher queries. Through the new `neptune.read()` procedure, customers now have an additional option of federating with external data stored in S3 versus needing to load data into Neptune. Organizations using Neptune for graph analytics can now dynamically incorporate S3-stored data without the traditional multi-step workflow requirements.

Key use cases include real-time graph analytics that combine S3 data with existing graph structures, dynamic node and edge creation from external datasets, and complex graph queries requiring external reference data. The procedure supports comprehensive data types including standard and Neptune-specific formats such as geometry and datetime, while maintaining security through the caller’s IAM credentials.

Read from S3 is available in all regions where Amazon Neptune Database is currently offered. To learn more, check out the Neptune Database documentation.

 

​Amazon Neptune now supports reading data from Amazon S3 within openCypher queries. Through the new `neptune.read()` procedure, customers now have an additional option of federating with external data stored in S3 versus needing to load data into Neptune. Organizations using Neptune for graph analytics can now dynamically incorporate S3-stored data without the traditional multi-step workflow requirements.
Key use cases include real-time graph analytics that combine S3 data with existing graph structures, dynamic node and edge creation from external datasets, and complex graph queries requiring external reference data. The procedure supports comprehensive data types including standard and Neptune-specific formats such as geometry and datetime, while maintaining security through the caller’s IAM credentials.
Read from S3 is available in all regions where Amazon Neptune Database is currently offered. To learn more, check out the Neptune Database documentation.  

Publicado el Deja un comentario

Amazon SimpleDB now supports exporting domain data to Amazon S3

Amazon SimpleDB now supports exporting domain data directly to Amazon S3 buckets in standard JSON format. Exports run in the background with no impact on database performance, making it simple to migrate data to other systems or meet data archival requirements.

The export tool offers features including cross-region and cross-account support, multiple encryption options, and flexible S3 bucket configuration. Key use cases include migrating data for long-term archival or compliance purposes. The tool provides three new APIs (StartDomainExport, GetExport, and ListExports) with built-in rate limiting of 5 exports per domain and 25 per account within 24 hours. There is no charge to use this tool. However, standard data transfer charges apply. 

 The export tool is available in all regions where Amazon SimpleDB is available. You can get started with the export tool by using the AWS API or CLI. For more information, see the Amazon SimpleDB documentation or the AWS Database Blog.

 

​Amazon SimpleDB now supports exporting domain data directly to Amazon S3 buckets in standard JSON format. Exports run in the background with no impact on database performance, making it simple to migrate data to other systems or meet data archival requirements.
The export tool offers features including cross-region and cross-account support, multiple encryption options, and flexible S3 bucket configuration. Key use cases include migrating data for long-term archival or compliance purposes. The tool provides three new APIs (StartDomainExport, GetExport, and ListExports) with built-in rate limiting of 5 exports per domain and 25 per account within 24 hours. There is no charge to use this tool. However, standard data transfer charges apply. 
 The export tool is available in all regions where Amazon SimpleDB is available. You can get started with the export tool by using the AWS API or CLI. For more information, see the Amazon SimpleDB documentation or the AWS Database Blog.  

Publicado el Deja un comentario

Announcing AWS Partner Central agents to accelerate co-sell

Today, AWS announces the general availability of AWS Partner Central agents, new AI-powered capabilities designed to accelerate partner co-selling with AWS. Built on Amazon Bedrock AgentCore, these agentic capabilities work alongside partner sales teams to shorten sales cycles and simplify funding access. AWS Partners can engage with these agentic capabilities directly in the console or programmatically through Model Context Protocol (MCP), enabling sales teams to access from within their own customer relationship management (CRM) systems.

With AWS Partner Central agents, partner teams get pipeline insights, tailored sales plays, and next-step recommendations on demand, so they know where to focus and what to do next. Partner sales teams can share meeting transcripts, notes, or emails with agents that automatically populate fields and advance deals, so they stay focused on selling, not data entry. Agents recommend funding at the opportunity level, highlight eligibility gaps, and create pre-populated fund requests, so partners capture available funding faster.

AWS Partner Central agents are available today in all commercial AWS Regions. To learn more about agentic capabilities in AWS Partner Central, review this blog. Partners can start using agents by visiting AWS Partner Central in the AWS console and accessing opportunities, after reviewing the agents guide, and to integrate agents into your own CRM, visit the Partner Central agents MCP server guide.

 

​Today, AWS announces the general availability of AWS Partner Central agents, new AI-powered capabilities designed to accelerate partner co-selling with AWS. Built on Amazon Bedrock AgentCore, these agentic capabilities work alongside partner sales teams to shorten sales cycles and simplify funding access. AWS Partners can engage with these agentic capabilities directly in the console or programmatically through Model Context Protocol (MCP), enabling sales teams to access from within their own customer relationship management (CRM) systems.
With AWS Partner Central agents, partner teams get pipeline insights, tailored sales plays, and next-step recommendations on demand, so they know where to focus and what to do next. Partner sales teams can share meeting transcripts, notes, or emails with agents that automatically populate fields and advance deals, so they stay focused on selling, not data entry. Agents recommend funding at the opportunity level, highlight eligibility gaps, and create pre-populated fund requests, so partners capture available funding faster.
AWS Partner Central agents are available today in all commercial AWS Regions. To learn more about agentic capabilities in AWS Partner Central, review this blog. Partners can start using agents by visiting AWS Partner Central in the AWS console and accessing opportunities, after reviewing the agents guide, and to integrate agents into your own CRM, visit the Partner Central agents MCP server guide.