Noticias de Microsoft septiembre 13, 2024

Anatomía de un copiloto

Cuando se trata de IA, lo que importa es el sistema (no el modelo).

Por Jared Spataro, vicepresidente corporativo de IA en el trabajo de Microsoft

Si tienen dificultades para comprender lo que la IA puede hacer por su negocio, diría que el lugar para comenzar es comprender la herramienta más poderosa en su caja de herramientas.

Mi trabajo consiste en ayudar a las empresas a llevar la IA al trabajo con éxito, y hablo con los clientes todos los días. En estas conversaciones, muchas de las personas con las que hablo se centran en los modelos fundamentales, por lo general los grandes modelos de lenguaje (LLM, por sus siglas en inglés) que ayudan a impulsar a los asistentes de IA.

Pero los LLM, que han recibido la mayor parte de la atención en la conversación pública sobre la IA, son solo un elemento de un sistema de IA más amplio. Si el sistema es un automóvil, piense en el LLM como el motor. Pero un automóvil no puede salir a la carretera sin algunos otros elementos clave, como las ruedas, la dirección, el combustible y más.

Echemos un vistazo bajo el capó para ver cómo funcionan los sistemas de IA y, en el proceso, esperamos inspirarlo a ver nuevas formas de aplicar la IA a su propio negocio.

Componentes clave

Dado que los asistentes de IA trabajan junto a nosotros, pensamos en ellos como copilotos, de hecho, es por eso que llamamos a nuestro propio asistente de IA Microsoft Copilot. Pero todos los sistemas de IA, ya sea de Microsoft, ChatGPT, Google o cualquier otro proveedor, tienen algunas partes clave universales:

La experiencia del usuario: Este es el punto de entrada al copiloto, donde interactúa con el sistema a través de mensajes de texto, audio o visuales para obtener las respuestas que necesita.

El orquestador: como eje central del sistema, el orquestador supervisa la planificación y la coordinación. Cuando ustedes escriben un prompt, determina qué partes del sistema pueden responder a sus necesidades.

Modelo fundacional: Piensen en los modelos fundacionales como «motores de razonamiento» impulsados por IA que analizan información para responder preguntas o resolver problemas. A menudo, se trata de un LLM entrenado en grandes cantidades de texto, pero existen muchos otros tipos de modelos, cada uno con sus propias fortalezas, debilidades y casos de uso ideales.

A veces se puede obtener lo que se necesita de un sistema que sólo tiene estos elementos básicos. Pregunten algo sencillo, como «¿Cuál es un gran auto de arranque para un conductor nuevo?» y obtendrán sugerencias útiles y específicas. Pero también pueden probar con preguntas más inesperadas, como «¿Podría un elefante tirar de mi Tundra?» (por supuesto, no es algo que recomendaría hacer en la vida real). El copiloto puede reunir lo que el LLM sabe sobre varios temas y luego aplicar un razonamiento basado en todos esos datos.

En este caso, cuando le hice esa pregunta a Copilot, el sistema dedujo de manera correcta que hablaba de mi Toyota Tundra. Respondió: «En teoría, un elefante podría tirar de tu Tundra», y detalló su razonamiento: se sabe que los elefantes asiáticos tiran de pesos más pesados que una Tundra. También ofreció un mensaje de no intentar esto en casa: «Este no es un uso práctico o humano de la fuerza de un elefante».

Es un comienzo impresionante, pero se parece más a un truco de fiesta que a una solución empresarial. En un entorno de trabajo, se necesita un sistema más completo. Los elementos básicos de un copiloto son buenos para razonar a través de conocimientos generales, pero no son suficientes cuando se trata de aportar el conocimiento y las habilidades específicos que pueden diferenciar a su empresa. Veamos por qué.

Conocimiento

Los modelos fundacionales de conocimiento tienen una limitación clave: se entrenan con un conjunto finito de información. Por lo tanto, si su pregunta se relaciona con algo que no está incluido en sus datos de entrenamiento, se quedan cortos.

Pero hay formas de sortear esa limitación. Es decir, puede conceder al orquestador acceso a nuevos conocimientos o fuentes de datos. Por ejemplo, cuando el orquestador puede extraer datos de su trabajo (correos electrónicos, archivos, reuniones, etc.), es mucho más inteligente con respecto a su negocio y sus necesidades.

Digamos que son comercializadores automotrices. Pueden hacerle una pregunta a Copilot como: «Soy un especialista en marketing que lidera el lanzamiento de un nuevo SUV eléctrico y necesito redactar un informe creativo para que nuestra agencia desarrolle una campaña publicitaria de televisión nacional. Una idea es presentar animales salvajes, incluidos elefantes».

A continuación, pueden dirigir el sistema a las fotos de sus productos, los archivos que describen sus especificaciones específicas y otras entradas, para que comprenda el tema de forma más amplia y profunda. Si incluyen esos recursos, obtienen un resultado muy diferente. Esto se debe a que el patrón crítico en el uso de copilotos en los negocios en este momento es basar el LLM en sus propios datos muy particulares.

Con un mensaje como este, el orquestador puede reunir los conocimientos generales del LLM (los elementos necesarios en un briefing creativo típico) junto con el conocimiento específico de su empresa (los detalles de su nuevo SUV).

Cada vez que su copiloto extrae de pozos de conocimiento más profundos o más específicos, les brinda respuestas mejores, más precisas y procesables. Pero hay un elemento adicional que eleva aún más el nivel de un copiloto.

Habilidades

La mayoría de los modelos fundamentales vienen con capacidades inherentes, como la capacidad de resumir información o escribir contenido nuevo. Pero no son tan buenos en otras habilidades importantes, como las matemáticas, el dibujo o el diseño, todas las cosas que los humanos hacen todos los días en el trabajo. Para ampliar las capacidades de su copiloto, debe darle algunas habilidades adicionales.

Digamos que son líderes creativos en la agencia de publicidad que trabaja en esa campaña para el SUV eléctrico. Dentro del ecosistema de Microsoft, pueden pedir ayuda a Image Creator de Designer para crear un guion gráfico de un concepto. Pueden empezar el prompt con: «Crea una serie de imágenes para un anuncio de televisión en el que aparezca un SUV eléctrico que conduce por la sabana al atardecer. En la primera imagen, vemos que la camioneta emerge de detrás de un matorral de hierba alta”.

En otras palabras, su copiloto puede ayudarles a crear guiones gráficos aproximados al instante, y pueden crearlos durante una reunión para dar vida a su concepto mientras todos hacen una lluvia de ideas. De esa manera, eliminan con rapidez las ideas débiles y pueden dedicar más tiempo a centrarles en las fuertes.

La creación de imágenes es solo un ejemplo de una habilidad de copiloto. La capacidad de codificar, automatizar procesos empresariales complejos, hacer que grandes bases de datos de información sean accesibles al instante con IA, cada una de ellas representa nuevas habilidades que pueden activar para su copiloto.

En resumen

Hay mucha excitación en torno a los modelos fundamentales, y gran parte de esta es bien merecida. Son la tecnología que ha abierto este nuevo capítulo en la innovación de la IA. Pero si bien son una parte importante del sistema, son solo una parte. Al orquestar con cuidado las interacciones entre el usuario, el conocimiento, las habilidades y los modelos fundamentales, el copiloto se vuelve aún más poderoso que la suma de sus partes. Ese es el verdadero desbloqueo que agregará valor al trabajo que realiza todos los días, de modo que cuando pisen el acelerador, terminarán justo donde necesitan ir.

<!–

Etiquetas:

–>

The post Anatomía de un copiloto appeared first on Source LATAM.