Saltar al contenido principal

馃煛 LLMs Utilizando Herramientas

MRKL Systems1 (Modular Reasoning, Knowledge and Language, siguiendo una l贸gica fon茅tica inglesa, se prouncia "miracle") son una arquitectura neuro-simb贸lica que combina LLMs (computaci贸n neuronal) y herramientas externas como calculadoras (computaci贸n simb贸lica) para resolver problemas complejos.

Un sistema MRKL est谩 compuesto por un conjunto de m贸dulos (por ejemplo, una calculadora, una API del clima, una base de datos, etc.) y un enrutador que decide c贸mo "enrutar" las consultas en lenguaje natural entrantes al m贸dulo apropiado.

Un ejemplo simple de un sistema MRKL es un LLM que puede usar una aplicaci贸n de calculadora. Este es un sistema de un solo m贸dulo, donde el LLM es el enrutador. Cuando se le pregunta: "驴Cu谩l es el resultado de 100*100?", el LLM puede elegir extraer los n煤meros de la consulta y luego decirle al sistema MRKL que use una aplicaci贸n de calculadora para calcular el resultado. Esto podr铆a verse as铆:

驴Cu谩l es el resultado de 100*100?

CALCULADORA[100*100]

El sistema MRKL ver铆a la palabra "CALCULADORA" e insertar铆a "100*100" en la aplicaci贸n de calculadora. Esta idea simple se puede expandir f谩cilmente a varias herramientas de computaci贸n simb贸lica.

Considere los siguientes ejemplos adicionales de aplicaciones:

  • Un chatbot que puede responder preguntas sobre una base de datos financiera extrayendo informaci贸n para formar una consulta SQL a partir del texto del usuario.

驴Cu谩l es el precio de las acciones de Apple ahora?

El precio actual es BASE DE DATOS [SELECCIONAR precio DE acciones DONDE empresa = "Apple" Y tiempo = "ahora"].
  • Un chatbot que puede responder preguntas sobre el clima extrayendo informaci贸n de la consulta y utilizando una API del clima para recuperar la informaci贸n.

驴C贸mo est谩 el clima en Nueva York?

El clima es API DEL CLIMA[Nueva York].
  • O incluso tareas mucho m谩s complejas que dependen de m煤ltiples fuentes de datos, como las siguientes:
Ejemplo de Sistema MRKL (AI21)

Un Ejemplo

He reproducido un ejemplo del sistema MRKL del art铆culo original, utilizando Dust.tt, vinculado aqu铆. El sistema lee un problema matem谩tico (por ejemplo, 驴Cu谩nto es 20 por 5^6?), extrae los n煤meros y las operaciones, y los reformatea para una aplicaci贸n de calculadora (por ejemplo, 20*5^6). Luego env铆a la ecuaci贸n reformateada a la aplicaci贸n de calculadora de Google y devuelve el resultado. Tenga en cuenta que el art铆culo original realiza una optimizaci贸n r谩pida en el enrutador (el LLM), pero no lo hago en este ejemplo. Veamos c贸mo funciona esto:

Primero, hice un conjunto de datos simple en la pesta帽a Datasets de Dust.

Luego, cambi茅 a la pesta帽a Specification y cargu茅 el conjunto de datos utilizando un bloque data.

A continuaci贸n, cre茅 un bloque llm que extrae los n煤meros y operaciones. Observe c贸mo en el prompt le dije que estar铆amos usando la calculadora de Google. El modelo que uso (GPT-3) probablemente tiene alg煤n conocimiento de la calculadora de Google desde el preentrenamiento.

Luego, hice un bloque code, que ejecuta un c贸digo JavaScript simple para eliminar los espacios de la finalizaci贸n.

Finalmente, hice un bloque search que env铆a la ecuaci贸n reformateada a la calculadora de Google.

隆A continuaci贸n, podemos ver los resultados finales, que son todos correctos!

Si茅ntase libre de clonar y experimentar con este playground aqu铆.

Notas

MRKL fue desarrollado por AI21 y originalmente utiliz贸 su LLM J-1 (Jurassic 1)2.

M谩s

Vea este ejemplo de un sistema MRKL construido con LangChain.


  1. Karpas, E., Abend, O., Belinkov, Y., Lenz, B., Lieber, O., Ratner, N., Shoham, Y., Bata, H., Levine, Y., Leyton-Brown, K., Muhlgay, D., Rozen, N., Schwartz, E., Shachaf, G., Shalev-Shwartz, S., Shashua, A., & Tenenholtz, M. (2022).
  2. Lieber, O., Sharir, O., Lentz, B., & Shoham, Y. (2021). Jurassic-1: Technical Details and Evaluation, White paper, AI21 Labs, 2021. URL: Https://Uploads-Ssl. Webflow. Com/60fd4503684b466578c0d307/61138924626a6981ee09caf6_jurassic_ Tech_paper. Pdf.