Saltar al contenido principal

🟡 Generated Knowledge

La idea detrás del enfoque de conocimiento generado1 es pedir al LLM que genere información potencialmente útil sobre una pregunta o tema dado antes de generar una respuesta final.

Por ejemplo, supongamos que desea escribir un pequeño artículo sobre algún animal, como osos espirituales. Antes de pedirle al LLM que escriba el artículo, puede pedirle que genere algunos datos sobre los osos espirituales. Esto ayudará al LLM a escribir un artículo más informativo. Hay dos formas sencillas de hacer esto.

Enfoque de un solo prompt.​

El primer enfoque consiste en pedirle al LLM que genere conocimiento y luego escriba la publicación, todo con un solo prompt.

Genera 4 hechos sobre el oso Kermode, luego usa estos hechos para escribir una breve publicación de blog con la información:

El oso Kermode, también conocido como oso espíritu, es una rara subespecie del oso negro americano que se encuentra en las regiones costeras de Columbia Británica, Canadá.

1. El oso Kermode es una subespecie única del oso negro americano, con aproximadamente el 10% de la población que tiene pelaje blanco.

2. El oso Kermode es un símbolo de los pueblos de las Primeras Naciones de Columbia Británica y es visto como un animal espiritual.

3. El oso Kermode es una parte importante del ecosistema, ayudando a dispersar las semillas y mantener el equilibrio del bosque.

4. El oso Kermode es una especie protegida y su población es monitoreada de cerca por el gobierno provincial.

El oso Kermode es un animal único y especial que se encuentra en las regiones costeras de Columbia Británica, Canadá. Aproximadamente el 10% de la población de esta subespecie del oso negro americano tiene pelaje blanco, lo que los convierte en una vista rara. El oso Kermode es un símbolo de los pueblos de las Primeras Naciones de Columbia Británica y es visto como un animal espiritual. Es una parte importante del ecosistema, ayudando a dispersar las semillas y mantener el equilibrio del bosque. El oso Kermode es una especie protegida y su población es monitoreada de cerca por el gobierno provincial. Es un animal hermoso y majestuoso, y es importante que hagamos nuestra parte para proteger y conservar esta especie.

Enfoque de doble prompt​

En este enfoque, primero pedimos al LLM que genere hechos sobre el oso:

Genera 10 hechos sobre el oso Kermode:
1. El oso Kermode, también conocido como Spirit Bear, es una rara subespecie del oso negro americano que se encuentra en Columbia Británica, Canadá.

2. El oso Kermode tiene un pelaje único de color blanco o crema, lo cual se debe a un gen recesivo.

3. El oso Kermode es un símbolo de esperanza y renovación para las Primeras Naciones de Columbia Británica.

4. El oso Kermode es una especie protegida y se encuentra en la lista de especies de preocupación especial del Comité sobre el Estatus de la Vida Silvestre en Peligro de Extinción en Canadá.

Luego, utilizamos los hechos generados para escribir el post, con una segunda solicitud:


1. El oso Kermode, también conocido como el Oso Espíritu, es una rara subespecie del oso negro americano que se encuentra en la Columbia Británica, Canadá.

2. El oso Kermode tiene un pelaje único de color blanco o crema, que se debe a un gen recesivo.

3. El oso Kermode es un símbolo de esperanza y renovación para los pueblos de las Primeras Naciones de la Columbia Británica.

4. El oso Kermode es una especie protegida y está clasificado como una especie de especial preocupación por el Comité sobre el Estado de la Vida Silvestre en Peligro de Canadá.

Usa los hechos anteriores para escribir una entrada de blog de un párrafo sobre el oso Kermode:


El oso Kermode, también conocido como el Oso Espíritu, es una rara subespecie del oso negro americano que se encuentra en la Columbia Británica, Canadá. Este oso único tiene un pelaje blanco o crema, causado por un gen recesivo, y es un símbolo de esperanza y renovación para los pueblos de las Primeras Naciones de la Columbia Británica. El oso Kermode es una especie protegida y está clasificado como una especie de especial preocupación por el Comité sobre el Estado de la Vida Silvestre en Peligro de Canadá, lo que lo convierte en una parte importante de la biodiversidad de la región.

Recomiendo este segundo enfoque, ya que puede producir contenidos más largos de forma más fiable.

Otro caso de uso​

El enfoque del conocimiento generado se introdujo en realidad para una tarea completamente distinta, la de responder a preguntas difíciles. Consideremos la siguiente pregunta, a la que GPT-3 responde incorrectamente:


Si primero le preguntamos al LLM que genere información sobre Congo y Sudáfrica, podemos luego utilizar esa información para responder la pregunta correctamente. En teoría, esto es similar a la técnica de CoT, ya que efectivamente estamos obteniendo del LLM un razonamiento intermedio en forma de hechos relacionados.

Comencemos con el primer paso, generación de conocimiento. Podemos pedirle al LLM que genere información sobre Congo y Sudáfrica:

A continuación, usemos ese conocimiento para responder correctamente la pregunta. ¡Este es el paso de integración de conocimiento!

Una discusión más técnica​

Aunque el caso de uso anterior era similar a la forma en que se introdujo originalmente el conocimiento generado, no es exactamente igual. El siguiente contenido abarca el contexto más técnico en el que se introdujo el enfoque. Sigue el patrón de dos pasos intermedios (generación de conocimiento e integración de conocimiento) que vimos anteriormente.

Generated Knowledge (Liu et al.)

Generación de conocimiento​

En el paso de generación de conocimiento, se pide al LLM que genere un conjunto de hechos sobre la pregunta. Al LLM se le pide que responda como se muestra a continuación. Se generan M terminaciones diferentes utilizando esta misma pregunta (similar al enfoque de autoconsistencia).

Generated Knowledge Example (Liu et al.)

Integración de conocimiento​

A continuación, generamos preguntas "con conocimientos ampliados" y hacemos una solicitud al modelo LLM con ellas para obtener respuestas finales. La forma más sencilla de entender esto es mediante un ejemplo.

Supongamos que intentamos responder la pregunta "La mayoría de los canguros tienen extremidades <mask>". Supongamos que en la etapa de generación de conocimientos hemos generado 2 conocimientos (M = 2):

  • Conocimiento 1: Los canguros son marsupiales que viven en Australia.

  • Conocimiento 2: Los canguros son marsupiales que tienen 5 extremidades.

Ahora, concatenamos cada conocimiento con la pregunta para generar preguntas con conocimientos ampliados:

  • Pregunta con Conocimiento Ampliado 1: La mayoría de los canguros tienen <mask\> extremidades. Los canguros son marsupiales que viven en Australia.

  • Pregunta con Conocimiento Ampliado 2: La mayoría de los canguros tienen <mask\> extremidades. Los canguros son marsupiales que tienen 5 extremidades.

Luego, solicitamos al LLM que responda estas preguntas con conocimientos ampliados y obtenemos las propuestas de respuesta final:

  • Respuesta 1: 4

  • Respuesta 2: 5

Seleccionamos la respuesta con la probabilidad más alta como la respuesta final. La probabilidad más alta podría ser la probabilidad softmax del token de respuesta o la probabilidad logarítmica del token (o tokens) de respuesta.

Modelos de lenguaje de Recitation-Augmented​

El enfoque de recitación aumentada2 es similar al conocimiento generado (básicamente el mismo). Sin embargo, es mucho menos complejo que la implementación formal del conocimiento generado.

La idea aquí es hacer una prompt de pocos ejemplos al LLM para generar información y responder en un mismo paso. El hecho de que el modelo recite/genere conocimiento y responda la pregunta en el mismo paso es la principal diferencia del enfoque de conocimiento generado.

Para reiterar, este enfoque induce al modelo con múltiples ejemplos de (pregunta, recitación, respuesta), y luego hace la pregunta. Los autores señalan que este enfoque se puede combinar con autoconsistencia o múltiples caminos de finalización.

Notas​

  • El conocimiento generado muestra mejoras en varios conjuntos de datos de sentido común.

  • El conocimiento correspondiente a la respuesta seleccionada se llama el conocimiento seleccionado.

  • En la práctica, se podría tomar la respuesta más frecuentemente encontrada como la final.


  1. Liu, J., Liu, A., Lu, X., Welleck, S., West, P., Bras, R. L., Choi, Y., & Hajishirzi, H. (2021). Generated Knowledge Prompting for Commonsense Reasoning. ↩
  2. Sun, Z., Wang, X., Tay, Y., Yang, Y., & Zhou, D. (2022). Recitation-Augmented Language Models. ↩