Announcing our new Paper: The Prompt Report, with Co-authors from OpenAI & Microsoft!

Check it out →

📙 Référence de vocabulaire

Dernière mise à jour le August 7, 2024 par Sander Schulhoff

Veuillez vous référer à cette page pour une liste de termes et de concepts que nous utiliserons tout au long de ce cours.

Les grands modèles de langue (LLMs), les modèles de langue pré-entraînés (PLMs)1, les modèles de langue (LMs) et les modèles fondamentaux

Ces termes font tous plus ou moins référence à la même chose : de grandes intelligences artificielles (réseaux neuronaux), qui ont généralement été entraînées sur une énorme quantité de texte.

Les modèles de langage masqués (MLMs)

Les MLMs sont un type de modèle NLP, qui ont un jeton ("token") spécial, généralement [MASK], qui est remplacé par un mot du vocabulaire. Le modèle prédit alors le mot qui a été masqué. Par exemple, si la phrase est "Le chien [MASK] le chat", le modèle prédit "chasse" avec une forte probabilité.

Les étiquettes ("labels")

Le concept d'étiquettes est mieux compris avec un exemple.

Supposons que nous voulions classifier certains tweets comme méchants ou non méchants. Si nous avons une liste de tweets et leur étiquette correspondante (méchants ou non méchants), nous pouvons entraîner un modèle à classer si les tweets sont méchants ou non. Les étiquettes ne sont généralement que des possibilités pour la tâche de classification.

L'espace d'étiquettes

Toutes les étiquettes possibles pour une tâche donnée ('méchants' et 'non méchants' pour l'exemple ci-dessus).

L'analyse de sentiment

L'analyse de sentiment est la tâche de classer le texte en sentiments positifs, négatifs ou autres.

"Modèle" vs "AI" vs "LLM"

Ces termes sont utilisés de manière quelque peu interchangeable tout au long de ce cours, mais ils ne signifient pas toujours la même chose. Les LLM sont un type d'IA, comme mentionné ci-dessus, mais toutes les IA ne sont pas des LLM. Lorsque nous mentionnons des modèles dans ce cours, nous faisons référence à des modèles d'IA. En tant que tel, dans ce cours, vous pouvez considérer les termes "modèle" et "IA" comme interchangeables.

L'apprentissage automatique (ML, machine learning)

Le ML est un domaine d'étude qui se concentre sur les algorithmes capables d'apprendre à partir de données. Le ML est une sous-catégorie de l'IA.

Le verbaliseur ("Verbalizer")

Dans le cadre de la classification, les verbaliseurs sont des mappages des étiquettes aux mots du vocabulaire d'un modèle de langage2. Par exemple, considérez la classification de sentiment avec le prompt suivant:

Tweet: "J'aime les hotpockets"
Quel est le sentiment de ce tweet ? Dites 'pos' ou 'neg'.

Ici, le verbaliseur est le mappage des étiquettes conceptuelles de positif et négatif aux jetons pos et neg.

L'apprentissage par renforcement à partir des commentaires humains (RLHF, Reinforcement Learning from Human Feedback)

Le RLHF est une méthode de fine-tuning des LLMs selon les données de préférence humaine.

Prompts

Prompt

A text or other input to a Generative AI


Few-Shot Standard Prompt

Standard prompts that have exemplars in them. Exemplars are examples of the task that the prompt is trying to solve, which are included in the prompt itself.


Prompting Techniques

CoT prompting

The main idea of CoT is that by showing the LLM some few shot exemplars where the reasoning process is explained in the exemplars, the LLM will also show the reasoning process when answering the prompt.


PAL

A method that uses code as intermediate reasoning

see PAL

Self-Consistency

Generating multiple chains of thought and taking the majority answer.


General ML

Label Space

All of the possible labels for a given task.


Gold Labels

The correct labels for a given task.


Labels

The concept of labels is best understood with an example.

Say we want to classify some Tweets as mean or not mean. If we have a list of Tweets and their corresponding *label* (mean or not mean), we can train a model to classify whether tweets are mean or not. Labels are generally just possibilities for the classification task.


Neural Network

A neural network is a group of interconnected units called neurons that send signals to one another. Neurons can be either biological cells or mathematical models.


Masked Language Models (MLMs)

MLMs are a type of NLP model, which have a special token, usually [MASK], which is replaced with a word from the vocabulary. The model then predicts the word that was masked. For example, if the sentence is 'The dog is [MASK] the cat', the model will predict 'chasing' with high probability.


Machine Learning (ML)

ML is a field of study that focuses on algorithms that can learn from data. ML is a subfield of AI.


Reinforcement Learning from Human Feedback (RLHF)

RLHF is a method for fine tuning LLMs according to human preference data.


API

Application Programming Interface. Enables different systems to interact with each other programmatically. Two types of APIs are REST APIs (web APIs) and native-library APIs.


Exemplars

Examples of the task that the prompt is trying to solve, which are included in the prompt itself.


LLM

A LLM (Large Language Model) is a model that is trained on language.


Sentiment Analysis

Sentiment analysis is the task of classifying text into positive, negative, or other sentiments.


Footnotes

  1. Branch, H. J., Cefalu, J. R., McHugh, J., Hujer, L., Bahl, A., del Castillo Iglesias, D., Heichman, R., & Darwishi, R. (2022). Evaluating the Susceptibility of Pre-Trained Language Models via Handcrafted Adversarial Examples.

  2. Schick, T., & Schütze, H. (2020). Exploiting Cloze Questions for Few Shot Text Classification and Natural Language Inference.

Word count: 0

Get AI Certified by Learn Prompting


Copyright © 2024 Learn Prompting.