Бібліографічний список

Reading Time: 1 minute

Last updated on August 7, 2024

Сторінка містить упорядкований список усіх документів, які використовуються у цьому курсі. Статті розподілені за темами.

Щоб процитувати цей курс, використовуйте надану цитату в репозиторії Github.

🔵 = Стаття, безпосередньо цитована в цьому курсі. Інші документи доповнили моє розуміння теми.

Примітка: оскільки документи GPT-3 та GPT-3 Instruct не відповідають моделям davinci, я намагаюся не цитувати їх як такі.

Стратегії інженерії запитів

Ланцюг думок (Chain of Thought)¹ 🔵

Ланцюг думок без прикладів у запиті (Zero Shot Chain of Thought)² 🔵

Самоузгодженість (Self Consistency)³ 🔵

Чим хороші контекстні приклади для GPT-3?⁴ 🔵

Запит про все, що завгодно (Ask-Me-Anything)⁵ 🔵

Згенеровані знання⁶ 🔵

Мовні моделі із функцією озвучення⁷ 🔵

Переосмислення ролі демонстрацій⁸ 🔵

Scratchpads⁹

Майєвтичні запити¹⁰

STaR¹¹

Запити від найменшого до найбільшого¹² 🔵

Рефреймінг інструктивних запитів на мову GPTk¹³ 🔵

Тест Тюркінга: чи можуть мовні моделі розуміти інструкції?¹⁴ 🔵

Надійність

MathPrompter¹⁵ 🔵

Ненадійність пояснень у запитах з невеликою кількістю прикладів для текстових міркувань¹⁶ 🔵

Запит для GPT-3 має бути надійним¹⁷

Різноманітні запити¹⁸ 🔵

Калібрування перед використанням: покращення продуктивності мовних моделей з кількома прикладами¹⁹ 🔵

Покращена самоузгодженість²⁰

Упередженість у тестовому ланцюзі думок з кількома прикладами²¹ 🔵

Конституційний ШІ: нешкідливість зворотного зв'язку із ШІ²² 🔵

Композиційне узагальнення - SCAN²³

Автоматизоване створення запитів

AutoPrompt²⁴ 🔵

Інженер автоматичних запитів²⁵

Моделі

Мовні моделі

GPT-3²⁶ 🔵

GPT-3 Instruct²⁷ 🔵

PaLM²⁸ 🔵

BLOOM²⁹ 🔵

BLOOM+1 (більше мов/ 0 покращень прикладів)³⁰

Технічний звіт GPT-4³¹ 🔵

Jurassic 1³² 🔵

GPT-J-6B³³

Roberta³⁴

Моделі генерування зображень

Stable Diffusion³⁵ 🔵

DALLE³⁶ 🔵

М'який запит

М'які запити³⁷ 🔵

Інтерпретовані дискретизовані м'які запити³⁸ 🔵

Набори даних

MultiArith³⁹ 🔵

GSM8K⁴⁰ 🔵

HotPotQA⁴¹ 🔵

Fever⁴² 🔵

BBQ: власноруч створений тест на упередженість для відповідей на запитання⁴³ 🔵

Інженерія запиту для зображень

Таксономія модифікаторів запитів⁴⁴

DiffusionDB⁴⁵

Книга запитів DALLE 2⁴⁶ 🔵

Інженерія запитів для мистецтва, згенерованого на основі тексту⁴⁷ 🔵

Зі створенням правильних запитів допоможе Stable Diffusion 2.0.⁴⁸ 🔵

Оптимізація запитів для перетворення тексту в зображення⁴⁹

Інженерія запитів IDEs

Prompt IDE⁵⁰ 🔵

Prompt Source⁵¹ 🔵

PromptChainer⁵² 🔵

PromptMaker⁵³ 🔵

Інструменти

LangChain⁵⁴ 🔵

TextBox 2.0: Бібліотека генерування текстів з попередньо підготовленими мовними моделями⁵⁵ 🔵

OpenPrompt: фреймворк з відкритим вихідним кодом для швидкого навчання⁵⁶ 🔵

GPT Index⁵⁷ 🔵

Прикладна інженерія запитів

Конструкції мовних моделей⁵⁸

MRKL⁵⁹ 🔵

ReAct⁶⁰ 🔵

PAL: Програмовані мовні моделі⁶¹ 🔵

Дизайн інтерфейсу користувача

Інструкції з проєктування запитів для моделей, які генерують текст у зображення⁶²

Введення запитів

Згенерований машиною текст: всебічний огляд загроз і методів їх виявлення⁶³ 🔵

Оцінка вразливості мовних моделей за допомогою власних прикладів⁶⁴ 🔵

Дослідження програмної поведінки ВММ: подвійне використання через атаки на систему безпеки⁶⁵ 🔵

Додатковий матеріал: всебічний аналіз нових загроз швидкого введення даних до великих мовних моделей, які інтегровані з додатками⁶⁶ 🔵

Введення запитів як атаки проти GPT-3⁶⁷ 🔵

Використання запитів GPT-3 зі зловмисними введеннями, які наказують моделі ігнорувати попередні вказівки⁶⁸ 🔵

Суперечливі запити⁶⁹ 🔵

ChatGPT "DAN" (та інші випадки джейлбрейку)⁷⁰ 🔵

Захист від введення запитів у GPT-3⁷¹ 🔵

Діалог з машиною: інженерія запитів та їхнє введення⁷²

Дослідження атак під час введення запитів⁷³ 🔵

Використання GPT-Eliezer проти джейлбрейку ChatGPT⁷⁴ 🔵

Запит в чаті Microsoft Bing⁷⁵

Джейлбрейк

Ігнорувати попередній запит: методи атаки на мовні моделі⁷⁶

Уроки з техніки безпеки та зловживання мовними моделями⁷⁷

Виявлення токсичності з генеративним висновком на основі запитів⁷⁸

Нові вдосконалені засоби модерації контенту⁷⁹

OpenAI API⁸⁰ 🔵

OpenAI ChatGPT⁸¹ 🔵

Твіт про ChatGPT 4⁸² 🔵

Робочий твіт⁸³ 🔵

Твіт-дослідження⁸⁴ 🔵

Твіт про здатність удавати⁸⁵ 🔵

Твіт про відповідальність⁸⁶ 🔵

Твіт у режимі Lynx⁸⁷ 🔵

Твіт у режимі Sudo⁸⁸ 🔵

Ігнорування попереднього запиту⁸⁹ 🔵

Дослідження

Попереднє навчання, запит та прогнозування: систематичний огляд методів запитів в обробці природної мови⁹⁰

Статті про запити⁹¹

Генерування наборів даних

Дослідження поведінки мовної моделі за допомогою модельних оцінок⁹²

Вибіркове коментування покращує навчання мовних моделей з кількома прикладами⁹³

Застосунки

Atlas: Навчання з кількома прикладами мовних моделей із розширеним пошуком⁹⁴

STRUDEL: Структуроване узагальнення діалогу для його розуміння⁹⁵

Актуальні теми

Auto-GPT⁹⁶

Baby AGI⁹⁷

AgentGPT⁹⁸

Різне

Запит — це програмування: мова запитів для великих мовних моделей⁹⁹

Паралельні контекстні вікна покращують контекстне навчання великих мовних моделей¹⁰⁰

Каталог шаблонів запитів для покращення їхньої розробки за допомогою ChatGPT¹⁰¹ 🔵

Навчання для виконання складних завдань за допомогою композиційного тонкого налаштування мовних моделей¹⁰²

Надзвичайні інструкції: узагальнення 1600+ завдань NLP за допомогою декларативних інструкцій¹⁰³

Покращення здатності мовних моделей з кількома прикладами до навчання¹⁰⁴

Занурення в результати пошуку¹⁰⁵

Як створювати запити? Можливості та виклики навчання з прикладами та без них для взаємодії людини та штучного інтелекту задля творчого застосування генеративних моделей¹⁰⁶

Про визначення соціальних упереджень у багатозадачному навчанні на основі запитів¹⁰⁷

Написання сюжету з використанням попередньо навчених мовних моделей¹⁰⁸ 🔵

StereoSet: Визначення стереотипів у попередньо навчених мовних моделях¹⁰⁹

Дослідження галюцинацій у продукуванні природної мови¹¹⁰

Приклади⁴

Wordcraft¹¹¹

PainPoints¹¹²

Самонавчання: узгодження мовної моделі з самостійно створеними інструкціями¹¹³

Від зображень до текстових запитів: нульовий VQA із замороженими великими мовними моделями¹¹⁴

Використання Cloze Questions для класифікації текстів з невеликою кількістю прикладів та висновку природною мовою¹¹⁵

Запит про все, що завгодно (Ask-Me-Anything)⁵

Водяний знак для великих мовних моделей¹¹⁶

Footnotes

Wei, J., Wang, X., Schuurmans, D., Bosma, M., Ichter, B., Xia, F., Chi, E., Le, Q., & Zhou, D. (2022). Chain of Thought Prompting Elicits Reasoning in Large Language Models. ↩
Kojima, T., Gu, S. S., Reid, M., Matsuo, Y., & Iwasawa, Y. (2022). Large Language Models are Zero-Shot Reasoners. ↩
Wang, X., Wei, J., Schuurmans, D., Le, Q., Chi, E., Narang, S., Chowdhery, A., & Zhou, D. (2022). Self-Consistency Improves Chain of Thought Reasoning in Language Models. ↩
Liu, J., Shen, D., Zhang, Y., Dolan, B., Carin, L., & Chen, W. (2022). What Makes Good In-Context Examples for GPT-3? Proceedings of Deep Learning Inside Out (DeeLIO 2022): The 3rd Workshop on Knowledge Extraction and Integration for Deep Learning Architectures. https://doi.org/10.18653/v1/2022.deelio-1.10 ↩ ↩²
Arora, S., Narayan, A., Chen, M. F., Orr, L., Guha, N., Bhatia, K., Chami, I., Sala, F., & Ré, C. (2022). Ask Me Anything: A simple strategy for prompting language models. ↩ ↩²
Liu, J., Liu, A., Lu, X., Welleck, S., West, P., Bras, R. L., Choi, Y., & Hajishirzi, H. (2021). Generated Knowledge Prompting for Commonsense Reasoning. ↩
Sun, Z., Wang, X., Tay, Y., Yang, Y., & Zhou, D. (2022). Recitation-Augmented Language Models. ↩
Min, S., Lyu, X., Holtzman, A., Artetxe, M., Lewis, M., Hajishirzi, H., & Zettlemoyer, L. (2022). Rethinking the Role of Demonstrations: What Makes In-Context Learning Work? ↩
Nye, M., Andreassen, A. J., Gur-Ari, G., Michalewski, H., Austin, J., Bieber, D., Dohan, D., Lewkowycz, A., Bosma, M., Luan, D., Sutton, C., & Odena, A. (2021). Show Your Work: Scratchpads for Intermediate Computation with Language Models. ↩
Jung, J., Qin, L., Welleck, S., Brahman, F., Bhagavatula, C., Bras, R. L., & Choi, Y. (2022). Maieutic Prompting: Logically Consistent Reasoning with Recursive Explanations. ↩
Zelikman, E., Wu, Y., Mu, J., & Goodman, N. D. (2022). STaR: Bootstrapping Reasoning With Reasoning. ↩
Zhou, D., Schärli, N., Hou, L., Wei, J., Scales, N., Wang, X., Schuurmans, D., Cui, C., Bousquet, O., Le, Q., & Chi, E. (2022). Least-to-Most Prompting Enables Complex Reasoning in Large Language Models. ↩
Mishra, S., Khashabi, D., Baral, C., Choi, Y., & Hajishirzi, H. (2022). Reframing Instructional Prompts to GPTk’s Language. Findings of the Association for Computational Linguistics: ACL 2022. https://doi.org/10.18653/v1/2022.findings-acl.50 ↩
Efrat, A., & Levy, O. (2020). The Turking Test: Can Language Models Understand Instructions? ↩
Imani, S., Du, L., & Shrivastava, H. (2023). MathPrompter: Mathematical Reasoning using Large Language Models. ↩
Ye, X., & Durrett, G. (2022). The Unreliability of Explanations in Few-shot Prompting for Textual Reasoning. ↩
Si, C., Gan, Z., Yang, Z., Wang, S., Wang, J., Boyd-Graber, J., & Wang, L. (2022). Prompting GPT-3 To Be Reliable. ↩
Li, Y., Lin, Z., Zhang, S., Fu, Q., Chen, B., Lou, J.-G., & Chen, W. (2022). On the Advance of Making Language Models Better Reasoners. ↩
Zhao, T. Z., Wallace, E., Feng, S., Klein, D., & Singh, S. (2021). Calibrate Before Use: Improving Few-Shot Performance of Language Models. ↩
Mitchell, E., Noh, J. J., Li, S., Armstrong, W. S., Agarwal, A., Liu, P., Finn, C., & Manning, C. D. (2022). Enhancing Self-Consistency and Performance of Pre-Trained Language Models through Natural Language Inference. ↩
Shaikh, O., Zhang, H., Held, W., Bernstein, M., & Yang, D. (2022). On Second Thought, Let’s Not Think Step by Step! Bias and Toxicity in Zero-Shot Reasoning. ↩
Bai, Y., Kadavath, S., Kundu, S., Askell, A., Kernion, J., Jones, A., Chen, A., Goldie, A., Mirhoseini, A., McKinnon, C., Chen, C., Olsson, C., Olah, C., Hernandez, D., Drain, D., Ganguli, D., Li, D., Tran-Johnson, E., Perez, E., … Kaplan, J. (2022). Constitutional AI: Harmlessness from AI Feedback. ↩
Lake, B. M., & Baroni, M. (2018). Generalization without Systematicity: On the Compositional Skills of Sequence-to-Sequence Recurrent Networks. https://doi.org/10.48550/arXiv.1711.00350 ↩
Shin, T., Razeghi, Y., Logan IV, R. L., Wallace, E., & Singh, S. (2020). Autoprompt: Eliciting knowledge from language models with automatically generated prompts. arXiv Preprint arXiv:2010.15980. ↩
Zhou, Y., Muresanu, A. I., Han, Z., Paster, K., Pitis, S., Chan, H., & Ba, J. (2022). Large Language Models Are Human-Level Prompt Engineers. ↩
Brown, T. B. (2020). Language models are few-shot learners. arXiv Preprint arXiv:2005.14165. ↩
Ouyang, L., Wu, J., Jiang, X., Almeida, D., Wainwright, C. L., Mishkin, P., Zhang, C., Agarwal, S., Slama, K., Ray, A., Schulman, J., Hilton, J., Kelton, F., Miller, L., Simens, M., Askell, A., Welinder, P., Christiano, P., Leike, J., & Lowe, R. (2022). Training language models to follow instructions with human feedback. ↩
Chowdhery, A., Narang, S., Devlin, J., Bosma, M., Mishra, G., Roberts, A., Barham, P., Chung, H. W., Sutton, C., Gehrmann, S., Schuh, P., Shi, K., Tsvyashchenko, S., Maynez, J., Rao, A., Barnes, P., Tay, Y., Shazeer, N., Prabhakaran, V., … Fiedel, N. (2022). PaLM: Scaling Language Modeling with Pathways. ↩
Scao, T. L., Fan, A., Akiki, C., Pavlick, E., Ilić, S., Hesslow, D., Castagné, R., Luccioni, A. S., Yvon, F., Gallé, M., Tow, J., Rush, A. M., Biderman, S., Webson, A., Ammanamanchi, P. S., Wang, T., Sagot, B., Muennighoff, N., del Moral, A. V., … Wolf, T. (2022). BLOOM: A 176B-Parameter Open-Access Multilingual Language Model. ↩
Yong, Z.-X., Schoelkopf, H., Muennighoff, N., Aji, A. F., Adelani, D. I., Almubarak, K., Bari, M. S., Sutawika, L., Kasai, J., Baruwa, A., Winata, G. I., Biderman, S., Radev, D., & Nikoulina, V. (2022). BLOOM+1: Adding Language Support to BLOOM for Zero-Shot Prompting. ↩
OpenAI. (2023). GPT-4 Technical Report. ↩
Lieber, O., Sharir, O., Lentz, B., & Shoham, Y. (2021). Jurassic-1: Technical Details and Evaluation, White paper, AI21 Labs, 2021. URL: Https://Uploads-Ssl. Webflow. Com/60fd4503684b466578c0d307/61138924626a6981ee09caf6_jurassic_ Tech_paper. Pdf. ↩
Wang, B., & Komatsuzaki, A. (2021). GPT-J-6B: A 6 Billion Parameter Autoregressive Language Model. https://github.com/kingoflolz/mesh-transformer-jax. https://github.com/kingoflolz/mesh-transformer-jax ↩
Liu, Y., Ott, M., Goyal, N., Du, J., Joshi, M., Chen, D., Levy, O., Lewis, M., Zettlemoyer, L., & Stoyanov, V. (2019). Roberta: A robustly optimized bert pretraining approach. arXiv Preprint arXiv:1907.11692. ↩
Rombach, R., Blattmann, A., Lorenz, D., Esser, P., & Ommer, B. (2021). High-Resolution Image Synthesis with Latent Diffusion Models. ↩
Ramesh, A., Dhariwal, P., Nichol, A., Chu, C., & Chen, M. (2022). Hierarchical Text-Conditional Image Generation with CLIP Latents. ↩
Lester, B., Al-Rfou, R., & Constant, N. (2021). The Power of Scale for Parameter-Efficient Prompt Tuning. ↩
Khashabi, D., Lyu, S., Min, S., Qin, L., Richardson, K., Welleck, S., Hajishirzi, H., Khot, T., Sabharwal, A., Singh, S., & Choi, Y. (2021). Prompt Waywardness: The Curious Case of Discretized Interpretation of Continuous Prompts. ↩
Roy, S., & Roth, D. (2015). Solving General Arithmetic Word Problems. Proceedings of the 2015 Conference on Empirical Methods in Natural Language Processing, 1743–1752. https://doi.org/10.18653/v1/D15-1202 ↩
Cobbe, K., Kosaraju, V., Bavarian, M., Chen, M., Jun, H., Kaiser, L., Plappert, M., Tworek, J., Hilton, J., Nakano, R., Hesse, C., & Schulman, J. (2021). Training Verifiers to Solve Math Word Problems. ↩
Yang, Z., Qi, P., Zhang, S., Bengio, Y., Cohen, W. W., Salakhutdinov, R., & Manning, C. D. (2018). HotpotQA: A Dataset for Diverse, Explainable Multi-hop Question Answering. ↩
Thorne, J., Vlachos, A., Christodoulopoulos, C., & Mittal, A. (2018). FEVER: a large-scale dataset for Fact Extraction and VERification. ↩
Parrish, A., Chen, A., Nangia, N., Padmakumar, V., Phang, J., Thompson, J., Htut, P. M., & Bowman, S. R. (2021). BBQ: A Hand-Built Bias Benchmark for Question Answering. ↩
Oppenlaender, J. (2022). A Taxonomy of Prompt Modifiers for Text-To-Image Generation. ↩
Wang, Z. J., Montoya, E., Munechika, D., Yang, H., Hoover, B., & Chau, D. H. (2022). DiffusionDB: A Large-scale Prompt Gallery Dataset for Text-to-Image Generative Models. ↩
Parsons, G. (2022). The DALLE 2 Prompt Book. https://dallery.gallery/the-dalle-2-prompt-book/ ↩
Oppenlaender, J. (2022). Prompt Engineering for Text-Based Generative Art. ↩
Blake. (2022). With the right prompt, Stable Diffusion 2.0 can do hands. https://www.reddit.com/r/StableDiffusion/comments/z7salo/with_the_right_prompt_stable_diffusion_20_can_do/ ↩
Hao, Y., Chi, Z., Dong, L., & Wei, F. (2022). Optimizing Prompts for Text-to-Image Generation. ↩
Strobelt, H., Webson, A., Sanh, V., Hoover, B., Beyer, J., Pfister, H., & Rush, A. M. (2022). Interactive and Visual Prompt Engineering for Ad-hoc Task Adaptation with Large Language Models. arXiv. https://doi.org/10.48550/ARXIV.2208.07852 ↩
Bach, S. H., Sanh, V., Yong, Z.-X., Webson, A., Raffel, C., Nayak, N. V., Sharma, A., Kim, T., Bari, M. S., Fevry, T., Alyafeai, Z., Dey, M., Santilli, A., Sun, Z., Ben-David, S., Xu, C., Chhablani, G., Wang, H., Fries, J. A., … Rush, A. M. (2022). PromptSource: An Integrated Development Environment and Repository for Natural Language Prompts. ↩
Wu, T., Jiang, E., Donsbach, A., Gray, J., Molina, A., Terry, M., & Cai, C. J. (2022). PromptChainer: Chaining Large Language Model Prompts through Visual Programming. ↩
Jiang, E., Olson, K., Toh, E., Molina, A., Donsbach, A., Terry, M., & Cai, C. J. (2022). PromptMaker: Prompt-Based Prototyping with Large Language Models. Extended Abstracts of the 2022 CHI Conference on Human Factors in Computing Systems. https://doi.org/10.1145/3491101.3503564 ↩
Chase, H. (2022). LangChain (0.0.66) [Computer software]. https://github.com/hwchase17/langchain ↩
Tang, T., Junyi, L., Chen, Z., Hu, Y., Yu, Z., Dai, W., Dong, Z., Cheng, X., Wang, Y., Zhao, W., Nie, J., & Wen, J.-R. (2022). TextBox 2.0: A Text Generation Library with Pre-trained Language Models. ↩
Ding, N., Hu, S., Zhao, W., Chen, Y., Liu, Z., Zheng, H.-T., & Sun, M. (2021). OpenPrompt: An Open-source Framework for Prompt-learning. arXiv Preprint arXiv:2111.01998. ↩
Liu, J. (2022). GPT Index. https://doi.org/10.5281/zenodo.1234 ↩
Dohan, D., Xu, W., Lewkowycz, A., Austin, J., Bieber, D., Lopes, R. G., Wu, Y., Michalewski, H., Saurous, R. A., Sohl-dickstein, J., Murphy, K., & Sutton, C. (2022). Language Model Cascades. ↩
Karpas, E., Abend, O., Belinkov, Y., Lenz, B., Lieber, O., Ratner, N., Shoham, Y., Bata, H., Levine, Y., Leyton-Brown, K., Muhlgay, D., Rozen, N., Schwartz, E., Shachaf, G., Shalev-Shwartz, S., Shashua, A., & Tenenholtz, M. (2022). ↩
Yao, S., Zhao, J., Yu, D., Du, N., Shafran, I., Narasimhan, K., & Cao, Y. (2022). ↩
Gao, L., Madaan, A., Zhou, S., Alon, U., Liu, P., Yang, Y., Callan, J., & Neubig, G. (2022). ↩
Liu, V., & Chilton, L. B. (2022). Design Guidelines for Prompt Engineering Text-to-Image Generative Models. Proceedings of the 2022 CHI Conference on Human Factors in Computing Systems. https://doi.org/10.1145/3491102.3501825 ↩
Crothers, E., Japkowicz, N., & Viktor, H. (2022). Machine Generated Text: A Comprehensive Survey of Threat Models and Detection Methods. ↩
Branch, H. J., Cefalu, J. R., McHugh, J., Hujer, L., Bahl, A., del Castillo Iglesias, D., Heichman, R., & Darwishi, R. (2022). Evaluating the Susceptibility of Pre-Trained Language Models via Handcrafted Adversarial Examples. ↩
Kang, D., Li, X., Stoica, I., Guestrin, C., Zaharia, M., & Hashimoto, T. (2023). Exploiting Programmatic Behavior of LLMs: Dual-Use Through Standard Security Attacks. ↩
Greshake, K., Abdelnabi, S., Mishra, S., Endres, C., Holz, T., & Fritz, M. (2023). More than you’ve asked for: A Comprehensive Analysis of Novel Prompt Injection Threats to Application-Integrated Large Language Models. ↩
Willison, S. (2022). Prompt injection attacks against GPT-3. https://simonwillison.net/2022/Sep/12/prompt-injection/ ↩
Goodside, R. (2022). Exploiting GPT-3 prompts with malicious inputs that order the model to ignore its previous directions. https://twitter.com/goodside/status/1569128808308957185 ↩
Chase, H. (2022). adversarial-prompts. https://github.com/hwchase17/adversarial-prompts ↩
KIHO, L. (2023). ChatGPT “DAN” (and other “Jailbreaks”). https://github.com/0xk1h0/ChatGPT_DAN ↩
Goodside, R. (2022). GPT-3 Prompt Injection Defenses. https://twitter.com/goodside/status/1578278974526222336?s=20&t=3UMZB7ntYhwAk3QLpKMAbw ↩
Mark, C. (2022). Talking to machines: prompt engineering & injection. https://artifact-research.com/artificial-intelligence/talking-to-machines-prompt-engineering-injection/ ↩
Selvi, J. (2022). Exploring Prompt Injection Attacks. https://research.nccgroup.com/2022/12/05/exploring-prompt-injection-attacks/ ↩
Stuart Armstrong, R. G. (2022). Using GPT-Eliezer against ChatGPT Jailbreaking. https://www.alignmentforum.org/posts/pNcFYZnPdXyL2RfgA/using-gpt-eliezer-against-chatgpt-jailbreaking ↩
Liu, K. (2023). The entire prompt of Microsoft Bing Chat?! (Hi, Sydney.). https://twitter.com/kliu128/status/1623472922374574080 ↩
Perez, F., & Ribeiro, I. (2022). Ignore Previous Prompt: Attack Techniques For Language Models. arXiv. https://doi.org/10.48550/ARXIV.2211.09527 ↩
Brundage, M. (2022). Lessons learned on Language Model Safety and misuse. In OpenAI. OpenAI. https://openai.com/blog/language-model-safety-and-misuse/ ↩
Wang, Y.-S., & Chang, Y. (2022). Toxicity Detection with Generative Prompt-based Inference. arXiv. https://doi.org/10.48550/ARXIV.2205.12390 ↩
Markov, T. (2022). New and improved content moderation tooling. In OpenAI. OpenAI. https://openai.com/blog/new-and-improved-content-moderation-tooling/ ↩
OpenAI. (2022). https://beta.openai.com/docs/guides/moderation ↩
OpenAI. (2022). https://openai.com/blog/chatgpt/ ↩
Maz, A. (2022). ok I saw a few people jailbreaking safeguards openai put on chatgpt so I had to give it a shot myself. https://twitter.com/alicemazzy/status/1598288519301976064 ↩
Piedrafita, M. (2022). Bypass @OpenAI’s ChatGPT alignment efforts with this one weird trick. https://twitter.com/m1guelpf/status/1598203861294252033 ↩
Parfait, D. (2022). ChatGPT jailbreaking itself. https://twitter.com/haus_cole/status/1598541468058390534 ↩
Soares, N. (2022). Using “pretend” on #ChatGPT can do some wild stuff. You can kind of get some insight on the future, alternative universe. https://twitter.com/NeroSoares/status/1608527467265904643 ↩
Moran, N. (2022). I kinda like this one even more! https://twitter.com/NickEMoran/status/1598101579626057728 ↩
Degrave, J. (2022). Building A Virtual Machine inside ChatGPT. Engraved. https://www.engraved.blog/building-a-virtual-machine-inside/ ↩
Sudo. (2022). https://www.sudo.ws/ ↩
Perez, F., & Ribeiro, I. (2022). Ignore Previous Prompt: Attack Techniques For Language Models. arXiv. https://doi.org/10.48550/ARXIV.2211.09527 ↩
Liu, P., Yuan, W., Fu, J., Jiang, Z., Hayashi, H., & Neubig, G. (2022). Pre-train, Prompt, and Predict: A Systematic Survey of Prompting Methods in Natural Language Processing. ACM Computing Surveys. https://doi.org/10.1145/3560815 ↩
Ding, N., & Hu, S. (2022). PromptPapers. https://github.com/thunlp/PromptPapers ↩
Perez, E., Ringer, S., Lukošiūtė, K., Nguyen, K., Chen, E., Heiner, S., Pettit, C., Olsson, C., Kundu, S., Kadavath, S., Jones, A., Chen, A., Mann, B., Israel, B., Seethor, B., McKinnon, C., Olah, C., Yan, D., Amodei, D., … Kaplan, J. (2022). Discovering Language Model Behaviors with Model-Written Evaluations. ↩
Su, H., Kasai, J., Wu, C. H., Shi, W., Wang, T., Xin, J., Zhang, R., Ostendorf, M., Zettlemoyer, L., Smith, N. A., & Yu, T. (2022). Selective Annotation Makes Language Models Better Few-Shot Learners. ↩
Izacard, G., Lewis, P., Lomeli, M., Hosseini, L., Petroni, F., Schick, T., Dwivedi-Yu, J., Joulin, A., Riedel, S., & Grave, E. (2022). Atlas: Few-shot Learning with Retrieval Augmented Language Models. ↩
Wang, B., Feng, C., Nair, A., Mao, M., Desai, J., Celikyilmaz, A., Li, H., Mehdad, Y., & Radev, D. (2022). STRUDEL: Structured Dialogue Summarization for Dialogue Comprehension. ↩
Significant-Gravitas. (2023). https://news.agpt.co/ ↩
Nakajima, Y. (2023). https://github.com/yoheinakajima/babyagi ↩
Reworkd.ai. (2023). https://github.com/reworkd/AgentGPT ↩
Beurer-Kellner, L., Fischer, M., & Vechev, M. (2022). Prompting Is Programming: A Query Language For Large Language Models. ↩
Ratner, N., Levine, Y., Belinkov, Y., Ram, O., Abend, O., Karpas, E., Shashua, A., Leyton-Brown, K., & Shoham, Y. (2022). Parallel Context Windows Improve In-Context Learning of Large Language Models. ↩
White, J., Fu, Q., Hays, S., Sandborn, M., Olea, C., Gilbert, H., Elnashar, A., Spencer-Smith, J., & Schmidt, D. C. (2023). A Prompt Pattern Catalog to Enhance Prompt Engineering with ChatGPT. ↩
Bursztyn, V. S., Demeter, D., Downey, D., & Birnbaum, L. (2022). Learning to Perform Complex Tasks through Compositional Fine-Tuning of Language Models. ↩
Wang, Y., Mishra, S., Alipoormolabashi, P., Kordi, Y., Mirzaei, A., Arunkumar, A., Ashok, A., Dhanasekaran, A. S., Naik, A., Stap, D., Pathak, E., Karamanolakis, G., Lai, H. G., Purohit, I., Mondal, I., Anderson, J., Kuznia, K., Doshi, K., Patel, M., … Khashabi, D. (2022). Super-NaturalInstructions: Generalization via Declarative Instructions on 1600+ NLP Tasks. ↩
Gao, T., Fisch, A., & Chen, D. (2021). Making Pre-trained Language Models Better Few-shot Learners. Proceedings of the 59th Annual Meeting of the Association for Computational Linguistics and the 11th International Joint Conference on Natural Language Processing (Volume 1: Long Papers). https://doi.org/10.18653/v1/2021.acl-long.295 ↩
Liévin, V., Hother, C. E., & Winther, O. (2022). Can large language models reason about medical questions? ↩
Dang, H., Mecke, L., Lehmann, F., Goller, S., & Buschek, D. (2022). How to Prompt? Opportunities and Challenges of Zero- and Few-Shot Learning for Human-AI Interaction in Creative Applications of Generative Models. ↩
Akyürek, A. F., Paik, S., Kocyigit, M. Y., Akbiyik, S., Runyun, Ş. L., & Wijaya, D. (2022). On Measuring Social Biases in Prompt-Based Multi-Task Learning. ↩
Jin, Y., Kadam, V., & Wanvarie, D. (2022). Plot Writing From Pre-Trained Language Models. ↩
Nadeem, M., Bethke, A., & Reddy, S. (2021). StereoSet: Measuring stereotypical bias in pretrained language models. Proceedings of the 59th Annual Meeting of the Association for Computational Linguistics and the 11th International Joint Conference on Natural Language Processing (Volume 1: Long Papers), 5356–5371. https://doi.org/10.18653/v1/2021.acl-long.416 ↩
Ji, Z., Lee, N., Frieske, R., Yu, T., Su, D., Xu, Y., Ishii, E., Bang, Y., Madotto, A., & Fung, P. (2022). Survey of Hallucination in Natural Language Generation. ACM Computing Surveys. https://doi.org/10.1145/3571730 ↩
Yuan, A., Coenen, A., Reif, E., & Ippolito, D. (2022). Wordcraft: Story Writing With Large Language Models. 27th International Conference on Intelligent User Interfaces, 841–852. ↩
Fadnavis, S., Dhurandhar, A., Norel, R., Reinen, J. M., Agurto, C., Secchettin, E., Schweiger, V., Perini, G., & Cecchi, G. (2022). PainPoints: A Framework for Language-based Detection of Chronic Pain and Expert-Collaborative Text-Summarization. arXiv Preprint arXiv:2209.09814. ↩
Wang, Y., Kordi, Y., Mishra, S., Liu, A., Smith, N. A., Khashabi, D., & Hajishirzi, H. (2022). Self-Instruct: Aligning Language Model with Self Generated Instructions. ↩
Guo, J., Li, J., Li, D., Tiong, A. M. H., Li, B., Tao, D., & Hoi, S. C. H. (2022). From Images to Textual Prompts: Zero-shot VQA with Frozen Large Language Models. ↩
Schick, T., & Schütze, H. (2020). Exploiting Cloze Questions for Few Shot Text Classification and Natural Language Inference. ↩
Kirchenbauer, J., Geiping, J., Wen, Y., Katz, J., Miers, I., & Goldstein, T. (2023). A Watermark for Large Language Models. https://arxiv.org/abs/2301.10226 ↩

Edit this page

📙 Словниковий довідник

📦 Рекомендовані продукти

Master Generative AI with Our Courses

Need Business GenAI Training?

Contact Sales

Want to keep learning

Explore Our Full Course Collection

DIFFICULTY LEVEL

RECOMMENDED COURSES

ChatGPT for Everyone

Introduction to Prompt Engineering

Live Courses

Бібліографічний список

Стратегії інженерії запитів

Ланцюг думок (Chain of Thought)1 🔵

Ланцюг думок без прикладів у запиті (Zero Shot Chain of Thought)2 🔵

Самоузгодженість (Self Consistency)3 🔵

Чим хороші контекстні приклади для GPT-3?4 🔵

Запит про все, що завгодно (Ask-Me-Anything)5 🔵

Згенеровані знання6 🔵

Мовні моделі із функцією озвучення7 🔵

Переосмислення ролі демонстрацій8 🔵

Scratchpads9

Майєвтичні запити10

STaR11

Запити від найменшого до найбільшого12 🔵

Рефреймінг інструктивних запитів на мову GPTk13 🔵

Тест Тюркінга: чи можуть мовні моделі розуміти інструкції?14 🔵

Надійність

MathPrompter15 🔵

Ненадійність пояснень у запитах з невеликою кількістю прикладів для текстових міркувань16 🔵

Запит для GPT-3 має бути надійним17

Різноманітні запити18 🔵

Калібрування перед використанням: покращення продуктивності мовних моделей з кількома прикладами19 🔵

Покращена самоузгодженість20

Упередженість у тестовому ланцюзі думок з кількома прикладами21 🔵

Конституційний ШІ: нешкідливість зворотного зв'язку із ШІ22 🔵

Композиційне узагальнення - SCAN23