paint-brush
Нова техніка підказок стверджує, що допомагає ШІ думати як людиза@mahakshah
774 показання
774 показання

Нова техніка підказок стверджує, що допомагає ШІ думати як люди

за Mahak Shah4m2025/01/15
Read on Terminal Reader

Надто довго; Читати

Підказки за ланцюгом думок революціонізують нашу взаємодію зі ШІ. Він розбиває складні проблеми на легкозасвоювані частини, дозволяючи моделі систематично вирішувати кожен компонент. Цей структурований підхід забезпечує точність і демонструє процес міркування, що є особливо цінним при роботі зі складними математичними операціями.
featured image - Нова техніка підказок стверджує, що допомагає ШІ думати як люди
Mahak Shah HackerNoon profile picture


Ви коли-небудь замислювалися, як змусити ШІ думати більше як людина? Хоча великі мовні моделі (LLM) чудово передбачають наступне слово в послідовності, вони часто спотикаються, коли стикаються з проблемами, що вимагають методичного мислення. Введіть підказки за ланцюгом думок – кардинальна техніка, яка революціонізує нашу взаємодію зі ШІ.

Порушення спонукання за ланцюгом думок


Уявіть, що ви навчаєте дитину розгадувати складну головоломку. Замість того, щоб показувати їм остаточну картинку, ви направляєте їх через кожен крок. Це, по суті, те, що підказка ланцюга думок (CoT) робить для LLM. Надаючи приклади, які демонструють покрокові міркування, ми допомагаємо цим моделям досягати точних рішень через логічну прогресію.


Джерело зображення: Wei et al. (2022)


Чарівна формула: чому вона працює


Традиційні методи підказок часто призводять до однозначних результатів. Однак підказка CoT розбиває складні проблеми на легкозасвоювані частини, що дозволяє моделі систематично розглядати кожен компонент. Цей підхід виявився настільки успішним, що передові моделі, як-от останні пропозиції OpenAI, включили його до своїх основних функцій.


Застосування в реальному світі: розв’язування математичних головоломок


Розглянемо практичний приклад. Уявіть, що ви допомагаєте ШІ розв’язати це рівняння

5x - 4 = 16


Ось як підказка CoT керує моделлю:

  1. Перший крок: додайте 4 до обох сторін
    • 5x - 4 + 4 = 16 + 4
    • 5x = 20
  2. Другий крок: розділіть обидві сторони на 5
    • 5x/5 = 20/5

    • х = 4


Цей структурований підхід забезпечує точність і демонструє процес міркування, що є особливо цінним під час складних математичних операцій.


Ланцюг думок проти кількакратних підказок: розуміння різниці


Обидва ці способи можуть здатися схожими на перший погляд, але вони служать різним цілям:


  • Кілька підказок : надає приклади введення та виведення, як-от клавіша з кількома варіантами відповіді.

  • Підказка за ланцюгом думок : демонструє повний процес міркування, як показ усієї роботи в математичній задачі.


Кілька підказок виглядатиме так:

 Example 1: Problem: If a store sells books for $5 each and markers for $3 each, how much would 2 books and 4 markers cost? Answer: $22 Example 2: Problem: If a store sells notebooks for $4 each and pens for $2 each, how much would 3 notebooks and 5 pens cost? Answer: $22


Підказка за ланцюжком думок виглядатиме так:

 Problem: If a store sells books for $5 each and markers for $3 each, how much would 2 books and 4 markers cost? Thinking: 1. Calculate cost of books: 2 books × $5 = $10 2. Calculate cost of markers: 4 markers × $3 = $12 3. Total cost = Cost of books + Cost of markers = $10 + $12 = $22 Answer: $22 Problem: If a store sells notebooks for $4 each and pens for $2 each, how much would 3 notebooks and 5 pens cost? Thinking: 1. Calculate cost of notebooks: 3 notebooks × $4 = $12 2. Calculate cost of pens: 5 pens × $2 = $10 3. Total cost = Cost of notebooks + Cost of pens = $12 + $10 = $22 Answer: $22

Ланцюг думок Zero-Shot


Використовуючи просту, але потужну фразу « Давайте думати крок за кроком», підказка Zero-shot CoT використовується в обставинах, коли у вас немає під рукою прикладів випадків. Наприклад, «Давайте поміркуємо крок за кроком: поясніть квантову фізику».

Коли слід використовувати підказки CoT?


Підказка CoT сяє, коли ви маєте справу з:

  • Складна арифметика
  • Багатоетапне логічне міркування
  • Здоровий глузд
  • Символічна маніпуляція


Останні тести від Клода продемонстрували, що методи, які використовують 3- або 5-шагове підказування CoT, добре справляються з важкими міркуваннями: GPQA та MMLU.

Майбутнє: мультимодальний ланцюг думок


Найновіший прогрес у міркуванні ШІ об’єднує візуальні та текстові компоненти в когнітивні процеси. Уявіть штучний інтелект, який діагностує ремонт велосипеда, розуміє інструкцію та забезпечує візуальні та звукові вказівки на кожному етапі процесу. Мультимодальний підхід означає майбутній прогрес у підтримці ШІ.


Джерело зображення: Zhang et al. (2023)

Підвищення ефективності ваших підказок CoT


Хоча спонукання ланцюга думок є потужним, воно діє з певними обмеженнями. Шлях міркування, який виконує модель, не гарантовано буде безпомилковим і незначно відрізняється в результатах.


Ось кілька порад, щоб отримати кращі результати:

  • Ретельно протестуйте з різними підходами.
  • Розгляньте можливість поєднання підказок CoT з іншими стратегіями підказок.
  • Якщо можливо, використовуйте більші моделі з понад 100 мільярдами параметрів.

Висновок


Враховуючи розвиток штучного інтелекту, стає очевидним, що підказка за ланцюгом думок (CoT) є ефективною технікою для використання більш просунутих здібностей міркування. Важливо відзначити, що використання підказок CoT для розробки додатків або для досягнення більш оптимальних результатів у взаємодії зі ШІ значно підвищує шанси на досягнення успіху.


Намір полягає не лише в тому, щоб отримати точну відповідь, а й у розумінні процедури, яка виконується для цього, і в цьому полягає краса спонукання за ланцюгом думок.

Виноски

  1. Вей, Дж., Ван, X., Шурманс, Д., Босма, М., Іхтер, Б., Ся, Ф., Чі, Е., Ле, К., і Чжоу, Д. (2022). Ланцюг думок спонукає до міркувань у великих мовних моделях.
  2. Кодзіма Т., Гу С.С., Рейд М., Мацуо Ю. та Івасава Ю. (2022). Великі мовні моделі — це нульові міркування.
  3. Чжан, Чжуошен та ін. «Мультимодальне мислення в мовних моделях». Препринт arXiv arXiv:2302.00923 (2023).


L O A D I N G
. . . comments & more!

About Author

Mahak Shah HackerNoon profile picture
Mahak Shah@mahakshah
A seasoned Software engineer having 6 years of experience with industry leaders like Splunk, Salesforce and Samsung.

ПОВІСИТИ БИРКИ

ЦЯ СТАТТЯ БУЛА ПРЕДСТАВЛЕНА В...