Такое словосочетание как Chat GPT слышали, наверное, все, но вот то, что точно таких же ИИ генеративного типа существует не только десятки, а возможно и сотни знают не многие. Кроме того, мало кто понимает как это работает и зачем он вообще нужен. А ведь такой «ИИ компьютер» находящийся за тысячи километров от вас может сгенерировать текст, решить задачу и даже посоветовать фильм под ваше настроение, если ему правильно задать вопрос. И для того, чтобы правильно формулировать задачу необходимо хотя бы отдаленно понимать как это работает. И в рамках данного материла мы постараемся на простом примере пояснить что такое генеративный ИИ, как он работает и как обучается.
Теория и допущения
ИИ такого типа работают путем изучения закономерностей на основе анализа больших объемов данных и последующего использования этих закономерностей для создания нового контента. Чтобы понять это на простом примере, давайте подумаем, как если бы мы учили кого-то писать стихи.
Этап обучения
Представьте, что у вас есть тысячи стихотворений, и ваша цель – научить компьютер создавать новые. Поначалу компьютер не понимает поэзии, но вы скормили ему все эти стихи для анализа. Он начинает с разбора каждого стихотворения на отдельные слова, фразы и даже грамматические структуры, изучая, какие слова обычно следуют за другими, как формируются предложения, какие рифмы или темы часто встречаются.
ИИ использует технику, называемую «обучением», чтобы учиться на этих данных. Но важно понимать, что это не совсем обучение, которое происходит на уроке биологии в девятом классе, по факту ИИ строит математическую модель, распознавая закономерности в стихах – например, как определенные типы слов используются вместе и что делает стихотворение рифмованным. Этот процесс известен как машинное обучение. Чем больше стихотворений он анализирует, тем лучше понимает структуру и правила поэзии.
Генерация нового контента
После того как искусственный интеллект обучен, он переходит на этап генерации. Если вы попросите его написать новое стихотворение, он не просто скопирует одно из них. Вместо этого он использует шаблоны, полученные в процессе обучения, чтобы создать что-то новое. Он начинает с подсказки или нескольких начальных слов и предсказывает, основываясь на известных ему шаблонах, какие слова и фразы должны быть следующими. Например, если вы дадите ему первую строку «Солнце садится за холм», он может сгенерировать новую строку, например «Ветер с прохладой дует с полей», основываясь на изученных шаблонах как и полагается рифма в большинстве случаев и большинстве скормленных стихотворений встречается через строчку соответственно третья строчка будет скажем «Тихо ложится на дом» и так далее.
Со временем, когда модели ИИ будут совершенствоваться и получать больше данных, они станут лучше генерировать творческий и сложный контент, будь то стихи, эссе, программный код. Но генерация это не творчество это новая модель на основе старых приемов.
Ключевой момент
Генеративный ИИ не «знает», как это делают люди и также он не осознает, как цель данной генерации. Он генерирует контент на основе моделей, которые он видел и распознал в прошлом. Он не создает контент с намерением или пониманием, а просто предсказывает следующую часть предложения или изображения, основываясь на своих изученных данных.