Первый опыт общения с ChatGPT у меня состоялся еще осенью прошлого года. Опыт был короткий, но несмотря на это, давший понимание плюсов и минусов. Минусы касались и самого сервиса. Сервис ChatGPT принадлежит компании Open AI, что значит три вещи. Первое, это то, что ваш диалог является частью обучения нейросеток Open AI. Вы помогаете тренерам OpenAI делать их работу. Второе, что ваши диалоги могут быть стерты, если у вас нет аккаунта определенного статуса. То есть все то время, что вы потратили на общение с чат-ботом для вас пропадет. Третье и немного конспирологическое — общаясь вы даете информацию о себе. Мы и так оставляем слишком много “цифровых следов”, которые умные люди перепродают третьим лицам (не подумайте чего, это я про таргетную рекламу).
Вследствие всего вышеперечисленного я решил что надо искать техническое решение, которое позволит развернуть нейросетку на локальном компьютере. С помощью моего старого друга Виталия Чащина, была развернута модель GPT+RAG. Почему именно это? Потому что RAG (Retrieval Augmented Generation) позволяет добавлять к готовой LM более точный контекст и, как следствие, получать более точные ответы в процессе диалога. Для запуска готовых моделей использовалась утилита LM Studio, которая позволяет выбирать различные модели, а для использования RAG — самописный фреймворк на Python. Тестировалась вся эта конструкция на текстах, связанных с описанием того продукта, над которым работает моя компания. Не буду пересказывать всего, что делал, остановлюсь на основных результатах.
Главный вывод: в случае специфических, узких тем нейросетка требует тщательного обучения, поскольку ответы иногда вызывают глубокое удивление. Обучение заключается в добавлении в контекст уточняющей информации, после чего опять следует диалог, в котором проверяется насколько хорошо нейросеть “усвоила материал”. Да, тоже самое происходит и при общении с ChatGPT, когда он просит уточнения, но в случае с локальной GPT+RAG моделью вы просто можете добавить фрагмент текста в соответствующую директорию. То есть вы имеете больше возможностей для управления процессом.
Этот приводит к другим выводам, которые подчас рушат те стереотипы, которые уже сложились вокруг нейростей и AI. Например, что искины скоро массово заменят людей причем даже в творческих профессиях. Да, нейросети уже “пишут” картины и тексты, “снимают” видео, но вопрос тренировки никто не отменял. Нет пока такого коробочного решения, которое позволит нажатием пары кнопок решать любые задачи, которые раньше требовали от человека нескольких дней, а то и недель. К тому же ментор-человек должен обладать более высокой степенью компетентности — либо иметь выход на экспертов с высокой компетентностью — чтобы “воспитать” нейросеть, которой можно будет доверять. Другими словами, без человека пока никуда. Быть может новые версии того же ChatGPT решат проблему самообучения, но конечным пользователем все же является человек и проверку результатов их работы все равно придется делать.
Поэтому скорее нейросети пойдут по той же траектории, что программное обеспечение для персональных компьютеров в 90х и начале нулевых. Excel убил калькулятор, а кадовские пакеты — кульман с ватманом. Профессионалы, которые быстрее освоят эти новые инструменты, которые смогут “воспитать” нейросети под собственные нужды, увеличат свою производительность и ценность на рынке. И вот тут есть целый ряд интересных моментов, которые относится к самому процессу “воспитания”.
Коммуникация это ключевой механизм как передачи информации, так и ее порождения (а также трансформации). Технологии связанные с коммуникационно-информорационными процессами всегда накладывали ограничения. Скажем, веке в XIX автор, написавший книгу или статью, вступал в диалог с читателями или коллегами по цеху в формате личной переписки, критических статей и эссе. Скорость обмена была, понятное дело, низкой. Появление интернета не только ускорило этот процесс и сделало его проще для коллективной работы. HTML, гипертекст, как одна из ключевых технологий веба, позволил связывать между собой разные тексты. Это позволило превратить наследие человеческой культуры в «глобальный метатекст», последовательность прочтения которого определяется человеком, который с ним взаимодействует.
Что привнес ChatGPT и аналогичные системы? Если опираться вышеприведенную технологию GPT+RAG, то процесс «тренировки» нейросети будет требовать от человека, понимания и знания тех первоисточников, из которых формируется контекст. Тренер должен хорошо владеть вопросом и это для него тоже является формой обучения и закрепления знаний. То есть он или она как минимум должны прочитать те книги, которые будут включены в контекст. Формирования контекста, тестирование ответов и последующее использование «готового продукта» — это та самая новая форма культурной коммуникации, которая была технологически невозможна еще лет тридцать назад. Второй важный момент — это возможность коллективной работы над контекстом и его проверкой. Как над той же вики работает коллектив волонтеров, так появятся коллективы и вокруг определенных нейросетей и «искинов». И, повторюсь еще раз, в ходе такой коммуникации в реальном времени каждый раз будут поражаться уникальные тексты с разными смыслами.
Думаю, что со временем нас будут ожидать те самые «коробочные» решения, нейросети «ручной работы», проверенные и верифицированные. Не просто инструменты, которые позволяют создать нейросеть, а уже прокачанные под определенные задачи нейросети и с поддержкой обновлений новым контекстом. Любая частная компания, которая захочет быть конкурентноспособной, должна будет «упаковать» свой опыт и иметь процедуры обновления и работы с ним. Научные институты без своих искинов будут выглядеть анахронизмами. Это все равно что сейчас иметь вебсайт на технологиях web 1.0.
Правда, остается один важный вопрос. Сможет ли массовый потребитель вести продуктивный диалог с такими системами в ходе их «тренировки» и «рабочего диалога»? Предполагаю, что массовый не сможет. Одним из разрушительных последствий использования соцсетей стало сокращение объема воспринимаемой человеком информации. Пост в 5000-10000 знаков в том же фейсбуке или 280 в твиттере, комментарии в одно-два предложения, а скорее в пару слов или эмодзи. Целое поколение выросло на таких форматах и вряд ли следующее будет лучше. Скорее всего, тренировка и эффективное использование нейросетей станет уделом небольшой прослойки профессионалов, ученых и просто образованных людей, которые еще способны воспринимать длинные тексты и поддерживать содержательный диалог.
Каков сухой остаток? Ученым, профессионалам, просто образованным людям стоит начать прокачивать собственные нейросети, связанные с основной деятельностью. Продавать свою экспертность станет проще. Писателям — скорее всего, герои ваших текстов будут искинами, которых вы будете «воспитывать» и «учить». Блогерам — обзаводиться ботами, которые за вас будут делать черновую работу по обработке потоков новостей, а вам останется понять, что действительно важно публиковать. Завсегдатаям соцсетей уже сейчас задуматься над тем с кем они так увлекательно общаются и вообще стоит ли тратить время на думскроллинг.






