Когда ChatGPT вреден: как универсальный ИИ может погубить ваш проект

28.01.2026

Фото носит иллюстративный характер. Из открытых источников.

Компании продолжают вкладываться в GPT-подобные модели, но именно универсальность все чаще становится причиной провалов. Эксперт Иван Будник объясняет, почему выбор «самой мощной нейросети» ведет к лишним расходам и неэффективным ИИ-проектам

В 2025 году вышло исследование S&P Global Market Intelligence: 42% компаний свернули почти все свои ИИ-инициативы, хотя год назад таких было только 17%. Дело не в качестве технологий — они работают нормально. Проблема в том, что компании пытаются решать любые задачи одним и тем же инструментом.

Мы видели много проектов, где команды запускали GPT-4 там, где могла бы справиться простая модель, например регрессия. Из-за этого система начинала тормозить, деньги быстро уходили, а пользователи оставались недовольны. Но на совещаниях в компаниях вновь и вновь повторяли: «Но GPT ведь самая мощная модель!»

Однако в таких случаях мощность роли не играет — важно подобрать инструмент, который действительно подходит под конкретную задачу. Разбираем, почему GPT не панацея и что делать, когда универсальность становится проблемой.

00:00 Реклама 00:00 00:00 / 02:03 Пропустить рекламу можно через Подробнее Почему нет одной нейросети на все случаи

Если нужно забить гвоздь, мы берем молоток. Можно попробовать сделать это микроскопом — он тяжелый, ударить им можно. Но это все равно неправильный инструмент.

С нейросетями происходит то же самое. Существуют разные типы моделей, и каждая разрабатывалась под свой формат данных. Одни лучше работают с информацией, которая приходит по порядку, например с временными рядами. Другие эффективнее анализируют текст и большие массивы данных. Есть модели, которые специально создавали для генерации изображений.

Каждый тип модели рассчитан на свое применение, и это подтверждается математикой. Теорема No Free Lunch говорит: не существует универсального алгоритма, который справляется со всеми задачами лучше остальных. Для разных задач нужны разные подходы — и это строго доказанный факт.

Поэтому даже если модель обучена на одном типе данных, она не будет автоматически хорошо работать на другом. Например, если взять сеть, обученную на фотографиях кошек, и просто «добавить» ей медицинские снимки, результат будет слабым без тонкой настройки под особенности медицины.

На что смотреть при выборе нейросети

Обычно начинают с трех вопросов: какие данные есть, что нужно получить и сколько этих данных доступно. Тип данных — это основа выбора инструмента.

Если вы работаете с текстом, используйте так называемые модели-трансформеры. Это тип нейросетей, которые сегодня лежат в основе всех топовых моделей работы с текстом (и не только): GPT-4/5, Claude 3, BERT, LLaMA, Mistral и многих других. В 2025 году почти во всех задачах по работе с текстами лидируют BERT, GPT-4/4.1, Claude 3.5 и их разные модификации.
Для изображений применяйте другие решения. Для генерации картинок подходят сервисы вроде Midjourney, Nano Banana и Seedream. Для аналитики изображений в облачных сервисах используют Vision Transformers, а для мобильных приложений — компактные модели вроде MobileNet.
С таблицами и числовыми данными лучше всего работают алгоритмы градиентного бустинга — в первую очередь XGBoost и CatBoost.

Объем данных тоже имеет значение. Если в распоряжении меньше 10 тыс. примеров, обучение крупных моделей вроде трансформеров с нуля неэффективно. В таком случае используют transfer learning — берут заранее обученную модель (например, BERT, Vision Transformer или MobileNet) и дообучают ее под конкретную задачу — либо выбирают более простые алгоритмы.

Почему нельзя использовать ChatGPT и аналоги под все задачи

LLM (Large Language Model) — это большая языковая модель вроде GPT-4, GPT-4.1, Claude 3.5 или Llama 3. Она обучена на огромных массивах текста и умеет писать, резюмировать, отвечать на вопросы и переводить. Но она не всегда лучший инструмент.

Главная ошибка — использовать большие языковые модели везде, где только можно. В Explosion.ai это назвали «LLM-максимализм»: компании интегрируют LLM в любые процессы. Нужно отфильтровать спам? Берут GPT-4. Сделать краткий пересказ? Снова GPT-4 или Claude 3. Вытащить даты из текста? Опять LLM.

Проблемы появляются сразу. Такие модели работают медленнее обычных алгоритмов, и пользователи не готовы ждать по десять секунд там, где раньше ответ занимал одну. Растут и затраты: каждая единица текста, которую обрабатывает модель (токен), стоит денег, а LLM тратит их тысячами.

Реальный пример: систему мониторинга репутации в компании (автоматически отслеживает, анализирует и оценивает, что говорят о бренде, компании или человеке в интернете) сначала построили полностью на LLM. Модель фильтровала тексты, делала краткие пересказы и вытаскивала нужные данные. Но через месяц стало ясно: это слишком медленно для работы в реальном времени, слишком дорого при увеличении объема данных и невозможно сопоставить пересказы с исходными текстами.

Решение оказалось простым. Архитектуру разделили на части: сначала работает обычный классификатор, который отсеивает шум и разбивает текст на предложения, а LLM используется только для пересказов. В результате система стала быстрее и значительно дешевле.

Когда скорость важнее мощности: какие модели ИИ использовать и зачем

Трансформеры сегодня — главный инструмент для работы с текстами. Они могут анализировать очень большие объемы информации и даже обрабатывать сразу текст, картинки и звук.

Но у них есть минус: чем длиннее текст, тем медленнее они работают. На огромных объемах данных трансформеры становятся слишком «тяжелыми», поэтому для таких задач нужны более быстрые модели.

При этом старые архитектуры — RNN и LSTM — по-прежнему полезны. Они работают быстрее, требуют меньше ресурсов и подходят для устройств, которые обрабатывают данные локально, а не в облаке. В задачах реального времени они показывают отличные результаты — например, могут точно распознавать действия человека по данным датчиков.

Диффузионные модели сильно продвинули создание изображений и медиа с помощью ИИ. Инструменты вроде Stable Diffusion, DALL-E и Midjourney создают качественные и разнообразные изображения, а также умеют работать со звуком, видео и кодом.

Однако эти модели медленные: для генерации им нужно много вычислений, поэтому они не подходят для приложений, где результат требуется мгновенно.

От данных зависит результат: как модели терпят ошибки и шум

Крупные нейросети очень чувствительны к качеству данных. Если в данных есть ошибки, неверные метки или перекос в пользу одного класса, модель будет постоянно ошибаться. Без предварительной подготовки данных — когда их очищают, выравнивают и приводят к единому формату — результаты таких моделей становятся непредсказуемыми.

Когда мы говорим «нейросети», многие представляют себе что-то огромное и сложное. Но есть и более простые, стабильные и предсказуемые алгоритмы, которые часто дают отличный результат там, где данные «мусорные» или неполные. К таким относятся Random Forest и XGBoost.

Random Forest — это алгоритм, который принимает решение не одним способом, а с помощью множества маленьких моделей, каждая из которых смотрит на данные под своим углом. Затем все эти модели голосуют, и выбирается самый надежный результат. Сильная сторона: устойчив к ошибкам в данных, работает стабильно даже при шуме, пропусках и перекосах.
XGBoost — это алгоритм, который строит прогноз постепенно, шаг за шагом, каждый раз исправляя свои предыдущие ошибки. Он сочетает множество простых решений, которые последовательно друг друга дополняют, что делает его одним из самых точных методов анализа данных. Сильная сторона: очень хорошо работает на реальных, «неидеальных» данных и дает высокую точность.

Хороший пример провала — модели, которые пытались использовать для обнаружения COVID-19 по снимкам. Большинство таких исследований не заработали в реальности. Основные причины были простыми:

Смешанные неподходящие данные. Информация бралась из разных источников, иногда с пересечениями — это ломало обучение.
Смещение из-за оборудования. Модели распознавали не болезнь, а особенности аппаратов, на которых делали снимки.
Смещение условий съемки. Например, на «здоровых» фото всегда была солнечная погода, и модель училась отличать солнце, а не признаки заболевания.

Как не работать вслепую

Сначала разберитесь в задаче, а не в моделях. Когда вы понимаете, что именно нужно решить, становится ясно, какой тип модели подойдет лучше всего.

Не ограничивайтесь одним методом — протестируйте несколько моделей и сравните, какая дает лучший результат. В этом помогают специальные AutoML-инструменты — это сервисы, которые автоматически подбирают оптимальный алгоритм, настраивают его параметры и проверяют качество работы.

AutoML (автоматизированное машинное обучение) — это инструмент, который сам выбирает лучшую модель, сам ее настраивает и сам проверяет результат.

То есть вместо того, чтобы вручную:

подбирать алгоритм;
настраивать параметры;
пробовать разные подходы;
сравнивать между собой результаты.

Также есть инструменты вроде AutoGluon, FLAML или H2O, они позволяют быстро перебрать десятки вариантов моделей и выбрать ту, которая показывает наилучший результат на ваших данных, без ручной настройки и длительных экспериментов.

Смотрите не только на точность. Важно понимать:

насколько модель стабильна;
можно ли объяснить ее решения;
сколько стоят ее вычисления.

Иногда модель с меньшей точностью, но более быстрым откликом — лучший выбор для реальной работы.

И обязательно фиксируйте все эксперименты: какие параметры пробовали, какие результаты получили. Это позволит воспроизвести успешные решения в будущем и поможет коллегам продолжить работу без догадок.

Инструменты, которые помогут выбрать подходящую модель

AutoGluon (AWS) — один из самых сильных AutoML-инструментов. Он умеет работать с таблицами, текстом и изображениями, автоматически собирая несколько моделей в один сильный ансамбль. На соревнованиях по машинному обучению Kaggle он показывает результат лучше 99% участников всего за несколько часов — и без сложной подготовки данных.
H2O AutoML делает упор на прозрачность. Он показывает, какие факторы влияют на решение модели, и формирует понятные отчеты. Это особенно важно для отраслей, где нужно объяснять каждое решение, — например, в банках или медицине.
FLAML (Microsoft Research) оптимизирует работу под бюджет. Он подбирает модели так, чтобы тратить минимум вычислительных ресурсов. Хорошо работает с популярными инструментами вроде scikit-learn, XGBoost, LightGBM и трансформеров.
Hugging Face к 2025 году стал главным центром готовых моделей. Модель SmolVLM с 256 млн параметров требует меньше 1 Гб видеопамяти, но по качеству обходит модели, которые в сотни раз больше. Ее можно запускать даже на iPhone. Появилась библиотека LeRobot для задач робототехники. Более 10 тыс. моделей уже интегрированы с Azure AI Foundry, что облегчает разработку.
PyTorch Lightning сильно упростил обучение моделей на больших вычислительных мощностях. Он позволяет отлаживать работу модели в реальном времени без перезапуска, легко масштабироваться от одной видеокарты до сотен, ставить эксперименты на паузу и продолжать позже.

Тэги:

деньги, болезнь, ту, covid-19, 2025, причины

Вместе с этим читают:

Врачи сообщили, какие ошибки лечения «подсветил» новый стандарт по гриппу
Рекомендации не использовать антибиотики в лечении гриппа существуют уже давно. Новый стандарт «подсветил» эти ошибки еще раз, рассказали опрошенные РБК врачи Новый стандарт лечения гриппа «подсветил» основные ошибки, которые допускались при лечении и самолечении гриппа. Об этом РБК рассказали опрошенные врачи. Исключение антибиотиков и диуретиков из перечня немедикаментозной помощи обоснованно, я...
Сегодня
Лера Антибиотик
26
Подробнее...
ЕС подтвердил обсуждение запрета на въезд участникам военной операции
Хиппер подтвердила, что этот вопрос накануне обсуждался на встрече ЕС. По ее словам, он получил поддержку нескольких государств. По данным Politico, инициатива исходила от Эстонии Европейский союз изучает возможность введения полного запрета на поездки в страны сообщества всем российским военным, которые участвовали в военной операции на Украине. Об этом сообщила представитель внешнеполитической службы ЕС Анита Хиппер. Она подтвердила, что этот вопрос накануне обсуждали на заседании Совета ...
31.01.2026
Шувалов Эдуард
48
Подробнее...
В Татарстане количество работающих кооперативов выросло в полтора раза
В кооперацию вовлечено более 22 тыс. фермерских и личных подсобных хозяйств. О развитии сельскохозяйственных потребительских кооперативов в Татарстане доложил заместитель Премьер-министра Республики Татарстан - министр сельского хозяйства и продовольствия Марат Зяббаров на республиканском совещании в Доме Правительства РТ. Провел совещание Раис Татарстана Рустам Минниханов. В режиме видеоконференцсвязи к совещанию были подключены все муниципальные районы. C 2......
31.01.2026
Виктор Антибиотик
45
Подробнее...
В 2025 году Курская область нарастила объемы экспорта продукции АПК
По объемам экспорта Курская область занимает 10 место в России. По предварительным данным ФРС России за 2025 год экспорт продукции АПК региона составит 874 млн долларов, выполнение целевого показателя составило 105%. Продукция АПК региона экспортируется более чем в 50 стран мира. Наибольший объем экспорта продукции осуществляется в Республику Беларусь, Алжир, Индию, Вьетнам, Китай, Узбекистан и др. «Итоги 2......
31.01.2026
Антибиотик
42
Подробнее...
Карантин по лейкозу КРС в Прилузском районе Коми отменён
Карантин, введённый в Прилузском районе Коми из-за вспышки лейкоза крупного рогатого скота, был отменён. Об этом сообщили в региональной ветслужбе, сделав соответствующее объявление на официальном портале республики. Меры по ликвидации эпизоотии и профилактике её распространения были успешно...
30.01.2026
Брилиан Виталий
43
Подробнее...
«Омский бекон» увеличил производство свиных полуфабрикатов на 17% в 2025 году
В 2025 году мясокомбинат «Омский бекон» увеличил объемы производства полуфабрикатов из свинины на 17%. Это стало возможным благодаря масштабному проекту модернизации цеха охлажденных полуфабрикатов, реализованному за последние два года. В ходе программы перевооружения были внедрены...
30.01.2026
Кореник Алексей
48
Подробнее...
Птицефабрика «Агрокомплекс» увеличила производство товарного яйца на 9% в 2025 году
В 2025 году птицефабрики «Агрокомплекса» имени Н.И. Ткачева произвели 191,7 миллиона штук товарного яйца, что на 15,3 миллиона больше, чем в 2024 году. Заместитель генерального директора по птицеводству Андрей Пусько отметил, что рост производства связан с внедрением новых...
30.01.2026
Виктор Антибиотик
43
Подробнее...
Аргентина: Рекордные валютные поступления от экспорта в 2025 году
В прошлом году экспорт говядины принес рекордную сумму иностранной валюты. По данным INDEC, из 713 364 тонн экспортированного товара (по весу продукции) этот сектор принес 3,884 миллиарда долларов США в иностранной валюте. По сравнению с предыдущим годом эти показатели свидетельствуют о снижении...
30.01.2026
Брилиан Виталий
49
Подробнее...
Компания, создавшая гамбургеры Paty, обанкротилась: долг в 23 миллиарда долларов и 1000 недействительных чеков
Мясоперерабатывающий завод в Пико приостановил работу на неопределенный срок, и в провинции Ла-Пампа может быть потеряно 450 рабочих мест. Подробности о крупном долге. Операционный спад на мясоперерабатывающем заводе Pico, принадлежащем Эрнесто «Тито» Ловенштейну,...
30.01.2026
Стром Игорь
46
Подробнее...