У меня тут лето и analysis paralysis. Хочу и есть что написать про AI, но никак не начну — слишком много хочется раскрыть здесь и сейчас. У меня есть два черновика про AI, агентов, медиабай и креативы, но пока не хочу их постить. Напишу что-то общее. Тут и дальше я пишу про хайповый Gen AI, не про классические истории, типа svm, catboost и прочего ML. Хайп же, чего бы не написать.
Я много работают с ИИ-шкой, сравнимо с остальным рабочим общением. У меня сейчас скептическое отношение к ИИ в его текущем виде — инструмент не хуже и не лучше других, со своими особенностями, но вообще-то я AI-оптимист.
Сейчас для меня лично и для моих кейсов AI выглядит так:
- легко под присмотром, с нескольких попыток и с черри пиком получить одноразовый вау-результат
- сложно постоянно получать скучный автономный результат со стабильным качеством
Поэтому, например, все (почти) агентные решения пока — такое.
Thinking-модели
Это самое частое — закинуть (и наговорить) побольше контекста и общаться. Обязательно с рамками по целями и с `будь brutally honest`.
Почему thinking? Потому что не thinking выдумывают много.
У меня все в Obsidian, я веду все заметки так, чтобы их было легко использовать с AI. Есть еще cursor-based кейсы не про разработку, но сейчас не про это.
Дальше всякое:
- Делегирование: обсудить задачи для разработки, обсудить управленческие или маркетинговые ситуации, процессы.
- Поштормить: баинговые подходы, подходы к решению инженерных задач, креативчики, тексты, всякое такое.
- Поговорить с моими же текстами, позадавать вопросы.
- Подготовка к сложным встречам. Например, если нужно пообщаться с юристами, то сначала я разбираю ситуацию с AI, потом подтверждаю с юристами.
- Найти и сравнить, получить сводку по решениям, фреймворкам и подходам. Потом пообщаться с результатами.
- В предыдущем случае иногда использую deep research. Мне нравится решение от OpenAI. Google тоже ок, но многословен и своеволен. У меня есть несколько смешных случаев, когда google шел исследовать что-то про объект1, когда я хотел про объект2. Говорил мне: я сейчас исследую объект1 (который пользователь именует объект2).
- Технические задачи, что-то типа: не завелось в терминале, что я делаю не так, памагите.
- Поговорить с документацией: context7, привет.
AI не готовит мне конкретный результат. У меня никогда нет ситуаций, когда я копирую из чата и использую. Это больше похоже на общение с умным и немного странным профессионалом, которое мне дает пищу для размышлений. Польза вот в чем:
- Общение с AI требует хорошо структурировать мысли
- Быстрый доступ к какими-то общим знаниям и к обратной связи на их базе
Ничего лучше o3-pro и o4-mini-high я пока не вижу. Anthropic рядом по качеству, но понятнее всего мне работать с OpenAI-моделями. Я несколько раз слезал с Pro, но через 2-3 дня возвращался.
NotebookLM
Начал писать и понял — это тема для отдельного поста. Если коротко — любая статья или пачка инфы превращается в адекватный подкаст.
Код и технические задачи
Я умею писать и читать код, но делаю это небыстро. Claude Code и Cursor пишут мне одноразовые скрипты и прототипы. Иногда, если задача хорошо структурирована и код будет компактным и одноразовым — это o4-mini-high.
При этом с кодом не все хорошо. Да, вайбкод одноразовых скриптов для песочницы — хорошо работает, если руки прямы. Взрослые кейсы — смотрите сами: tldr: берем senior разрабов на большой кодовой базе (именно так) — разработка с AI занимает на 20% больше времени, хотя разработчики говорят об 20% ускорении. Много такого и не только.
Замена google
Когда мне надо что-то найти и перейти дальше по ссылке или получить короткий ответ из поиска, я иду в Perplexity вместо Google. Их Research / Lab мне не нравятся: галлюцинируют как гадины и путаются в фактах. Единственное, где они ок — потребительские задачи: наушники там сравнить и отзывы почитать.
Прочее:
- не thinking: переводы, суммаризации, парсинг данных, ad texts и т.д.
- бытовые кейсы: кляузу накатать, спросить что-то в поездке
- локальные модели, когда не хочется делиться чем-то с OpenAI