Подписаться
Опубликовано

Странное тестовое, которое проверяет LLM

Автор
  • Имя
    Product games с Кристиной Гусевой
    Telegram

Странное тестовое, которое проверяет LLM

На днях узнала, что одна из российских компаний даёт тестовое продактам: провести дискавери и создать прототип — и всё это с LLM за 2–4 часа.

В ответе нужно описать шаги с промптами, а также саммари с результатами.

При этом проверяют задание они тоже с помощью LLM — говорят, по своим критериям.

Скажу сразу: в текущей формулировке задание считаю плохим. Оно помогает отсечь только тех, кто либо забил на него, либо кто не слышал о LLM.

Почему так:

1. Что мы проверяем? Если хотим посмотреть, какие AI-инструменты знает кандидат, то нужно просить делать упор на разнообразие инструментов и аргументацию их выбора. Если продуктовые скиллы, то нужно делать упор на то, как человек умеет валидировать результаты LLM. А это уже выходит за скоуп «сделай всё с LLM».

2. Из первого пункта вытекает, что в тестовом критически важны критерии оценки. В зависимости от них будет по-разному строиться презентация результатов. Без них кандидаты играют в угадайку — верно ли они определили критерии оценки. В итоге в преселекте останутся кандидаты, которые: а) угадали, что вы хотите от них увидеть б) прогнали саммари через LLM и поправили те части, которые LLM «не понравились»

3. Но если у нас есть критерии, то возникает другая проблема: Кандидаты просто включат эти критерии в промпт, и отредактируют саммари так, чтобы оно проходило проверку. Опять получается ерунда.

Как можно было бы сделать - идем от цели: 1. Если хотим получить демо инструментов, которые знает кандидат — просим аргументировать выбор инструментов. Держим в голове, что это тоже можно нагуглить за выходные. Возможно, личное общение тут помогло бы.

2. Если хотим понять продуктовое мышление — даём продуктовую задачу и не ограничиваем, что всё должно быть сделано с LLM. Просим кандидата презентовать итог. Пусть сам решает, когда уместно использовать LLM и до какой степени. Главное, чтобы он дошёл до цели, и его размышления были логичны.

3. А вообще, лучше любых тестовых говорят прошлые проекты. Если кандидат может в режиме онлайн показать и рассказать, как и в каких случаях он работал с LLM, что билдил с их помощью — это будет лучше тысячи тестовых.

#PG_размышления

Product games с Кристиной Гусевой
10409 подписчиков
952 поста
Продакт-менеджер в New Yorker в Германии, ex-менеджер продукта в ВТБ ❤️ Рассказываю о карьере, делюсь, как строить продукты, которые пользователи полюбят Сотрудничество - @KriGuseva https://www.gosuslugi.ru/snet/6739ccfc340096358ba95950

Закрепленные

Из подборки #PG_размышления

Опубликовано

Отчет: 2 месяца без найма

Отчет о двух месяцах без найма: как отсутствие сотрудников влияет на запуск продукта, важность идеи и управленческие мысли продакт‑менеджера.
Опубликовано

Не только соискателям сложно в эпоху AI, но и рекрутерам.

В эпоху AI рекрутеры часто получают заявки от фейковых кандидатов: профили создают другие люди, а работу выполняет третья сторона.
Опубликовано

Полтора месяца вне найма

Полтора месяца без найма позволяют сосредоточиться на продуктах, повысить фокус и автономность, но вызывают психологические качели.
Опубликовано

Рефлексия недели: автоматизировать неэффективность = масштабировать убытки

Автоматизация неэффективных процессов приводит к росту убытков; перед внедрением AI важно проанализировать и протестировать текущие бизнес‑процессы.
Опубликовано

Как я стала тиктокером с 500k просмотров

Как я набрала 500 000 просмотров в TikTok: проверенные приёмы AI‑аккаунта, зацикливание и роль виральных роликов в продвижении рекламного контента.

Свежие посты