~/wiki / prototipy-i-handoff / testirovanie-prototipa-s-realnymi-polzovatelyami

Показал прототип реальным людям — они сломали всё за десять минут. Вот что я узнал

◷ 17 мин чтения 19.06.2026

Основной чат

Чат для вайбкодеров: новости, гайды, поиск исполнителей, маркетплейс и разбор реальных кейсов.

Показал прототип реальным людям — они сломали всё за десять минут. Вот что я узнал - обложка

Я был уверен, что прототип готов. Три недели итераций, вылизанные экраны, аккуратные микроанимации, продуманный онбординг. Принёс на коридорный тест пяти людям — и за десять минут они разнесли его в пыль. Не потому что были злыми. Потому что они не были мной.

Самое неприятное — большинство проблем я мог бы найти сам. Если бы перестал смотреть на макет глазами автора и хоть раз попробовал пройти его как человек, который видит продукт впервые, без контекста, без терпения и без желания «разобраться».

Эта статья — не про методологию юзабилити-тестов. Их и без меня описали. Это разбор того, что реально происходит, когда дизайнер впервые показывает свою работу не коллегам, а живым пользователям. Какие иллюзии разваливаются, какие паттерны повторяются у всех команд, и что с этим делать на следующей итерации — не через полгода, а на этой неделе.

Почему «показать живым людям» так больно

В голове дизайнера прототип — это законченная история. Ты помнишь, почему кнопка стоит именно тут, какой сценарий привёл к этому экрану, что будет на следующем шаге. У пользователя в голове — пустота и задача. Он не видел макетов до этого, не сидел на воркшопах, не читал бриф.

Эта асимметрия — главная причина, почему тесты ломают прототипы. Не «плохой дизайн», не «глупые пользователи». Просто два разных контекста встречаются впервые, и побеждает тот, кто платит за продукт.

Что именно ломается чаще всего

Названия разделов, которые казались очевидными — никто не понимает, что внутри
Главное действие на экране — пользователь его не видит и кликает в логотип
Онбординг — пролистывается за две секунды, всё забыто
Иконки без подписей — угадываются хуже, чем кажется команде
Состояния ошибок и пустые экраны — оказываются основным опытом, а не исключением

Когда это видишь вживую, первое желание — оправдаться. «Они же не дочитали», «они торопились», «реальный пользователь был бы внимательнее». Нет. Реальный пользователь будет ещё невнимательнее, потому что у него не будет тебя за плечом.

Подготовка: что сделать до того, как звать людей

Большинство провальных тестов проваливаются не во время сессии, а до неё. Команда зовёт людей «посмотреть прототип», не договорившись, что именно проверяет.

Сформулируй гипотезу, а не «потестим»

«Потестим онбординг» — не задача. Задача звучит так:

«Проверяем, понимает ли новый пользователь, что наш продукт делает, за первые 30 секунд»
«Проверяем, доходит ли человек до создания первого проекта без подсказок»
«Проверяем, что блок с тарифами не пугает на этапе регистрации»

Под каждую гипотезу — конкретный сценарий и конкретный признак провала. Если не можешь заранее описать, как выглядит «не получилось», ты не тестируешь, а коллекционируешь мнения.

Чеклист готовности прототипа к встрече с людьми

Есть один основной сценарий, который реально кликается от начала до конца
Реалистичные данные, а не «Lorem ipsum» и «Имя Фамилия»
Состояния ошибок и пустые экраны прокликаны, а не «потом доделаем»
Заглушки и неактивные кнопки помечены, чтобы не сбивать пользователя
Прототип открывается на том устройстве, на котором его будут смотреть
У тебя есть отдельный документ для заметок, а не Figma поверх макета

Антипаттерны на этапе подготовки

Показывать «всё, что успели нарисовать» — пользователь утонет, ты получишь шум
Тестировать с коллегами из соседней команды — они уже знают продукт лучше, чем покажут
Готовить сценарий, который ведёт пользователя за руку («теперь нажмите сюда») — это демонстрация, а не тест
Звать только лояльных клиентов — они будут вежливыми и бесполезными

Первые десять минут сессии решают всё

На реальном тесте ценная информация приходит не из ответов на вопросы, а из того, что человек делает молча в первые минуты. Куда смотрит, куда ведёт курсор, где замирает, где хмурится. Если ты в это время говоришь — ты затираешь сигнал собственным голосом.

Минимальный протокол ведения сессии

Объясни, что тестируешь продукт, а не человека — буквально этими словами
Попроси думать вслух, но не дави, если замолкает
Дай задачу формулировкой пользователя, не своей: «вам нужно записаться к врачу», а не «откройте раздел "Запись"»
Не подсказывай, даже если больно смотреть. Пауза в 15 секунд кажется вечностью, но именно там живёт инсайт
Фиксируй не выводы, а наблюдения: «3 секунды искал кнопку "Далее"», а не «навигация плохая»

Вопросы, которые стоит задавать после задачи

Что вы ожидали увидеть на этом экране?
В какой момент стало непонятно?
Если бы это был ваш реальный сценарий, вы бы продолжили или закрыли?
Чего здесь не хватает, чтобы вы доверились продукту?

Короткий итог первого блока: тест ломает прототип не потому что прототип плохой, а потому что впервые встречается с контекстом, в котором он будет жить. Чем раньше устроишь эту встречу — тем дешевле обойдутся выводы.

Разбор находок: как превратить сессию в решения

После пяти-семи сессий у тебя на руках куча заметок, скриншотов и обрывков фраз. На этом этапе большинство команд делает одну из двух ошибок: либо хватается чинить первое попавшееся, либо устраивает большое совещание «обсудить результаты» и тонет в субъективных оценках. Ни то, ни другое не работает.

Разбери наблюдения по слоям

Перед тем как что-то править, разложи всё, что собрал, по трём слоям. Один и тот же провал может жить на любом из них, и лечится он по-разному.

Интерфейс: человек не увидел кнопку, не понял лейбл, промахнулся по тач-таргету. Чинится макетом.
Сценарий: человек дошёл туда, куда мы его не ждали; нашёл короткий путь, о котором мы не думали; застрял там, где у нас «и так понятно». Чинится логикой флоу.
Модель продукта: человек не понимает, что это за штука, кому она нужна и зачем платить. Никакими кнопками не чинится — это разговор с продактом и маркетингом.

Если перепутать слои, будешь полировать иконки в продукте, у которого сломано позиционирование.

Считай частоту, а не громкость

Один пользователь, который десять минут эмоционально ругался на цвет, — это один голос. Пять пользователей, молча промахнувшихся мимо одной и той же кнопки, — это паттерн. На ревью находок проще всего ориентироваться так.

Сколько людей споткнулось	Что с этим делать
1 из 5–7	Записать, не трогать
2–3 из 5–7	Проверить гипотезой, починить в ближайшем спринте
4+ из 5–7	Чинить сейчас, остальное подождёт

Это грубо, но дисциплинирует. Без такой шкалы команда всегда чинит то, что громче кричал последний участник.

Типичные ошибки диагностики

Подменять причину симптомом

Пользователь сказал: «Мне нужна кнопка "Назад" вот здесь». Слабая команда рисует кнопку. Сильная — спрашивает себя, почему он вообще захотел назад. Часто оказывается, что предыдущий экран не дал ему уверенности, и он пошёл проверять. Кнопка тут — пластырь, а лечить надо тот экран.

Чинить по одному человеку

Самая дорогая ошибка — переделать ключевой флоу под мнение одного яркого респондента. Особенно если он был экспертом, особенно если он был громким, особенно если он совпал во вкусе с кем-то из команды. Правило простое: если паттерн виден у одного — это гипотеза, не решение.

Лечить там, где удобно, а не там, где болит

Часто настоящая проблема — в архитектуре или в продуктовом обещании, но трогать это страшно и долго. Команда соглашается: «давайте пока перепишем подсказку». Через месяц приходят те же грабли, только в новой обёртке. Если на ревью все облегчённо выдыхают после предложенного решения — это повод насторожиться, а не радоваться.

Как переносить выводы в макет

Начни с экранов, где люди молчали

Самые опасные места теста — не там, где пользователь ругался, а там, где он замолчал и начал двигать курсором кругами. Молчание означает, что человек строит свою модель происходящего вместо того, чтобы действовать. В макете эти места требуют не украшения, а ответа на вопрос «что здесь сейчас и что я могу сделать дальше».

Чеклист правок после теста

Главное действие на экране визуально доминирует, и это проверено не только на десктопе
Названия разделов переписаны словами пользователей из стенограмм, а не словами команды
Пустые состояния отвечают на вопрос «что мне делать прямо сейчас», а не «здесь пока ничего нет»
Ошибки объясняют, что произошло и как выйти, без «Error 4002»
Иконки, которые угадывались хуже половины раз, получили подписи
У каждой правки в файле есть ссылка на конкретное наблюдение, а не «после теста решили»

Последний пункт важнее, чем кажется. Через две недели никто не вспомнит, почему кнопка переехала. Если рядом с правкой нет «двое из пяти искали её внизу», на следующем ревью её передвинут обратно.

Вопросы для дизайн-ревью перед следующим тестом

Какую гипотезу мы проверяем именно этой версией макета?
Что мы готовы услышать и какой ответ нас расстроит?
Где в макете остались места, которые мы «и так понимаем» — и не проверили?
Какие правки мы внесли по одному голосу и зачем?
Что мы сознательно не чиним до следующей итерации, и почему это безопасно?

Короткий итог: тест даёт сырьё, а не решения. Ценность появляется на разборе — когда ты отделяешь интерфейс от сценария, частоту от громкости и причину от симптома. Без этого шага даже самый честный тест превращается в коллекцию занятных историй за обедом.

Когда подключать AI и где он ломается

Соблазн понятный: тест на пять человек дал тебе сто пятьдесят минут записи, расшифровку, заметки в FigJam и кучу скриншотов. Хочется загрузить всё в модель и получить «топ-5 проблем». Иногда это работает, но проваливается чаще, чем кажется.

Что AI делает хорошо в разборе теста

Сводит расшифровки в тематические кластеры, когда ты сам уже потерял картину
Подсвечивает места, где пользователь меняет формулировки задачи (часто это и есть смена ментальной модели)
Переписывает интерфейсные тексты словами из стенограмм, если ты дашь ему сырые цитаты
Готовит черновик отчёта для команды по твоей структуре находок

Что AI делает плохо

Считает за «инсайт» любую длинную цитату, особенно эмоциональную
Уверенно придумывает паттерн там, где было одно наблюдение
Сглаживает противоречия между пользователями, хотя именно противоречия и интересны
Теряет контекст сценария: видит фразу «не понял», но не видит, что человек уже три минуты тыкал в неактивный элемент

Рабочее правило: AI помогает на этапе сортировки и оформления, но не на этапе решения «что чинить». Кластеризацию делегируй, приоритизацию — нет.

Безопасный процесс с моделью

Загружай расшифровки без имён, почт и любых данных, которые ты не готов увидеть в чужом логе
Проси модель ссылаться на конкретные реплики, а не «обобщать впечатление»
Если модель пишет «пользователи считают, что...» — это сигнал перечитать исходник, такой формулировки в тесте обычно не было
Финальный список проблем переписываешь руками: то, что не прошло через твою голову, не пройдёт и через продуктовую дискуссию

Как объяснять решения команде

Самая частая поломка после теста — не в макете, а в разговоре. Дизайнер приходит с десятью находками, разработчик слышит «всё переделываем», продакт слышит «сроки сдвигаются», и дальше начинается торг вместо работы.

Структура разбора, которая не превращается в спор

Сценарий: какую задачу человек пытался решить
Что увидели: короткое наблюдение, без интерпретации
Сколько раз повторилось: цифра, пусть и маленькая
Гипотеза причины: почему это случилось
Что предлагаем: одно изменение, не три
Что осознанно не трогаем: и почему это безопасно отложить

Последний пункт обычно забывают, а он снимает половину тревоги у продакта. Когда команда видит, что ты сам разделил «чиним сейчас» и «ждёт следующего цикла», доверие к остальным пунктам растёт.

Антипаттерны на разборе

Показывать видео целиком. Никто не пересматривает запись — выбирай тридцатисекундные фрагменты под конкретное наблюдение.
Начинать с решения. «Я предлагаю переделать шапку» без сценария читается как вкусовщина, даже если за этим пять провалов подряд.
Спорить о вкусах в реальном времени. Если на ревью всплывает «мне не нравится цвет», уводи в отдельную ветку, не смешивай с находками теста.
Голосовать за правки. Тест — не демократия. Решения принимает тот, кто отвечает за результат флоу, опираясь на частоту и сценарий.

Как проверить, что ты сделал тест хорошо

Чеклист качества разбора

Для каждой правки в макете есть ссылка на конкретное наблюдение, а не общая отсылка к тесту
Различены инсайты по интерфейсу и по продукту, и они едут в разные очереди
Есть хотя бы одна находка, которая противоречит твоей исходной гипотезе — если нет, ты, скорее всего, слышал только удобное
Список «не чиним сейчас» не пустой и обоснован
Команда после ревью знает, что попадает в ближайший спринт, а что — нет
Через две недели ты сможешь восстановить логику решения, не пересматривая записи

Вопросы себе перед следующим раундом

Где в этом тесте я услышал то, что хотел услышать?
Какие места макета я не дал пользователям поломать, и почему?
Какие правки я сделал по одному голосу, и готов ли я это защитить цифрами через месяц?
Что я отдал AI, а что оставил себе — и совпадает ли это с зоной риска?

Короткий итог сегмента: продвинутый тест — это не больше респондентов и не более умный инструмент. Это дисциплина на разборе: отделять наблюдение от вывода, вывод от решения, решение от его упаковки для команды. AI и аналитика ускоряют первые шаги, но за последний по-прежнему отвечает живой человек с именем в Jira.

Чеклист на каждый раунд тестов

Этот список проходишь руками перед тем, как сесть за разбор. Не для красоты — для того, чтобы потом не оправдываться перед собой и командой.

До теста

Сценарии записаны как задачи пользователя, а не как «покажите экран Х»
В прототипе живые только те узлы, которые ты реально готов услышать ломающимися
Заранее зафиксирована гипотеза, которую тест может опровергнуть — письменно, до первого респондента
Договорённость с собой: что считается «провалом» сценария, а не «ну он просто не разобрался»
Запись и расшифровка организованы так, что через месяц ты найдёшь нужный фрагмент за минуту

Во время теста

Молчишь дольше, чем хочется — пауза часто вытаскивает настоящую реакцию
Не подсказываешь словами из интерфейса («а вы видели кнопку Продолжить?»)
Не объясняешь, «как задумано» — пока человек не закончил сценарий
Записываешь не только слова, но и где руки/курсор зависли

После теста

Каждая находка привязана к конкретной реплике или моменту записи
Разделены проблемы интерфейса и проблемы продукта — это разные очереди
Есть список «не чиним сейчас» с обоснованием
Решения сформулированы как одно изменение на одну находку, а не пакетом

Анти-паттерны, которые ломают тест задним числом

Тест может пройти хорошо, а ценность — утечь на этапе интерпретации. Ниже — то, что встречается чаще всего.

«Мы тестировали — значит, обосновано»

Тест становится индульгенцией. Любое спорное решение защищается фразой «так показал юзер-тест», хотя в тесте было два человека и один из них спешил. Если ссылаешься на тест — называй число повторений и сценарий. Если повторение одно — это сигнал к следующему раунду, а не аргумент.

Перепаковка вкусов в находки

Самая тихая поломка. Дизайнеру не нравился блок — и в разборе появляется наблюдение, под которое подобраны две подходящие реплики. Защита простая: на ревью отдельно показываешь свою исходную гипотезу и отдельно — что её опровергает. Если опровержений ноль, скорее всего, ты слышал только удобное.

Один респондент — большое решение

Яркая фраза одного человека уносит команду в большой редизайн. Иногда это правда инсайт, но чаще — эмоция. Правило: на один голос — максимум маленькое изменение или гипотеза для следующего раунда. Структурные правки требуют повторяемости.

Чинить всё подряд

После теста есть искушение взять список из пятнадцати пунктов и проехать по всем. Через спринт макет становится мозаикой компромиссов, а флоу — нет. Лучше две правки, которые ты можешь объяснить, чем пятнадцать, которые ты не сможешь защитить.

«AI уже всё разобрал»

Кластеры от модели выглядят аккуратно, и хочется принять их как итог. Но аккуратность — не точность. Модель сгладит противоречия и придумает паттерн там, где было одно наблюдение. Сортировка — её, приоритизация — твоя.

Вопросы для ревью находок

Эти вопросы задавай не респонденту, а себе и команде, когда разбираете результаты. Они режут половину пустых дискуссий.

На каком сценарии это случилось и сколько раз повторилось?
Это проблема интерфейса или проблема продукта — и в какую очередь едет?
Что мы осознанно не чиним по этой находке и почему это безопасно?
Какое одно изменение мы делаем — и как поймём через две недели, что оно сработало?
Есть ли в списке находка, которая ломает нашу исходную гипотезу? Если нет — тест провёл сам себя.
Какие правки идут по одному голосу и готовы ли мы их защитить через месяц?

Короткий практический итог

Реальные люди ломают прототип не потому, что он плохой, а потому что у них нет твоего контекста. Это и есть ценность теста — не подтверждение, а потеря контекста, которую можно увидеть со стороны.

Хороший раунд складывается из трёх простых дисциплин: давать ломать то, что ты действительно готов поменять; отделять наблюдение от вывода и вывод от решения; упаковывать находки так, чтобы команда видела не список проблем, а понятный план — что чиним, что откладываем, как проверим.

Всё остальное — инструменты, модели, шаблоны разборов — помогает только тогда, когда эти три вещи уже на месте. Если их нет, ни один умный сервис не спасёт от теста, который красиво подтвердил то, что ты и так хотел услышать.

$ cd ../ ← назад к Прототипы и handoff

$ nav --prev

$ nav --next

Показал прототип реальным людям — они сломали всё за десять минут. Вот что я узнал

## Почему «показать живым людям» так больно

### Что именно ломается чаще всего

## Подготовка: что сделать до того, как звать людей

### Сформулируй гипотезу, а не «потестим»

### Чеклист готовности прототипа к встрече с людьми

### Антипаттерны на этапе подготовки

## Первые десять минут сессии решают всё

### Минимальный протокол ведения сессии

### Вопросы, которые стоит задавать после задачи

## Разбор находок: как превратить сессию в решения

### Разбери наблюдения по слоям

### Считай частоту, а не громкость

## Типичные ошибки диагностики

### Подменять причину симптомом

### Чинить по одному человеку

### Лечить там, где удобно, а не там, где болит

## Как переносить выводы в макет

### Начни с экранов, где люди молчали

### Чеклист правок после теста

### Вопросы для дизайн-ревью перед следующим тестом

## Когда подключать AI и где он ломается

### Что AI делает хорошо в разборе теста

### Что AI делает плохо

### Безопасный процесс с моделью

## Как объяснять решения команде

### Структура разбора, которая не превращается в спор

### Антипаттерны на разборе

## Как проверить, что ты сделал тест хорошо

### Чеклист качества разбора

### Вопросы себе перед следующим раундом

## Чеклист на каждый раунд тестов

### До теста

### Во время теста

### После теста

## Анти-паттерны, которые ломают тест задним числом

### «Мы тестировали — значит, обосновано»

### Перепаковка вкусов в находки

### Один респондент — большое решение

### Чинить всё подряд

### «AI уже всё разобрал»

## Вопросы для ревью находок

## Короткий практический итог

Как передать анимации разработчику так, чтобы он их не упростил до статики

Интерактивный прототип в Figma: как убедить заказчика с первого показа

Почему «показать живым людям» так больно

Что именно ломается чаще всего

Подготовка: что сделать до того, как звать людей

Сформулируй гипотезу, а не «потестим»

Чеклист готовности прототипа к встрече с людьми

Антипаттерны на этапе подготовки

Первые десять минут сессии решают всё

Минимальный протокол ведения сессии

Вопросы, которые стоит задавать после задачи

Разбор находок: как превратить сессию в решения

Разбери наблюдения по слоям

Считай частоту, а не громкость

Типичные ошибки диагностики

Подменять причину симптомом

Чинить по одному человеку

Лечить там, где удобно, а не там, где болит

Как переносить выводы в макет

Начни с экранов, где люди молчали

Чеклист правок после теста

Вопросы для дизайн-ревью перед следующим тестом

Когда подключать AI и где он ломается

Что AI делает хорошо в разборе теста

Что AI делает плохо

Безопасный процесс с моделью

Как объяснять решения команде

Структура разбора, которая не превращается в спор

Антипаттерны на разборе

Как проверить, что ты сделал тест хорошо

Чеклист качества разбора

Вопросы себе перед следующим раундом

Чеклист на каждый раунд тестов

До теста

Во время теста

После теста

Анти-паттерны, которые ломают тест задним числом

«Мы тестировали — значит, обосновано»

Перепаковка вкусов в находки

Один респондент — большое решение

Чинить всё подряд

«AI уже всё разобрал»

Вопросы для ревью находок

Короткий практический итог