Размер шрифта
Цвет фона и шрифта
Изображения
Озвучивание текста
Обычная версия сайта

Голосовое управление на складе: как мы внедряем Voice Picking и какие результаты получаем

Подробнее
17 декабря 2025
Содержание

Голосовое управление на складе: как мы внедряем Voice Picking и какие результаты получаем

Что такое голосовое управление складом (Voice Picking) и зачем оно нужно

Меня зовут Александр, я руковожу отделом внедрения в INTEKEY. Мы — системный интегратор в логистике: берем на себя автоматизацию складов целиком —  от анализа процессов и выбора технологий до внедрения, обучения персонала и дальнейшей поддержки.

Одна из технологий, с которой мы активно работаем последние годы, —  голосовое управление складом (Voice Picking / Pick-by-Voice). В этом направлении нашим технологическим партнером выступает компания «АйВойс» с платформой GOLAS.

В этой статье я расскажу, как голосовое управление работает на реальных складах, какие нюансы возникают при внедрении, в каких случаях Voice Picking дает максимальный эффект, а где ожидания стоит скорректировать.

Voice Picking (голосовой отбор, Pick-by-Voice) —  технология автоматизации складских операций, при которой сотрудники получают задания и подтверждают их выполнение голосом через гарнитуру. Это полностью безбумажный, hands-free формат, интегрированный со складской системой управления (WMS), с обменом данными в режиме реального времени.

«Надеваешь наушник —  и тебя ведут»: как выглядит голосовой отбор в работе

Как это выглядит без голоса

В классическом сценарии на складе используется один из двух подходов:

  • Терминалы сбора данных (ТСД)

Новичку выдают устройство, полчаса объясняют, где в меню искать задания, какую кнопку нажимать, как сканировать, как подтверждать. Дальше он выходит в зону отбора, толкая тележку одной рукой и держа терминал в другой. Взгляд прыгает между мелким экраном и стеллажами, часть внимания уходит на интерфейс, а не на товар.

  • Бумажные отборочные листы

Сотрудник получает стопку листов с заказами, артикулами и адресами ячеек. Почерк у кладовщика бывает разный, листы мнутся и теряются. Чтобы понять, что брать дальше, человек постоянно сверяется с бумагой и держит в голове маршрут: из одной зоны в другую, разные позиции и количества. Усталость и спешка закономерно увеличивают риск ошибок.

Как это работает с голосовым управлением складом

В голосовом сценарии интерфейс для сотрудника значительно проще:

  • Гарнитура (как правило —  компактный наушник с микрофоном);
  • Небольшой набор голосовых команд: подтверждение, повторы, сообщения о проблемах и т.п.

Система по шагам ведет оператора:

  • Указывает зону/ряд/ячейку;
  • Озвучивает товар и количество;
  • Просит подтвердить действие голосом;
  • Переводит к следующему шагу или следующему заказу.

Руки при этом остаются свободными: не нужно держать терминал, переставлять его с места на место, отвлекаться на экран. Взгляд направлен на стеллажи и пространство вокруг, а не на устройство. За счет этого:

  • Снижается утомляемость;
  • Уменьшается количество ошибок;
  • Повышается безопасность (особенно при работе на высоте или в узких проходах).

По нашему опыту внедрений, уже через несколько часов работы с Voice Picking новые сотрудники формулируют одно и то же: «Не надо запоминать, что дальше —  система сама говорит». Именно этого эффекта мы и добиваемся.

Как устроена связка WMS и GOLAS: техническая схема голосового управления

Для INTEKEY как интегратора принципиально важно, чтобы голосовое управление складом было не «надстройкой сверху», а частью единой системы учета. Схема работы в проектах с GOLAS выглядит так:

1. Формирование задания в WMS

INTEKEY WMS формирует задания (отбор, пополнение, инвентаризация, приемка и т.д.), включая:

  • номера заказов;
  • перечень позиций;
  • адреса ячеек;
  • приоритеты, партии, дополнительные параметры.

2. Передача задания в голосовую систему

Через API задание передается на платформу GOLAS. На этом шаге мы настраиваем сопоставление:

  • форматов заказов и артикулов;
  • схем адресации;
  • типов операций и статусов.

Задача —  чтобы WMS и голосовая платформа «одинаково понимали» каждое задание.

3. Построение маршрута и голосового сценария

GOLAS анализирует задания: где лежат товары, какие заказы срочные, как минимизировать лишние перемещения. На этой основе платформа строит оптимальный маршрут и превращает его в последовательность голосовых команд.

4. Работа оператора с голосом

Сотрудник выполняет указания:

  • идет к нужной зоне и ячейке;
  • отбирает товар и нужное количество;
  • подтверждает действия голосом (число, «готово», служебные фразы);
  • следует по маршруту до завершения задания.

5. Распознавание, контроль и возврат статусов в WMS

Платформа распознает ответы, проверяет корректность (адрес, количество, состояние процесса) и возвращает статусы обратно в WMS. В учетной системе в реальном времени видно:

  • какие позиции уже отобраны;
  • какие в работе;
  • где зафиксированы проблемы или отклонения.

Без такого двустороннего обмена голос внезапно превращается в «говорящий список», а реальная картина по заказам и остаткам снова живет в тетрадке или в голове менеджера смены. В наших проектах голосовое управление всегда строится как полноценный учетный контур.

Как голосовая система работает в реальных условиях склада

Работа с шумом

Склад —  это не студия звукозаписи. Здесь постоянно:

  • Гудит вентиляция;
  • Ездят погрузчики и роклы;
  • Стучат паллеты;
  • Разговаривают сотрудники.

Обычный микрофон смартфона в таких условиях записывает сплошной шум. Поэтому в голосовых проектах мы используем специализированные гарнитуры с направленными микрофонами и активным шумоподавлением:

  • Один микрофон «слышит» общий фон;
  • Второй —  голос с близкого расстояния;
  • Система вычитает одно из другого, выделяя голос оператора.

Этого недостаточно без правильного распознавания речи, поэтому в наших проектах используется голосовая платформа GOLAS, изначально обученная на реальных «производственных» записях —  с шумом склада, а не в тишине офиса.

Важный момент: GOLAS —  это не универсальный голосовой ассистент «на все случаи». Платформа настроена на ограниченный набор команд и чисел, типичных для склада:

  • Числа 1-100;
  • «Готово», «повтори», «проблема»;
  • Названия зон и адреса ячеек.

Если система не уверена в том, что услышала, она не гадает, а переспросит. На практике это чаще происходит в первые часы работы, пока люди привыкают говорить в микрофон четко. Через день-два частота переспросов обычно минимальна.

Отдельно настраиваем комфорт оператора: если сотрудник переходит в более шумную зону, достаточно сказать «громче», и голосовой движок увеличивает уровень звука.

Акценты и разные языки

Люди говорят по-разному:

  • Кто-то быстро, проглатывая окончания;
  • Кто-то с ярким региональным акцентом;
  • Кто-то только осваивает русский язык.

В последних версиях GOLAS появилась важная для нас функция —  автоматическое определение языка речи в реальном времени. Для многонациональных складов это критическое улучшение.

Технически это выглядит так:

  • Используется потоковое распознавание с применением технологий LLM;
  • По первым звукам система определяет, к какой языковой модели (из более чем 20) отнести речь;
  • Дальше включается соответствующая модель распознавания;
  • Платформа может работать в многоязычном режиме, автоматически переключаясь между, например, русским и таджикским.

Что это даёт на практике:

  • Снимается языковой барьер —  новый сотрудник может сразу работать на привычном языке;
  • Снижается нагрузка на обучение —  наставнику не нужно учить, как «правильно произнести команду»;
  • Уменьшается количество ошибок из-за недопонимания.

Даже в рамках одного языка система подстраивается под конкретный голос. В первые часы может чаще переспрашивать —  через день-два распознавание стабилизируется.

Как мы настраиваем голосовую систему под нестандартные процессы

Когда клиент говорит: «У нас не просто коробки брать», —  это обычно сигнал, что дальше будет интересная работа. Наша задача — не сломать текущую логику склада под «коробочное» голосовое решение, а встроить голос в реальные процессы.

Шаг 1. Аудит: смотрим, как всё устроено по факту

Мы выезжаем на склад на 1-2 дня —  не в кабинет руководителя, а в операционные зоны:

  • Отбор;
  • Приемка;
  • Комплектация;
  • Упаковка и экспедиция.

Изучаем:

  • Как сотрудники получают задания (бумага, ТСД, устные команды);
  • Какие шаги выполняют от старта до завершения операции;
  • На что уходит больше всего времени;
  • Что происходит, когда «что-то идет не по плану» (нет товара, брак, не читается код, нет тары).

Параллельно:

  • С сотрудниками обсуждаем, что неудобно и где чаще ошибаются;
  • С менеджментом —  какие KPI критичны и какая нужна отчетность.

Шаг 2. Проектирование голосовых сценариев

На основе аудита мы проектируем голосовые диалоги: как именно система будет «разговаривать» с оператором.

Пример —  приемка с контролем срока годности и веса:

  • Система: «Начать приемку. Накладная 456. Товар "Йогурт ванильный". Партия АВ123».
  • Сотрудник находит и сверяет паллету.
  • Система: «Проверьте срок годности на упаковке».
  • Сотрудник: «Годен до 15.10.2025» или «Проблема —  срок 01.05.2025».
  • Если срок в норме: «Взвесьте одну упаковку, назовите вес».
  • Сотрудник: «450 грамм».
  • Система, сверив с данными WMS: «Вес соответствует. Примите 20 коробок».

Продумываем «идеальный» сценарий и возможные развилки:

  • Если срок истек —  создается акт расхождения, система уточняет: «Отметить всю партию как брак?»;
  • Если вес не совпадает —  предлагает: «Перевзвесить» или «Отклонить партию».

Шаг 3. Интеграция с WMS

Далее связываем голосовые сценарии с реальными данными:

  • WMS передает в GOLAS: что принять, какую партию, по каким нормам;
  • GOLAS возвращает в WMS: фактически принятое количество, зафиксированный брак и причину, отклонения по весу/срокам.

INTEKEY WMS и голосовая платформа GOLAS работают как единое решение благодаря бесшовной интеграции между решениями. Задание из WMS сразу проговаривается в гарнитуре сотрудника. Подтверждение отбора голосом мгновенно фиксируется в WMS. Менеджер видит складские операции, местоположение сотрудников и их текущие задачи в одном интерфейсе, может отправлять точечные голосовые сообщения.

Интеграция построена так, что новые функции в GOLAS автоматически поддерживаются в INTEKEY WMS. Это сокращает время настройки при внедрении и упрощает ежедневную работу.

Шаг 4. Пилот и настройка «по месту»

Мы не запускаем голос сразу на весь склад. Сначала —  пилот:

  • Один участок или одна смена;
  • 5-10 человек;
  • 2-3 недели работы.

Цели:

  • Дать людям привыкнуть без стресса;
  • Собрать обратную связь по формулировкам, громкости, логике шагов;
  • Убедиться, что данные корректно ходят между WMS и GOLAS.

На основе пилота дорабатываем:

  • Диалоги и ветвления;
  • Темп и формат озвучки;
  • Логику отдельных шагов.

После этого масштабируем голосовое управление на весь склад и другие площадки.

Кейс: контроль сборки промо-наборов

Исходная ситуация:

  • Клиент собирал подарочные промо-наборы из 5-6 товаров;
  • Сборщик получал список на бумаге, бегал по разным зонам, подбирал позиции;
  • Контролер сверял готовый набор со списком; ошибок было много.

Решение:

  • Система: «Собрать промо-набор "Весенний". Возьмите первую позицию: "Кофе растворимый, 100 г" в зоне Б-7».
  • Сотрудник берет товар, сканирует штрихкод сканером на запястье.
  • Система: «Товар верный. Положите в коробку №1».
  • Далее —  по всем позициям набора.
  • В конце: «Набор собран. Запечатайте коробку и отнесите на конвейер».

Результат:

  • Время сборки набора сократилось примерно на 30%;
  • Количество ошибок при комплектации упало до нуля —  каждый товар проверяется по штрихкоду, система не даст положить «не то».

Контролеру остается проверить только целостность упаковки.

Как голосовое управление меняет работу менеджера склада

Голосовое управление складом меняет подход к управлению.

Онлайн‑картина склада

Менеджер получает веб-интерфейс, в котором:

  • Показана карта склада с условными значками сотрудников;
  • Видно, кто где находится и что делает;
  • Для каждого отображается, какой заказ он собирает, сколько позиций уже отобрано и сколько осталось.

Если оператор задержался в одной точке —  это видно. Руководитель может точечно вмешаться, не покидая рабочего места.

Коммуникация «точка в точку»

Вместо поисков по складу и звонков на мобильный:

  • Менеджер выбирает сотрудника в интерфейсе, нажимает «сообщение» и проговаривает текст;
  • Оператор слышит его в гарнитуре и отвечает голосом, не прекращая работу.

Для общих объявлений (про перерывы, временно закрытые зоны, изменение приоритета заказов) есть режим сообщений «всем».

Статистика и планирование смены

В интерфейсе в реальном времени видны:

  • Количество собранных и оставшихся заказов;
  • Средняя производительность по смене;
  • Производительность по каждому сотруднику.

Это помогает:

  • Распределять нагрузку;
  • Выявлять узкие места;
  • Своевременно переключать людей и задачи.

Быстрая работа с инцидентами

Если оператор говорит: «Проблема —  повреждена упаковка», система:

  • Фиксирует инцидент с привязкой к ячейке и товару;
  • Отображает уведомление менеджеру.

Дальше руководитель принимает решение: списать, заменить, отправить на проверку. Время реакции уменьшается в разы, мелкие проблемы не накапливаются.

Когда голосовое управление складом может быть неоптимальным

Голос —  не универсальное решение на все случаи. Есть сценарии, где его эффективность ограничена.

Визуально насыщенные процессы

Например:

  • Мультиячейочное хранение с выбором по срокам/партиям;
  • Приемка/отгрузка с большим количеством параметров (серийные номера, коды партий, сложная маркировка).

Там, где оператору все равно нужно внимательно читать этикетку и сверять множество параметров, терминал с экраном и сканером может быть эффективнее.

Высокоавтоматизированные склады

Если на объекте:

  • основная работа выполняется техникой и роботами;
  • сотрудники выполняют только точечный контроль и наладку;

голосовое управление для нескольких человек может не окупиться.

Устаревшие или самописные учетные системы

Проблемы:

  • отсутствие API;
  • сложная и неочевидная бизнес-логика;
  • необходимость «костыльных» интеграций через файлы и промежуточные БД.

В таких кейсах мы честно проговариваем сроки, бюджет и риски. Часто логичнее сначала модернизировать или заменить WMS, а уже затем подключать голос.

Слабая инфраструктура и маленькие склады

  • при нестабильном Wi‑Fi значительная часть бюджета уйдет в сеть;
  • при 3-5 сотрудниках и 10-15 заказах в день срок окупаемости может быть слишком долгим.

Мы всегда считаем экономику и не навязываем голос там, где он дает прирост лишь 5-7% при высокой стоимости проекта.

Что дает голосовое управление: win‑win для компании и сотрудников

По данным наших внедрений:

Компания получает:

  • рост производительности на 10-30% (при переходе с бумаги —  до 2-3 раз, с ТСД —  10-25%);
  • снижение ошибок на 60-75% —  меньше пересортицы, недовложений, меньше возвратов;
  • сокращение времени обучения новичков примерно на 50% (с недель до часов);
  • снижение текучести на 28-35% —  работа становится проще, понятнее и менее стрессовой.

Сотрудники получают:

  • рост дохода на 15-20% при сдельной оплате за счет повышения личной выработки;
  • удобный, понятный инструмент вместо бумажных листов и сложных меню ТСД;
  • прозрачную обратную связь —  возможность в любой момент узнать выработку, остаток заданий, время до конца смены.

Дополнительные возможности голосовой платформы

Современное голосовое управление складом —  это:

  • служебные команды («повтори», «адрес», «товар», «выработка», «сколько до конца», «время»);
  • автоматические уведомления (например, за 20 минут до конца смены — с текущей выработкой);
  • геймификация (сообщения о рекордах, экономии времени, выполнении плана);
  • работа с исключительными ситуациями (повреждения, пересчеты, выборочная инвентаризация);
  • интеграция с другим оборудованием (печать этикеток, управление световой индикацией и т.д.).

Отвечаем на частые вопросы о голосовом управлении складом

Мы подробно проговариваем с заказчиками темы:

  • поведение системы при грубой лексике (распознает команды, а не оценочно относится к словам);
  • работа при временном отсутствии Wi‑Fi (кэширование и синхронизация, но при этом потребность в стабильной сети);
  • влияние простуды и «сорванного голоса» (запасные режимы подтверждения);
  • использование личных смартфонов (теоретически возможно, практически — нежелательно);
  • сроки внедрения (пилот 2-3 недели, полный проект 2-4 месяца);
  • работа с сопротивлением персонала (старт с «добровольцами» и демонстрация реальной выгоды);
  • резерв гарнитур (10-15% запасного парка).

С чего начать: чек‑лист для тех, кто думает о голосе

  • Посчитайте экономику.
  • Найдите «болевые» процессы.
  • Начните с пилота на 5-10 человек.
  • Оцените Wi‑Fi и состояние WMS.
  • Подготовьте людей и честно объясните цели.

Вывод

У голосового управления складом есть мощный потенциал, но сама технология —  только часть успеха. Можно купить отличные гарнитуры и подписку на платформу, но:

  • не интегрировать их как следует с WMS;
  • не обеспечить стабильный Wi‑Fi;
  • не адаптировать процессы и не обучить людей.

В этом случае голос так и останется красивой, но неиспользуемой возможностью.

Задача INTEKEY как интегратора —  настроить голосовое управление так, чтобы оно прижилось в реальной работе и приносило измеримую пользу: и бизнесу, и сотрудникам. Если вам интересно понять, что голос может дать именно вашему складу, разумный первый шаг —  небольшой пилот с честными замерами «до/после».

Загрузка комментариев...