Aru Control

Это серверное решение для бизнеса, которое бесшовно интегрируется в рабочие процессы, существенно ускоряя, облегчая и оптимизируя работу технической поддержки, отделов продаж и контроля обращений одновременно через telegram, виджет на сайте и звонки.

Project Cover

Aru Control (paw version)

Это серверное решение для бизнеса, которое бесшовно интегрируется в рабочие процессы, существенно ускоряя, облегчая и оптимизируя работу технической поддержки, отделов продаж и контроля обращений одновременно через три канала коммуникации:

  1. Telegram-бот - консультирует по заданным параметрам, распознает изображения и голосовые сообщения, отвечает на вопросы о компании и ориентируется в смежных темах.
  2. Виджет на сайте - гибко настраиваемый модуль, который встраивается на любой сайт с помощью всего одной строки <script>. Он общается с пользователями в режиме реального времени, отвечает на вопросы и отлично понимает контекст вашего бизнеса.
  3. Телефонный ИИ-ассистент - модуль, интегрируемый в уже существующую телефонию или разворачиваемый как новое решение на базе Asterisk (для доступа с городских и мобильных номеров потребуется SIP-транк от оператора связи). Ассистент владеет всей информацией о компании и общается по телефону естественным голосом в реальном времени, как живой оператор.

PAW-версия

PAW-версия изначально не привязана к конкретной нише. С помощью встроенных инструментов вы можете адаптировать систему под любой вид деятельности, загрузив в неё любые знания и параметры: график работы, сценарии поведения ассистента, информацию о скидках, адресах филиалов, видах и стоимости услуг.

Для всех трех каналов используется единая база знаний. Вам не нужно настраивать каждый источник отдельно: достаточно один раз заполнить информацию, и ИИ-ассистенты будут работать по общему сценарию на всех платформах.

Установка и запуск

Для развертывания системы достаточно запустить Node.js-сервер проекта. Рекомендуется делать это на том же сервере, где расположена IP-телефония на базе Asterisk (если планируется голосовой модуль). Однако благодаря оптимизации и низкой задержке серверы могут физически находиться даже на разных континентах.

Проект подключается к сервисам Gemini с помощью всего одного API-ключа. В настройках отдельно указываются модели: одна для текстового взаимодействия, вторая - для Live-режима (распознавание речи и голосовые ответы в реальном времени).

Настройка всей системы интуитивно понятна и происходит с помощью текстового описания. Вам нужно лишь составить системный промпт, задающий характер поведения ИИ, и заполнить базу знаний в виде текстовых строк. Никакого программирования или написания скриптов не требуется.

После запуска и подключения всех трех источников ИИ-ассистент будет демонстрировать единую модель поведения и использовать общую базу знаний как в виджете, так и в Telegram-боте и по телефону.

Автоматическое определение намерений и статусов

Важной особенностью проекта является автоматическое определение намерений и статуса пользователя. Система выделяет несколько ключевых категорий:

  • Лид - новый пользователь, впервые написавший или позвонивший в компанию.
  • Фрустрация - фиксация недовольства или гнева клиента в процессе диалога (например, жалобы на отсутствие парковки, завышенные цены, долгое ожидание или плохое обслуживание). Система моментально обращает внимание на такие события.
  • Жалоба - критический статус, сигнализирующий об угрозе безопасности, репутации или блокировке бизнес-процессов (сообщения о пожаре, травмах, несанкционированном списании средств и т.д.).

Если в ходе беседы система определяет критическую важность диалога, требующую немедленного вмешательства человека, оператору отправляется мгновенное уведомление. В CRM у этого пользователя появляется соответствующая пометка, а на главном дашборде закрепляется уведомление, которое будет висеть до тех пор, пока проблема не решится.

Для более наглядного понимания функционала и демонстрации всех возможностей давайте подробно разберем интерфейс системы на примерах.

Главный экран проекта:

Главный экран системы доступен сразу после авторизации.

  • В первой строке отображаются актуальные статусы подключения к Telegram-боту, доступность виджета на сайте и статус подключения воркера к IP-телефонии.
  • Ниже представлена сводная статистика по количеству лидов, активных клиентов, зафиксированных инцидентов и процент успешно решенных вопросов.
  • Центральную часть занимает интерактивный график активности по всем трем источникам за последние 7 дней, а также диаграммы распределения обращений по статусам и каналам связи за всё время.
  • В самом низу страницы выводится оперативная статистика за текущие сутки и список нерешенных инцидентов с указанием их приоритета и статуса.

База знаний:

База знаний представляет собой простое текстовое поле для ввода информации о бизнесе. Если вам требуются базовые консультации и информирование, сюда можно внести краткие сведения. Для глубокой поддержки вы можете загрузить максимально детальное описание процессов - это не повлияет на скорость или качество ответов, так как контекстное окно моделей Gemini обладает огромным объёмом.

Важное пояснение

В проекте намеренно не используются сложные семантические модели и векторизация данных. Название RAG используется здесь для простоты понимания архитектуры и как вектор для будущего развития системы в сторону работы с Big Data.

Вся информация из базы знаний передается напрямую в контекстное окно модели. Расход токенов при этом минимален: даже если вы заполните сотню строк подробной информацией, это практически не отразится на итоговом счете за API и никак не снизит скорость генерации ответов.

Как упоминалось ранее, эта информация без изменений и дублирования используется одновременно во всех трех каналах коммуникации.

Консоль Телеграм бота:

Это основной рабочий инструмент оператора для управления диалогами в Telegram.

  • Если система фиксирует статус «Жалоба» или «Фрустрация» в переписке, у оператора на экране мгновенно всплывает уведомление.
  • При необходимости оператор может в один клик перехватить управление диалогом, переключив его из автоматического режима в ручной. Отправлять сообщения клиенту можно прямо из этого интерфейса.
  • Также здесь можно вручную изменить статус клиента или временно заблокировать пользователя в боте.
  • Доступна удобная фильтрация диалогов, поиск по ключевым словам и подробная аналитика по времени обращений.

Для самого пользователя общение в Telegram выглядит максимально естественно - бот намеренно не перегружен сложными инлайн-кнопками или громоздким оформлением, имитируя диалог с реальным менеджером. Бот отлично распознает текст, изображения и голосовые сообщения.

Консоль виджета:

Консоль виджета визуально и функционально схожа с консолью Telegram-бота: здесь представлена аналогичная статистика, списки диалогов и инструменты аналитики. Любую сессию можно мгновенно перевести в ручной режим, чтобы продолжить общение с посетителем сайта в реальном времени.

Настройка виджета:

В этом разделе осуществляется тонкая кастомизация веб-виджета.

  • Вы можете гибко настроить цветовую гамму элементов управления, форму, размер и позиционирование кнопки на экране.
  • Задаются приветственные сообщения и заголовки окна чата.
  • В верхней части экрана находится готовый код интеграции, который позволяет подключить виджет к любому сайту буквально в одну строчку.
  • По умолчанию для предпросмотра загружается тестовая страница, однако вы можете ввести URL своего сайта, чтобы оценить, как виджет впишется в ваш реальный дизайн. Для точного подбора оттенков в интерфейс встроена удобная пипетка (Color Dropper).

Настроенный виджет:

При переходе оператора в ручной режим клиент получает уведомление о том, что к чату подключился живой специалист. Для удобства чтения сообщения ИИ-ассистента подсвечиваются белым цветом, а ответы оператора-человека - контрастным черным.

Консоль телефонии:

Интерфейс контроля звонков аналогичен консоли виджета и Telegram-бота. Главное отличие состоит в том, что вместо текстовых сообщений оператор видит точную и быструю текстовую расшифровку (транскрибацию) голосового диалога в реальном времени.

Здесь действуют те же правила автоматизации: подсветка критических сообщений, мгновенное определение намерений клиента и отправка алертов оператору при обнаружении проблемных ситуаций.

Важное пояснение

Любой телефонный разговор может быть перенаправлен на живого специалиста (на стационарный телефон или софтфон). Для оптимального распределения нагрузки внутри колл-центра рекомендуется настроить систему очередей в Asterisk - в этом случае переадресованный звонок автоматически уйдет на свободного оператора или сотрудника с наименьшим количеством принятых вызовов за день.

Благодаря интеграции моделей Gemini Live ИИ-ассистент реагирует на реплики мгновенно, без раздражающих задержек. Синтезированный голос звучит естественно и практически не отличается от человеческого. Система на лету распознает множество языков и способна переключаться между ними прямо в процессе диалога.

Настройка Asterisk:

Интеграция с АТС спроектирована максимально простой.

  • Вам необходимо указать адрес сервера, учетные данные ARI (Asterisk REST Interface), имя ARI-приложения и настройки диалплана.
  • На стороне самой АТС настройка сводится к редактированию всего 4 конфигурационных файлов. Подробная пошаговая инструкция со всеми необходимыми листингами всегда доступна в правой части экрана - код можно скопировать в один клик.
  • Если ваша телефония работает под управлением FreePBX или аналогичной графической оболочки, все настройки можно выполнить с помощью мыши в веб-интерфейсе панели.

Вам остается лишь указать входящий номер, на который будет отвечать искусственный интеллект, и номер оператора (или очередь) для переадресации критических вызовов, после чего система готова к тестированию. Текущий статус работы воркера наглядно отображается в этом разделе и на главном дашборде.

Небольшая CRM система:

Все обращения из всех каналов связи автоматически консолидируются в едином реестре. Здесь отображаются текущие статусы клиентов, источники обращений, выявленные намерения ИИ и состояния открытых диалогов.

Доступна глубокая фильтрация, быстрая сортировка, ручное изменение статусов и закрытие инцидентов с возможностью добавления сервисных заметок. Отсюда же можно легко перейти к детальной истории диалога в соответствующем разделе или удалить устаревшую карточку.

Рассылка:

Полезным дополнением системы является модуль безопасных таргетированных рассылок по базе пользователей Telegram-бота.

Рассылки осуществляются в строгом соответствии с лимитами и правилами платформы Telegram. Вы можете сегментировать получателей по их текущему статусу. К примеру, критически важные сообщения (об изменении графика работы или переезде офиса) можно отправить абсолютно всем пользователям, а информацию о закрытых скидках и акциях - только лидам или клиентам со статусом «Фрустрация» в качестве лояльного жеста или извинения за возможные неудобства.

Системные настройки:

В этом разделе конфигурируются ключевые параметры работы платформы:

  • Токен Telegram-бота, глобальный API-ключ Gemini и точные названия используемых текстовых и голосовых моделей.
  • Предпочтительные голоса для телефонного ИИ-помощника.
  • Системный промпт (System Instructions), определяющий роль, тон и границы поведения ассистента.
  • Также в интерфейс выведена кнопка безопасной перезагрузки Node.js-сервера без необходимости ручного входа в консоль сервера.

Настройки пользователей системы:

Платформа поддерживает гибкое разграничение прав доступа (RBAC). Вы можете создавать неограниченное количество учетных записей для сотрудников и гибко распределять права доступа к различным модулям. Это позволяет, например, выделить отдельных операторов исключительно под текстовые чаты (Telegram/виджет), а права администрирования телефонии оставить системному инженеру.

Редактор запрещенных слов и фраз:

Если для вашего бизнеса критически важно исключить упоминание определенных тем, нецензурной лексики, упоминаний конкурентов или нежелательных фраз, вы можете жестко зафиксировать их в стоп-листе.

Что произойдет при фиксации стоп-слова?

  1. По телефону: вызов немедленно прерывается, а номер звонящего заносится в черный список.
  2. В Telegram-боте: ID пользователя мгновенно блокируется; бот перестает отвечать на его сообщения и отслеживать активность.
  3. В виджете на сайте: окно чата блокируется и становится полностью неактивным для данного посетителя.

Архитектура и развертывание

Система построена на стеке Node.js. В качестве базы данных по умолчанию используется легкая и надежная SQLite, однако архитектура позволяет беспрепятственно переключиться на масштабируемую PostgreSQL.

Использование облачных API от Gemini позволяет экономить бюджет: один ключ и единый биллинг в одном кабинете закрывают потребности как в текстовых моделях, так и в real-time голосовых технологиях. Учитывая лояльную тарификацию токенов и среднюю длительность сессий, даже при нагрузке в 1000 клиентов в месяц суммарно по всем трем каналам связи итоговые затраты на API составят всего порядка 50-60 долларов (а на практике - даже меньше).

Установка системы занимает считаные минуты: достаточно распаковать дистрибутив в любую директорию на сервере и запустить процесс одной командой (для продакшена рекомендуется настроить автозапуск службы через PM2 или systemd). Платформа кроссплатформенна и стабильно работает на Windows, macOS и Linux. Самым трудоемким этапом является сопряжение с АТС, но если у вас уже развернута телефония Asterisk и есть специалист по ее поддержке, весь процесс интеграции займет не более 3-5 минут.