Голосовой ИИ агент по продажам

Илья Низамов
18 ноября 2025 г. в 13:20
1
👍
🔥 2
😁
😱
👏
💯
😭
👎
🤔
🤣
👌
🤯
И
Илья Низамов
Автор темы
18 ноября 2025 г. в 13:20(изменено)
Голосовой ИИ агент по продажам Всем привет, в этом видео покажу голосового агента, который продает окна, будем эмитировать телефонный разговор. ИИ агент может собирать какую-то информацию о клиенте, проверить остатки по базе 1С, проконсультировать по товарам и оформить заказ. При этом он не устает, работает 24/7, не берет больничные и отпуска. Сейчас появляется все больше моделей, которые могут принимать голос и сразу генерировать его, но реально крутое решение есть только у OpenAI и оно достаточно дорогое. В видео же демонстрируется конвейер, который преобразует голос в текст, потом текст обрабатывается LLM и генерируется голосовой ответ. При желании можно собрать такой конвейер полностью локально. И как мне кажется, 2026 год станет годом небольших, но достаточно мощных мультимодальных моделей, которые подымут качество голосовых ии агентов на совершенно новый уровень. Хотите научиться автоматизировать отделы продаж с помощью ИИ в связке с 1С, приходите на курс https://nizamov.school/courses/ai/chatgpt-1s Rutube: https://rutube.ru/shorts/937b05442a579f73fe0028347bdc233a/ Youtube: https://youtube.com/shorts/8G1jrkBGorA?si=S7mur5McuKNfQ-Ir VK: https://vkvideo.ru/clip-107483541_456239286 #ai #ии #голосовойии #shorts #голосовойпомощникии #голосовойииагент #ииагент #иименеджер
А
Александр
18 ноября 2025 г. в 18:12(изменено)
судя по видео, задержки нет вообще. Это склейка или реально настолько быстро работает?
И
Илья Низамов
18 ноября 2025 г. в 18:12(изменено)
Нет, она есть, но очень не значительная, просто чтобы влезь в 60сек, пришлось слегка подрезать.
И
Илья Низамов
18 ноября 2025 г. в 18:13(изменено)
На видео задержка обозначена в сек
А
Александр
18 ноября 2025 г. в 18:14(изменено)
да, заметил - порядка нескольких секунд
И
Илья Низамов
18 ноября 2025 г. в 18:16(изменено)
но сам диалог получился почти не рваный, можно еще выжать, допустим заместо whisper использовать модель от Тбанка в тритон инференсе, и генерацию голоса делать не в режиме озвучки полной фразы, а потоком.
И
Илья Низамов
18 ноября 2025 г. в 18:17(изменено)
Сейчас больше всего времени отъедают транскрибация и генерация голоса.
V
Vladimir
18 ноября 2025 г. в 21:28(изменено)
Спасибо за информацию! А где можно про вариант 'под Windows ' посмотреть/почитать?
V
Vladimir
18 ноября 2025 г. в 21:33(изменено)
Я пробовал локально под Windows через Whisper Desktop и т.п. - не очень быстро получается 😕
V
Vladimir
18 ноября 2025 г. в 21:34(изменено)
С llama.cpp и LMStudio знаком
И
Илья Низамов
18 ноября 2025 г. в 22:08(изменено)
Faster whisper работает значительно быстрее
И
Илья Низамов
18 ноября 2025 г. в 22:08(изменено)
Под windows
V
Vladimir
18 ноября 2025 г. в 22:37(изменено)
Но он использует те же самые LLM, что и Whisper. Есть варианты использования других LLM?