Введение
В продолжение предыдущего поста я завершил обработку прайса поставщика, содержащего 12 000 товаров. Весь процесс занял менее 20 секунд. Несмотря на наличие ошибок, нейронная сеть была обучена всего на 9 % от общего количества товаров, что уже демонстрирует её эффективность. В ближайшее время планирую расширить датасет, после чего задача будет считаться полностью решённой.
Технические детали
Сервис готов к ежедневной обработке десятков поставщиков и автоматическому подсчёту примерной суммы чека, которую можно заработать с запроса клиента.
Параметры обработки
- Объём данных: 12 000 товаров
- Порции: 50 товаров за раз
- Общее время: 17.73 сек
- Средняя медианная цена по категориям: 4567 ₽
Код‑лог
Начинаем обработку 11941 товаров порциями по 50...
Обработка завершена. Всего обработано: 11941 товаров.
Время обработки и вычисления медианных цен по категориям: 17.732579 секунд
Медианная цена по категориям:
{ None: 4567.0,
'42': 1530.0,
'Avalanche': 23990.0,
'Бомбер': 3959.0,
'Брюки': 5488.0,
'Варежки': 960.0,
'Ветровка': 1690.0,
'Джемпер': 1200.0,
'Джоггеры': 3065.0,
'Дождевик': 1580.0,
'Жилет': 3490.0,
'Куртка': 4206.0,
'Майка': 729.0,
'Макинтош': 5890.0,
'Набор': 3825.0,
'Парка': 7567.0,
'Перчатки': 290.0,
'Платье': 1443.0,
'Пуховик': 16470.0,
'Рубашка': 3138.0,
'Рубашка поло': 1561.0,
'Свитшот': 2069.0,
'Толстовка': 2774.0,
'Футболка': 697.0,
'Худи': 2198.0,
'Шапка': 621.0,
'Шорты': 1445.0,
'анорак': 2290.0,
'джинсовая': 5350.0,
'жилет': 500.0,
'рубашка': 7350.0,
'рубашка поло': 889.0,
'спортивные': 642.0
}
Выводы
Нейронная сеть, обученная на небольшом объёме данных, смогла быстро обработать весь прайс и вывести медианные цены по категориям. Это открывает путь к автоматизации анализа цен и расчёту потенциальной прибыли от каждого запроса клиента. Следующий шаг – расширить датасет и доработать модель для более точного распознавания категорий.
Ключевые слова
1С, AI, NLP, spaCy, NER, обработка прайса, автоматизация.