Введение
Недавно появились новые карты RTX 5060 Ti, и я провёл тесты, чтобы понять, как они соперничают с классическим RTX 3090 24 GB в задачах инференса больших языковых моделей (LLM). Ниже – краткие итоги, плюсы и минусы каждой конфигурации, а также рекомендации по выбору.
Параметры и цены
- RTX 3090 24 GB (б/у, февраль 2026) – 65 – 75 тыс ₽
- 2× RTX 5060 Ti 16 GB (новые) – 100 – 110 тыс ₽
Плюсы и минусы RTX 3090 24 GB
Плюсы
- 24 GB единой памяти – можно загружать большие модели целиком без разделения.
- Небольшое увеличение производительности по сравнению с 5060 Ti.
- Одна карта – упрощённая настройка, меньше проблем с драйверами.
- Энергопотребление примерно одинаковое (370 W мой экземпляр vs 2×180 W).
- Занимает меньше слотов в корпусе.
- Не требуется поддержка мульти‑GPU в программном обеспечении.
Минусы
- Б/у карта – риски износа, отсутствие гарантии.
- Устаревшая архитектура Ampere (2020).
- Высокая цена за единицу.
- Отсутствует путь к апгрейду без полной замены карты.
Плюсы и минусы 2× RTX 5060 Ti 16 GB
Плюсы
- 32 GB общей памяти – больше возможностей для крупных моделей.
- Новые карты с гарантией.
- Современная архитектура Blackwell – дольше останутся актуальными.
- Можно начать с одной карты (50 – 55 тыс ₽) и добавить вторую позже.
- Лучшая энергоэффективность.
- Поддержка новых технологий и оптимизаций.
Минусы
- Суммарно дороже (~100 – 110 тыс ₽ vs 65 – 75 тыс ₽).
- Чуть медленнее в инференсе.
- Сложнее настройка (tensor parallelism, multi‑GPU).
- Занимают больше места в корпусе.
- Память разделена между картами – возможны задержки при обмене данных.
Рекомендации по выбору
- Берите RTX 3090, если:
- Бюджет ограничен.
- Работаете с моделями до 24 GB.
- Важна простота настройки.
- Готовы к рискам б/у.
- Берите 2× RTX 5060 Ti, если:
- Можете потратить больше.
- Планируете работать с моделями >24 GB.
- Важна гарантия и долгосрочная перспектива.
- Хотите начать с одной карты и расширяться.
Где посмотреть подробные результаты
Тесты по инференсу LLM на обеих конфигурациях завершены. Результаты доступны на странице бенчмарков.
Автор: @nizamov_studio_1c
Теги: #llmbenchmark #ollama #vllm #llamacpp #inferencebenchmark #локальныеllm #производительностьllm #gpubenchmark #aiбенчмарк #тестнейросетей #llmинференс #нейросети