RTX 3090 vs 2x RTX 5060 Ti: Какой GPU выбрать для инференса LLM?

Введение

Недавно появились новые карты RTX 5060 Ti, и я провёл тесты, чтобы понять, как они соперничают с классическим RTX 3090 24 GB в задачах инференса больших языковых моделей (LLM). Ниже – краткие итоги, плюсы и минусы каждой конфигурации, а также рекомендации по выбору.

Параметры и цены

  • RTX 3090 24 GB (б/у, февраль 2026) – 65 – 75 тыс ₽
  • 2× RTX 5060 Ti 16 GB (новые) – 100 – 110 тыс ₽

Плюсы и минусы RTX 3090 24 GB

Плюсы

  • 24 GB единой памяти – можно загружать большие модели целиком без разделения.
  • Небольшое увеличение производительности по сравнению с 5060 Ti.
  • Одна карта – упрощённая настройка, меньше проблем с драйверами.
  • Энергопотребление примерно одинаковое (370 W мой экземпляр vs 2×180 W).
  • Занимает меньше слотов в корпусе.
  • Не требуется поддержка мульти‑GPU в программном обеспечении.

Минусы

  • Б/у карта – риски износа, отсутствие гарантии.
  • Устаревшая архитектура Ampere (2020).
  • Высокая цена за единицу.
  • Отсутствует путь к апгрейду без полной замены карты.

Плюсы и минусы 2× RTX 5060 Ti 16 GB

Плюсы

  • 32 GB общей памяти – больше возможностей для крупных моделей.
  • Новые карты с гарантией.
  • Современная архитектура Blackwell – дольше останутся актуальными.
  • Можно начать с одной карты (50 – 55 тыс ₽) и добавить вторую позже.
  • Лучшая энергоэффективность.
  • Поддержка новых технологий и оптимизаций.

Минусы

  • Суммарно дороже (~100 – 110 тыс ₽ vs 65 – 75 тыс ₽).
  • Чуть медленнее в инференсе.
  • Сложнее настройка (tensor parallelism, multi‑GPU).
  • Занимают больше места в корпусе.
  • Память разделена между картами – возможны задержки при обмене данных.

Рекомендации по выбору

  • Берите RTX 3090, если:
    • Бюджет ограничен.
    • Работаете с моделями до 24 GB.
    • Важна простота настройки.
    • Готовы к рискам б/у.
  • Берите 2× RTX 5060 Ti, если:
    • Можете потратить больше.
    • Планируете работать с моделями >24 GB.
    • Важна гарантия и долгосрочная перспектива.
    • Хотите начать с одной карты и расширяться.

Где посмотреть подробные результаты

Тесты по инференсу LLM на обеих конфигурациях завершены. Результаты доступны на странице бенчмарков.

Автор: @nizamov_studio_1c

Теги: #llmbenchmark #ollama #vllm #llamacpp #inferencebenchmark #локальныеllm #производительностьllm #gpubenchmark #aiбенчмарк #тестнейросетей #llmинференс #нейросети