Введение
В продолжение темы OCR с помощью языковых моделей я протестировал новые локальные модели Gemma 3, обученные с поддержкой квантования (QAT). Результаты оказались впечатляющими – 100 % точность при работе с 12‑битной версией модели.
Gemma 3 12B с QAT
Gemma 3 – это семейство больших языковых моделей, разработанных с акцентом на эффективность и масштабируемость. В данной работе использовалась версия 12B, дополненная техникой квантования QAT, которая позволяет уменьшить размер модели без потери качества.
Результаты тестирования
Тесты проводились на той же задаче OCR, что и в предыдущих публикациях. Модель демонстрировала 100 % точность распознавания текста, что подтверждает эффективность комбинации Gemma 3 и QAT. Кроме того, модель стала легковесной, что позволяет запускать её на потребительских видеокартах.
Практическое применение
Легковесность модели открывает возможности для интеграции OCR‑решений в небольшие и средние проекты, где ресурсы ограничены. Это особенно актуально для компаний, использующих 1С и ищущих быстрые и надёжные решения для обработки документов.
Выводы
Gemma 3 12B с квантованием QAT демонстрирует, что современные языковые модели могут достигать высокой точности OCR без необходимости мощного оборудования. Это делает их привлекательными для широкого круга задач в области ИИ и автоматизации.
