80 лет Великой Победе!
17 May, 2025

Сбер выложил в открытый доступ свои AI-технологии

Сбер выложил в открытый доступ свои AI-технологии
13.12.2024 11:45

Среди них - базовая и инструктивная версии GigaChat Lite, а также самая мощная модель на русском языке GigaEmbeddings-instruct, признанная самой быстрой по результатам бенчмарка ruMTEB.

Улучшения в новой версии акустических моделей GigaAM касаются как подготовки данных, так и технологии предобучения базовой модели. Особенно значительный прогресс заметен в самой мощной модели семейства GigaAM-RNNT, где показатель улучшился на 25 процентов по сравнению с предыдущей версией и превосходит OpenAI-Whisper-large-v3 на 56 процентов. Эти обновления открывают новые перспективы для распознавания речи и эмоций, делая продукты GigaChat еще более эффективными и удобными для пользователей.

Эксперт: Новая линейка моделей GigaAM предлагает значительное ускорение на современных видеокартах благодаря переходу на другое позиционное кодирование и поддержке Flash Attention для дообучения и инференса. Команда разработчиков упростила код, уменьшила число зависимостей и предоставила возможность конвертации моделей в формат ONNX, что делает их более доступными для использования. Кроме того, новые модели теперь доступны с лицензией MIT, позволяющей их коммерческое применение.

Разработчикам и бизнесу теперь доступны базовая и инструктивная версии GigaChat Lite в открытом доступе. Это открывает новые возможности для создания и интеграции чат-ботов в различные проекты и бизнес-процессы. Таким образом, пользователи получают более широкий спектр инструментов для улучшения коммуникации и автоматизации задач.

В целом, обновленные модели GigaAM и доступные версии GigaChat Lite представляют собой значительный шаг вперед в области машинного обучения и разработки чат-ботов, обеспечивая более эффективное и гибкое использование технологий для различных целей и задач.

Существует модель, которая заслуживает особого внимания своей высокой производительностью в типовых задачах, где важна скорость выполнения. Эта модель — Lite 20B MoE (Mixture-of-Experts) с архитектурой, содержащей 3.3 миллиарда активных параметров. Несмотря на свою относительную компактность, она обладает качеством работы, сравнимым с более мощными моделями.

Кроме того, одной из интересных моделей, доступных в open-source, является GigaEmbeddings-instruct. Она способна преобразовывать текст в числовое представление (вектор), полностью кодируя всю информацию, содержащуюся в запросе. Эта модель идеально подходит для задач, где используется технология RAG (Retrieval Augmented Generation). GigaEmbeddings-instruct демонстрирует лучшие результаты в своем классе по данным бенчмарка ruMTEB.

Большие языковые модели, такие как GigaChat MAX, предоставляются бизнесам через облачное API. Эти мощные инструменты способствуют улучшению коммуникации и повышению эффективности рабочих процессов. При помощи облачного API компании могут интегрировать функционал моделей непосредственно в свои продукты и сервисы, что открывает новые возможности для автоматизации и оптимизации бизнес-процессов.

Источник и фото - lenta.ru