ym103487564
sber.giga.chat
База знаний для разработки AI-агентов

AI-сервис синхронного перевода

Срок начала реализации
Декабрь 2024
Срок вывода в ПРОМ
Ноябрь 2025
Блок
Сервисы
Подразделение
Центр Искусственного Интеллекта
01
Проблема
Языковой барьер мешает:
  • Адаптации, успеваемости и как следствие привлечению иностранных студентов в вузах РФ
  • Пониманию и, как следствие, активному участию иностранных гостей (особенно стран БРИКС) в международных форумах РФ
Стандартные решения с переводчиками-синхронистами ограничены масштабированием: по языкам, количеству залов, возможному времени работы и требуемому времени подготовки, а также высокой стоимостью
02
Цель
Содействие стратегии РФ по экспорту образования через создание решения для иностранных студентов, которое позволит:
  • Улучшить вовлеченность иностранных студентов в образовательный процесс
  • Повысить успеваемость иностранных студентов по профильным предметам и как следствие сократить % отчисления из-за неуспеваемости
  • Способствовать изучению русского языка за счёт сокращения времени на разбор учебных материалов
  • Создать конкурентное преимущество для вузов РФ для привлечения иностранных студентов (стратегия 500 тыс. к 2030)
03
Решение
AI-сервис состоит из 2 частей:
  • Кросс-платформенное Desktop ПО, которое позволяет пользователю-организатору запускать трансляцию, используя любой источник звука (например, микрофон)
  • Пользовательский интерфейс в формате веб-страницы (виртуальная комната) позволяет пользователю получать транскрибацию и текстовый перевод на любой из 15 языков с задержкой до 2.5 сек., получать суммаризацию трансляции в любой момент времени по запросу и генерировать тесты с автопроверкой по тексту лекции (элемент в разработке)
Функциональность
ПО администратора/преподавателя:
  • Захват и распознание речи с русского, английского и китайского языков
  • Создание виртуальных залов (+ генерация QR-кодов для подключения в этот виртуальный зал)
  • Управление виртуальными залами (удаление, очистка контента в зале, переименование)
  • Просмотр статистики
Пользовательский интерфейс (страница в браузере):
  • Отображение транскрибации и перевода речи в текст в режиме реального времени
  • Выбор и смена языка перевода (1 или 2 для билингвального) из 15 представленных
  • Возможность скачать текстовый файл расшифровки на выбранном языке
  • Возможность скачать конспект в формате AI-суммаризации
  • Возможность пройти тест по материалу, сгенерированный AI (1 или множество ответов)
Визуализация решения
Текущий эффект
Пилот
Решение для вузов
Пилот
Решение для мероприятий
Целевой эффект
TBD
Рост среднего балла иностранных студентов по профильным предметам
TBD
Снижение доли отчислений иностранных студентов
TBD
Рост CSI преподавателей и иностранных студентов по процессу обучения
TBD
Сокращение затрат на обеспечение перевода
TBD
Увеличение вовлечённости иностранных гостей (retention и посещаемость)
TBD
Увеличение числа иностранных гостей
Используемая фундументальная модель
Используемые инструменты разработки и улучшения GenAI-решений
LoRA
PEFT
Triton inference server
Размер и роли команды реализации решения
11 ПШE
1 Владелец продукта
1 TeamLead
2 BackEnd Developer
2 FrontEnd Developer
2 Data Scientist аудио (модели распознания речи)
2 Data Scientist языковые модели (контекстный машинный перевод)
1 MLOps
Контактное лицо
Жилин Евгений Юрьевич
Zhilin.E.Yu@sberbank.ru
Ещё кейсы
PMAgent (Process Mining от Сбера)
Цель кейса: Снизить потери при банкротстве физлиц, назначая стратегии урегулирования
Agentic BI в Навигаторе
Цель кейса: Обеспечить оперативный и легкий поиск любой информации в АС Навигатор
Мультиагентная система AiGenA (ИИ-архитектор)