Детали вакансии

Зарплата: от 0 руб.
Образование: Не указано
Тип занятости: Полная занятость
График работы: Полный рабочий день
Опыт работы: 0
Компания: Детский мир
Адрес: г Москва, Садовническая улица 82
Контактное лицо: Александра
Телефон: +7(495) 725 63 57
Должностные обязанности

Mы — команда синтеза речи голосового ассистента Маруся, сейчас нас 4 человека. Команда распределённая — Москва, Санкт-Петербург, Казань. Мы сфокусированы на построении end-to-end пайплайна синтеза речи. Сейчас улучшаем качество как самого синтеза, так и текстового фронтенда (нормализация текста, расстановка в нём ударений, пауз и акцентов).

Наша цель — построить устойчивое решение, которое можно масштабировать и использовать как для голосового ассистента, так и за его пределами.

Технологии: PyTorch, Kubeflow, S3, ONNX, TensorRT.

Задачи:

  • Разработка моделей: text2text для предобработки входного текста, различных акустических моделей и вокодеров. Для text2text ищем возможность использовать большие pretrain-модели. В разрезе аудиомоделей проводим эксперименты с разными архитектурами: авторегрессионными, параллельными, codec-based.
  • Подбор данных для обучения моделей. Майнинг и фильтрация текстовых данных, подготовка и контроль записи аудио.
  • Чтение и разбор статей. Мы находимся в постоянном поиске новых технологий, поэтому нужно будет читать статьи, искать новые подходы, воспроизводить их и тестировать на наших данных.
  • Определение приоритетов и задач для своей команды.
  • Контроль качества разрабатываемых решений.
  • Обучение и развитие команды DL-специалистов.

Требования:

  • Опыт управления командой.
  • Знание классических алгоритмов и структур данных.
  • Глубокое понимание алгоритмов машинного обучения.
  • Опыт внедрения моделей в продакшен.

Будет плюсом:

  • Опыт работы с моделями и данными в звуковом домене (ASR, TTS, voice cloning и т. п.).
  • Знание методов оптимизации больших моделей: квантизация, onnxruntime, TensorRT.