Tech Lead Gen AI
Находимся в поиске Tech Lead Gen AI, кто будет заниматься разработкой Фабрики генеративного контента для одной из крупнейших BigTech-компаний в России.
Чем предстоит заниматься:
- Лидировать команду из 8-10 full-stack/ml-инженеров, проводить code review и архитектурные сессии;
- Определять архитектуру решения;
- Выбирать стек open-source моделей (LLM, diffusion, TTS) и способ их версионирования;
- Проектировать архитектуру надежного, масштабируемого и воспроизводимого ML пайплайна (deterministic → fast preview → final render);
- Разрабатывать архитектуру сценарного LLM ядра, агентный планировщик сцен (LLM-to-task graph), модуль «Story Graph ⇄ renderer» с RAG-feedback-loop;
- Управлять надежностью и стоимостью решения:
– GPU-budgeting, mixed-precision, batch-ing, stream-ing;
– Observability: tracing генераций до исходного prompt/версии модели.
Мы ждем от вас:
- 5+ лет прод-разработки на Python (или Go/Rust + Python для ML);
- Хорошие знания ML и DeepLearning, понимание архитектуры трансформеров;
- Опыт деплоя и оптимизации моделей на GPU;
- Опыт проектирования микросервисов/ event-driven пайплайнов;
- Хорошие знания алгоритмов, async/parallel patterns, DB/Cache (Postgres, Redis);
- Docker, CI/CD, базовый k8s, мониторинг (Prom/Grafana);
- Свободный английский.
Плюсом будет:
- Прод-опыт с Llama-family моделями, SD/VideoDiffusion, RAG-системами;
- Опыт autotuning/quantization (LoRA, AWQ, GGUF) и сервинга через vLLM;
- Знакомство с агентными оркестраторами (LangGraph, CrewAI, Autogen);
- Опыт с медийным пайплайном: ffmpeg-клейки, стриминг, DRM;
- Профильное IT образование.
Что мы предлагаем:
- Удобный формат работы на ваш выбор - офис, гибрид или удаленка;
- Медицинскую страховку с 1 месяца, включая стоматологию, страхование жизни и здоровья в поездках за рубеж;
- Компенсацию мобильной связи;
- Участие во внешних IT конференциях и обучающих программах;
- Полезные курсы и вебинары в корпоративном университете и электронные библиотеки;
- Скидки и предложения от партнеров на фитнес, занятия английским и прочее.
За более подробной информацией можно обращаться к Арине, adenisova@marksmans.ru, tg: @arinadenisova02