Мы работаем над платформой для аренды GPU и LLM инференса -
https://www.cloudrift.ai/. Ищем AI/ML-инженера для работы над LLM платформой: оптимизация
производительности, исследование современных GenAI-подходов и публикация
материалов, улучшение платформы для GPU аренды.
Обязанности:
- Оптимизация пайплайнов инференса LLM по скорости, стоимости и масштабируемости
- Исследование и внедрение техник GenAI (RAG, agents, MCP)
- Совместная работа с системными инженерами над планированием GPU и оптимизацией памяти
- Улучшение опыта разработчиков (UX) на нашей GPU-платформе
- Подготовка технических статей, бенчмарков и руководств для ML-сообщества.
Требования:
- Практический опыт с фреймворками инференса LLM (vLLM, llama.cpp, SGLang и другие)
- Понимание тюнинга производительности GPU
- Уверенные знания Python и ML-инструментов: PyTorch, Hugging Face Transformers
- Развитые письменные навыки и умение понятно объяснять технические концепции на английском языке.
- Опыт работы с Docker
Плюс:
- Вклад в open-source проекты или опубликованные исследования контент по ML
-
Любые знания релевантные для связанного продукта по аренде GPU, то есть
знание Rust, опыт работы с DevOps инструментами такими как Kubernetes,
опыт работы с базами данных
Условия:
- Зарплата в зависимости от опыта, от $1500 в месяц
- Головной офис в Калифорнии, оформление через филиал в Казахстане
- Формат: удалённо
- График: фултайм, гибкий
Отклик:
- Email:
careers@cloudrift.ai
- GitHub проекты, резюме и коротко о себе на английском языке
- Дополнительная информация:
https://www.cloudrift.ai/careers
Обсуждение 6
Обсуждение не доступно в веб-версии. Чтобы написать комментарий, перейдите в приложение Telegram.
Обсудить в Telegram