Мы работаем над платформой для аренды GPU и LLM инференса - https://www.cloudrift.ai/. Ищем AI/ML-инженера для работы над LLM платформой: оптимизация
производительности, исследование современных GenAI-подходов и публикация
материалов, улучшение платформы для GPU аренды.

Обязанности:
- Оптимизация пайплайнов инференса LLM по скорости, стоимости и масштабируемости
- Исследование и внедрение техник GenAI (RAG, agents, MCP)
- Совместная работа с системными инженерами над планированием GPU и оптимизацией памяти
- Улучшение опыта разработчиков (UX) на нашей GPU-платформе
- Подготовка технических статей, бенчмарков и руководств для ML-сообщества.

Требования:
- Практический опыт с фреймворками инференса LLM (vLLM, llama.cpp, SGLang и другие)
- Понимание тюнинга производительности GPU
- Уверенные знания Python и ML-инструментов: PyTorch, Hugging Face Transformers
- Развитые письменные навыки и умение понятно объяснять технические концепции на английском языке.
- Опыт работы с Docker

Плюс:
- Вклад в open-source проекты или опубликованные исследования контент по ML
-
Любые знания релевантные для связанного продукта по аренде GPU, то есть
знание Rust, опыт работы с DevOps инструментами такими как Kubernetes,
опыт работы с базами данных

Условия:
- Зарплата в зависимости от опыта, от $1500 в месяц
- Головной офис в Калифорнии, оформление через филиал в Казахстане
- Формат: удалённо
- График: фултайм, гибкий

Отклик:
- Email: careers@cloudrift.ai
- GitHub проекты, резюме и коротко о себе на английском языке
- Дополнительная информация: https://www.cloudrift.ai/careers
? 27
? 1
? 1
6 35 4.1K

Обсуждение 6

Обсуждение не доступно в веб-версии. Чтобы написать комментарий, перейдите в приложение Telegram.

Обсудить в Telegram