Проект в области анализа судебных решений и юридической аналитики.
Посещение офиса в г.Астана обязательно.
Задачи:
Подготовка и обработка текстовых данных:
- Разработка пайплайнов для предобработки текстов
- Реализация логики разделения документов на смысловые части
- Создание систем фильтрации и очистки данных
- Работа с различными форматами данных (txt, pdf, doc)
Работа с embedding моделями:
- Опыт работы с embedding моделями
- Настройка и оптимизация векторных представлений текста
- Работа с векторными базами данных (ChromaDB, FAISS)
- Оценка качества эмбеддингов
Fine-tuning модели:
- Опыт fine-tuning языковых моделей
- Подготовка данных для обучения моделей
- Разработка методик оценки качества моделей
- Работа с метриками и валидацией
Разработка компонентов оценки:
- Создание систем оценки релевантности документов
- Разработка метрик для оценки качества извлеченной информации
- Реализация логики валидации результатов
Требования к квалификации:
- Не менее 1 года опыта работы с NLP проектами
- Опыт работы с языковыми моделями и RAG системами
- Практический опыт подготовки данных для обучения моделей
- Желательно наличие опыта работы с текстовыми данными
- Знание языков программирования и фреймворков: Python, PyTorch/TensorFlow, Hugging Face Transformers, LangChain/LlamaIndex
Условия:
- Заработная плата зависит от квалификации
- 5 дней в неделю с 9:00 до 18:00
- Возможен гибридный график после испытательного срока
- Практикуем быстрый найм, без долгих согласований и этапов
- В команде есть тимлид
Ключевые навыки
- Python
- PyTorch
- TensorFlow
- LangChain
- LlamaIndex
- Hugging Face
Задайте вопрос работодателю
Он получит его с откликом на вакансию
Где предстоит работать
Астана, улица Жошы хана, 27
Вакансия опубликована 17 марта 2025 в Астане