Canary deployment для моделей: как выкатывать новую версию без лишнего риска
Объясняем canary deployment и показываем, как безопаснее выкатывать новую версию ML-модели в прод.
SenatorovAI Journal
Здесь выходят статьи по Data Science с нуля, Python для Data Science, машинному обучению, математике, scikit-learn, проектной работе и развитию сильного технического мышления.
Русскоязычные статьи SenatorovAI для обучения, роста в профессии Data Scientist и поисковой индексации.
Объясняем canary deployment и показываем, как безопаснее выкатывать новую версию ML-модели в прод.
Разбираем latency в ML API и объясняем, почему скорость ответа модели влияет на продукт не меньше качества.
Сравниваем batch inference и real-time inference и объясняем, как выбирать режим работы модели под задачу.
Объясняем feature lineage и показываем, почему происхождение признаков важно для прод-ML и аудита модели.
Разбираем leakage во временных признаках и объясняем, как будущее незаметно попадает в train-данные.
Объясняем SQL CTE и показываем, как конструкции WITH помогают делать запросы чище и читаемее.
Разбираем SQL performance и объясняем, как писать аналитические запросы, которые не убивают хранилище.
Объясняем, как A/B тесты и ML работают вместе и почему модели нельзя оценивать только офлайн-метриками.
Разбираем CI/CD для ML-сервисов и объясняем, как автоматизировать выкладку моделей и API.
Объясняем data contracts и показываем, почему явные договоренности о данных важны для аналитики и ML.
Разбираем baseline в NLP и объясняем, почему даже в текстовых задачах нужно начинать с простого и честного ориентира.
Объясняем backtesting и показываем, как проверять модели и стратегии на исторических интервалах без самообмана.
Разбираем time-based validation и объясняем, почему случайный split опасен для временных рядов и событийных задач.
Объясняем survival analysis и показываем, когда важно моделировать время до события, а не только его вероятность.
Разбираем churn prediction и объясняем, как строить модели оттока без leakage и неверных признаков.
Объясняем LTV-модели и показываем, зачем бизнесу и Data Science оценка долгосрочной ценности клиента.
Разбираем cohort analysis и объясняем, как когортный подход помогает анализировать удержание и рост продукта.
Объясняем, почему pattern пропусков в данных сам по себе может быть полезным сигналом для аналитики и моделей.
Разбираем, как scaling влияет на нейросети, линейные модели и методы на расстояниях в Machine Learning.
Сравниваем feature drift и concept drift и объясняем, почему эти два типа изменений нельзя смешивать.
Разбираем data quality и объясняем, как оценивать надежность данных до аналитики, отчетов и ML.
Объясняем class weights, oversampling и другие подходы к дисбалансу классов в задачах классификации.
Разбираем выбор threshold в классификации и объясняем, почему хороший порог зависит от цены ошибок.
Сравниваем ROC-AUC и PR-AUC и объясняем, в каких задачах какая метрика дает более полезную картину.
По этому фильтру статьи не найдены.