Data Science с нуля до junior: реалистичный план 2026
Сколько реально нужно времени, что учить, какие проекты собирать в портфолио и как смотреть на рынок РФ junior-DS в 2026.
Data Science — одна из самых маркетингово раздутых ниш. Курсы за 200K обещают «junior через 6 месяцев», но реальность жёстче: рынок junior-DS перенасыщен, на одну вакансию 200-400 откликов, и без сильного портфолио + математики собеседование не пройти.
Сколько реально нужно времени
- 9-12 месяцев плотной учёбы (15-20 часов/неделю) до уровня junior с шансами на собеседование.
- 12-18 месяцев если совмещаешь с работой при 8-10 часах/неделю.
- 6 месяцев — нереалистично, если у тебя нет бэкграунда в математике или программировании. Даже бывшие аналитики/инженеры доучиваются 6-9 месяцев.
Что РЕАЛЬНО спрашивают на собеседованиях
Программирование:
- Python — pandas, numpy, matplotlib/seaborn, scikit-learn. Уверенно, на уровне «могу написать pipeline за 30 минут».
- SQL — JOIN, GROUP BY, window functions, CTE. Не на уровне «слышал», а «решаю задачи на StrataScratch».
- Git + Jupyter + командная строка — базовый dev-stack.
Математика и статистика:
- Базовая стат: распределения, p-value, доверительные интервалы, A/B-тесты.
- Линейная алгебра: векторы, матрицы, собственные значения (для понимания PCA, embeddings).
- Теория вероятностей: условная вероятность, Байес, основные распределения.
- Производные и градиенты — для понимания градиентного спуска.
Машинное обучение:
- Классические алгоритмы: линейная/логистическая регрессия, дерево, random forest, gradient boosting (XGBoost/LightGBM/CatBoost), кластеризация (k-means, DBSCAN).
- Нейросети basic: MLP, CNN для картинок, transformers поверхностно.
- Метрики и валидация: ROC AUC, precision/recall, cross-validation, ranking metrics для рекомендаций.
Инженерия (растёт в требованиях 2024-2026):
- Docker — упаковка моделей.
- REST API — Flask или FastAPI для деплоя.
- MLOps basic: MLflow, DVC, отслеживание экспериментов.
Реальные зарплаты РФ 2026
- Junior DS (0-1 год): 100-180 тысяч в Москве, 70-120 в регионах. Удалёнка реальна, но конкуренция жёсткая.
- Middle DS (1-3 года): 200-350 тысяч в Москве.
- Senior DS (3+ лет): 350-600+ тысяч в Москве, плюс премии в крупных компаниях.
- ML Engineer часто платят больше «чистого DS» — рынок ценит инженерные навыки.
Реальность junior: в РФ есть переизбыток junior-DS и недостаток middle. Многие проходят курсы, но устраиваются 30-40% выпускников через 3-6 месяцев активного поиска.
План на 9-12 месяцев
Месяцы 1-2: Python + pandas + базовая статистика. Stepik (бесплатно), курсы Karpov.Courses Hard Skills (платно).
Месяцы 3-4: SQL + математика (линейка, теория вероятностей). Хан Академия + Курсера. Параллельно начинать Kaggle Getting Started competitions.
Месяцы 5-6: Классическое ML (scikit-learn) + первый pet-проект. Решать минимум 2-3 задачи на Kaggle, выкладывать на GitHub с README и анализом.
Месяцы 7-8: Углубление + boosting (XGBoost/CatBoost) + практика на A/B-тестах. Второй проект сложнее (не учебный): анализ открытых данных, real-world задача.
Месяцы 9-10: Третий проект с end-to-end pipeline (от данных до API). Решение алгоритмических задач для big tech собеседований.
Месяцы 11-12: Резюме, отклики, тестовые задания, собеседования. Параллельно учить статистику глубже + А/B-тесты для аналитиков-интервью.
Чего избегать
- ❌ Курсы без математики — pandas можно за месяц, но без линейной алгебры и статистики ты не пройдёшь техническое собеседование.
- ❌ Только Coursera/Udemy без проектов — портфолио из 0 проектов = 0 шанс на собеседовании.
- ❌ Игнорировать SQL — на 80% позиций junior-DS первый раунд — это SQL-задачи.
- ❌ Учить «новейший трендовый AI» прежде классики — без логрегрессии и градиентного бустинга трансформеры не помогут.
- ❌ Идти за брендом школы — «Skillbox/Yandex.Practicum/SkillFactory» дают одинаково среднее качество. Решает твоя самостоятельная работа.
Альтернатива: ML-инженер или Аналитик
Если математика тяжело идёт — рассмотри смежные позиции:
- Аналитик данных (Python + SQL + Tableau/Metabase) — порог ниже, рынок свободнее.
- ML-инженер (Python + Docker + Kubernetes + DevOps) — порог по математике ниже, спрос на инженерные навыки выше.
- MLOps — самая молодая ниша, дефицит специалистов, зарплаты как у senior DS.
Что почитать дальше
- Подборка: Python — программирование с нуля
- Подборка: Нейросети — ChatGPT, Midjourney и практика
- Подборка: Нейросети и prompt-engineering
Data Science — реальная профессия с хорошими зарплатами, но не «golden ticket» как обещают курсы. Без математики и проектов рынок junior жестокий. Реалистично — 9-12 месяцев плотной работы + 3-6 месяцев активного поиска первой работы. Если готов к этому — нормальная карьерная ставка.