DataScience_SkillFactory

Репозиторий содержит проекты, выполняемые в рамках прохождения специализации Data Science в Skill Factory. Описание проектов приведено в порядке убывания сложности, актуальности. То есть сначала - самые свежие проекты.

Project_5 Car Price Prediction

Проект посвящен задаче определения рыночной цены автомобиля по его доступной конфигурации. Проект состоит из двух основных частей:

парсер сайта auto.ru по имеющимся автомобилям, составление базы для обучения моделей
обучение предсказательных моделей, были использованы: градиентный бустинг (CatBoost), случайный лес (RandomForestRegressor) Также были проведены следующие работы:
очистка данных
feature generation
подбор параметров моделей
кросс-валидация моделей

Project_4 Credit Scoring

Имеются данные о клиентах банка. Задача состоит в том, чтобы построить модель предсказания дефолта клиента по кредиту. В качестве предсказательной модели использована модель логистической регрессии.

Project_3 Trip Advisor restaurant rating

По имеющемуся датасету о ресторанах сайта TripAdvisor. Тренировка в очистке данных, предобработке, генерации новых признаков. Предсказательная модель - RandomForestRegressor

Project_2 Exploratory data analysis

Разведывательный анализ данных. Для исследования предоставлена база с данными об учениках, которая содержит достаточно широкие сведения о молодых людях, их семейном положении, занятости и успеваемости по математике. Суть проекта — отследить влияние условий жизни учащихся в возрасте от 15 до 22 лет на их успеваемость по математике, чтобы на ранней стадии выявлять студентов, находящихся в группе риска. Цель: В данном проекте целью является произвести предобработку набора данных и провести разведывательный анализ. Необходимо произвести их первичную оценку, подготовить данные для дальнейшего построения модели, которая предсказала бы результаты экзамена по математике для каждого ученика.

Project_1 IMDB movies

Проект посвящен анализу данных фильмов IMDB. Тренировка в применении библиотек pandas, numpy

project_0 GitHub start

Задача состоит в следующем: генерируется случайное число от 0 до 100. Необходимо написать алгоритм, позволяющий определить это число за минимальное количество шагов. Решение: реализован алгоритм бинарного поиска, позволяющий находить неизвестное число из дипазона в среднем за 4 шага.

Name		Name	Last commit message	Last commit date
Latest commit History 25 Commits
input/imbd-sf		input/imbd-sf
project_0 GitHub start		project_0 GitHub start
project_1 IMDB movies		project_1 IMDB movies
project_2 Exploratory data analysis		project_2 Exploratory data analysis
project_3 Trip Advisor restaurant rating		project_3 Trip Advisor restaurant rating
project_4 Credit Scoring		project_4 Credit Scoring
project_5 Car Price Prediction		project_5 Car Price Prediction
.gitignore		.gitignore
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

input/imbd-sf

input/imbd-sf

project_0 GitHub start

project_0 GitHub start

project_1 IMDB movies

project_1 IMDB movies

project_2 Exploratory data analysis

project_2 Exploratory data analysis

project_3 Trip Advisor restaurant rating

project_3 Trip Advisor restaurant rating

project_4 Credit Scoring

project_4 Credit Scoring

project_5 Car Price Prediction

project_5 Car Price Prediction

.gitignore

.gitignore

README.md

README.md

Repository files navigation

DataScience_SkillFactory

Project_5 Car Price Prediction

Project_4 Credit Scoring

Project_3 Trip Advisor restaurant rating

Project_2 Exploratory data analysis

Project_1 IMDB movies

project_0 GitHub start

About

Releases

Packages

Contributors 2

Languages

AlexeyDegterev/DataScience_SkillFactory

Folders and files

Latest commit

History

Repository files navigation

DataScience_SkillFactory

Project_5 Car Price Prediction

Project_4 Credit Scoring

Project_3 Trip Advisor restaurant rating

Project_2 Exploratory data analysis

Project_1 IMDB movies

project_0 GitHub start

About

Resources

Stars

Watchers

Forks

Languages