Перед вами полноценный путеводитель в увлекательный мир обработки данных при помощи Pandas, NumPy и Scikit-learn. Он содержит множество примеров, которые помогут вам научиться преобразовывать сырые крупицы данных в настоящий шедевр из ценной информации и аналитических выводов. Книга разбита на три части, каждая из которых посвящена отдельным аспектам работы с данными. Часть I. Подготовка к расширенному анализу данных Вы научитесь свободно использовать средства, представленные в библиотеках Pandas, NumPy и Scikit-learn для предварительной подготовки данных. Часть II. Конструирование признаков для моделей машинного обучения Вы примете участие в полноценном проекте по анализу данных, а также научитесь конструировать новые признаки и корректировать данные. Часть III. Очистка и предварительная обработка данных Вы поучаствуете в большом проекте по прогнозированию временных рядов, а также научитесь корректировать аномалии в данных и освоите методы снижения размерности. Издание предназначено как делающим первые шаги в освоении науки о данных, так и практикующим специалистам, желающим улучшить свои навыки.
Книга написана сотрудниками компании Cuantum Technologies, специализирующейся на разработке качественных веб-приложений с использованием передовых технологий и инструментов. Авторы обладают обширным опытом в анализе и визуализации данных, машинном обучении и искусственном интеллекте.