Kategorie

Расширенная аналитика с PySpark

  • Автор: Ури Ласерсон, Сэнди Райза, Акаш Тандон

  • Переплет: мягкий
  • Страниц: 224
  • Формат: 23.3x16.7x1.2 см
  • Вес: 310 г
  • ISBN: 978-5-9775-1770-6
  • Бумага: офсетная
  • Год издания: 2023
  • Язык издания: русский

44264417

Dostupnost: odeslání do 9-13 pracovních dnů

517 Kč

Книга посвящена практическим методам анализа больших объемов данных с использованием языка Python и фреймворка Spark, она знакомит с моделью программирования Spark и основами системы с открытым исходным кодом PySpark. Каждая глава описывает отдельный аспект анализа данных, показаны основы обработки данных в PySpark и Python на примере очистки данных, подробно освещается машинное обучение с помощью Spark. Книга поможет читателю понять, как устроен и работает весь конвейер PySpark для комплексной аналитики больших наборов данных: от создания и оценки моделей до очистки, предварительной обработки и исследования данных с особым акцентом на производственные приложения. Отдельные главы посвящены обработке изображений и библиотеке Spark NLP.