- "Big Data in Practice. How 45 Successful Companies Used Big Data Analytics to Deliver Extraordinary Results" Бернард Марр
Введение в принципы и лучшие практики работы с большими данными. - "Большие данные. Революция, которая изменит то, как мы живем, работаем и мыслим" Виктор Майер-Шенбергер и Кеннет Кукьер
Рассматривает влияние больших данных на различные аспекты жизни и бизнеса.
- "Высоконагруженные приложения. Программирование, масштабирование, поддержка" Мартин Клеппман
Глубокое исследование различных моделей хранения данных и их применения. - "SQL и реляционная теория. Как грамотно писать код на SQL" К. Дж. Дейт
Подробное руководство по реляционной модели и SQL. - "Семь баз данных за семь недель. Введение в современные базы данных и идеологию NoSQL" Джим Р. Уилсон и Эрик Редмонд
Рассматривает различные модели данных, включая колоночные, графовые и документные базы данных.
- "SQL за 10 минут" Бен Форта
Быстрое введение в SQL. - "Системы графовых баз данных. Neo4j" Маркин А. В.
Пособие по языку запросов для графовых баз данных Neo4j. - "MongoDB: Полное руководство" Брэдшоу Ш., Брэзил Й., Ходоров К.
Введение в запросы MongoDB.
4. OLTP vs. OLAP, аналитические базы данных и эффективное представление данных для выполнения аналитических задач
- "Инструментарий хранения и анализа данных. Полное руководство по размерному моделированию" Ральф Кимбалл
Классика по OLAP и аналитическим базам данных. - "Building a Scalable Data Warehouse with Data Vault 2.0" by Dan Linstedt and Michael Olschimke
Рассматривает современные подходы к построению масштабируемых хранилищ данных. - "Аналитика как конкурентное преимущество. Новая наука побеждать" Т.Давенпорт, Дж.Харрис
Влияние аналитики на бизнес и как эффективно использовать данные для принятия решений.
5. Поисковые индексы и эффективное хранение и применение индексов на диске – хэш-таблицы, деревья поиска, пространственные индексы, полнотекстовый поиск
- "Распределенные данные. Алгоритмы работы современных систем хранения информации" А.Петров
Глубокое понимание внутренних механизмов баз данных, включая индексы. - "Elasticsearch 7.0 Cookbook" by Alberto Paro
Подробное руководство по полнотекстовому поиску с Elasticsearch. - "Алгоритмы. Вводный курс" Кормен Томас Х.
Классическое введение в алгоритмы, включая хэш-таблицы и деревья поиска.
- "Professional Hadoop" by Antony Benoy, Boudnik Konstantin
Рассматривает Avro и другие форматы данных в контексте Hadoop. - "Protocol Buffers Documentation"
Документация на Protocol Buffers (protobuf). - "The Definitive Guide to SQLite" by Grant Allen and Mike Owens
Введение в работу с табличными данными с использованием SQLite.
- "Корпоративное озеро больших данных. Новый подход к использованию Big Data и Data Science в бизнесе" А.Горелик
Подробное введение в концепцию озер данных. - "Data Warehousing Fundamentals for IT Professionals" by Paulraj Ponniah
Рассматривает интеграцию озер данных и витрин данных. - "Building the Data Lakehouse" by Bill Inmon and Krish Krishnan
Новая концепция интеграции озер данных и традиционных хранилищ данных.
8. Популярные NoSQL хранилища и СУБД: Scylla/Cassandra, HDFS, HBase, Redis, Memcached, ElasticSearch/Solr, MongoDB, ClickHouse
- "Cassandra: Полное руководство" Дж.Карпентер и Э. Хьюитт
Полное руководство по Cassandra. - "Hadoop: Подробное руководство" Т.Уайт
Основополагающая книга по HDFS и экосистеме Hadoop. - "Advanced Elasticsearch 7.0"
Подробное руководство по Elasticsearch. - The Little MongoDB Book (Маленькая книга о MongoDB)
Книга на Гитхабе о MongoDB. - "Руководство по ClickHouse"
Введение и подробное руководство по ClickHouse.