index Data Science¶ Big Data 数据密集型应用 流式系统 Database¶ Database Systems MySQL Redis SQL必知必会 数据仓库 Practical Data Science¶ Free text and natural language processing Intro Jupyter notebook Relational Data The data collection process Hadoop¶ Avro Flink Flume HBase Hadoop基础 Hive Kafka Sqoop YARN ZooKeeper 关于MapReduce 文件格式 Spark¶ 附录 1 简介 2 Structured API 3 Low-level APIs 4 Spark是如何在集群上运行的 5 Spark Streaming 6 MLlib 7 调优