Greenplum数据库是一种大规模并行处理(MPP)数据库服务器,其架构特别针对管理大规模分析型数据仓库以及商业智能工作负载而设计。
学习资料
如何开发一个可以在多个平台运行的软件
希望介绍一下各种MySQL存储引擎,尤其是 InnoDB
学习
InnoDB,是MySQL的数据库引擎之一,现为MySQL的默认存储引擎,为MySQL AB发布binary的标准之一。
Apache Zeppelin 是一个可以进行大数据可视化分析的交互式开发系统,可以承担数据接入、数据发现、数据分析、数据可视化、数据协作等任务,其前端提供丰富的可视化图形库,不限于SparkSQL,后端支持HBase、Flink 等大数据系统以插件扩展的方式,并支持Spark、Python、JDBC、Markdown、Shell 等各种常用Interpreter,这使得开发者可以方便地使用SQL 在 Zeppelin 中做数据开发。
资料
数据科学家是指能采用科学方法、运用数据挖掘工具对复杂多量的数字、符号、文字、网址、音频或视频等信息进行数字化重现与认识,并能寻找新的数据洞察的工程师或专家(不同于统计学家或分析师)。一个优秀的数据科学家需要具备的素质有:懂数据采集、懂数学算法、懂数学软件、懂数据分析、懂预测分析、懂市场应用、懂决策分析等。
求 相关的学习资料
元数据是用来描述数据的,对于数据架构的提炼,数据仓库的构建是非常重要的。
Apache Kylin™是一个分布式分析引擎,提供基于Hadoop的SQL查询和多维分析(OLAP)查询能力,用于大规模数据集的快速查询分析Kylin的多维立方体(MOLAP Cube)、SQL分析查询、OLAP引擎设计、近在线分析,以及Kylin与Hadoop和BI工具的集成和其他工具的整合,可以实现对机器学习的支持。