作为企业的应用核心,oracle数据性能和可用性是系统稳定的基础
pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。
利用Python的自然语言处理包,可以方便的进行语言识别和理解。
Spark是Apache的一个顶级项目,是一个快速、通用的大规模数据处理引擎。
数据治理是指从使用零散数据变为使用统一主数据、从具有很少或没有组织和流程治理到企业范围内的综合数据治理、从尝试处理主数据混乱状况到主数据井井有条的一个过程。
azkaban是一个开源的任务调度系统,用于负责任务的调度运行(如数据仓库调度),用以替代linux中的crontab。
学习数据库建模、sql优化相关知识
apache Flink是由Apache软件基金会开发的开源流处理框架,其核心是用Java和Scala编写的分布式流数据流引擎。
如何搭建大数据平台技术架构?有没有好的大数据平台架构案例
ZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务,是Google的Chubby一个开源的实现,是Hadoop和Hbase的重要组件。它是一个为分布式应用提供一致性服务的软件,提供的功能包括:配置维护、域名服务、分布式同步、组服务等。
在Oracle中如何定义自己的数据类型
详细介绍Oracle支持的各种数据类型,以及使用原则。
SQL语言共分为四大类:数据查询语言DQL,数据操纵语言DML,数据定义语言DDL,数据控制语言DCL。
存储过程优点是性能高,缺点是可移植性差,难以维护,应该怎么结合需求设计呢?
索引可以提高查询效率,但是也会造成update/insert/delete的操作重建索引带来的效率问题。
索引是否真的在最终的中起作用,会受 SQL的写法影响。
关系表的主键是非常重要的设计约束,如何设计才能保证唯一性、稳定性,并且高性能呢?
多些实例资料
希望全面介绍存储、运行、访问。
求 传感器以及相应的数据处理技术相关资料
表、列、索引、主键、外键....