推荐-火龙果

工具

热点 | 建模 | 设计 | 开发 | 测试 | 运维 |
管理 | 需求 | 产品 | 架构 | 大数据 | AI |
过程 | 嵌入式 | 安全 | 课程 | 探索 | 汽车系统工程 | 界面 | 微服务 | 物联网 | 集成构建 |

提问

数据治理与数据资产管理

lpt 发布于 2019-10-15 浏览数：3290 点赞数：4

想学习数据治理中的数据管控如何落地实施的：元数据、数据质量、数据标准、数据安全与隐私管理、数据生命周期管理、数据架构与模型管理等

讲座：数据治理与数据资产管理—视频

政务数据资产管理之数据架构赏析

建设大数据平台，从“治理”数据谈起

孙东发布于 2019-11-21 浏览数：1017 点赞数：2

排序算法是《数据结构与算法》中最基本的算法之一。

PHP实现常用排序算法（含示意动图）

大数据思维

何枭发布于 2019-8-9 浏览数：1648 点赞数：2

相关资料

企业的一切皆需用大数据思维

文档：大数据处理技术与思维详解

文档：大数据时代的大数据思维

GraphX学习资料

牛诚发布于 2019-9-21 浏览数：2106 点赞数：2

Spark GraphX是一个分布式图处理框架，它是基于Spark平台提供对图计算和图挖掘简洁易用的而丰富的接口，极大的方便了对分布式图处理的需求。社交网络中人与人之间有很多关系链，例如Twitter、Facebook、微博和微信等，这些都是大数据产生的地方都需要图计算，现在的图处理基本都是分布式的图处理，而并非单机处理。Spark GraphX由于底层是基于Spark来处理的，所以天然就是一个分布式的图处理系统。

文档：GraphX 入门

文档：SparkGraphX

何秋林发布于 2019-9-22 浏览数：2170 点赞数：4

随着社交、电商、金融、零售、物联网等行业的快速发展，现实社会织起了了一张庞大而复杂的关系网，传统数据库很难处理关系运算。大数据行业需要处理的数据之间的关系随数据量呈几何级数增长，亟需一种支持海量复杂数据关系运算的数据库，图数据库应运而生。

越来越火的图数据库究竟是什么？

Neo4j图形数据库的好处-文档

文档：图数据库Neo4j架构实践

时序数据库

管海涛发布于 2019-9-22 浏览数：2201 点赞数：4

时序数据库（Time Series Database）是用于存储和管理时间序列数据的专业化数据库，为时间序列数据提供高性能读写和强计算能力的分布式云端数据库服务。时序数据库特别适用于物联网设备监控和数据分析，以及互联网业务监控场景。

时序数据库介绍和使用

深度解读！时序数据库HiTSDB：分布式流式聚合引擎

时序数据库OpenTSDB构建工业大数据存储平台

郭飞发布于 2019-9-29 浏览数：2260 点赞数：4

数据中台是指通过数据技术，对海量数据进行采集、计算、存储、加工，同时统一标准和口径。数据中台把数据统一之后，会形成标准数据，再进行存储，形成大数据资产层，进而为客户提供高效服务。

什么是数据中台?一文读懂数据中台

揭秘网易严选数据中台的建设之道

文库-某电商数据中台架构实践

MySQL DBA实战技能

孙云发布于 2019-10-24 浏览数：983 点赞数：2

MySQL数据库的体系结构、性能调优、高性能高可靠架构方案设计、常见故障处理，数据库的原理 MySQL 的架构设计

DBA很忙—MySQL的性能优化及自动化运维实践

图文MySQL 5.6 新特性 DBA 和开发人员指南

文档：MySQL高可架构设计方案

Kettle原理与应用

李旭发布于 2019-9-19 浏览数：2683 点赞数：2

学习Kettle

[图文]KETTLE基本知识培训

kettle工具使用文档

Kettle产品详细介绍

孙柯发布于 2019-9-9 浏览数：1997 点赞数：3

HDFS是一个高度容错性的系统，适合部署在廉价的机器上。HDFS能提供高吞吐量的数据访问，非常适合大规模数据集上的应用。HDFS放宽了一部分POSIX约束，来实现流式读取文件系统数据的目的。

HDFS核心技术详解

文档：HDFS入门解读

文档：HDFS应用场景、原理、基本架构及使用方法

flink相关学习资料

张子墨发布于 2019-10-14 浏览数：907 点赞数：1

Apache Flink - 图文 - 百度文库

Akka在Flink中的使用解析 – 过往记忆

Flink动态表的连续查询（Continuous Queries on Dynamic Tables）

pyhon数据清洗

周清月发布于 2019-8-23 浏览数：2556 点赞数：3

数据清洗是指发现并纠正数据文件中可识别的错误的最后一道程序，包括检查数据一致性，处理无效值和缺失值等。与问卷审核不同，录入后的数据清理一般是由计算机而不是人工完成。

Python数据清洗 - 洗什么？怎么洗？看完就明白了

python3常用的数据清洗方法

干货：用Python进行数据清洗，这7种方法你一定要掌握

俎涛发布于 2019-8-4 浏览数：2227 点赞数：3

MySQL各种存储引擎，索引的组织有何不同，如何提高查询效率。

MySQL索引底层实现原理

Mysql之索引介绍

MySQL索引原理以及查询优化

分析型数据库

小云发布于 2019-9-22 浏览数：997 点赞数：1

支持大数据分析的分析型数据库有哪些，都有什么特点和用途？

阿里云分析型数据库基本认识

阿里分析型数据库AnalyticDB入门

回首2018 | 分析型数据库AnalyticDB

基于Flink搭建流计算平台

周周发布于 2019-8-12 浏览数：2151 点赞数：2

Apache Flink 是一个框架和分布式处理引擎，用于在无边界和有边界数据流上进行有状态的计算。Flink 能在所有常见集群环境中运行，并能以内存速度和任意规模进行计算。

Flink的快速入门

flink开发实战之flink原理解析

基于Apache Flink的一站式实时计算平台

cansandra优化

zhgx 发布于 2019-8-14 浏览数：2264 点赞数：4

Cassandra是一套开源分布式NoSQL数据库系统。它最初由Facebook开发，用于储存收件箱等简单格式数据，集GoogleBigTable的数据模型与Amazon Dynamo的完全分布式的架构于一身Facebook于2008将 Cassandra

Cassandra NoSQL数据模型设计指南

Cassandra研究报告

cassandra百亿级数据库迁移实践

分布式存储与分布式计算

刘利发布于 2019-8-8 浏览数：2196 点赞数：3

解决方案、数据库设计、相关架构

20分钟看懂大数据分布式计算

Kafka的初步认识

浅谈分布式服务协调技术 Zookeeper

数据库原理

黄海涛发布于 2019-7-31 浏览数：2140 点赞数：4

数据库的基本原理。

一文看懂数据库原理

文档：数据库原理

文档：数据库原理及应用分析解析

互联网大数据与机器学习算法

郭靖峰发布于 2019-7-24 浏览数：2196 点赞数：4

随着智能时代（AI）的到来，数据量急剧增加，如何应用人工智能算法变得越来越有挑战，企业在规划和设计大数据和机器学习算法时，涉及到方方面面的知识点。

一文读懂机器学习，大数据/自然语言处理/算法全有了

利用已有的大数据技术，如何构建机器学习平台

大数据数据仓库建设

PostgreSQL教程

王珺发布于 2019-7-31 浏览数：2356 点赞数：4

PostgreSQL 的设计、使用和优化

PostgreSQL语法、连接

postgresql 性能优化

基于PostgreSQL的内存计算引擎，来自Lenovo的设计开发经验

当前第13页，共有17页，共有：332条记录

首页上一页下一页尾页