类别

 
 

 
  求知 文章 文库 Lib 视频 iProcess 课程 认证 咨询 工具 讲座 Modeler   Code  
会员   
求知
 


                                   
 
 
HDFS   孙柯 发布于  2019-9-9  浏览数:142  点赞数:1  

 HDFS是一个高度容错性的系统,适合部署在廉价的机器上。HDFS能提供高吞吐量的数据访问,非常适合大规模数据集上的应用。HDFS放宽了一部分POSIX约束,来实现流式读取文件系统数据的目的。

HDFS核心技术详解     2019-9-11  lc   浏览 21  1次 
文档:HDFS入门解读     2019-9-10  lpt   浏览 13  1次 
文档:HDFS应用场景、原理、基本架构及使用方法     2019-9-10  lpt   浏览 10 
数据治理与数据资产管理   lpt 发布于  2019-10-15  浏览数:25  

想学习数据治理中的数据管控如何落地实施的:元数据、数据质量、数据标准、数据安全与隐私管理、数据生命周期管理、数据架构与模型管理等

文档:大数据平台下的数据治理     2019-10-15  琳琳   浏览 2 
文档:数据管控解决方案     2019-10-15  lpt   浏览 1 
flink相关学习资料   张子墨 发布于  2019-10-14  浏览数:23  

 

[图文]Apache Flink API runtime, and project roadmap - 百度文库     2019-10-14  张子墨   
Apache Flink - 图文 - 百度文库     2019-10-14  张子墨   
pyhon数据清洗   周清月 发布于  2019-8-23  浏览数:409  点赞数:1  

数据清洗是指发现并纠正数据文件中可识别的错误的最后一道程序,包括检查数据一致性,处理无效值和缺失值等。与问卷审核不同,录入后的数据清理一般是由计算机而不是人工完成。 

Python数据清洗 - 洗什么?怎么洗?看完就明白了     2019-8-26  刘利   浏览 89 
python3常用的数据清洗方法     2019-8-26  刘利   浏览 50 
干货:用Python进行数据清洗,这7种方法你一定要掌握     2019-8-26  刘利   浏览 44 
TiDb   jely 发布于  2019-10-11  浏览数:18  

TiDB 是一个分布式 NewSQL 数据库。它支持水平弹性扩展、ACID 事务、标准 SQL、MySQL 语法和 MySQL 协议,具有数据强一致的高可用特性,是一个不仅适合 OLTP 场景还适合 OLAP 场景的混合数据库。

文档:TiDB原理与实战     2019-10-11  微微   浏览 3 
文档:TiDB架构与开源之路     2019-10-11  wy   浏览 1 
文档:使用 TiDB 进行实时数据分析      2019-10-11  wy   浏览 1 
NewSQL   刘利 发布于  2019-10-11  浏览数:20  

 NewSQL 是对各种新的可扩展/高性能数据库的简称,这类数据库不仅具有NoSQL对海量数据的存储管理能力,还保持了传统数据库支持ACID和SQL等特性。

文档:百度 NewSQL数据库系统     2019-10-11  微微   浏览 1 
数据中台   郭飞 发布于  2019-9-29  浏览数:19  

 数据中台是指通过数据技术,对海量数据进行采集、计算、存储、加工,同时统一标准和口径。数据中台把数据统一之后,会形成标准数据,再进行存储,形成大数据资产层,进而为客户提供高效服务。

民生银行数据中台体系的构建与实践-亿欧     2019-10-8  可可   浏览 2 
读透《阿里巴巴数据中台实践》,其到底有什么高明之处?     2019-10-8  可可   
数据中台之结构化大数据存储设计 - 图文     2019-9-29  可可   浏览 4 
MySQL的索引   俎涛 发布于  2019-8-4  浏览数:382  点赞数:1  

 MySQL各种存储引擎,索引的组织有何不同,如何提高查询效率。

MySQL索引底层实现原理      2019-8-4  俎涛   浏览 76  1次 
Mysql之索引介绍     2019-8-4  俎涛   浏览 98  1次 
MySQL索引原理以及查询优化     2019-9-11  lisa   浏览 53  1次 
分析型数据库   小云 发布于  2019-9-22  浏览数:26  

 支持大数据分析的分析型数据库有哪些,都有什么特点和用途?

【图文】马如悦-Palo分析型数据库在百度内的应用实践     2019-9-24  刘利   浏览 4 
Palo:百度面向分析的大规模数据库系统-马如悦     2019-9-24  流式   浏览 4 
图数据库   何秋林 发布于  2019-9-22  浏览数:13  

 随着社交、电商、金融、零售、物联网等行业的快速发展,现实社会织起了了一张庞大而复杂的关系网,传统数据库很难处理关系运算。大数据行业需要处理的数据之间的关系随数据量呈几何级数增长,亟需一种支持海量复杂数据关系运算的数据库,图数据库应运而生。

文档:图数据库Neo4j架构实践     2019-9-29  李睿   浏览 1 
使用图形数据库模型数据     2019-9-22  左超   浏览 2 
图形数据库Neo4j基本了解     2019-9-22  左超   浏览 1 
时序数据库   管海涛 发布于  2019-9-22  浏览数:12  

 时序数据库(Time Series Database)是用于存储和管理时间序列数据的专业化数据库,为时间序列数据提供高性能读写和强计算能力的分布式云端数据库服务。时序数据库特别适用于物联网设备监控和数据分析,以及互联网业务监控场景。

深度解读!时序数据库HiTSDB:分布式流式聚合引擎     2019-9-25  wy   浏览 2 
时序数据库OpenTSDB构建工业大数据存储平台     2019-9-25  wy   浏览 1 
腾讯唯一时序数据库:CTSDB 解密     2019-9-22  左超   浏览 1 
GraphX学习资料   牛诚 发布于  2019-9-21  浏览数:20  

 Spark GraphX是一个分布式图处理框架,它是基于Spark平台提供对图计算和图挖掘简洁易用的而丰富的接口,极大的方便了对分布式图处理的需求。社交网络中人与人之间有很多关系链,例如Twitter、Facebook、微博和微信等,这些都是大数据产生的地方都需要图计算,现在的图处理基本都是分布式的图处理,而并非单机处理。Spark GraphX由于底层是基于Spark来处理的,所以天然就是一个分布式的图处理系统。


基于Spark Graphx+Neo4j实现用户社群发现     2019-9-23  刘浩   浏览 1 
Spark GraphX 对图进行可视化     2019-9-23  刘浩   浏览 1 
文档:07GraphX 入门     2019-9-23  wy   浏览 1 
Kettle原理与应用   李旭 发布于  2019-9-19  浏览数:27  

 学习Kettle

Kettle转换中的Java代码步骤应用入门与实战     2019-9-20  wy   浏览 3 
kettle工具使用文档     2019-9-20  lc   浏览 3 
kettle入门例子大全 - 图文     2019-9-20  lc   浏览 2 
基于Flink搭建流计算平台   周周 发布于  2019-8-12  浏览数:259  

Apache Flink 是一个框架和分布式处理引擎,用于在无边界和有边界数据流上进行有状态的计算。Flink 能在所有常见集群环境中运行,并能以内存速度和任意规模进行计算。

Flink的快速入门     2019-9-17  可可   浏览 72 
flink开发实战之flink原理解析     2019-9-17  可可   浏览 40 
基于Apache Flink的一站式实时计算平台     2019-8-15  lpt   浏览 34 
cansandra优化   zhgx 发布于  2019-8-14  浏览数:275  点赞数:2  

Cassandra是一套开源分布式NoSQL数据库系统。它最初由Facebook开发,用于储存收件箱等简单格式数据,集GoogleBigTable的数据模型与Amazon Dynamo的完全分布式的架构于一身Facebook2008 Cassandra

Cassandra NoSQL数据模型设计指南     2019-8-14  lisa   浏览 37  1次 
Cassandra研究报告     2019-8-14  lisa   浏览 38  1次 
cassandra百亿级数据库迁移实践     2019-8-14  lisa   浏览 35  1次 
分布式存储与分布式计算   刘利 发布于  2019-8-8  浏览数:415  点赞数:1  

解决方案、数据库设计、相关架构

20分钟看懂大数据分布式计算     2019-9-5  谢素燕   浏览 92  1次 
Kafka的初步认识     2019-9-5  可可   浏览 43  1次 
浅谈分布式服务协调技术 Zookeeper     2019-9-5  可可   浏览 45  1次 
数据库原理   黄海涛 发布于  2019-7-31  浏览数:463  点赞数:2  

 数据库的基本原理。

一文看懂数据库原理     2019-8-8  可可   浏览 214  2次 
文档:数据库原理     2019-8-1  lpt   浏览 89  2次 
文档:数据库原理及应用分析解析     2019-8-1  lpt   浏览 89  2次 
互联网大数据与机器学习算法   郭靖峰 发布于  2019-7-24  浏览数:276  点赞数:2  

 随着智能时代(AI)的到来,数据量急剧增加,如何应用人工智能算法变得越来越有挑战,企业在规划和设计大数据和机器学习算法时,涉及到方方面面的知识点。

一文读懂机器学习,大数据/自然语言处理/算法全有了     2019-8-20  昵称   浏览 69  1次 
利用已有的大数据技术,如何构建机器学习平台      2019-8-20  可可   浏览 50  1次 
大数据数据仓库建设     2019-7-31  刘旻浩   浏览 73  2次 
PostgreSQL教程   王珺 发布于  2019-7-31  浏览数:329  点赞数:2  

 PostgreSQL 的设计、使用和优化

PostgreSQL语法、连接     2019-7-31  刘利   浏览 76  3次 
postgresql 性能优化     2019-8-19  可可   浏览 69  2次 
基于PostgreSQL的内存计算引擎,来自Lenovo的设计开发经验     2019-8-22  可可   浏览 56 
MySQL存储引擎InnDB原理解析   井冈山 发布于  2019-7-31  浏览数:312  点赞数:2  

InnoDB作为MySQL的主流存储引擎,具有事务管理、外键、行级锁、跨表空间存储等众多很有用的特性,是深入了解MySQL的关键技术。

MySQL存储引擎对比     2019-7-31  吴友鹏   浏览 81  1次 
一篇文章带你读懂MySQL和InnoDB     2019-7-31  吴军   浏览 64  1次 
InnoDB存储结构     2019-7-31  吴军   浏览 68  1次 

当前第1页,共有5页,共有:93条记录     
首页 上一页 下一页 尾页     


 
公开课计划

基于Kubernetes的DevOps实践 10-22[北京]
需求分析管理 11-5[北京]
软件开发过程中的质量管理实践 11-16[北京]
人工智能,机器学习和深度学习 11-26 [北京]
业务架构到IT架构(TOGAF9.2认证)11-28[北京]
企业级全栈自动化测试技术 10-16 [上海]
大数据平台架构与应用实战 11-8[上海]
Python及数据分析 11-25 [深圳]
更多...
能力培养&认证 更多...

成功案例 更多...


每天2个文档/视频
扫描微信二维码订阅
订阅技术月刊
获得每月300个技术资源
 
希望我们的资料可以帮助你学习,也欢迎投稿&提建议给我
频道编辑:winner
邮       件:winner@uml.net.cn

关于我们 | 联系我们 | 京ICP备10020922号 京公海网安备110108001071号