类别

 
 

  求知 文章 文库 Lib 视频 iPerson 课程 认证 咨询 工具 讲座 Modeler   Code  
会员   
求知
 

                                   
 
 
大数据平台CDH和Impala   赵明宇 发布于  2020-7-2  浏览数:9  

 学习

文档:基于 Impala 构建实时用户行为分析引擎     2020-7-3  wy   浏览 3 
如何构建大数据平台   郭瑶瑶 发布于  2020-7-2  浏览数:9  

 学习

文档:企业大数据平台建设方案     2020-7-3  wy   浏览 2 
如何构建大数据层级体系,看这一文章就够了     2020-7-2  可可   浏览 2 
数据科学家   张梓轩 发布于  2020-7-1  浏览数:22  

 数据科学家是指能采用科学方法、运用数据挖掘工具对复杂多量的数字、符号、文字、网址、音频或视频等信息进行数字化重现与认识,并能寻找新的数据洞察的工程师或专家(不同于统计学家或分析师)。一个优秀的数据科学家需要具备的素质有:懂数据采集、懂数学算法、懂数学软件、懂数据分析、懂预测分析、懂市场应用、懂Apache Kylin™是一个分布式分析引擎,提供基于Hadoop的SQL查询和多维分析(OLAP)查询能力,用于大规模数据集的快速查询分析Kylin的多维立方体(MOLAP Cube)、SQL分析查询、OLAP引擎设计、近在线分析,以及Kylin与Hadoop和BI工具的集成和其他工具的整合,可以实现对机器学习的支持。


Python + Apache Kylin 让数据分析更加简单!     2020-7-1  可可   浏览 4 
效率提升 4 倍,Apache Kylin 在银联的实践     2020-7-1  可可   浏览 4 
【案例分享】Apache Kylin在美团点评的应用     2020-6-15  lpt   浏览 18 
Yarn架构   zhgx 发布于  2020-6-1  浏览数:262  点赞数:1  

 Apache Hadoop YARN (Yet Another Resource Negotiator,另一种资源协调者)是一种新的 Hadoop 资源管理器,它是一个通用资源管理系统,可为上层应用提供统一的资源管理和调度,它的引入为集群在利用率、资源统一管理和数据共享等方面带来了巨大好处。

yarn入门——yarn的架构及作业调度     2020-6-1  lisa   浏览 70  1次 
文档:MapReduce和YARN架构原理     2020-6-9  lpt   浏览 58 
文档:Mapreduce原理和YARN     2020-6-9  lpt   浏览 61 
图计算   刘伟 发布于  2020-6-9  浏览数:36  

 

图(Graph)是用于表示对象之间关联关系的一种抽象数据结构,使用顶点(Vertex)和边(Edge)进行描述:顶点表示对象,边表示对象之间的关系。可抽象成用图描述的数据即为图数据。图计算,便是以图作为数据模型来表达问题并予以解决的这一过程。以高效解决图计算问题为目标的系统软件称为图计算系统。
文档:图计算与Pregel     2020-6-9  wy   浏览 21 
Pregel(图计算)技术原理     2020-6-9  wy   浏览 20 
Spark(十七)图计算GraphX     2020-6-9  wy   浏览 21 
数据库升级和数据迁移   Karol 发布于  2020-5-28  浏览数:43  

 学习

文档:将数据库迁移并整合到 Oracle Database 12c     2020-6-9  wy   浏览 17 
文库-数据库升级与数据迁移实战分享     2020-6-2  可可   浏览 9 
大数据迁移实践之路     2020-5-28  wy   浏览 21 
MPP架构大数据技术   李旭 发布于  2020-5-21  浏览数:49  
学习基于vertica的MPP大数据架构及应用
Hadoop、MPP技术介绍、对比与应用-文库     2020-6-5  可可   浏览 6 
HadoopMPP技术介绍对比与应用-文库     2020-6-5  可可   浏览 21 
文档;Vertica 4.1架构概述     2020-5-28  wy   浏览 23 
Presto资料   苑梦 发布于  2020-5-19  浏览数:58  

 Presto是一个facebook开源的分布式SQL查询引擎,适用于交互式分析查询,数据量支持GB到PB字节。

【实践案例分享】Presto 在有赞的实践之路     2020-6-10  可可   浏览 24 
presto 0.166概述     2020-6-10  jely   浏览 23 
Presto架构及原理     2020-5-20  wy   浏览 28 
Redis    郑萍 发布于  2020-4-9  浏览数:293  

  Redis(Remote Dictionary Server ),即远程字典服务,是一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库,并提供多种语言的API。

文档: redis简要介绍     2020-4-16  lisa   浏览 74 
文档:Redis介绍与内部实现机制     2020-4-10  Catherine   浏览 62 
学Redis这篇就够了     2020-4-30  可可   浏览 89 
数据库事务   黄嘉 发布于  2020-5-12  浏览数:60  

 数据库事务( transaction)是访问并可能操作各种数据项的一个数据库操作序列,这些操作要么全部执行,要么全部不执行,是一个不可分割的工作单位。事务由事务开始与事务结束之间执行的全部数据库操作组成。

数据库事务简介(一)--- 所谓事务     2020-7-1  可可   浏览 2 
文档:数据库原理 第5章 事务管理     2020-5-21  wy   浏览 26 
文档:数据库保护之事务     2020-5-14  wy   浏览 28 
kudu   张迪 发布于  2020-4-15  浏览数:269  点赞数:1  

 Kudu是cloudera开源的运行在hadoop平台上的列式存储系统,拥有Hadoop生态系统应用的常见技术特性,运行在一般的商用硬件上,支持水平扩展,高可用。

Kudu设计原理初探     2020-4-24  可可   浏览 80 
kudu 架构原理     2020-4-24  可可   浏览 63 
Kudu:支持快速分析的新型Hadoop存储系统     2020-4-20  lisa   浏览 68 
SparkSQL   金星月 发布于  2020-4-1  浏览数:324  点赞数:1  

 Spark SQL是Spark用来处理结构化数据的一个模块,它提供了一个编程抽象叫做DataFrame并且作为分布式SQL查询引擎的作用

Spark计算引擎之SparkSQL详解     2020-4-20  可可   浏览 103 
文档:基于SparkSQL的海量数据仓库设计与实践     2020-4-2  Joan   浏览 71 
SparkSQL基础知识总结     2020-4-20  可可   浏览 101 
数据资源管理   隋文宇 发布于  2020-2-13  浏览数:565  点赞数:1  

 相关资料

大数据资产管理总体框架概述     2020-2-20  lc   浏览 154  1次 
数据资产管理     2020-4-7  可可   浏览 110 
火龙果讲座:数据治理与数据资产管理     2020-4-7  可可   浏览 125 
OpenCV相关资料   lisa 发布于  2020-2-11  浏览数:506  

 OpenCV是一个基于BSD许可(开源)发行的跨平台计算机视觉库,可以运行在Linux、Windows、Android和Mac OS操作系统上。它轻量级而且高效——由一系列 C 函数和少量 C++ 类构成,同时提供了Python、Ruby、MATLAB等语言的接口,实现了图像处理和计算机视觉方面的很多通用算法。

文档:OpenCV_简介     2020-2-11  lisa   浏览 137  1次 
OpenCV 中的图像处理 部分 IV (一)     2020-2-13  可可   浏览 113  1次 
OpenCV 中的图像处理 部分 IV (二)     2020-2-13  可可   浏览 112 

当前第1页,共有7页,共有:131条记录     
首页 上一页 下一页 尾页     


 
公开课计划

使用Vue.jS构建web应用实战 7-10[在线]
大数据平台搭建与高性能计算 7-24[在线]
python与selenium进行web测试 7-24[在线]
云计算、微服务与分布式架构 7-25[在线]
软件架构设计方法、案例与实践 7-30[在线]
业务视角的测试分析与设计 8-1[在线]
MBSE(基于模型的系统工程) 8-8[在线]
重构复杂遗留系统的最佳实践 8-21[在线]
更多 ...
能力培养&认证 更多...

成功案例 更多...