类别

 
 

  求知 文章 文库 Lib 视频 iPerson 课程 认证 咨询 工具 讲座 Model Center   Code  
会员   
求知
 

                                   
 
 
数据科学家   张梓轩 发布于  2020-7-1  浏览数:1638  点赞数:1  

 数据科学家是指能采用科学方法、运用数据挖掘工具对复杂多量的数字、符号、文字、网址、音频或视频等信息进行数字化重现与认识,并能寻找新的数据洞察的工程师或专家(不同于统计学家或分析师)。一个优秀的数据科学家需要具备的素质有:懂数据采集、懂数学算法、懂数学软件、懂数据分析、懂预测分析、懂市场应用、懂决策分析等。

数据科学家需要掌握的10项统计技术,快来测一测吧     2020-8-7  可可   浏览 1471 
数据科学家最常用的十大机器学习算法     2020-8-7  可可   浏览 1453 
数据科学家必须要掌握的5种聚类算法     2020-8-7  可可   浏览 1388 
大数据平台CDH和Impala   赵明宇 发布于  2020-7-2  浏览数:2500  

 学习

impala的原理架构介绍及应用场景     2020-7-21  可可   浏览 1645 
Cloudera Manager(简称CM)+CDH构建大数据平台     2020-7-21  可可   浏览 1538 
Hadoop - 企业级大数据管理平台CDH(监控)     2020-7-21  可可   浏览 1504 
实时数仓   田蕾 发布于  2020-7-16  浏览数:2402  点赞数:1  

求 相关的学习资料

数据仓库介绍与实时数仓案例     2020-7-16  张凯   浏览 1443 
看完了这篇实时数仓建设,才发现以前的都白看了(内有美团案例)     2020-7-16  张凯   浏览 1417 
菜鸟实时数仓技术架构演进     2020-7-24  wy   浏览 1199 
如何构建大数据平台   郭瑶瑶 发布于  2020-7-2  浏览数:4018  

 学习

干货 · 如何搭建大数据分析平台?     2020-7-8  可可   浏览 1511 
如何创建一个大数据平台     2020-7-13  lpt   浏览 1306 
如何构建大数据层级体系,看这一文章就够了     2020-7-2  可可   浏览 1325 
元数据的建模和管理   蔡子明 发布于  2020-6-11  浏览数:4711  点赞数:1  

 元数据是用来描述数据的,对于数据架构的提炼,数据仓库的构建是非常重要的。

大数据流程模型和元数据管理-大数据治理概述     2020-7-7  可可   浏览 1264 
从元数据到元数据管理,这篇文章终于讲清楚了      2020-7-7  可可   浏览 1476 
元数据管理模块方案-文库     2020-7-7  可可   浏览 1508 
mysql事务   明月 发布于  2020-6-23  浏览数:2884  

 学习

深入学习MySQL事务:ACID特性的实现原理     2020-6-29  lpt   浏览 1111 
mysql事务实现原理     2020-6-29  lpt   浏览 1272 
MySQL的四种事务隔离级别     2020-6-29  wy   浏览 1188 
Apache Kylin大数据分析和机器   钟国军 发布于  2020-6-9  浏览数:2068  

Apache Kylin™是一个分布式分析引擎,提供基于Hadoop的SQL查询和多维分析(OLAP)查询能力,用于大规模数据集的快速查询分析Kylin的多维立方体(MOLAP Cube)、SQL分析查询、OLAP引擎设计、近在线分析,以及Kylin与Hadoop和BI工具的集成和其他工具的整合,可以实现对机器学习的支持。


Kylin大数据分析     2020-6-10  可可   浏览 1258 
Python + Apache Kylin 让数据分析更加简单!     2020-7-1  可可   浏览 1306 
效率提升 4 倍,Apache Kylin 在银联的实践     2020-7-1  可可   浏览 1376 
数据流相关资料   zhgx 发布于  2020-6-26  浏览数:871  

 学习

文档:基于数据流的大数据计算引擎     2020-7-6  lpt   浏览 850 
文档: 单页应用的数据流方案探索     2020-7-6  lpt   浏览 824 
文档:百度多媒体数据流服务     2020-7-6  lpt   浏览 827 
TF-IDF算法   云飞 发布于  2020-6-17  浏览数:829  

  TF-IDF(term frequency–inverse document frequency)是一种用于信息检索与数据挖掘的常用加权技术。

如何用TF-IDF算法提取文本中的关键词?     2020-6-17  wy   浏览 1038 
TF-IDF算法及应用     2020-6-17  wy   浏览 823 
SQL Server性能优化实战    孙鹏 发布于  2020-6-12  浏览数:900  

 学习

SQL Server的性能调优:解决查询速度慢的五种方法     2020-6-22  可可   浏览 903 
深入解析 SQL Server 高可用镜像实现原理      2020-6-15  可可   浏览 897 
文库:SQLServer2008R2-监视与调优解决方案     2020-6-12  可可   浏览 908 
Yarn架构   zhgx 发布于  2020-6-1  浏览数:3932  点赞数:1  

 Apache Hadoop YARN (Yet Another Resource Negotiator,另一种资源协调者)是一种新的 Hadoop 资源管理器,它是一个通用资源管理系统,可为上层应用提供统一的资源管理和调度,它的引入为集群在利用率、资源统一管理和数据共享等方面带来了巨大好处。

yarn入门——yarn的架构及作业调度     2020-6-1  lisa   浏览 1568  1次 
文档:MapReduce和YARN架构原理     2020-6-9  lpt   浏览 1412 
文档:Mapreduce原理和YARN     2020-6-9  lpt   浏览 1489 
图计算   刘伟 发布于  2020-6-9  浏览数:959  

 

图(Graph)是用于表示对象之间关联关系的一种抽象数据结构,使用顶点(Vertex)和边(Edge)进行描述:顶点表示对象,边表示对象之间的关系。可抽象成用图描述的数据即为图数据。图计算,便是以图作为数据模型来表达问题并予以解决的这一过程。以高效解决图计算问题为目标的系统软件称为图计算系统。
文档:图计算与Pregel     2020-6-9  wy   浏览 816 
Pregel(图计算)技术原理     2020-6-9  wy   浏览 964 
Spark(十七)图计算GraphX     2020-6-9  wy   浏览 953 
数据库升级和数据迁移   Karol 发布于  2020-5-28  浏览数:1014  

 学习

文档:将数据库迁移并整合到 Oracle Database 12c     2020-6-9  wy   浏览 1008 
文库-数据库升级与数据迁移实战分享     2020-6-2  可可   浏览 1285 
大数据迁移实践之路     2020-5-28  wy   浏览 875 
MPP架构大数据技术   李旭 发布于  2020-5-21  浏览数:773  
学习基于vertica的MPP大数据架构及应用
Hadoop、MPP技术介绍、对比与应用-文库     2020-6-5  可可   浏览 1035 
HadoopMPP技术介绍对比与应用-文库     2020-6-5  可可   浏览 780 
文档;Vertica 4.1架构概述     2020-5-28  wy   浏览 1278 
Presto资料   苑梦 发布于  2020-5-19  浏览数:832  

 Presto是一个facebook开源的分布式SQL查询引擎,适用于交互式分析查询,数据量支持GB到PB字节。

【实践案例分享】Presto 在有赞的实践之路     2020-6-10  可可   浏览 970 
presto 0.166概述     2020-6-10  jely   浏览 940 
Presto架构及原理     2020-5-20  wy   浏览 986 
Redis    郑萍 发布于  2020-4-9  浏览数:3572  

  Redis(Remote Dictionary Server ),即远程字典服务,是一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库,并提供多种语言的API。

文档: redis简要介绍     2020-4-16  lisa   浏览 1443 
文档:Redis介绍与内部实现机制     2020-4-10  Catherine   浏览 1472 
学Redis这篇就够了     2020-4-30  可可   浏览 1489 
数据库事务   黄嘉 发布于  2020-5-12  浏览数:774  

 数据库事务( transaction)是访问并可能操作各种数据项的一个数据库操作序列,这些操作要么全部执行,要么全部不执行,是一个不可分割的工作单位。事务由事务开始与事务结束之间执行的全部数据库操作组成。

数据库事务简介(一)--- 所谓事务     2020-7-1  可可   浏览 815 
文档:数据库原理 第5章 事务管理     2020-5-21  wy   浏览 1189 
文档:数据库保护之事务     2020-5-14  wy   浏览 1051 
kudu   张迪 发布于  2020-4-15  浏览数:3558  点赞数:1  

 Kudu是cloudera开源的运行在hadoop平台上的列式存储系统,拥有Hadoop生态系统应用的常见技术特性,运行在一般的商用硬件上,支持水平扩展,高可用。

Kudu设计原理初探     2020-4-24  可可   浏览 1438 
kudu 架构原理     2020-4-24  可可   浏览 1886 
Kudu:支持快速分析的新型Hadoop存储系统     2020-4-20  lisa   浏览 1395 
SparkSQL   金星月 发布于  2020-4-1  浏览数:3963  点赞数:1  

 Spark SQL是Spark用来处理结构化数据的一个模块,它提供了一个编程抽象叫做DataFrame并且作为分布式SQL查询引擎的作用

Spark计算引擎之SparkSQL详解     2020-4-20  可可   浏览 1784 
文档:基于SparkSQL的海量数据仓库设计与实践     2020-4-2  Joan   浏览 1430 
SparkSQL基础知识总结     2020-4-20  可可   浏览 1563 
数据资源管理   隋文宇 发布于  2020-2-13  浏览数:4811  点赞数:1  

 相关资料

大数据资产管理总体框架概述     2020-2-20  lc   浏览 1885  1次 
数据资产管理     2020-4-7  可可   浏览 1530 
火龙果讲座:数据治理与数据资产管理     2020-4-7  可可   浏览 1558 

当前第10页,共有16页,共有:312条记录     


 
公开课计划

QT应用开发 11-21[线上]
C++高级编程 11-27[北京]
LLM大模型应用与项目构建 12-26[特惠]
基于UML和EA进行系统分析设计 12-20[线上]
数据建模方法与工具 12-3[北京]
SysML建模专家 1-16[北京]
更多 ...
能力培养&认证 更多...

成功案例 更多...