热点  |  建模  |  设计  |  开发  |  测试  |  运维  |
  管理  |  需求  |  产品  |  架构  |  大数据  |  AI  |
  过程  |  嵌入式  |  安全  |  课程  |  探索  |  汽车系统工程  |
提问  
 
Kettle原理与应用
李旭 发布于  2019-9-19  浏览数:2547  

 学习Kettle

[图文]KETTLE基本知识培训    
kettle工具使用文档    
Kettle产品详细介绍    
 
HDFS
孙柯 发布于  2019-9-9  浏览数:1831  点赞数:1  

 HDFS是一个高度容错性的系统,适合部署在廉价的机器上。HDFS能提供高吞吐量的数据访问,非常适合大规模数据集上的应用。HDFS放宽了一部分POSIX约束,来实现流式读取文件系统数据的目的。

HDFS核心技术详解    
文档:HDFS入门解读    
文档:HDFS应用场景、原理、基本架构及使用方法    
 
pyhon数据清洗
周清月 发布于  2019-8-23  浏览数:2375  点赞数:1  

数据清洗是指发现并纠正数据文件中可识别的错误的最后一道程序,包括检查数据一致性,处理无效值和缺失值等。与问卷审核不同,录入后的数据清理一般是由计算机而不是人工完成。 

Python数据清洗 - 洗什么?怎么洗?看完就明白了    
python3常用的数据清洗方法    
干货:用Python进行数据清洗,这7种方法你一定要掌握    
 
MySQL的索引
俎涛 发布于  2019-8-4  浏览数:2092  点赞数:1  

 MySQL各种存储引擎,索引的组织有何不同,如何提高查询效率。

MySQL索引底层实现原理     
Mysql之索引介绍    
MySQL索引原理以及查询优化    
 
分析型数据库
小云 发布于  2019-9-22  浏览数:924  

 支持大数据分析的分析型数据库有哪些,都有什么特点和用途?

阿里云分析型数据库基本认识    
阿里分析型数据库AnalyticDB入门    
回首2018 | 分析型数据库AnalyticDB    
 
基于Flink搭建流计算平台
周周 发布于  2019-8-12  浏览数:2006  

Apache Flink 是一个框架和分布式处理引擎,用于在无边界和有边界数据流上进行有状态的计算。Flink 能在所有常见集群环境中运行,并能以内存速度和任意规模进行计算。

Flink的快速入门    
flink开发实战之flink原理解析    
基于Apache Flink的一站式实时计算平台    
 
cansandra优化
zhgx 发布于  2019-8-14  浏览数:2080  点赞数:2  

Cassandra是一套开源分布式NoSQL数据库系统。它最初由Facebook开发,用于储存收件箱等简单格式数据,集GoogleBigTable的数据模型与Amazon Dynamo的完全分布式的架构于一身Facebook2008 Cassandra

Cassandra NoSQL数据模型设计指南    
Cassandra研究报告    
cassandra百亿级数据库迁移实践    
 
分布式存储与分布式计算
刘利 发布于  2019-8-8  浏览数:2056  点赞数:1  

解决方案、数据库设计、相关架构

20分钟看懂大数据分布式计算    
Kafka的初步认识    
浅谈分布式服务协调技术 Zookeeper    
 
数据库原理
黄海涛 发布于  2019-7-31  浏览数:1973  点赞数:2  

 数据库的基本原理。

一文看懂数据库原理    
文档:数据库原理    
文档:数据库原理及应用分析解析    
 
互联网大数据与机器学习算法
郭靖峰 发布于  2019-7-24  浏览数:2050  点赞数:2  

 随着智能时代(AI)的到来,数据量急剧增加,如何应用人工智能算法变得越来越有挑战,企业在规划和设计大数据和机器学习算法时,涉及到方方面面的知识点。

一文读懂机器学习,大数据/自然语言处理/算法全有了    
利用已有的大数据技术,如何构建机器学习平台     
大数据数据仓库建设    
 
PostgreSQL教程
王珺 发布于  2019-7-31  浏览数:2176  点赞数:2  

 PostgreSQL 的设计、使用和优化

PostgreSQL语法、连接    
postgresql 性能优化    
基于PostgreSQL的内存计算引擎,来自Lenovo的设计开发经验    
 
MySQL存储引擎InnDB原理解析
井冈山 发布于  2019-7-31  浏览数:2070  点赞数:2  

InnoDB作为MySQL的主流存储引擎,具有事务管理、外键、行级锁、跨表空间存储等众多很有用的特性,是深入了解MySQL的关键技术。

MySQL存储引擎对比    
一篇文章带你读懂MySQL和InnoDB    
InnoDB存储结构    
 
MySQL InnoDB特性:两次写(D
程里 发布于  2019-8-4  浏览数:775  

 为了避免宕机带来的数据丢失,MySQL提供 double write机制

详解MySQL两次写的设计及实现    
InnoDB的关键特性-插入缓存,两次写,自适应hash索引详解    
mysql-innodb关键特性    
 
基于python的spark大数据处理技
王鹏 发布于  2019-8-5  浏览数:1025  

 python是数据分析常用语言之一,而Apache spark是一个开源强大的分布式查询和处理引擎

如何将Spark与Python结合?    
Python学习笔记——大数据之Spark简介与环境搭建    
Python学习笔记——大数据之SPARK核心    
 
MySQL分区表
俎涛 发布于  2019-8-4  浏览数:812  

 如果通过对表分区,管理大数据量的表

[图文]Mysql主从与分区技术    
文档:MySQL分区表    
MySQL分区表    
 
PostgreSQL源码解读
邓辉 发布于  2019-7-31  浏览数:1028  

 了解一个数据库最好的方法就是读读它的内核源码

PostgreSQL源码结构    
PostgreSQL Source Code: Main Page    
 
MySQL源码解读
钱飞扬 发布于  2019-7-31  浏览数:867  

了解MySQL的原理,通过源码是一个好方法。

MySQL内核源码解读-    
 
互联网业务数据分析
刘浩 发布于  2019-7-31  浏览数:805  

数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。这一过程也是质量管理体系的支持过程。在实用中,数据分析可帮助人们作出判断,以便采取适当行动。

常用的数据分析方法 - 图文 - 百度文库    
 
如何实现一个自己的数据库
山铭 发布于  2019-7-31  浏览数:856  

 数据库系统是一个完备的数据存储和管理系统,如果能够自己开发一个数据库,对理解数据库架构会大有好处。


当前第13页,共有17页,共有:325条记录