标签所有文章

大数据离线项目实践之sdk数据收集

1年 之前

数据收集的方案 收集的方式:通过在客户端嵌入SDK的方式收集用户行为数据(SDK:一段收集数据的代码 […]

我拿到了阿里大牛(清华毕业生)总结的大数据学习路线+视频教程

1年 之前

一,题记 要说当下IT行业什么最火?ABC无出其右。所谓ABC者,AI + Big Data + C […]

阿里技术架构负责人内部总结:HDFS监控落地的思考

Hadoop分布式文件系统(HDFS)被设计成适合运行在通用硬件(commodity hardwar […]

大数据实时流计算平台Spark Streaming二次封装开源框架源码分享

源码获取请先转发,关注后私信:“spark” 即可免费获取 一个完善的Spark Streaming […]

京东实战案例:基于Alluxio优化大数据计算框架的容错性和灵活性

1年 之前

编者按:本文是由京东大数据团队撰写的关于Alluxio深度应用到京东大数据平台的实践案例。 京东(J […]

Hadoop干货丨阿里高级大数据工程师带你深入了解MapReduce、 HDFS

Hadoop被公认是一套行业大数据标准开源软件,在分布式环境下提供了海量数据的处理能力。几乎所有主流 […]

从概念、存储、处理、分析与应用来分析大数据技术原理与应用

1年 之前

本书介绍: 本书系统介绍了大数据的相关知识,分为大数据基础篇、大数据存储篇、大数据处理与分析篇、大数 […]

如何使用PySpark来利用机器学习模型对流数据进行预测?

1年 之前

全文共6787字,预计学习时长20分钟 来源:Pexels 概述 流数据是一个在机器学习领域蓬勃发展 […]

NoSQL:如何使用NoSQL架构构建实时广告系统

以下文章来源于京东零售技术 ,作者郑思城 链接:https://mp.weixin.qq.com/s […]

phoenix学习

1年 之前

Phoenix是构建在HBase之上的关系型数据库层,作为内嵌的客户端JDBC驱动用以对HBase中 […]

大数据之hive Serde序列化\/反序列化性能对比

1年 之前

java 中我们使用序列化和反序列化主要目的是将对象和字节序列进行相互转换。序列化的作用是什么呢?1 […]

Hadoop分布式文件系统:架构和设计

1年 之前

引言 Hadoop分布式文件系统(HDFS)被设计成适合运行在通用硬件(commodity hard […]

美图架构师详解:从0-1构建大数据平台,保证你没看过

如今大数据在各行业的应用越来越广泛:运营基于数据关注运营效果,产品基于数据分析关注转化率情况,开发基 […]