如今大数据技术的应用场景,对实时性的要求越来越高。作为新一代大数据流处理框架,Flink独树一帜,能够提供毫秒级别的延迟,同时保证了数据处理的低延迟、高吞吐和结果的正确性。 Flink已然成为各大公司实时领域的发力重点,以阿里为代表的一众大厂都在全力投入,众多国内企业为Flink社区贡献了大量源码。如今Flink已被认为是大数据实时处理的方向和未来,掌握Flink的人才炙手可热。 通尚硅谷精心打磨的Flink理论及项目实战视频教程,主要分为两部分:Flink基础理论与基于Flink的电商用户行为分析项目实战。第一部分Flink基础理论的讲解,涉及到各种重要概念、原理和API的用法,并配有大量的示例代码实现;第二部分以电商作为业务应用场景,以Flink作为分析框架,介绍一个电商用户行为分析项目的开发实战。 为了方便广大Java程序员上手学习,本套教程采用Java版API进行讲解和演示。通过理论和实际的紧密结合,让你对Flink和流式处理应用的场景、以及电商分析业务领域有更深刻的认识,通过对流处理原理的学习和与批处理架构的对比,帮你建立对大数据处理架构更全面的了解,为日后成长为架构师打下基础。
视频目录 001.尚硅谷_Flink理论-Flink简介(一)Flink是什么002.尚硅谷_Flink理论-Flink简介(二)为什么要用Flink003.尚硅谷_Flink理论-Flink简介(三)流数据处理的行业004.尚硅谷_Flink理论-Flink简介(四)流处理的发展演变005.尚硅谷_Flink理论-Flink简介(五)Flink的特点006.尚硅谷_Flink理论-Flink简介(六)Flink vs Spark Streaming007.尚硅谷_Flink理论-简单上手(一)批处理WordCount008.尚硅谷_Flink理论-简单上手(二)流处理WordCount009.尚硅谷_Flink理论-简单上手(三)流式数据源测试010.尚硅谷_Flink理论-Flink部署(一)Flink安装和配置011.尚硅谷_Flink理论-Flink部署(二)Job的提交运行012.尚硅谷_Flink理论-Flink部署(三)资源的分配和并行度测试013.尚硅谷_Flink理论-Flink部署(四)命令行提交Job014.尚硅谷_Flink理论-Flink部署(五)Yarn和K8s平台的Flink部署015.尚硅谷_Flink理论-运行时架构(一)Flink四大组件016.尚硅谷_Flink理论-运行时架构(二)作业提交流程_抽象架构017.尚硅谷_Flink理论-运行时架构(三)Yarn上作业提交流程018.尚硅谷_Flink理论-运行时架构(四)作业调度原理及思考问题019.尚硅谷_Flink理论-运行时架构(五)Slot和任务调度020.尚硅谷_Flink理论-运行时架构(六)Slot和并行度的关系021.尚硅谷_Flink理论-运行时架构(七)程序结构和数据流图022.尚硅谷_Flink理论-运行时架构(八)数据传输和任务链023.尚硅谷_Flink理论-流处理API_创建执行环境024.尚硅谷_Flink理论-流处理API_Source(一)从集合读取数据025.尚硅谷_Flink理论-流处理API_Source(二)从文件读取数据026.尚硅谷_Flink理论-流处理API_Source(三)从kafka读取数据027.尚硅谷_Flink理论-流处理API_Source(四)自定义测试数据源028.尚硅谷_Flink理论-流处理API_Transform(一)基本转换操作029.尚硅谷_Flink理论-流处理API_Transform(二)滚动聚合030.尚硅谷_Flink理论-流处理API_Transform(三)reduce聚合031.尚硅谷_Flink理论-流处理API_Transform(四)分流032.尚硅谷_Flink理论-流处理API_Transform(五)connect合流033.尚硅谷_Flink理论-流处理API_Transform(六)union合流034.尚硅谷_Flink理论-流处理API_Flink支持的数据类型035.尚硅谷_Flink理论-流处理API_Flink中的UDF函数类036.尚硅谷_Flink理论-流处理API_Flink中的数据重分区操作037.尚硅谷_Flink理论-流处理API_Sink(一)_Kafka038.尚硅谷_Flink理论-流处理API_Sink(二)_Redis039.尚硅谷_Flink理论-流处理API_Sink(三)_Es040.尚硅谷_Flink理论-流处理API_Sink(四)_JDBC041.尚硅谷_Flink理论-Window API(一)_基本概念042.尚硅谷_Flink理论-Window API(二)_窗口类型043.尚硅谷_Flink理论-Window API(三)_窗口分配器044.尚硅谷_Flink理论-Window API(四)_窗口函数(一)时间窗口u增量聚合045.尚硅谷_Flink理论-Window API(五)_窗口函数(二)时间窗口全窗口聚合046.尚硅谷_Flink理论-Window API(六)_窗口函数(三)计数窗口测试047.尚硅谷_Flink理论-Window API(七)_其它可选API048.尚硅谷_Flink理论-时间语义(一)_时间语义概念049.尚硅谷_Flink理论-时间语义(二)_时间语义的应用050.尚硅谷_Flink理论-时间语义(三)_事件时间语义的设置051.尚硅谷_Flink理论-Watermark(四)_Watermark概念和原理052.尚硅谷_Flink理论-Watermark(五)_Watermark特点和行为053.尚硅谷_Flink理论-Watermark(六)_Watermark在任务间的传递054.尚硅谷_Flink理论-Watermark(七)_Watermark在代码中的设置055.尚硅谷_Flink理论-Watermark(八)_Watermark的设定原则056.尚硅谷_Flink理论-事件时间语义下的窗口测试(一)057.尚硅谷_Flink理论-窗口起始点和偏移量058.尚硅谷_Flink理论-事件时间语义下的窗口测试(二)迟到数据处理059.尚硅谷_Flink理论-状态管理(一)状态定义060.尚硅谷_Flink理论-状态管理(二)算子状态061.尚硅谷_Flink理论-状态管理(三)键控状态062.尚硅谷_Flink理论-状态编程_温度跳变报警063.尚硅谷_Flink理论-并行任务Watermark传递测试064.尚硅谷_Flink理论-状态管理(四)状态后端065.尚硅谷_Flink理论-ProcessFunction(一)整体介绍和分类066.尚硅谷_Flink理论-ProcessFunction(二)KeyedProcessFunction测试067.尚硅谷_Flink理论-ProcessFunction(三)应用案例_一段时间内温度连续上升068.尚硅谷_Flink理论-ProcessFunction(四)应用案例_高低温分流069.尚硅谷_Flink理论-容错机制(一)检查点概念070.尚硅谷_Flink理论-容错机制(二)从检查点做故障恢复071.尚硅谷_Flink理论-容错机制(三)检查点算法思路和Barrier072.尚硅谷_Flink理论-容错机制(四)检查点具体算法073.尚硅谷_Flink理论-容错机制(五)保存点074.尚硅谷_Flink理论-容错机制(六)检查点和重启策略配置075.尚硅谷_Flink理论-状态一致性(一)一致性概念和分类076.尚硅谷_Flink理论-状态一致性(二)端到端状态一致性077.尚硅谷_Flink理论-状态一致性(三)幂等写入078.尚硅谷_Flink理论-状态一致性(四)事物写入_预写日志和两阶段提交079.尚硅谷_Flink理论-状态一致性(五)事物写入_Flink和Kafka连接保证状态一致性080.尚硅谷_Flink理论-Table API和Flink SQL(一)_基本介绍和简单示例081.尚硅谷_Flink理论-Table API和Flink SQL(二)_基本程序结构082.尚硅谷_Flink理论-Table API和Flink SQL(三)_表环境配置083.尚硅谷_Flink理论-Table API和Flink SQL(四)_创建表_从文件读取数据084.尚硅谷_Flink理论-Table API和Flink SQL(五)_表的查询085.尚硅谷_Flink理论-Table API和Flink SQL(六)_表的输出_输出到文件086.尚硅谷_Flink理论-Table API和Flink SQL(七)_Kafka数据管道测试087.尚硅谷_Flink理论-Table API和Flink SQL(八)_更新模式088.尚硅谷_Flink理论-Table API和Flink SQL(九)_输出到其它外部系统089.尚硅谷_Flink理论-Table API和Flink SQL(十)_表和流的转换090.尚硅谷_Flink理论-Table API和Flink SQL(十一)_动态表和持续查询091.尚硅谷_Flink理论-Table API和Flink SQL(十二)_处理时间特性092.尚硅谷_Flink理论-Table API和Flink SQL(十三)_事件时间特性093.尚硅谷_Flink理论-Table API和Flink SQL(十四)_分组窗口094.尚硅谷_Flink理论-Table API和Flink SQL(十五)_开窗函数095.尚硅谷_Flink理论-Table API和Flink SQL(十六)_系统内置函数096.尚硅谷_Flink理论-Table API和Flink SQL(十七)_标量函数097.尚硅谷_Flink理论-Table API和Flink SQL(十八)_表函数098.尚硅谷_Flink理论-Table API和Flink SQL(十九)_聚合函数099.尚硅谷_Flink理论-Table API和Flink SQL(二十)_表聚合函数100.尚硅谷_Flink项目-项目介绍(一)_批处理和流处理101.尚硅谷_Flink项目-项目介绍(二)_电商用户行为分析102.尚硅谷_Flink项目-项目介绍(三)_项目模块设计103.尚硅谷_Flink项目-项目介绍(四)_项目模块分析和实现思路104.尚硅谷_Flink项目-实时热门商品统计(一)_依赖引入和数据定义105.尚硅谷_Flink项目-实时热门商品统计(二)_开窗聚合106.尚硅谷_Flink项目-实时热门商品统计(三)_排序输出TopN107.尚硅谷_Flink项目-实时热门商品统计(四)_切换Kafka数据源108.尚硅谷_Flink项目-实时热门商品统计(五)_Kafka批量数据测试109.尚硅谷_Flink项目-实时热门商品统计(六)_Flink SQL实现110.尚硅谷_Flink项目-实时热门页面统计(一)_程序整体架构111.尚硅谷_Flink项目-实时热门页面统计(二)_代码具体实现112.尚硅谷_Flink项目-实时热门页面统计(三)_乱序数据测试113.尚硅谷_Flink项目-实时热门页面统计(四)_乱序数据处理代码改进114.尚硅谷_Flink项目-PV统计(一)_基本实现和测试115.尚硅谷_Flink项目-PV统计(二)_并行和数据倾斜优化116.尚硅谷_Flink项目-UV统计(一)_基于Set的去重117.尚硅谷_Flink项目-UV统计(二)_布隆过滤器原理118.尚硅谷_Flink项目-UV统计(三)_程序架构和自定义窗口触发器119.尚硅谷_Flink项目-UV统计(四)_自定义布隆过滤器120.尚硅谷_Flink项目-UV统计(五)_具体代码实现121.尚硅谷_Flink项目-市场推广渠道统计(一)_整体架构和自定义测试数据源122.尚硅谷_Flink项目-市场推广渠道统计(二)_具体代码实现123.尚硅谷_Flink项目-市场推广统计(三)_不分渠道代码实现124.尚硅谷_Flink项目-广告点击量统计(一)_基本代码实现125.尚硅谷_Flink项目-广告点击量统计(二)_点击异常行为黑名单过滤126.尚硅谷_Flink项目-恶意登录检测(一)_程序架构和实现思路127.尚硅谷_Flink项目-恶意登录检测(二)_简单代码实现128.尚硅谷_Flink项目-恶意登录检测(三)_代码时效性改进129.尚硅谷_Flink项目-恶意登录检测(四)_CEP代码实现130.尚硅谷_Flink项目-CEP简介(一)_CEP概念和Pattern API整体介绍131.尚硅谷_Flink项目-CEP简介(二)_个体模式和模式序列132.尚硅谷_Flink项目-CEP简介(三)_复杂事件的匹配检测133.尚硅谷_Flink项目-CEP简介(四)_连续登录失败检测用循环模式优化134.尚硅谷_Flink项目-订单超时检测(一)_CEP实现整体架构135.尚硅谷_Flink项目-订单超时检测(二)_CEP具体实现和测试136.尚硅谷_Flink项目-订单超时检测(三)_ProcessFunction实现思路和程序架构137.尚硅谷_Flink项目-订单超时检测(四)_ProcessFunction具体实现流程138.尚硅谷_Flink项目-订单支付实时对账(一)_实现思路和程序架构139.尚硅谷_Flink项目-订单支付实时对账(二)_具体代码实现140.尚硅谷_Flink项目-Join操作(一)_Window Join141.尚硅谷_Flink项目-Join操作(二)_Interval Join142.尚硅谷_Flink项目-订单支付实时对账(三)_Join实现