Flink入门教程.docx
《Flink入门教程.docx》由会员分享,可在线阅读,更多相关《Flink入门教程.docx(9页珍藏版)》请在第一文库网上搜索。
1、Fl ink入门教程不得不说,Flink这两年是真的火Flink入门时一些可能看不太懂的点又或是看官方介绍看不太懂的点(API我就不细说了,多用用应该都能看懂)。什么是Flink?在Flink的官网上,可以把官方文档语言设置为中文,于是我们可以看到官方是这样介绍的:hpiinkApache Rink IMt么?Sffl运HWhat is SUUful Functions?应用场爆Fllnk用户下我文移,快取常助Rink博育flink-packags.org (S社区&项目信息开发计划妁何参与贯”Rink on GatHub (5EngltahttApacheFImk (gApache Flin
2、k 是什么?架构应用运维AwcbeHf*是一个梃饕町分花式处理引,用于荏无边界和背边尸数根以上进行。状等:的计1, %*能在所宿常见保环境中运行,并能以内存速度和任意政校进行计一.WT,筱们来介绍一下Rnk架构中的要方面.处理无界和有界数据任何类型的BU81B可以彭成一怜事件波信用卡交易、传息H3ML机B日志、网出诙移动应网程等上的用户交互记录,所有这至K霭都形成一和流.教枢可以赛作为无界或古药界究来处理.1无界流有定义31的开的,但没有定义观的结束.它们会无休止产生数抠,无界近的致握必友捋康处理,即致怒版密取后餐费立一处爬fPF”*既赛赛达科处因为人是无的.在任何时,人不会完版.处无界K1R
3、3I常9!求以特定版学18电事佐.积知件发生的序.以便瓶够推断纺果的完整性.2.有乃漳有定义流的开的,也有定义配的嬉我.。界潭可以在雁取所有数局后再遂行计.。界流所皆炉稔可以8博序,所以并不鳖厉序微取.有界篁处理通案被称为就处理 bcaiA(M iveem 一 tound , .1盯run而i所打,翻而 a i: trouMd stream ”:,心-wded,1 Apache Flink擅长处*无界和胃界数鹰集悄心的时何控与和状并化使得门小的运行时(ruMime)费够运行任何处理无界流的应用.可界流剥由一钙专力88室大小15%集精覆设计的算法对跳据空检讨行内8Mie.产生了出色的件胡通过探索
4、F:mk之上构建的用到柬加深理第.部署应用到任意地方Apache FW*K 个分布式黑皖.它篇!(计II资方来求行应用程库.Fbnk集成了所。零见的夏翼灵沿管/薪.例MHadecpYAAN、Apache Mesos 10 Kubemotee,但同时t3可以作为!9立集群运行.%*被设计为跳第很好堆工作在上述细个费*E理H中,这是通过费法管理修将定(foufce-manager.ae*ic)的部事模式实现的.Fir*可以采用与当前法源管理日招适改的方式送行交互.部司白破应用程序时.月,改会根挺应用桎序配置的并行性启动标识所需的资谡,并从贾延管理行谪求这些资源.在发生故口的情况T. FW*通过调求
5、新资JP*髯援发生故那的容HI. 点交我控制应用用停的所有遢信B是激过REST调用遂行的,达可以篇化Fink 5各龄环境中的筌成.上面的图我们每个字都能看得懂,但连起来就看不懂了。不管怎么样,我们可以了解到:Flink是一个分布式的计算处理引擎分布式:它的存储或者计算交由多台服务器上完成,最后汇总起来达到最终的效果。实时:处理速度是毫秒级或者秒级的计算:可以简单理解为对数据进行处理.,比如清洗数据(对数据进行规整,取出有用的数据)MySQLRedisHBaseKafka基于官网的一句话介绍,我们就可以联想出很多东西。这篇文章可以带你简单认识一下Flink的一些基础概念,等你真正用到的时候就可以
6、依据这篇文章来对Elink进行入门,现在Storm都被很多人给抛弃掉了,那么Flink优于Storm的地方有哪些呢?接下来我们一起来看看Fl ink吧。什么是有边界和无边界?Apache Fl ink是一个框架和分布式处理引擎,亮弋在无边界和有边界数据流上进行有状态的计算。官方其实也有介绍,但对初学者来说不太好理解,我来幼儿园化一卜,大家学到Flink 了,消息队列肯定有用过吧?那你们是怎么用消息队列的呢?Producer生产数据,发给Broker, Consumer消费,完事。在消费的时候,我们需要管什么Producer什么时候发消息吗?不需耍吧。反正来一条,我就处理一条,没毛病吧。这种没有
7、做任何处理的消息,默认就是无边界的。那有边界就很好理解了:无边界的基础卜.加上条件,那就是有边界的。加什么条件呢?比如我要加个时间:我要消费从8月8号至IJ8月9号的数据,那就是有边界的。有边界什么时候用无边界,什么时候用有边界?那也很好理解。我做数据清洗:来一条,我处理一条,这种无边界的就好了。我要做数据统计:每个小时的pv(page view)是多少,那我就设置1小时的边界,攒着一小时的数据来处理一次。在Flink在 设置“边界”这种操作叫做开窗口(Windows),窗口可简单分为两种类型:时间窗口(TimeWindows):按照时间窗口进行聚合,比如上面所讲得攥着一个小时的数据处理一次。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Flink 入门教程