您的位置:首页 > 数据 >
焦点速读:轻量级微服务计算框架Pulsar——下一代的消息系统
来源:CSDN 2023-01-10 10:43:38

Pulsar 是下一代的新型消息系统,将批流处理集于一身,并且致力于克服一些现有的消息系统的弱点。Apache Pulsar 是由 Yahoo 开发并开源的企业级消息系统。由 Yahoo 在 2016年开源,并在 2018 年成为 Apache Software Foundation 顶级项目。为了有更好的运行效率、可扩展性和灵活性,Pulsar 从架构上就是分层架构。这样的分层架构相比以往的单体架构更加灵活,可以根据需要来进行配置存储层和处理层,更加容易维护和扩容。

Pulsar Overview

Apache Pulsar 是一个提供多租户并且拥有高性能的消息系统,早期由 Yahoo 进行开发,后由 ASF 进行管理。 


(相关资料图)

Pulsar 有以下特征: 

原生支持多集群,并且在集群之间通过地域复制 (geo-replication) 无缝衔接。 

端到端之间的低延迟。 

百万 topic 无缝扩展。 

支持多种客户端比如:Java、Go、C++、Python。 

支持独占订阅、共享订阅、故障转移订阅。 

用 BookKeeper 保证消息的持久化。

原生支持轻量级微服务计算框架 Pulsar Functions。 

基于 Pulsar Functions 的微服务连接器框架 Pulsar IO,方便数据在 Apache Pulsar 的输入输出。

分层存储提供了当数据变为老数据时可以从热存储卸载到类似 S3 或 GCS 的冷存储。

Queuing vs Streaming

Queuing

消息队列没有顺序,并且可以共享,消费者可以从一个点对点的消息队列中接收消息。当有消息发出后,任何消费者都有可能接收到这条消息并进行消费,至于哪个消费者能接收到消息是由消息中间件的实现来决定的。消息队列通常会应用在一些无状态的应用中,这些应用并不关心这些消息的接收顺序,他们只需要将这些收到的消息进行确认或者删除,并且尽可能的去并发处理这些消息。典型的消息系统有 RabbitMQ、RocketMQ。

Streaming

与消息队列正好相反,streaming 是严格要求顺序并且是独占的消息。在流消息这种情况下,通常只有一个消费者消费,并且这条消息是和写入时的顺序一致。流消息通常用于有状态的应用中,这些应用要求消息的顺序与写入时一致,错误的顺序会影响结果的正确性,也会影响对这些消息的处理。队列和流的存在, 在现在的微服务架构和事件驱动架构中举足轻重。

Stream process

流处理是在消息的生产者和消费者中间的处理过程。在消息到达消费者之前,可以自定义输出消息,来达到符合自己要求的消息。通常流处理应用于大数据的处理过程,一些公司的数据都是实时动态生成,采用时间窗口或者其他方式对复杂的流事件进行分析和处理,然后再传递给下一个消费者消费。

Process Guarantees

Process Guarantees 是 Pulsar 中消息接收或处理的保证机制,目前在 Pulsar 中,这种保证大部分是在 Pulsar Functions 中,由于 Pulsar Functions 是一种 Event process, 数据的处理过程对结果会造成影响,所以需要一种机制来保证数据的处理次数。

Pulsar 提供了以下几种状态:

At most once: 指此条消息最多被使用一次。 

At least once (default): 指在接收到消息后,这条消息会被至少使用一次;如果不成功,重新拿到消息处理。在 Pulsar Function 处理过程所产生的中间修改会被保存。 

Effectively once: 在 Pulsar Functions 只有效处理一次,当一次处理过程出错,中间修改不会被保存。

以上状态大多数在 Pulsar Functions 中使用,在消费者端,Pulsar 会保证 At least once。

更多关于 Pulsar 的技术干货和产品动态,请关注 ApachePulsar 微信公众号。

点击“阅读原文”,进入 Pulsar 官网了解更多。

关键词:
相关文章
2022年黄骅港完成煤炭运量20515.8万吨 世界热点

2022年黄骅港完成煤炭运量20515.8万吨 世界热点

1月8日,船舶在黄骅港码头装运煤炭。黄骅港煤炭堆场转运设备在作业(1月8日摄,无人机照片)。  位于河北沧州的黄骅港是西煤东运、北煤南运更多

2023-01-10 10:12:46
世界热议:2022年煤矿智能化重大进展发布会在京召开

世界热议:2022年煤矿智能化重大进展发布会在京召开

  1月7日,2022年煤矿智能化重大进展发布会在京召开。本次发布会旨在展示交流2022年煤矿智能化科技创新和建设成果,总结推广经验,发挥先进更多

2023-01-10 10:16:42
环球热头条丨2023年内蒙古煤炭目标产量将达到12.5亿吨

环球热头条丨2023年内蒙古煤炭目标产量将达到12.5

  记者从1月5日召开的2023年全区能源工作会议上获悉,2023年,我区将继续肩负起保障国家能源安全的重大政治责任,全力以赴保障能源安全稳定更多

2023-01-10 10:00:38
2022年我国原煤产量过亿吨企业增至7家

2022年我国原煤产量过亿吨企业增至7家

  据中国煤炭工业协会统计与信息部初步统计,2022年,全国原煤产量超5000万吨企业15家,与去年持平。产量合计约为259亿吨,较去年增加约13亿更多

2023-01-10 09:55:09
每日热闻!CCTD重磅分析:2023年煤炭市场展望

每日热闻!CCTD重磅分析:2023年煤炭市场展望

  2022年,虽然受到国际能源市场持续紧张、高温干旱暴雨极端天气、疫情扰动以及输入性通胀等因素影响,但是在政策调控和市场机制的配合下,更多

2023-01-10 10:15:31
2022年黑龙江省产煤超6900万吨

2022年黑龙江省产煤超6900万吨

  2022年,黑龙江省煤矿安全生产取得历史性突破。全省煤矿实现零死亡,事故起数、死亡人数同比分别减少3起、5人;全省煤矿连续14个月未发生更多

2023-01-09 10:01:03
资讯:福建省:确保全省主力燃煤电厂存煤可用天数不低于20天

资讯:福建省:确保全省主力燃煤电厂存煤可用天数

  福建省发改委近日印发关于做好2023年一季度经济工作若干措施的通知。通知指出,切实保障能源供应。发挥煤电油气运保障工作协调机制作用,更多

2023-01-09 09:59:33
2023年重庆已与陕煤集团达成1900万吨煤炭合作协议|焦点资讯

2023年重庆已与陕煤集团达成1900万吨煤炭合作协议

  1月6日从重庆市经济信息委获悉,2022年,陕煤入渝规模达17983万吨,同比增长132%,创历年新高,按照每一列3000吨计算,相当于每天17列运煤更多

2023-01-09 10:02:12
上产量、保运量、增储量!目前全国能源供需平稳有序

上产量、保运量、增储量!目前全国能源供需平稳有

  沙漠采气,中国石油塔里木油田19座大中型气田开足马力,日产量超过1亿立方米;西煤东运,承担全国铁路煤运总量近15的大秦铁路优化调度,日更多

2023-01-09 10:00:10
CCTD分析:一季度炼焦煤市场展望

CCTD分析:一季度炼焦煤市场展望

  1宏观预期最差的时候可能已经过去,市场将在强预期与弱恢复中反复拉扯。  疫情防控政策优化以来市场不断抬高对复工复产和经济复苏的预期更多

2023-01-09 09:54:59