概述
Apache Storm的设计针对的是流式数据,不过对于大数据的实时分析它也是很可靠的计算系统。它同样是一个开源项目而且开发人员可以使用所有的主流高级语言。Apache Storm主要用于以下应用:在线机器学习、连续计算、实时分析、ETL、分布式RPC。Apache Storm有配置方便、可用性高、容错性好及扩展性好等诸多优点,处理速度也极快,每个节点每秒可以处理数百万个tuple。
目前最新的Apache Storm是去年11月5日发布的0.9.6版。
[hidecontent type="logged" desc="隐藏内容:登录后可查看"]
Storm集群中有三种节点:Nimbus、Zookeeper和Supervisor。Nimbus与Hadoop的JobTracker类似,主要用于运算的上传、代码的分发和计算的监测。Zookeeper节点的作用是Storm集群的协调,Supervisor节点则是实现对worker的控制。
Storm 是一个分布式实时计算系统。类似于 Hadoop 如何提供一组用于批处理的通用原语,Storm 提供一组用于进行实时计算的通用原语。Storm 简单,可以与任何编程语言一起使用,被许多公司使用,并且使用起来很有趣!
Rationale页面解释了 Storm 是什么以及构建它的原因。该演示文稿也很好地介绍了该项目。
Storm 在storm.apache.org有一个网站。在 Twitter 上关注@stormprocessor以获取项目更新。
文档
可以在Storm 网站上找到文档和教程。
开发人员和贡献者还应该查看我们的开发人员文档
[/hidecontent]