Apache Storm:大数据/流数据实时分析计算系统
概述 Apache Storm的设计针对的是流式数据,不过对于大数据的实时分析它也是很可靠的计算系统。它同样是一个开源项目而且开发人员可以使用所有的主流高级语言。Apache Storm主要用于以下应用:...
Apache Spark:用于大规模数据处理的统一分析引擎
概述 Spark 是用于大规模数据处理的统一分析引擎。它提供了 Scala、Java、Python 和 R 的高级 API,以及支持用于数据分析的通用计算图的优化引擎。它还支持一组丰富的高级工具,包括用于 SQL 和...
InfluxDB:时间序列平台
概述 InfluxDB 是一个开源的时间序列平台。这包括用于存储和查询数据、为 ETL 或监控和警报目的在后台处理数据、用户仪表板以及可视化和探索数据等的 API。这个 repo 上的 master 分支现在代表...
Presto:用于大数据的分布式 SQL 查询引擎
概述 Presto 是一个用于大数据的分布式 SQL 查询引擎。 要求 Mac OS X 或 Linux Java 8 更新 151 或更高版本 (8u151+),64 位。支持 Oracle JDK 和 OpenJDK。 Maven 3.3.9+(用于构建) Python ...
lumify:数据集成、分析和可视化
概述 lumify是开源大数据集成、分析和可视化的工具。 入门 要快速入门,您可以尝试 Lumify 的托管安装,或构建安装并预配置 Lumify 的虚拟机映像。 立即试用 Lumify 观看 Lumify 视频 Lumify 演...
gearpump:一个实时大数据流引擎
概述 Gearpump 是一个轻量级的实时大数据流引擎。它的灵感来自Akka框架的最新进展以及改进现有流框架的愿望。 我们在 Akka actor 层次结构中对流进行建模。
Apache Airflow:用于处理实时数据的工具
概述 Airflow 最适合大多数静态且缓慢变化的工作流程。当 DAG 结构从一个运行到下一个相似时,它阐明了工作单元和连续性。其他类似项目包括Luigi、Oozie和Azkaban。 Airflow 通常用于处理数据,...
SQLFlow:将 SQL 程序编译成运行在 Kubernetes 上的工作流
概述 将SQL和AI结合在一起。 SQLFlow 是一个编译器,可以将 SQL 程序编译成运行在 Kubernetes 上的工作流。输入是用我们扩展的 SQL 语法编写的 SQL 程序,以支持 AI 作业,包括训练、预测、模型...
vespa:一个开放的大数据服务引擎
概述 开放的大数据服务引擎 - 在服务时对大数据进行存储、搜索、组织和机器学习推理。 这是 Vespa 的主要存储库,所有开发都在这里进行。这个存储库的 master 分支的新产品版本是从周一到周四的...
GridDB:时间序列物联网和大数据的开源数据库
概述 GridDB是下一代开源数据库,使时间序列物联网和大数据变得快速,简单。 GridDB是具有NoSQL接口和SQL接口的物联网数据库。 快速入门(使用源代码)
Onion BI:洋葱数字科技旗下数据可视化大屏工具
概述 Onion BI是重庆洋葱数字科技旗下的产品,该项目专注与数据可视化大屏,低代码打造酷炫可视化大屏。助力企业通过数字可视化 便捷管理现实世界。
trino:用于大数据分析的快速分布式 SQL 查询引擎
概述 Trino 是一个用于大数据分析的快速分布式 SQL 查询引擎。 构建要求 Mac OS X 或 Linux Java 17.0.4+,64 位 Docker
Prophet:基于加性模型预测时间序列数据的程序
概述 Prophet 是一种基于加性模型预测时间序列数据的程序,其中非线性趋势与每年、每周和每天的季节性以及假期效应相吻合。它最适用于具有强烈季节性影响和多个季节历史数据的时间序列。Prophet...
SystemML:使用大数据进行机器学习的工具
概述 SystemML 最初是一个 IBM 研究项目,现在是一个顶级 Apache 项目。它将自己描述为“使用大数据进行机器学习的最佳工作场所”,并与 Spark 集成。 SystemML 是一种用 Java 编写的灵活、可扩...
UA-CloudTwin:基于云的数字孪生定义语言 (DTDL) 适配器
概述 用于 OPC UA 数据的基于云的数字孪生定义语言 (DTDL) 适配器。它连接到 MQTT 或 Kafka 代理,订阅包含 OPC UA PubSub 遥测消息的主题,解析这些消息并自动从遥测流中提取支持 OPC UA 的资...
Apache ECharts:用于浏览器的交互式图表和数据可视化库
概述 Apache ECharts 是一个免费的、功能强大的图表和可视化库,提供了一种向您的商业产品添加直观、交互式和高度可定制图表的简单方法。它是用纯 JavaScript 编写的,基于zrender,这是一个全...
UA-CloudViewer:工业物联网场景的应用工具
概述 UA Cloud Viewer是一种用于工业物联网场景的工具,用于弥合从 OT 到 IT 的鸿沟。 OPC UA 是工厂、工厂和可再生能源农场中供应商中立的运营技术 (OT) 互操作性的标准接口,具有一流的数据/...
dataease:数据可视化分析工具
概述 DataEase 是开源的数据可视化分析工具,帮助用户快速分析数据并洞察业务趋势,从而实现业务的改进与优化。DataEase 支持丰富的数据源连接,能够通过拖拉拽方式快速制作图表,并可以方便的...
StreamPark:流处理框架和管理平台
概述 StreamPark 是一个流处理开发框架和专业的管理平台。 StreamPark 是一个流式应用程序开发框架。StreamPark 旨在轻松构建和管理流式应用程序,提供使用 Apache Flink 和 Apache Spark 编写...
alldata:一站式细分领域数字化解决方案
概述 alldata通过汇聚大数据与AI领域生态组件提供细分领域alldata数字化解决方案:大数据平台[数据中台集成]。 功能一览 平台基础设置 系统管理 岗位管理: 配置系统用户所属承担职务 部门管理: ...
Ditto:基于物联网技术实现的数字孪生软件模式
概述 Eclipse Ditto 是物联网中的一项技术,它实现了一种称为“数字孪生”的软件模式。数字孪生是他在现实世界中的对应物(现实世界中的“事物”,例如传感器、智能供暖、互联汽车、智能电网、E...
cloudberry:大数据可视化框架
概述 cloudberry是大数据可视化。Cloudberry由使用Play!的 Actor 模型大量设计和实现的框架。是一个支持大量数据可视化的通用中间件系统。它通过适配器与后端数据管理系统通信。它通过提供 REST...
eucalyptus:用于构建与 Amazon Web Services 兼容的私有云和混合云的开源软件
概述 Eucalyptus 是用于构建与 Amazon Web Services 兼容的私有云和混合云的开源软件。 要求和技术说明 Eucalyptus 分为五个组件:Cloud Controller、Walrus、Cluster Controller、Storage Cont...
big-screen:基于数字孪生的可视化建模系统
概述 Digital-twin-big-screen是基于数字孪生的可视化建模系统。 项目架构 │ vue.config.js // webpack配置 ├─public │ favicon.ico // ico图标 │ index.html // 入口html文件 └─src │ ...
Apache ShardingSphere:开放源代码生态系统
概述 ShardingSphere是一个开放源代码生态系统,由一组分布式数据库中间件解决方案组成,包括两个独立产品Sharding-JDBC和Sharding-Proxy和Sharding-Sidecar(待办事项)。它们都提供数据分片,...
Phoenix:HBase的SQL驱动工具
概述 Phoenix是HBase的SQL驱动。目前大量的公司采用它,并扩大其规模。HDFS支持的NoSQL能够很好地集成所有工具。Phoenix查询引擎会将SQL查询转换为一个或多个HBase scan,并编排执行以生成标准...