开源
trino:用于大数据分析的快速分布式 SQL 查询引擎
来源:元经纪     阅读:1105
网站管理员
发布于 2023-05-18 08:44
查看主页

概述

Trino 是一个用于大数据分析的快速分布式 SQL 查询引擎。

构建要求

[hidecontent type="logged" desc="隐藏内容:登录后可查看"]

建筑Trino

Trino 是一个标准的 Maven 项目。只需从项目根目录运行以下命令:

./mvnw clean install -DskipTests

在第一次构建时,Maven 从 Internet 下载所有依赖项并将它们缓存在本地存储库 ( ~/.m2/repository) 中,这可能需要一段时间,具体取决于您的连接速度。后续构建速度更快。

Trino 有一套全面的测试,需要花费大量时间才能运行,因此被上述命令禁用。当您提交拉取请求时,这些测试由 CI 系统运行。我们建议只在本地对您更改的代码区域运行测试。

在你的 IDE 中运行 Trino

概述

第一次构建 Trino 后,您可以将项目加载到 IDE 中并运行服务器。我们推荐使用 IntelliJ IDEA。因为 Trino 是一个标准的 Maven 项目,所以您可以轻松地将它导入到您的 IDE 中。在 IntelliJ 中,从“快速启动”框中选择 “打开项目”或 从“文件”菜单中选择“打开”并选择根文件。pom.xml

在 IntelliJ 中打开项目后,仔细检查是否为项目正确配置了 Java SDK:

  • 打开文件菜单并选择项目结构
  • 在 SDKs 部分,确保选择 JDK 17(如果不存在则创建一个)
  • 在项目部分,确保项目语言级别设置为 17

运行测试服务器

运行 Trino 进行开发的最简单方法是运行类TpchQueryRunner 。它将启动配置有 TPCH 连接器的服务器的开发版本。然后您可以使用 CLI 对该服务器执行查询。许多其他连接器都有自己的*QueryRunner类,您可以在处理特定连接器时使用这些类。

运行完整的服务器

Trino 带有示例配置,应该开箱即用以进行开发。使用以下选项创建运行配置:

  • 主要类别:io.trino.server.DevelopmentServer
  • 虚拟机选项:-ea -Dconfig=etc/config.properties -Dlog.levels-file=etc/log.properties -Djdk.attach.allowAttachSelf=true
  • 工作目录:$MODULE_DIR$
  • 使用模块的类路径:trino-server-dev

工作目录应该是trino-server-dev子目录。在 IntelliJ 中,using$MODULE_DIR$会自动完成此操作。

如果VM options对话框中不存在,则需要选择Modify options 并启用Add VM options.

运行命令行

启动 CLI 连接到服务器并运行 SQL 查询:

client/trino-cli/target/trino-cli-*-executable.jar

运行查询以查看集群中的节点:

SELECT * FROM system.runtime.nodes;

针对 TPCH 连接器运行查询:

SELECT * FROM tpch.tiny.region;

[/hidecontent]

 
免责声明:本文为用户发表,不代表网站立场,仅供参考,不构成引导等用途。 开源
【2023年12月1日-7日:上海浦东】“AIGC的创新与发展”沙龙活动
连通“智慧大脑” 推动“智改数转”加速跑
微星modernam242/am272系列aio一体机发布
中移物联“行车卫士”赋能黔南州餐饮智慧化配送
为啥你的小米SU7方向盘记忆 再下一次上车时位置不同?

首页

分类

定制方案

消息

我的