vespa：一个开放的大数据服务引擎

概述

开放的大数据服务引擎 - 在服务时对大数据进行存储、搜索、组织和机器学习推理。

这是 Vespa 的主要存储库，所有开发都在这里进行。这个存储库的 master 分支的新产品版本是从周一到周四的每个工作日发布的。

[hidecontent type="logged" desc="隐藏内容：登录后可查看"]

主页：https: //vespa.ai
文档： https: //docs.vespa.ai
持续构建： https: //factory.vespa.oath.cloud
免费在云端运行应用程序： https: //cloud.vespa.ai

背景

搜索、推荐和个性化等用例需要在大型语料库中选择数据子集，根据所选数据评估机器学习模型，组织和聚合并返回它，通常在不到 100 毫秒的时间内，同时数据语料库是不断变化的。

这很难做到，尤其是对于需要分布在多个节点上并并行评估的大型数据集。Vespa 是一个以高可用性和性能为您执行这些操作的平台。它已经开发多年，并被用于许多大型互联网服务和应用程序，这些服务和应用程序每秒处理来自 Vespa 的数十万次查询。

安装

运行您自己的 Vespa 实例： https: //docs.vespa.ai/en/getting-started.html 或者将您的 Vespa 应用程序部署到云服务：https://cloud.vespa.ai

用法

在入门指南中创建的应用程序功能完备且可用于生产，但您可能希望添加更多节点以实现冗余。
请参阅开发应用程序，了解如何将您自己的 Java 组件添加到您的 Vespa 应用程序。
Vespa API有助于理解如何与 Vespa 交互
探索示例应用程序
关注Vespa 博客以获取功能更新/用例

完整文档位于https://docs.vespa.ai。

建筑

你不需要构建 Vespa 来使用它，但如果你想贡献你需要能够构建代码。本节介绍如何构建和测试 Vespa。要了解在哪里进行更改，请参阅Code-map.md。TODO.md中提供了一些带有代码指针的改进建议。

开发环境

CentOS Stream 8 支持 C++ 和 Java 构建。Java 源代码也可以在任何安装了 Java 17 和 Maven 的平台上构建。使用以下指南设置一个完整的开发环境，使用 Docker 构建 Vespa，运行单元测试和运行系统测试： CentOS Stream 8 上的 Vespa 开发。

构建 Java 模块

export MAVEN_OPTS="-Xms128m -Xmx1024m"
./bootstrap.sh java
mvn install --threads 1C

如果您只需要构建 Java 模块，请使用它，否则请遵循的完整开发指南。

[/hidecontent]