开放的大数据服务引擎 - 在服务时对大数据进行存储、搜索、组织和机器学习推理。
这是 Vespa 的主要存储库,所有开发都在这里进行。这个存储库的 master 分支的新产品版本是从周一到周四的每个工作日发布的。
[hidecontent type="logged" desc="隐藏内容:登录后可查看"]
搜索、推荐和个性化等用例需要在大型语料库中选择数据子集,根据所选数据评估机器学习模型,组织和聚合并返回它,通常在不到 100 毫秒的时间内,同时数据语料库是不断变化的。
这很难做到,尤其是对于需要分布在多个节点上并并行评估的大型数据集。Vespa 是一个以高可用性和性能为您执行这些操作的平台。它已经开发多年,并被用于许多大型互联网服务和应用程序,这些服务和应用程序每秒处理来自 Vespa 的数十万次查询。
运行您自己的 Vespa 实例: https: //docs.vespa.ai/en/getting-started.html 或者将您的 Vespa 应用程序部署到云服务:https://cloud.vespa.ai
完整文档位于https://docs.vespa.ai。
你不需要构建 Vespa 来使用它,但如果你想贡献你需要能够构建代码。本节介绍如何构建和测试 Vespa。要了解在哪里进行更改,请参阅Code-map.md。TODO.md中提供了一些带有代码指针的改进建议。
CentOS Stream 8 支持 C++ 和 Java 构建。Java 源代码也可以在任何安装了 Java 17 和 Maven 的平台上构建。使用以下指南设置一个完整的开发环境,使用 Docker 构建 Vespa,运行单元测试和运行系统测试: CentOS Stream 8 上的 Vespa 开发。
export MAVEN_OPTS="-Xms128m -Xmx1024m"
./bootstrap.sh java
mvn install --threads 1C
如果您只需要构建 Java 模块,请使用它,否则请遵循的完整开发指南。
[/hidecontent]