使用场景
法律行业:快速准确地检索相关法律案例和法规,提高法律研究效率。
金融领域:分析金融文件和报告,快速提取关键信息,辅助投资决策。
软件开发:理解和生成代码,提高编程效率和代码质量。
产品特色
在法律、金融、代码等八个领域的 100 个数据集中排名第一
支持 2048、1024、512 和 256 维度嵌入,通过 Matryoshka 学习实现
提供多种嵌入量化选项,包括 32 位浮点、有符号和无符号 8 位整数以及二进制精度,同时最小化质量损失
支持 32K 令牌上下文长度,相比 OpenAI(8K)和 Cohere(512)更长
int8 精度和 1024 维度的 voyage-3-large 仅比 float 精度和 2048 维度的版本检索质量低 0.31%,但存储成本降低 8 倍
即使使用 512 维度的二进制嵌入,voyage-3-large 仍比 OpenAI-v3-large(3072 维度浮点嵌入)性能高 1.16%,存储成本降低 200 倍
使用教程
1. 访问 https://docs.voyageai.com/docs/embeddings 了解详细文档。
2. 注册并获取 API 密钥。
3. 使用 API 密钥调用 voyage-3-large 模型,输入文本数据。
4. 获取模型返回的嵌入向量,用于后续的检索或其他任务。
5. 根据需要选择合适的维度和量化选项,以平衡性能和成本。