TurboQuant encoding for Vectors by connortsui20 · Pull Request #7269 · vortex-data/vortex

connortsui20 · 2026-04-02T18:30:57Z

Continuation of #7167, authored by @lwwmanning

Summary

Lossy quantization for vector data (e.g., embeddings) based on TurboQuant (https://arxiv.org/abs/2504.19874). Supports both MSE-optimal and inner-product-optimal (Prod with QJL correction) variants at 1-8 bits per coordinate.

Key components:

Single TurboQuant array encoding with optional QJL correction fields, storing quantized codes, norms, centroids, and rotation signs as children.
Structured Random Hadamard Transform (SRHT) for O(d log d) rotation, fully self-contained with no external linear algebra library.
Max-Lloyd centroid computation on Beta(d/2, d/2) distribution.
Approximate cosine similarity and dot product compute directly on quantized arrays without full decompression.
Pluggable TurboQuantScheme for BtrBlocks, exposed via WriteStrategyBuilder::with_vector_quantization().
Benchmarks covering common embedding dimensions (128, 768, 1024, 1536).

Also refactors CompressingStrategy to a single constructor, and adds vortex_tensor::initialize() for session registration of tensor types, encodings, and scalar functions.

API Changes

Adds a new TurboQuant encoding + some other things. TODO

Testing

TODO

Signed-off-by: Connor Tsui <connor.tsui20@gmail.com>

Lossy quantization for vector data (e.g., embeddings) based on TurboQuant (https://arxiv.org/abs/2504.19874). Supports both MSE-optimal and inner-product-optimal (Prod with QJL correction) variants at 1-8 bits per coordinate. Key components: - Single TurboQuant array encoding with optional QJL correction fields, storing quantized codes, norms, centroids, and rotation signs as children. - Structured Random Hadamard Transform (SRHT) for O(d log d) rotation, fully self-contained with no external linear algebra library. - Max-Lloyd centroid computation on Beta(d/2, d/2) distribution. - Approximate cosine similarity and dot product compute directly on quantized arrays without full decompression. - Pluggable TurboQuantScheme for BtrBlocks, exposed via WriteStrategyBuilder::with_vector_quantization(). - Benchmarks covering common embedding dimensions (128, 768, 1024, 1536). Also refactors CompressingStrategy to a single constructor, and adds vortex_tensor::initialize() for session registration of tensor types, encodings, and scalar functions. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com> Co-Authored-By: Will Manning <will@willmanning.io> Signed-off-by: Connor Tsui <connor.tsui20@gmail.com>

connortsui20 added the changelog/feature A new feature label Apr 2, 2026

connortsui20 force-pushed the ct/turboquant branch 4 times, most recently from 44ca104 to 2bbee51 Compare April 2, 2026 19:54

add CompressorConfig

0ec1d1c

Signed-off-by: Connor Tsui <connor.tsui20@gmail.com>

connortsui20 force-pushed the ct/turboquant branch from 2bbee51 to e2d40c3 Compare April 2, 2026 22:13

connortsui20 force-pushed the ct/turboquant branch from e2d40c3 to feebac6 Compare April 2, 2026 22:40

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

TurboQuant encoding for Vectors#7269

TurboQuant encoding for Vectors#7269
connortsui20 wants to merge 2 commits intodevelopfrom
ct/turboquant

connortsui20 commented Apr 2, 2026

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants

Conversation

connortsui20 commented Apr 2, 2026

Summary

API Changes

Testing

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants