arcadedb-haystack

ArcadeDB integration for Haystack 2.x — one database for document storage, HNSW vector search, and SQL metadata filtering.

Why ArcadeDB?

Most RAG setups need separate backends for documents, vectors, and full-text search. ArcadeDB replaces all three:

Document storage — vertex-based records with flexible MAP metadata
HNSW vector search — native approximate nearest neighbor index (cosine, euclidean, dot product)
SQL filtering — full SQL WHERE clauses on metadata fields
No special drivers — pure HTTP/JSON API via requests

Installation

pip install arcadedb-haystack

Quick Start

# Start ArcadeDB
docker run -d -p 2480:2480 \
    -e JAVA_OPTS="-Darcadedb.server.rootPassword=arcadedb" \
    arcadedata/arcadedb:latest

export ARCADEDB_USERNAME=root
export ARCADEDB_PASSWORD=arcadedb

from haystack import Document
from haystack.document_stores.types import DuplicatePolicy
from haystack_integrations.document_stores.arcadedb import ArcadeDBDocumentStore

store = ArcadeDBDocumentStore(
    database="myproject",
    embedding_dimension=768,
)

# Write documents
docs = [
    Document(
        content="ArcadeDB supports graphs, documents, and vectors.",
        embedding=[0.1] * 768,
        meta={"source": "docs", "category": "database"},
    )
]
store.write_documents(docs, policy=DuplicatePolicy.OVERWRITE)

# Filter by metadata
results = store.filter_documents(
    filters={"field": "meta.category", "operator": "==", "value": "database"}
)

# Vector similarity search
similar = store._embedding_retrieval(
    query_embedding=[0.1] * 768,
    top_k=5,
)

Using in a Pipeline

from haystack import Pipeline
from haystack_integrations.components.retrievers.arcadedb import ArcadeDBEmbeddingRetriever
from haystack_integrations.document_stores.arcadedb import ArcadeDBDocumentStore

store = ArcadeDBDocumentStore(database="myproject", embedding_dimension=768)

pipeline = Pipeline()
pipeline.add_component("retriever", ArcadeDBEmbeddingRetriever(document_store=store, top_k=10))

result = pipeline.run({"retriever": {"query_embedding": [0.1] * 768}})
documents = result["retriever"]["documents"]

Configuration

Parameter	Default	Description
`url`	`http://localhost:2480`	ArcadeDB HTTP endpoint
`database`	`haystack`	Database name
`username`	env `ARCADEDB_USERNAME`	HTTP Basic Auth username
`password`	env `ARCADEDB_PASSWORD`	HTTP Basic Auth password
`type_name`	`Document`	Vertex type name
`embedding_dimension`	`768`	Vector dimension for HNSW index
`similarity_function`	`cosine`	`cosine`, `euclidean`, or `dot`
`recreate_type`	`False`	Drop and recreate type on init
`create_database`	`True`	Create database if it doesn't exist

Components

`ArcadeDBDocumentStore`

Implements the Haystack DocumentStore protocol:

count_documents() — count stored documents
filter_documents(filters) — retrieve documents matching metadata filters
write_documents(documents, policy) — write/upsert/skip documents
delete_documents(document_ids) — delete by ID

`ArcadeDBEmbeddingRetriever`

Pipeline component for vector similarity retrieval:

Uses ArcadeDB's native HNSW index via vectorNeighbors()
Supports runtime filter override and merge via FilterPolicy
Serializable for pipeline export/import

Development

# Install in dev mode
pip install -e ".[dev]"

# Run tests (requires running ArcadeDB)
pytest tests/

License

Apache License 2.0 — see LICENSE.

Name		Name	Last commit message	Last commit date
Latest commit History 1 Commit
examples		examples
integrations		integrations
src/haystack_integrations		src/haystack_integrations
tests		tests
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
pyproject.toml		pyproject.toml

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

arcadedb-haystack

Why ArcadeDB?

Installation

Quick Start

Using in a Pipeline

Configuration

Components

`ArcadeDBDocumentStore`

`ArcadeDBEmbeddingRetriever`

Development

License

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

arcadedb-haystack

Why ArcadeDB?

Installation

Quick Start

Using in a Pipeline

Configuration

Components

ArcadeDBDocumentStore

ArcadeDBEmbeddingRetriever

Development

License

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

`ArcadeDBDocumentStore`

`ArcadeDBEmbeddingRetriever`

Packages