Graph Analytics

Neo4j bietet bis zu 100-mal höhere Analytik-Performance

von - 09.11.2023
Foto: neo4j.com
Mit Parallel Runtime und Native Change Data Capture (CDC) will der Anbieter die Verarbeitung von Workloads in Enterprise-Umgebungen beschleunigen.
Neo4j, Anbieter von Graphdatenbanken und Graph Analytics, hat neue Features für seine Produkte vorgestellt. Damit soll die Performance rund um operative wie analytische Workloads deutlich steigen. Anwender können Abfragen (Queries) noch schneller durchführen, transaktionale und analytische Prozesse in einer Datenbank zentral verarbeiten und Datenänderungen in Echtzeit nachverfolgen.
Die neuen Features im Überblick:
  • Mit der neuen Parallel Runtime ermöglicht Neo4j eine bis zu 100-mal höhere Performance*, indem Threads nun gleichzeitig über mehrere CPU-Kerne zur Ausführung analytischer Abfragen laufen. Dabei nutzt die Graphdatenbank eine Technologie namens Morsel Based Parallelism, um die Skalierbarkeit zu erhöhen, die Ressourcennutzung zu verbessern und ein nahtloses Multitasking sicherzustellen.
  • Mit der neuen Datenänderungserfassung, native Change Data Capture (CDC), lässt sich nachverfolgen, wann Änderungen stattgefunden haben. Dritt-Systeme und Services, die auf diese Änderungen reagieren müssen, erhalten automatisch entsprechende Benachrichtigungen. CDC ist im Neo4j Connector for Kafka und Confluent integriert, um diese Änderungen unterschiedlichen Systemen und Datenbanken verfügbar zu machen.
  • Neue Embeddings erlauben Anwendern ein erleichtertes Erstellen von Knowledge Graphen. Die Modelle können bislang fehlende Datenbeziehungen aufzeigen sowie neue Datenbeziehungen im Wissensgraphen prädiktiv ableiten und so den semantischen Kontext für Abfragen erweitern.
  • Die Graphdatenbank erhält neue Algorithmen für Pfadsuchen, um höhere Effizienz bei komplexen Abfragen zu ermöglichen. Die Algorithmen ermitteln die optimale Sequenz und identifizieren den relevantesten Pfad zwischen einzelnen Knoten im Graphen.
Anwender können die neuen Features ab sofort sowohl in der Neo4j Graphdatenbank als auch in der Cloud Version (Neo4j AuraDB) nutzen. Change Data Capture (CDC) ist zunächst als öffentliche Beta-Version des EAP verfügbar.
Bereits im August 2023 hat Neo4j die Kernfunktionen der Graphdatenbank um native Vektorsuche erweitert. Die Integration liefert genaue, erklärbare und transparente Ergebnisse für Large Language Models (LLMs) und andere generative KI-Anwendungen.
Weitere Informationen finden Sie auf der Webseite oder im Blogbeittrag "Neo4j Unveils Parallel Runtime and CDC".
* Die Performance steigt proportional zur Anzahl der CPUs. Das genannte Ergebnis basiert auf einem Benchmark-Test, der eine Leistungsverbesserung für eine analytische Abfrage auf einem Stackoverflow-Datensatz mit 50 Millionen Knoten und 124 Millionen Beziehungen zeigt. Der Server (32 CPUs, 128 GByte Speicher) ist über 7473/browser/:https://demo.neo4jlabs.com:7473/browser/ öffentlich zugänglich.
Verwandte Themen