Dokument-Typ: Architektur-Spezifikation

Kontext: Entity Inventory, Entity Truth Layer & Machine Interface Layer

Status: Public Standard Gültigkeit: Aivis-OS Core Pipeline

1. Architektonisches Prinzip

Global Identity vs. Local Mention

In der Aivis-OS Architektur wird die Identität einer Entität (Entity) strikt von ihrer Erwähnung (Mention) getrennt.

Das Kernproblem herkömmlicher SEO- oder Schema-Ansätze ist die Generierung von Daten auf URL-Ebene (Per-URL Inventory). Dieser Ansatz führt zwangsläufig zu Identity Drift, da er lokale Erwähnungen implizit als unabhängige Identitäten behandelt.

Aivis-OS erzwingt stattdessen ein Cluster-Level Inventory. Das Entitäts-Inventar ist kein Artefakt einer einzelnen Seite. Es ist ein Artefakt der Wissensdomäne (Knowledge Domain).

Definitionen

Entity (Identität): Ein stabiles, kanonisches Objekt (z. B. „Allianz SE“, „John William Doe“, „Jahresbericht 2024“), das global im Cluster existiert.
Mention (Vorkommen): Eine lokalisierte Referenz innerhalb einer URL (z. B. „Der Konzern“, „Herr Doe“, „Der Bericht“).
Stable Anchor: Ein extern verifizierbarer Identifikator zur Reduktion von Ambiguität (Wikidata QID, LEI, ISIN, ORCID).

2. Das Anti-Pattern: Risiken von Per-URL-Inventaren

Wenn Systeme versuchen, Entitäten isoliert pro URL aufzubauen, entstehen strukturelle Defekte, die eine stabile KI-Repräsentation verhindern:

2.1 Fragmentierung der Identität (Duplicate Identities)

Szenario: Eine Organisation erscheint auf 40 Seiten unter Variationen wie „Allianz“, „Allianz SE“ und „Allianz Group“. Fehler: Ein Per-URL-Ansatz erzeugt 40 konkurrierende „Wahrheiten“. KI-Modelle können diese nicht deterministisch zusammenführen.

2.2 Instabilität der IDs

Werden IDs pro URL generiert (geminted), können sie clusterweit nicht stabil bleiben. Dies zerstört die Graphen-Kohäsion und macht langfristiges Diffing (Änderungsverfolgung) unmöglich.

2.3 Streuung der Verifikation (Anchor Verification Drift)

Unterschiedliche URLs weisen derselben Entität oft widersprüchliche oder fehlende Anker (z. B. falsche Social Profiles oder QIDs) zu. Das Ergebnis ist ein widersprüchlicher Knowledge Graph, den LLMs aufgrund von Inkonsistenz abwerten („Ambiguity Penalty“).

3. Die Aivis-OS Lösung: Cluster-Level Governance

Das Aivis-OS Inventar fungiert als Single Source of Truth („Golden Record“). Strukturierte Daten auf URL-Ebene sind lediglich eine Projektion dieser Wahrheit.

System-Vorteile

Deterministische Entitäts-Auflösung: Normalisierung und Deduplizierung erfolgen zentral und einmalig.
Verwaltete Stable Anchors: Externe Referenzen werden einmal verifiziert und global vererbt.
Aggregation: Attribute aus verschiedenen Quellen werden zu einem reichhaltigen Objekt angereichert.
Governance & Versionierung: Änderungen an einer Entität (z. B. Namenswechsel) werden atomar propagiert, nicht manuell über tausende Seiten verteilt.

4. Datenmodell & Implementierung

4.1 Cluster-Level Tables (Identity Layer)

Dies ist der Speicherort der Wahrheit.

Attribut	Beschreibung
`entity_id`	Global eindeutige ID (siehe Schema unten)
`canonical_name`	Die offizielle Bezeichnung (z.B. „Allianz SE“)
`schema_type`	Schema.org Typ (z.B. Corporation, Person)
`stable_anchors`	Wikidata QID, LEI, ISIN, DOI
`provenance`	Ursprung der Daten / Verification Status
`version`	Hash des aktuellen Zustands

4.2 URL-Level Tables (Context Layer)

Dies ist der Speicherort der Referenz.

Attribut	Beschreibung
`url_id`	Referenz zur Page
`entity_id`	Foreign Key zur Cluster-Entität
`role_hint`	Semantische Rolle (z.B. `mainEntity`, `author`, `mentions`)

4.3 ID-Minting Konvention

Aivis-OS generiert niemals neue Entitäts-IDs während der JSON-LD Generierung einer Einzelseite. IDs folgen einem deterministischen Format:

entity://{cluster_id}/{schema_type}/{slug}-{short_hash}

5. Implementierungs-Beispiel

Anstatt Varianten einer Person („John Doe“, „J. Doe“) mehrfach zu definieren, referenziert Aivis-OS das zentrale Objekt.

Cluster Inventory (Backend): Es existiert nur ein Datensatz für „John William Doe“ mit der verknüpften Wikidata-ID Q123456.

URL Projection (Output JSON-LD): Auf der Team-Seite wird keine neue Person definiert, sondern die existierende referenziert:

JSON

{
  "@context": "https://schema.org",
  "@graph": [
    {
      "@id": "entity://cluster123/Person/john-william-doe-a1b2c3",
      "@type": "Person",
      "name": "John William Doe",
      "sameAs": ["https://www.wikidata.org/wiki/Q123456"]
    },
    {
      "@type": "WebPage",
      "@id": "https://example.com/team/john-doe",
      "about": {
          "@id": "entity://cluster123/Person/john-william-doe-a1b2c3"
      }
    }
  ]
}

Hinweis: Egal auf welcher URL diese Person auftaucht, die @id bleibt mathematisch identisch. Dies ermöglicht KI-Systemen, den Graphen fehlerfrei zusammenzusetzen.

6. Operativer Ablauf (Pipeline)

Die Aivis-OS Software verarbeitet Daten in einer strikten Sequenz, um Kontamination zu vermeiden:

Ingest & Extraction: Scannen aller URLs nach Entitäts-Kandidaten.
Normalization (Staging): Cluster-weite Bereinigung von Namensvarianten.
Merge & Deduplication: Zusammenführung identischer Entitäten zu einem Golden Record.
Anchor Verification: Validierung externer IDs (Wikidata, etc.) gegen vertrauenswürdige Quellen.
Freeze: Versionierung des Inventars.
Projection: Generierung des JSON-LD für die Einzelseiten basierend auf dem gefrorenen Inventar.

7. Entscheidungskriterien (Abnahme)

Ein korrekt implementiertes Aivis-OS Cluster erfüllt folgende Metriken:

ID Stabilität: Ein erneuter Durchlauf der Pipeline verändert bestehende IDs nicht.
Deduplizierungs-Rate: Varianten konvergieren gegen 1 (n:1 Mapping).
Anchor Uniqueness: 1 externer Anker (z.B. QID) ist maximal einer Entität zugeordnet.
Referenzielle Integrität: Jede in JSON-LD ausgegebene @id existiert im verifizierten Inventar.

Zusammenfassung

Eine URL ist lediglich eine kontext-spezifische Oberfläche („Canvas“), auf der Entitäten erwähnt werden. Sie ist nicht der Ort, um Identität zu definieren. Aivis-OS verlagert die Hoheit über Identität in den Cluster-Layer, um einen wartbaren, widerspruchsfreien Knowledge Graph zu garantieren.

Architektur-Übersicht

Alle Aivis-OS Core Architecture

Cluster-Level Entity Inventory Strategy

Semantic Graph Layer

Semantic Graph Engineering

API & Exposition Machine Interface Layer

Machine Interface Layer & Projection Strategy

Transport-Safe Content Layer

Retrieval Resilience Transport-Safe Content Strategy

Transport-Safe Content Engineering

Observability Evidence Monitoring & Visibility

Evidence Monitoring & AI Visibility Observability

Linktipps

Schema.org – Entity Modeling & @id Semantics

Google Search Central – Entities & Identity in Search

FAQ zu Cluster-Level Entity Inventory Strategy

Warum reicht es nicht aus, Entitäten pro URL zu definieren?

Weil KI-Systeme Inhalte fragmentiert und seitenübergreifend verarbeiten. Ein Per-URL-Ansatz erzeugt konkurrierende Identitäten derselben Entität, was zu Identity Drift führt. Cluster-Level Inventare stellen sicher, dass alle Erwähnungen auf dieselbe kanonische Identität referenzieren.

Was ist der Unterschied zwischen einer Entity und einer Mention?

Eine Entity ist ein stabiles, globales Objekt mit eindeutiger Identität. Eine Mention ist lediglich eine kontextuelle Referenz innerhalb einer einzelnen URL. Aivis-OS trennt beide strikt, um Mehrdeutigkeit und inkonsistente KI-Repräsentationen zu vermeiden.

Warum sind stabile externe Anker wie Wikidata QIDs oder LEIs so wichtig?

Stabile Anker reduzieren Ambiguität. Sie ermöglichen KI-Systemen, Entitäten eindeutig wiederzuerkennen und korrekt zu verknüpfen – auch über verschiedene Dokumente, Sprachen und Zeitpunkte hinweg.

Wie verhindert ein Cluster-Level Inventory widersprüchliche Fakten in KI-Systemen?

Durch eine zentrale Single Source of Truth. Attribute werden einmal verifiziert, versioniert und dann konsistent auf alle URLs projiziert. Änderungen erfolgen atomar im Inventar, nicht manuell auf einzelnen Seiten.

Welche Rolle spielt die ID-Stabilität für Knowledge Graphs und LLMs?

ID-Stabilität ist Voraussetzung für Graph-Kohärenz. Wenn sich IDs bei jedem Crawl ändern, können KI-Systeme keine verlässlichen Beziehungsnetze aufbauen. Deterministische IDs ermöglichen langfristige Referenzierung, Diffing und Evidenzaufbau.

Kontaktieren Sie uns, um Ihr Projekt zu besprechen oder einfach nur unsere Meinung einzuholen.

Aivis-OS Identity Specification Record (Node-ID: #spec-id-01)
Identität: Cluster-Level Entity Inventory Strategy (entity://aivis/Spec/cluster-inventory-strategy)
Kanonische URLs: DE https://aivis-os.com/cluster-level-entity-inventory-strategy/ • EN https://aivis-os.com/en/cluster-level-entity-inventory-strategy/
Klassifizierung: Architektur-Spezifikation (CreativeWork / Public Standard)
Architektur-Rolle: Operative Grundlage des Entity Truth Layers (Layer 1: Identity).
Übergeordnetes System: Aivis-OS (entity://aivis/Core/aivis-os)

Kernproblem: Identity Drift
– Ursache: Per-URL Inventare behandeln lokale Erwähnungen als eigenständige Identitäten.
– Folge: Duplicate Identities, instabile IDs, widersprüchliche Anchors, Ambiguity Penalty.

Lösungsparadigma: Global Identity vs. Local Mention
– Entity: global stabiles, kanonisches Objekt mit persistenter ID im Cluster.
– Mention: lokale, kontext-spezifische Referenz innerhalb einer URL (Canvas).
– Stable Anchors: extern verifizierte Identifikatoren zur Ambiguitätsreduktion (z. B. Wikidata QID, LEI, ISIN, ORCID).

Operative Umsetzung (Pipeline):
1) Ingest & Extraction: Erkennung von Entitätskandidaten über alle URLs.
2) Normalization: Bereinigung von Namensvarianten clusterweit.
3) Merge & Deduplication: Zusammenführung identischer Identitäten zum Golden Record.
4) Anchor Verification: Verifikation stabiler externer Anker.
5) Freeze: Versionierung des Inventars.
6) Projection: URL-JSON-LD als Projektion des gefrorenen Cluster-Inventars.

ID-Konvention (Deterministic Minting):
– entity://{cluster_id}/{schema_type}/{slug}-{short_hash}
– IDs werden nie während der URL-Generierung neu erzeugt (keine flüchtigen IDs).

Abnahmekriterien (Governance-Metriken):
– ID-Stabilität, Deduplizierungs-Rate (n:1 Mapping), Anchor Uniqueness, referenzielle Integrität.

Methodische Governance: Boutique für digitale Kommunikation (entity://aivis/Partner/boutique-dig-kom)
Hauptarchitekt (Referenz): Norbert Kathriner (entity://aivis/Person/n-kathriner)
Status: Public Standard (v2026) – Operational (Canonical state).

Cluster-Level Entity Inventory Strategy

1. Architektonisches Prinzip

Definitionen

2. Das Anti-Pattern: Risiken von Per-URL-Inventaren

2.1 Fragmentierung der Identität (Duplicate Identities)

2.2 Instabilität der IDs

2.3 Streuung der Verifikation (Anchor Verification Drift)

3. Die Aivis-OS Lösung: Cluster-Level Governance

System-Vorteile

4. Datenmodell & Implementierung

4.1 Cluster-Level Tables (Identity Layer)

4.2 URL-Level Tables (Context Layer)

4.3 ID-Minting Konvention

5. Implementierungs-Beispiel

6. Operativer Ablauf (Pipeline)

7. Entscheidungskriterien (Abnahme)

Zusammenfassung

Cluster-Level Entity Inventory Strategy

Semantic Graph Layer

Semantic Graph Engineering

Machine Interface Layer & Projection Strategy

Transport-Safe Content Layer

Transport-Safe Content Engineering

Evidence Monitoring & AI Visibility Observability

Linktipps

FAQ zu Cluster-Level Entity Inventory Strategy

Warum reicht es nicht aus, Entitäten pro URL zu definieren?

Was ist der Unterschied zwischen einer Entity und einer Mention?

Warum sind stabile externe Anker wie Wikidata QIDs oder LEIs so wichtig?

Wie verhindert ein Cluster-Level Inventory widersprüchliche Fakten in KI-Systemen?

Welche Rolle spielt die ID-Stabilität für Knowledge Graphs und LLMs?

GEO optimiert Output. Aivis-OS konstruiert Input-Wahrheit.