Files
service-finder/docs/V01_gemini/21_DEEP ASSET CATALOG.md

2.8 KiB

21.1 Adatmélység és Idővonal

A rendszer célja a teljes EU-s járműpark lefedése a 2000-es évjárattól kezdődően.

Hierarchia: Make -> Model -> Generation -> Engine Variant -> Trim Level.

Kezdeti adatok: Az első fázisban a robot a 4 alapszintet tölti (Márka, Típus, Évjárat, Motor), majd iteratívan mélyíti a factory_data JSONB mezőt (olajmennyiség, nyomaték, guminyomás stb.).

# 21. Deep Asset Catalog (MDM)

Ez a dokumentum írja le a járművek technikai mélységét kategóriánként.

1. Kategória Specifikus Adatok (JSONB Schemas)

  • Személyautó: Klíma fajták (digit, többzónás), hajtáslánc, ADAS rendszerek.
  • Teherautó/Kamion: Tengelyek száma, fülke típusa, retarder típusok, menetíró.
  • Motorkerékpár: Munkaütem, hűtés módja, táskák/dobozok konfigurációja.
  • Hajó: Merülés, vízkiszorítás, orrsugárkormány, navigációs elektronika.

2. Numerikus Indexelés

A gyors keresés érdekében a következő mezők fix oszlopok:

  • engine_capacity (ccm)
  • power_kw (kW)
  • weight_kg (Súly)
  • year_from / year_to (Gyártási időszak)

21. Deep Asset Catalog & Master Data Management (MDM)

Ez a modul a rendszer "agyát" képezi, ahol a zajos külső forrásokból származó adatok tiszta, dúsított és egyedi járműspecifikációkká alakulnak.

21.1 Adatmodell (vehicle_model_definitions)

A katalógus nem egyszerűen rekordokat tárol, hanem egy Master-Slave viszonyrendszert valósít meg a duplikációk elkerülése érdekében.

Kulcsfontosságú mezők:

  • technical_code: Egyedi gyári azonosító (pl. PC44, ZX600R). Elsődleges kulcs a deduplikációhoz.
  • parent_id: Önhivatkozás. Ha egy rekord duplikátum, itt mutat a Master (eredeti) rekordra.
  • synonyms (JSONB): Alternatív elnevezések gyűjteménye (pl. "Tracer 9", "MT-09 Tracer") a kereshetőség javítására.
  • year_from / year_to: Gyártási intervallumok a generációk megkülönböztetéséhez.
  • specifications (JSONB): Műszaki adatok (olajmennyiség, gyertya típus, hűtőfolyadék).

21.2 Master-Merge Logika

A rendszer az "Igazság Hierarchiáját" követi az adatok mentésekor:

  1. Hatósági Adat (RDW): CCM és teljesítmény (kW) forrása.
  2. AI Adatbányászat (Gemini + Google Search): Technikai kódok, évjáratok és szervizadatok forrása.
  3. Manuális felülbírálat: Legmagasabb prioritású status = 'manual_check'.

Összefésülési szabály (Deduplikáció):

A Robot 2 csak akkor olvaszt össze két rekordot, ha:

  • A make (gyártó) egyezik.
  • A technical_code azonos és nem 'N/A'.
  • A engine_capacity (CCM) megegyezik.

21.3 Állapotgépek (Status Lifecycle)

  • unverified: Alapállapot, csak nyers adatok.
  • ai_enriched: Sikeresen dúsított, hitelesített Master rekord.
  • duplicate: Felismert másolat, amely egy Master rekordhoz van láncolva.