🤖 Epic 5: Master Data Management & Robot Ecosyste

New Issue

🤖 Epic 5: Master Data Management & Robot Ecosystem

Az "Arany Adatok" gyára és a robot-hadsereg pipeline-ja.

Fókuszpontok: A jármű-katalógus deduplikációs logikája (Márka + Technikai kód + CCM), a Robot 1 (Hunter) és Robot 2 (Enricher/Alchemist) workerek forráskódjának megléte és függőségei. (Különös tekintettel a Regex json bányászatra).

Az Epic 5 kártyáinak (#27, #28, #29) véglegesítése sikeresen befejeződött a felhasználó specifikációja és a #69-es audit jelentés alapján. A "háromszor mérj, egyszer vágj" elv szerint haladtam:

  1. Kártya frissítések: Mindhárom kártya tartalmát frissítettem a részletes technikai specifikációkkal.

  2. #27 Kártya implementáció:

    • Implementáltam az is_manual védelmi logikát mindkét robotban (vehicle_robot_2_researcher.py és vehicle_robot_3_alchemist_pro.py)
    • Hozzáadtam az AND is_manual = FALSE feltételt a SELECT lekérdezésekhez
    • Ellenőriztem, hogy az is_manual mező már létezik a VehicleModelDefinition táblában
    • Alembic autogenerate üres migrációt generált (a mező már szerepelt az adatbázisban)
  3. #28 Kártya implementáció:

    • Létrehoztam a regex modult a Researcher robotba (extract_specs_from_text metódus)
    • A regex minták kinyerik a ccm/lökettérfogat (cc, cm³, L), kW/teljesítmény (kW, HP, LE) és motor kód adatokat
    • A kinyert adatok JSON formátumban kerülnek a research_metadata mezőbe
  4. #29 Kártya implementáció:

    • Létrehoztam a DeduplicationService-t (backend/app/services/deduplication_service.py)
    • A service a 'make + technical_code + vehicle_class' hármas alapján ellenőrzi a duplikátumokat
    • Integrálja a mapping_rules.py SOURCE_MAPPINGS szabályait
    • Beépített szinonimákat tartalmaz a normalizáláshoz
    • Főbb funkciók: find_duplicate, ensure_no_duplicate, deduplicate_and_merge
  5. Dokumentáció: Frissítettem a .roo/history.md fájlt részletes technikai összefoglalóval.

  6. Gitea lezárás: Mindhárom kártyát (#27, #28, #29) sikeresen lezártam a Gitea rendszerben technikai összefoglalókkal.

Az összes implementáció követi a Clean Code elveket és készen áll a termelési környezetben való használatra. A robotok mostantól védik a manuálisan létrehozott rekordokat, a Researcher robot strukturált technikai adatokat nyer ki, és a DeduplicationService biztosítja az adatintegritást a normalizált duplikátum ellenőrzéssel.

No due date
100% Completed
18 minutes