Worker: vehicle_ultimate_r2_enricher #90

Closed
opened 2026-03-18 03:13:07 +01:00 by kincses · 2 comments
Owner

Mérföldkő: EPIC 9: UltimateSpecs Pipeline Overhaul (Decoupled, Car & Moto Ready)
Cél: Az Elemző (Offline Data Cleaning) worker létrehozása, amely a JSON-ből kinyeri a konkrét számokat és beírja a Library fizikai oszlopaiba.

🔗 Függőségek (Dependencies)

  • Bemenet (Mikre támaszkodik): tábla (pipeline_status='pending_enrich'), Fuzzy Mapping szótár (autós és motoros kulcsszavak), JSON mező
  • Kimenet (Mik támaszkodnak rá): R3 Finalizer (a library sorait várja)

📝 Elemzés

A robot kiveszi a sorokat a Library táblából. Fuzzy Mapping használatával (ami ismeri az autós és motoros kulcsszavakat is) kinyeri a JSON-ből a konkrét számokat (pl. power_kw, engine_cc, torque_nm, max_speed, curb_weight, wheelbase, seats, fuel_type, transmission_type, drive_type, body_type). Sikeres tisztítás után a -t 'pending_match'-re állítja. A robotnak offline kell működnie (nincs hálózati kérés), csak a JSON adatokon dolgozik. Hibás vagy hiányzó adatok esetén a robot megőrzi az eredeti értékeket és naplózza a problémát.

**Mérföldkő:** EPIC 9: UltimateSpecs Pipeline Overhaul (Decoupled, Car & Moto Ready) **Cél:** Az Elemző (Offline Data Cleaning) worker létrehozása, amely a JSON-ből kinyeri a konkrét számokat és beírja a Library fizikai oszlopaiba. ### 🔗 Függőségek (Dependencies) - **Bemenet (Mikre támaszkodik):** tábla (pipeline_status='pending_enrich'), Fuzzy Mapping szótár (autós és motoros kulcsszavak), JSON mező - **Kimenet (Mik támaszkodnak rá):** R3 Finalizer (a library sorait várja) ### 📝 Elemzés A robot kiveszi a sorokat a Library táblából. Fuzzy Mapping használatával (ami ismeri az autós és motoros kulcsszavakat is) kinyeri a JSON-ből a konkrét számokat (pl. power_kw, engine_cc, torque_nm, max_speed, curb_weight, wheelbase, seats, fuel_type, transmission_type, drive_type, body_type). Sikeres tisztítás után a -t 'pending_match'-re állítja. A robotnak offline kell működnie (nincs hálózati kérés), csak a JSON adatokon dolgozik. Hibás vagy hiányzó adatok esetén a robot megőrzi az eredeti értékeket és naplózza a problémát.
kincses added this to the EPIC 9: UltimateSpecs Pipeline Overhaul (Decoupled, Car & Moto Ready) milestone 2026-03-18 03:13:07 +01:00
kincses added the Status: To DoType: ScriptScope: Robot labels 2026-03-18 03:13:07 +01:00
kincses added Status: Done and removed Status: To Do labels 2026-03-18 12:11:19 +01:00
Author
Owner

Munka befejezve: 2026-03-18 11:11:19

Technikai Összefoglaló:
Robot vehicle_ultimate_r2_enricher sikeresen implementálva. A robot offline adattisztítást és strukturálást végez a vehicle.external_reference_library táblában, fuzzy mapping segítségével kinyeri a technikai specifikációkat (power_kw, engine_capacity stb.), és strukturált JSON formátumba helyezi őket. Tesztelve Docker környezetben, egy sor sikeresen feldolgozva (ID=1, Honda Civic).

⏱️ A ráfordított időt a Gitea rögzítette.

✅ **Munka befejezve:** 2026-03-18 11:11:19 **Technikai Összefoglaló:** Robot vehicle_ultimate_r2_enricher sikeresen implementálva. A robot offline adattisztítást és strukturálást végez a vehicle.external_reference_library táblában, fuzzy mapping segítségével kinyeri a technikai specifikációkat (power_kw, engine_capacity stb.), és strukturált JSON formátumba helyezi őket. Tesztelve Docker környezetben, egy sor sikeresen feldolgozva (ID=1, Honda Civic). ⏱️ *A ráfordított időt a Gitea rögzítette.*
Author
Owner

A Gitea #90-es kártya ("Worker: vehicle_ultimate_r2_enricher") sikeresen teljesítve. Létrehoztam a backend/app/workers/vehicle/ultimatespecs/vehicle_ultimate_r2_enricher.py fájlt, amely implementálja a Producer-Consumer lánc harmadik elemét (The Analyzer). A robot offline adattisztítást és strukturálást végez a vehicle.external_reference_library táblában, fuzzy mapping segítségével kinyeri a technikai specifikációkat (power_kw, engine_capacity, torque_nm, stb.), és strukturált JSON formátumba helyezi őket standardized és _raw mezőkkel. A robotot teszteltem a Docker környezetben, ahol sikeresen feldolgozott egy sort (ID=1, Honda Civic), kitöltötte a fizikai oszlopokat (power_kw=150, engine_cc=1993) és frissítette a pipeline_status-t pending_match-re. Dokumentációt frissítettem a .roo/history.md fájlban, majd lezártam a Gitea kártyát a gitea_manager.py finish paranccsal.

A Gitea #90-es kártya ("Worker: vehicle_ultimate_r2_enricher") sikeresen teljesítve. Létrehoztam a `backend/app/workers/vehicle/ultimatespecs/vehicle_ultimate_r2_enricher.py` fájlt, amely implementálja a Producer-Consumer lánc harmadik elemét (The Analyzer). A robot offline adattisztítást és strukturálást végez a `vehicle.external_reference_library` táblában, fuzzy mapping segítségével kinyeri a technikai specifikációkat (power_kw, engine_capacity, torque_nm, stb.), és strukturált JSON formátumba helyezi őket `standardized` és `_raw` mezőkkel. A robotot teszteltem a Docker környezetben, ahol sikeresen feldolgozott egy sort (ID=1, Honda Civic), kitöltötte a fizikai oszlopokat (power_kw=150, engine_cc=1993) és frissítette a pipeline_status-t `pending_match`-re. Dokumentációt frissítettem a `.roo/history.md` fájlban, majd lezártam a Gitea kártyát a `gitea_manager.py finish` paranccsal.
Sign in to join this conversation.