AI-szerkesztőségi eljárás
Az AI Forradalom cikkeit nagy nyelvi modellek (LLM) készítik el, emberi felügyelet alatt. Ez az oldal részletesen leírja, hol és hogyan kerül a folyamatba AI, hol és hogyan ember.
Mit csinál az AI
Az AI-pipeline három rétegen használ nyelvi modelleket:
- Tartalom-elemzés. A bejövő RSS-tételeket egy modell elemzi: meghatározza a sztori típusát (termékhír, kutatás, üzleti tranzakció, szabályozás stb.), kinyeri a kulcs-tényeket (számok, nevek, dátumok), és javasol egy szerkesztői szempontot (angle).
- Cikk-generálás. A modell az eredeti angol nyelvű forrás és a tartalom-elemzés alapján három részben elkészíti a magyar összefoglalót: cím, lead, törzs. A három részt külön LLM-hívás generálja, hogy mindegyikhez célzott promptot lehessen adni (címhez tömörség és figyelemfelhívás, lead-hez tényszerűség, törzshöz strukturáltság).
- Minőségkapu és javítás. Egy második modell végigellenőrzi a generált cikket: tényszerűség (az állítások szerepelnek-e a forrásban), magyar nyelvi minőség, struktúra. Ha a cikk nem üti meg a küszöböt, automatikus javítás (repair pass) fut, vagy a cikk vázlatba kerül és nem publikálódik.
Plusz egy negyedik AI-réteg végzi a duplikátum-szűrést: az új cikket vektoros beágyazással (embedding) hasonlítjuk össze a korábbi cikkekkel, és ha 92%-os hasonlóság fölött találunk egyezést, a cikk nem készül el.
Mit csinál az ember
A pipeline mögött egyetlen felelős szerkesztő áll — Khava Nikita. A napi szerkesztői feladatok:
- Tartalom-mintavétel. Naponta többször átolvas friss cikkeket, kiszűri a hibás összefoglalókat, manuálisan javít vagy archivál ahol kell.
- Minőségi monitoring. Minden reggel ellenőrzi a
pipeline_healthsnapshotot: publikálási arány, átlagos minőségi pontszám, nyelvi hibák, queue-állapot. Ha valami eltér a normáltól, beavatkozik. - Hibajelzés-kezelés. Az ai@aiforradalom.hu címre érkező minden visszajelzést személyesen olvas és intézkedik. Lásd: hibajavítási folyamat.
- Pipeline-fejlesztés. Új RSS-források felvétele, prompt-tuning a felfedezett hibatípusok alapján, modell-választás karbantartása, képkereső-finomítás, vizuális (OG kép, Facebook poszt) optimalizáció.
- Kiemelt pozíciók. A főoldal hero/lead/featured slotjait a pipeline javasolja, de a szerkesztő manuálisan felüldefiniálhatja.
Modellek és infrastruktúra
Két LLM-szolgáltatóra támaszkodunk: Google Gemini (a fő generálási feladatokra) és Groq (a duplikátum-szűréshez, minőségkapuhoz, javításhoz). A modellválasztást a feladat jellege és a válaszidő-igény határozza meg: rövid, gyors lépésekhez gyorsabb és olcsóbb modellt használunk, hosszabb generáláshoz erősebbet.
Az infrastruktúra Vercel (frontend) és Supabase (adatbázis, Edge Functions) alapokon fut, európai régiókban. A képeket Cloudflare R2 tárolja.
Átláthatóság
Minden cikk fejlécében külön AI-átláthatósági jelvény jelzi a generálás tényét. Az eredeti angol forrás megjelenik a cikk fejlécében és lábrészében is, közvetlen linkkel.
A schema.org metaadatok a Google és más keresők felé is jelzik az AI-asszisztált előállítást: a NewsArticle entitás creativeWorkStatus: "AI-assisted" mezőt visel, és minden cikk hivatkozza a forrás URL-jét (citation).
Mit NEM csinál az AI
A pipeline NEM hoz létre saját, forrás nélküli állításokat (a minőségkapu kiszűri a támasz nélküli számokat és kontextust). NEM másol szóról szóra (szerzői jogi szempontból kerüljük). NEM publikál szponzorált tartalmat. NEM szerkeszti a más oldalon megjelent felhasználói véleményeket vagy kommentárokat.
Hibák és korlátok
Az AI-generált tartalom hibázhat — különösen a számok, dátumok, nevek terén, vagy ha a forrás véleménycikket ténymegállapításként közöl. A minőségkapu ezeket a hibákat visszaszorítja, de nem zárja ki teljesen. Ha hibát talál, jelezze az ai@aiforradalom.hu címen — a szerkesztő személyesen javítja.