AI-szerkesztőségi eljárás

Az AI Forradalom cikkeit nagy nyelvi modellek (LLM) készítik el, emberi felügyelet alatt. Ez az oldal részletesen leírja, hol és hogyan kerül a folyamatba AI, hol és hogyan ember.

Mit csinál az AI

Az AI-pipeline három rétegen használ nyelvi modelleket:

Tartalom-elemzés. A bejövő RSS-tételeket egy modell elemzi: meghatározza a sztori típusát (termékhír, kutatás, üzleti tranzakció, szabályozás stb.), kinyeri a kulcs-tényeket (számok, nevek, dátumok), és javasol egy szerkesztői szempontot (angle).
Cikk-generálás. A modell az eredeti angol nyelvű forrás és a tartalom-elemzés alapján három részben elkészíti a magyar összefoglalót: cím, lead, törzs. A három részt külön LLM-hívás generálja, hogy mindegyikhez célzott promptot lehessen adni (címhez tömörség és figyelemfelhívás, lead-hez tényszerűség, törzshöz strukturáltság).
Minőségkapu és javítás. Egy második modell végigellenőrzi a generált cikket: tényszerűség (az állítások szerepelnek-e a forrásban), magyar nyelvi minőség, struktúra. Ha a cikk nem üti meg a küszöböt, automatikus javítás (repair pass) fut, vagy a cikk vázlatba kerül és nem publikálódik.

Plusz egy negyedik AI-réteg végzi a duplikátum-szűrést: az új cikket vektoros beágyazással (embedding) hasonlítjuk össze a korábbi cikkekkel, és ha 92%-os hasonlóság fölött találunk egyezést, a cikk nem készül el.

Mit csinál az ember

A pipeline mögött egyetlen felelős szerkesztő áll — Khava Nikita. A napi szerkesztői feladatok:

Tartalom-mintavétel. Naponta többször átolvas friss cikkeket, kiszűri a hibás összefoglalókat, manuálisan javít vagy archivál ahol kell.
Minőségi monitoring. Minden reggel ellenőrzi a pipeline_health snapshotot: publikálási arány, átlagos minőségi pontszám, nyelvi hibák, queue-állapot. Ha valami eltér a normáltól, beavatkozik.
Hibajelzés-kezelés. Az ai@aiforradalom.hu címre érkező minden visszajelzést személyesen olvas és intézkedik. Lásd: hibajavítási folyamat.
Pipeline-fejlesztés. Új RSS-források felvétele, prompt-tuning a felfedezett hibatípusok alapján, modell-választás karbantartása, képkereső-finomítás, vizuális (OG kép, Facebook poszt) optimalizáció.
Kiemelt pozíciók. A főoldal hero/lead/featured slotjait a pipeline javasolja, de a szerkesztő manuálisan felüldefiniálhatja.

Modellek és infrastruktúra

Két LLM-szolgáltatóra támaszkodunk: Google Gemini (a fő generálási feladatokra) és Groq (a duplikátum-szűréshez, minőségkapuhoz, javításhoz). A modellválasztást a feladat jellege és a válaszidő-igény határozza meg: rövid, gyors lépésekhez gyorsabb és olcsóbb modellt használunk, hosszabb generáláshoz erősebbet.

Az infrastruktúra Vercel (frontend) és Supabase (adatbázis, Edge Functions) alapokon fut, európai régiókban. A képeket Cloudflare R2 tárolja.

Átláthatóság

Minden cikk fejlécében külön AI-átláthatósági jelvény jelzi a generálás tényét. Az eredeti angol forrás megjelenik a cikk fejlécében és lábrészében is, közvetlen linkkel.

A schema.org metaadatok a Google és más keresők felé is jelzik az AI-asszisztált előállítást: a NewsArticle entitás creativeWorkStatus: "AI-assisted" mezőt visel, és minden cikk hivatkozza a forrás URL-jét (citation).

Mit NEM csinál az AI

A pipeline NEM hoz létre saját, forrás nélküli állításokat (a minőségkapu kiszűri a támasz nélküli számokat és kontextust). NEM másol szóról szóra (szerzői jogi szempontból kerüljük). NEM publikál szponzorált tartalmat. NEM szerkeszti a más oldalon megjelent felhasználói véleményeket vagy kommentárokat.

Hibák és korlátok

Az AI-generált tartalom hibázhat — különösen a számok, dátumok, nevek terén, vagy ha a forrás véleménycikket ténymegállapításként közöl. A minőségkapu ezeket a hibákat visszaszorítja, de nem zárja ki teljesen. Ha hibát talál, jelezze az ai@aiforradalom.hu címen — a szerkesztő személyesen javítja.