Frissítve: 7 perce·Ma: 27
Modellek & LLM
AI által generált szöveg

Megjelent a Mr. Chatterbox, a 28 ezer victoria-kori könyvből tanult nyelvi modell

Trip Venturella fejlesztette ki a modellt, amely 2,05 GB méretű és 340 millió paramétert tartalmaz.

Megjelent a Mr. Chatterbox, a 28 ezer victoria-kori könyvből tanult nyelvi modell
Fotó: Igor Shalyminov / Unsplash
Forrás: Simon WillisonSzerző: AI Forradalom szerk.
Megosztás

Trip Venturella a 2026. március 30-án bemutatta a Mr. Chatterbox nevű nyelvi modellt, amely 28 035 viktoriánus könyvből, 1837–1899 közötti brit kiadványokból készült. A képzési korpusz 2,93 milliárd tokenből áll, a modell 340 millió paraméterrel és 2,05 GB méretű súlyfájllal rendelkezik.

Miért fontos ez? A modell kizárólag nyilvánosan hozzáférhető, szerzői jogi szabad forrásokból van felépítve, így nem igényel szabadon letölthető, licenc nélküli adatokat. Ez egy előrelépés a “etikus” LLM-ek felé, amelyek a jövőben a jogvédett tartalom minimalizálásával is működhetnek.

A technikai részletek szerint a Mr. Chatterbox a Karpathy nanochat keretrendszerrel készült, és 2,93 milliárd tokenre lett finomhangolva. A 20:1 paraméter–token arányt vizsgálva a 340 millió paraméterrel rendelkező modellhez több mint 7 milliárd token szükséges, így a jelenlegi adathalmaz mérete nem elég ahhoz, hogy a modell hasonlóan hatékony legyen, mint a GPT-2 Medium.

A modell használata egyszerű: a Hugging Face Spaces demo vagy a saját LLM környezetben futtatható. A fejlesztő a Claude Code segítségével készített egy plugin-t, amelyet a llm install llm-mrchatterbox paranccsal telepíthetnek, majd a llm chat -m mrchatterbox paranccsal indíthatnak beszélgetést.

A továbbiakban a fejlesztők célja, hogy a teljesen nyilvános adatbázisokból álló modellből egy hasznos beszélgetőpartnert hozzanak létre. Jelenleg a modell „Markov‑chain” jellegű válaszokat ad, de a 2022 Chinchilla kutatás alapján a tréning adatmennyiség megduplázása vagy akár négyszeresére emelése szükséges a praktikus használathoz. A következő hónapokban várható a modell továbbfejlesztése és a felhasználói visszajelzések alapján történő finomhangolás.

Megosztás

Tetszik az oldal? Támogasd a fejlesztést

Az AI Forradalom egy automatizált pipeline: napi adatgyűjtés, LLM-feldolgozás és infrastruktúra fenntartása valódi költségekkel jár. Ha értékesnek találod a tömör, naprakész AI-összefoglalókat, egy kávé sokat segít.

Támogatom