Kutatás2026. ápr. 14.frissítve: 20:18

microgpt: Andrej Karpathy lecsupaszította a GPT-t, 200 sorban a lényeg

Andrej Karpathy, a neves AI-kutató, egy mindössze 200 soros Python szkripttel tette közzé a microgpt-t, amely egy teljes GPT modell betanítására és következtetésére is képes.

Fotó: Gabriel Vasiliu / Unsplash

forrás: Andrej Karpathy·AI Forradalom szerk.·2026. április 14.

Megosztás

A microgpt egyetlen Python fájlban, mindössze 200 sorban tartalmazza egy GPT modell teljes algoritmusát, függőségek nélkül. A fájl tartalmazza a szükséges algoritmikus tartalom teljes egészét: adatkészletet, tokenizálót, autograd motort, GPT-2-szerű neurális hálózati architektúrát, Adam optimalizálót, képzési és következtetési ciklust – Andre Karpathy szerint, aki a karpathy.ai oldalon mutatta be a projektet.

Karpathy célja az LLM-ek (nagyméretű nyelvi modellek) leegyszerűsítése volt, a projekt korábbi munkáinak (micrograd, makemore, nanogpt) csúcspontja. Ez a szkript több projekt (micrograd, makemore, nanogpt stb.) és egy évtizedes megszállottság csúcspontja az LLM-ek lényegükre való egyszerűsítésére – állítja Karpathy.

A mikrogpt működésének szíve

A modell képes mintákat tanulni egy adatkészletből, például 32 000 névből, majd új, hihető hangzású példákat generálni. A microgpt bemutatja, hogyan működik a modell az adatkészlettől a tokenizáláson át a generálásig, rávilágítva az LLM-ek alapvető működési elveire.

A nyitott forráskód jelentősége

A teljes forráskód elérhető egy GitHub gistben, a karpathy.ai/microgpt.html weboldalon, valamint Google Colab notebookként is. Karpathy még művészeti alkotásként is árulja a microgpt-t a karpathy.art oldalon, 2024. március 15-én indította el a projektet.

tetszett a cikk? oszd meg →

Megosztás