Google új AI chipekkel erősít: inference TPU érkezik a héten
A Google a héten, egy Las Vegas-i konferencián mutathatja be az inference feladatokra, vagyis a betanított AI modellek futtatására szánt új TPU chipjeit.

Az Alphabet Inc. tulajdonában lévő Google AI chipjei az elmúlt hónapokban a tech szektor egyik legkeresettebb termékévé váltak, még a cég legnagyobb riválisai is ezeket halmozzák fel — írja a Bloomberg Technology.
A vállalat most arra készül, hogy tovább építse ezt a lendületet, és bevezeti az inference-re, azaz a betanított mesterséges intelligencia modellek futtatására dedikált új chipjeit. Ezzel a lépéssel a Google tovább erősítheti pozícióját a gyorsan növekvő félvezetőpiacon, ahol az AI szoftverek elterjedése hajtja a keresletet, és kihívója lehet a piacvezető Nvidiának.
A Google már több mint egy évtizede tervez chipeket, de most a hangsúly az alacsony késleltetésű, gyors inference-en van. Ez különösen fontos a beszélgetős AI-ügynökök és más, gyors válaszidőt igénylő alkalmazások esetében.
A szilícium aranya
Tavaly a Nvidia is bemutatott egy gyors inference chipet, a Google most hasonlóan célspecifikus megoldással lép piacra. Eddig a Google – a Nvidia korábbi gyakorlatához hasonlóan – egyetlen TPU modellt használt mind a betanításra, mind az inference-re.
A chipkészítés új korszaka
Az új chip bevezetésével azonban a cég specifikusan erre a feladatra optimalizált hardverrel áll elő, ami jelentősen javíthatja az AI modellek futtatásának sebességét és hatékonyságát. A Google inference TPU chipje várhatóan 2024-ben lesz elérhető a fejlesztők számára.