SQL-előzményekből épít tudásbázist a DataHub az AI-hallucinációk ellen
A DataHub új kontextus-intelligencia rétege SQL-lekérdezési előzményeket használ, hogy AI-ügynökök számára biztosítsa a szükséges kontextust, csökkentve a téves válaszokat.

A DataHub csütörtökön dobta piacra kontextus-intelligencia rétegét, amely a meglévő SQL-lekérdezési előzményeket bányássza ki egy szemantikai index felépítéséhez. Ezt az indexet teszi elérhetővé AI-ügynökök számára olyan platformokon keresztül, mint a MCP, LangChain, Google Agent Development Kit és CrewAI. A cég szerint ez lehetővé teszi az ügynökök számára, hogy ne tévesszék el a csatlakozásokat, mivel hozzáférnek a korábban már működő, ember által validált lekérdezésekhez.
A Miro digitális együttműködési platformja korábban 65%-nál rosszabb eredményt produkált AI-ügynökeivel, amikor közvetlenül a több mint 10 000 táblát tartalmazó Snowflake környezetüket kérdezték. A probléma nem a modell volt, hanem a kontextus hiánya. Az új réteg metaadatokat, entitáskapcsolatokat, lekérdezési előzményeket és üzleti szándékot gyűjt össze, így az ügynökök helyes adatbázis-entitásokat tudnak azonosítani SQL generálása előtt.
Kapcsolódó: AI-ügynökök optimalizálása
A kontextus intelligencia alapja
A DataHub alapítói a LinkedInen építették fel az azonos nevű nyílt forráskódú projektet, ahol Shirshanka Das CTO közel 11 évig vezette az adat-infrastruktúrát. A projektnek ma már több mint 15 000 közreműködője és 3 000 gyártási telepítése van világszerte. A Context Intelligence alapjául szolgáló lekérdezési napló-kivonatolási és SQL-elemzési képességek nem ehhez a kiadáshoz készültek, hanem évek alatt fejlődtek a gyártási környezetekben.
Kapcsolódó: LLM-ek szemantikai rétege
Üzleti logika és szemantikai horgonyok
A rendszer a zajos nyers naplók helyett a „golden queries”-re, vagyis a bevált üzleti logikát képviselő, magas minőségű elemzői lekérdezésekre és ütemezett folyamatokra szűr. Ezekből mintákat von ki, és szemantikai horgonyoknak nevezett strukturált szöveges definíciókká alakítja, amelyekre az ügynökök támaszkodnak SQL generálása előtt. A domain szakértők felülvizsgálhatják a javasolt kontextusokat, és feloldhatják az ellentmondásos definíciókat.
Kapcsolódó: autonóm AI-ügynökök
A DataHub pozicionálása szerint a kontextusréteg platformfüggetlen, és nem helyettesíti a meglévő rendszereket, hanem kontextust biztosít olyan végpontoknak, mint a Snowflake szemantikai nézetek vagy a Microsoft Fabric IQ. Kevin Petrie, a BARC elemzője szerint a DataHub megkülönbözteti magát a piacon azzal, hogy képes integrálni a strukturált és strukturálatlan objektumokat, beleértve dokumentumokat és képeket is. A DataHub kontextus-intelligencia rétege a 2024. év elején érhető el a Snowflake és Microsoft Fabric IQ platformokon.
Kapcsolódó: nyelvi modellek tesztelése