Az LLM szójegyzék: Fogalmak és meghatározások

Bevezetés

A nagy nyelvi modellek világa gyorsabban változik, mint bármely más technológiai terület. Minden hónapban új architektúrák, új eszközök, új gondolkodási formák, új visszakeresési rendszerek és új optimalizálási stratégiák jelennek meg, és mindegyik újabb terminológiai réteget hoz magával.

A marketingesek, SEO-szakemberek és digitális stratégák számára a kihívás nem csupán az LLM-ek használata, hanem a felfedezést magát meghatározó technológia nyelvének megértése is.

Ez a szótár segít eligazodni a zavaros információk között. Meghatározza a 2025-ben fontos kulcsfogalmakat, gyakorlati szempontból magyarázza őket, és összekapcsolja őket az AIO-val, a GEO-val és az AI-vezérelt keresés jövőjével. Ez nem egy egyszerű szótár – hanem a modern AI-ökoszisztémákat formáló ötletek térképe.

Használja alapvető referenciaanyagként mindenhez, ami az LLM-ekkel, beágyazásokkal, tokenekkel, képzéssel, visszakereséssel, érveléssel és optimalizálással kapcsolatos.

A–C: Alapvető fogalmak

Figyelem

A Transformer belső mechanizmusa, amely lehetővé teszi a modell számára, hogy a mondat releváns részeire összpontosítson, függetlenül azok pozíciójától. Ez lehetővé teszi az LLM-ek számára, hogy megértsék a kontextust, a kapcsolatokat és a jelentést hosszú szekvenciákban.

Miért fontos: A figyelem minden modern LLM intelligencia gerince. Jobb figyelem → jobb következtetés → pontosabb hivatkozások.

AI-optimalizálás (AIO)

A tartalom strukturálásának gyakorlata, hogy az AI rendszerek pontosan megértsék, visszakeressék, ellenőrizzék és idézzék azt.

Miért fontos: Az AIO az új SEO – alapvető fontosságú az AI áttekintésekben, a ChatGPT keresésben és a Perplexityben való láthatóság szempontjából.

Igazítás

A modellek olyan módon történő kiképzése, hogy azok összhangban legyenek az emberi szándékkal, a biztonsági szabványokkal és a platform céljaival.

Tartalmazza:

RLHF
SFT
alkotmányos AI
preferencia modellezés

Miért fontos: Az összehangolt modellek előre jelezhetőbb, hasznosabb válaszokat adnak, és pontosabban értékelik a tartalmat.

Autoregresszív modell

Olyan modell, amely egyszerre egy token kimenetet generál, amelyek mindegyike a korábbi tokenek hatására alakul.

Miért fontos: Ez magyarázza, miért javítja a generálás minőségét a világosság és a struktúra – a modell egymás után építi fel a jelentést.

Visszaterjesztés

A képzési algoritmus, amely a hibagradiens számításával állítja be a modell súlyait. Így „tanul” egy LLM.

Előítélet

A modell kimenetének mintái, amelyeket torz vagy kiegyensúlyozatlan képzési adatok befolyásolnak.

Miért fontos ez: Az elfogultság befolyásolhatja, hogy a márkád vagy témád hogyan jelenik meg vagy marad ki az AI által generált válaszokban.

Gondolkodási lánc (CoT)

Egy olyan érvelési technika, amelynek során a modell a problémákat lépésről lépésre bontja le, ahelyett, hogy rögtön a végső válaszra ugrana.

Miért fontos ez: Az intelligensebb modellek (GPT-5, Claude 3.5, Gemini 2.0) belső gondolatláncokat használnak a mélyebb érveléshez.

Hivatkozások (az AI keresésben)

Az AI-rendszerek által a generált válaszok alatt feltüntetett források. Megegyezik a generatív keresés „pozíció nullájával”.

Miért fontos: A hivatkozás a láthatóság új mérőszáma.

Kontextusablak

Az a szövegmennyiség, amelyet egy LLM egy interakció során feldolgozni tud.

Tartománya:

32k (régebbi modellek)
200k–2M (modern modellek)
10 millió+ token a legmodernebb architektúrákban

Miért fontos: A nagy ablakok lehetővé teszik a modellek számára, hogy egyszerre egész webhelyeket vagy dokumentumokat elemezzenek – ez elengedhetetlen az AIO számára.

D–H: Mechanizmusok és modellek

Csak dekóder transzformátor

A GPT modellek mögött álló architektúra. Generálásra és érvelésre specializálódott.

Beágyazás

A jelentés matematikai ábrázolása. A szavak, mondatok, dokumentumok és még a márkák is vektorokká alakulnak.

Miért fontos ez? A beágyazások határozzák meg, hogy az AI hogyan értelmezi a tartalmát, és hogy a márkája megjelenik-e a generált válaszokban.

Beágyazási tér / vektortér

A többdimenziós „térkép”, ahol a beágyazások élnek. A hasonló fogalmak csoportosulnak.

Miért fontos ez: Ez az LLM-ek valódi rangsorolási rendszere.

Entitás

Stabil, géppel felismerhető fogalom, például:

Ranktracker
Kulcsszókereső
SEO platform
ChatGPT
Google keresés

Miért fontos ez: Az LLM-ek sokkal inkább támaszkodnak az entitások közötti kapcsolatokra, mint a kulcsszavak egyezésére.

Few-Shot / Zero-Shot tanulás

A modell képessége arra, hogy minimális példákkal (few-shot) vagy példák nélkül (zero-shot) végezzen feladatokat.

Finomhangolás

Az alapmodellre alkalmazott kiegészítő képzés, amelynek célja a modell specializálása egy adott területre vagy viselkedésre.

Generatív motoroptimalizálás (GEO)

Kifejezetten AI által generált válaszok optimalizálása. Arra összpontosít, hogy hiteles hivatkozássá váljon az LLM-alapú keresőrendszerek számára.

GPU / TPU

Speciális processzorok, amelyeket az LLM-ek nagyméretű képzésére használnak.

Hallucináció

Amikor egy LLM helytelen, alátámasztatlan vagy kitalált információkat generál.

Miért fontos ez? A hallucinációk csökkennek, ahogy a modellek jobb képzési adatokat, jobb beágyazásokat és erősebb visszakeresést kapnak.

I–L: Képzés, értelmezés és nyelv

Következtetés

Az LLM-ből származó kimenet generálásának folyamata a képzés befejezése után.

Utasítások finomhangolása

A modell kiképzése annak érdekében, hogy megbízhatóan kövesse a felhasználói utasításokat.

Ezáltal az LLM-ek „hasznosnak” tűnnek.

Tudáshatár

Az a dátum, amely után a modellnek nincs több képzési adata. A visszakereséssel kiegészített rendszerek részben megkerülik ezt a korlátozást.

Tudásgráf

Az entitások és azok kapcsolataik strukturált ábrázolása. A Google Kereső és a modern LLM-ek ezeket a grafikonokat használják a megértés alapjául.

Nagy nyelvi modell (LLM)

Transformer-alapú neurális hálózat, amelyet nagy adathalmazokon képeztek ki a nyelv értelmezésére, generálására és megértésére.

LoRA (alacsony rangú adaptáció)

Egy módszer a modellek hatékony finomhangolására anélkül, hogy minden paramétert módosítani kellene.

M–Q: Modellviselkedések és rendszerek

Szakértők keveréke (MoE)

Olyan architektúra, amelyben több „szakértő” neurális almodell különböző feladatokat lát el, és egy útválasztó hálózat választja ki, melyik szakértőt aktiválja.

Miért fontos ez? A MoE modellek (GPT-5, Gemini Ultra) sokkal hatékonyabbak és nagyobb léptékben alkalmazhatók.

Modell-összehangolás

Lásd „Igazítás” – a biztonságra és a szándék-megfeleltetésre összpontosít.

Modell súlyok

A képzés során megtanult numerikus paraméterek. Ezek határozzák meg a modell viselkedését.

Multimodális modell

Többféle típusú bemenetet elfogadó modell:

szöveg
képek
hang
videó
PDF
kód

Miért fontos ez: A multimodális LLM-ek (GPT-5, Gemini, Claude 3.5) képesek teljes weboldalakat holisztikusan értelmezni.

Természetes nyelv megértése (NLU)

A modell képessége a jelentés, a kontextus és a szándék értelmezésére.

Neurális hálózat

Egymással összekapcsolt csomópontok (neuronok) réteges rendszere, amelyet minták tanulására használnak.

Ontológia

Egy adott területen belüli fogalmak és kategóriák strukturált ábrázolása.

Paraméterek száma

A modellben megtanult súlyok száma.

Miért fontos ez? Több paraméter → nagyobb ábrázolási kapacitás, de nem mindig jobb teljesítmény.

Pozíciós kódolás

A tokenekhez hozzáadott információ, hogy a modell ismerje a szavak sorrendjét egy mondatban.

Prompt-tervezés

Bemenetek kialakítása az LLM-től kívánt kimenetek előidézése érdekében.

R–T: Visszakeresés, érvelés és képzési dinamika

RAG (visszakereséssel kiegészített generálás)

Olyan rendszer, amelyben az LLM külső dokumentumokat keres elő, mielőtt választ generálna.

Miért fontos ez? A RAG jelentősen csökkenti a hallucinációkat és támogatja az AI keresést (ChatGPT Search, Perplexity, Gemini).

Érvelési motor

Az a belső mechanizmus, amely lehetővé teszi az LLM számára a többlépcsős elemzés elvégzését.

A következő generációs LLM-ek (GPT-5, Claude 3.5) a következőket tartalmazzák:

gondolatmenet
eszközhasználat
tervezés
önreflexió

Erősítéses tanulás emberi visszajelzésekből (RLHF)

Olyan képzési folyamat, amelynek során az emberek értékelik a modell kimeneteit, segítve ezzel a viselkedés irányítását.

Újrarangsorolás

Egy visszakeresési folyamat, amely a dokumentumokat minőségük és relevanciájuk szerint rendezi át.

Az AI keresőrendszerek az újrarangsorolást használják a hivatkozási források kiválasztásához.

Szemantikus keresés

Beágyazásokon, nem pedig kulcsszavakon alapuló keresés.

Önfigyelés

Egy mechanizmus, amely lehetővé teszi a modell számára, hogy a mondatban szereplő különböző szavak fontosságát egymáshoz viszonyítva értékelje.

Softmax

Matematikai függvény, amelyet a logitok valószínűségekké alakítására használnak.

Felügyelt finomhangolás (SFT)

A modell kézi betanítása jó viselkedésű, válogatott példák alapján.

Token

Az LLM által feldolgozott szöveg legkisebb egysége. Lehet:

egy egész szó
szótag
írásjel
szimbólum

Tokenizálás

A szöveg tokenekre bontásának folyamata.

Transzformátor

A modern LLM-ek mögött álló neurális architektúra.

U–Z: Haladó fogalmak és új trendek

Vektor adatbázis

A beágyazások tárolására és visszakeresésére optimalizált adatbázis. Gyakran használják RAG rendszerekben.

Vektorhasonlóság

Két beágyazás vektortérben való közelségének mérőszáma.

Miért fontos ez? A hivatkozások kiválasztása és a szemantikai egyezés egyaránt a hasonlóságtól függ.

Súlyösszekapcsolás

Egy technika, amelyet a paraméterek számának csökkentésére használnak a rétegek közötti súlyok megosztásával.

Zero-Shot általánosítás

A modell azon képessége, hogy olyan feladatokat is helyesen végezzen el, amelyekre soha nem képezték ki kifejezetten.

Zero-Shot visszakeresés

Amikor egy AI-rendszer előzetes példák nélkül helyes dokumentumokat keres elő.

Miért fontos ez a szótár az AIO, a SEO és az AI felfedezés szempontjából?

A keresőmotorokról az AI-motorokra való átállás azt jelenti, hogy:

a felfedezés most már szemantikai
rangsorolás → hivatkozás
kulcsszavak → entitások
oldal tényezők → vektor tényezők
SEO → AIO/GEO

Ezeknek a kifejezéseknek a megértése:

javítja az AIO stratégiát
megerősíti az entitásoptimalizálást
tisztázza, hogyan értelmezik az AI modellek a márkádat
segít diagnosztizálni az AI hallucinációkat
jobb tartalomklasztereket hoz létre
útmutatást ad a Ranktracker eszköz használatához
jövőbiztosítja marketingjét

Mert minél jobban megérted az LLM-ek nyelvét, annál jobban megérted, hogyan lehet belelátni azok működésébe.

Ez a szótár a referenciapontod – az új AI-vezérelt felfedezési ökoszisztéma szótára.