Miért buknak meg az AI-termékek, ha a képzési adatok nem felelnek meg a valós világnak?

Bevezető

Amikor először láttam, hogy egy ígéretes bevezetés után egy AI-termék kudarcot vallott, a probléma nem az interfész, az infrastruktúra vagy akár maga a modell volt. A rendszer a belső tesztelés során jól teljesített. A mutatók jól néztek ki, a bemutatók lenyűgözték az érdekelt feleket, és a bevezetés magabiztosan haladt előre. Aztán a valódi felhasználók elkezdtek vele interakcióba lépni ellenőrizetlen környezetben, és szinte azonnal megjelentek a repedések. Ez az élmény megváltoztatta az AI-fejlesztésről alkotott véleményemet. Ma, amikor a csapatok a számítógépes látáshoz szükséges szintetikus adatokról kezdenek beszélni, én ezt általában nem annyira kísérleti technológiának tekintem, hanem inkább egy sokkal mélyebb probléma megoldásának: a legtöbb AI-rendszert olyan környezetben tanítják be, amely sokkal tisztább és szűkebb, mint a valóság.

Az AI-rendszerek öröklik a képzési környezetük korlátait

Az AI-vel kapcsolatos egyik legnagyobb tévhit az a meggyőződés, hogy a modellek széles, emberi értelemben vett értelemben intelligenssé válnak. A gyakorlatban a legtöbb rendszer nagymértékben függ attól a környezettől, amelyből tanul.

Ha egy modellt főként tiszta példák alapján képeznek ki, akkor azt tanulja meg, hogy tiszta bemeneti adatokra számítson. Ha ritkán találkozik kétértelműségekkel, később nehezen boldogul velük. Ha a képzés során hiányoznak a fontos szélsőséges feltételek, a modellnek nincs értelmes hivatkozási pontja, amikor ezek a feltételek a termelés során megjelennek.

Ezért tűnik sok AI-termék lenyűgözőnek a kontrollált bemutatók során, de a bevezetés után inkonzisztensen viselkedik. A probléma nem mindig az, hogy a modell gyenge. Gyakran a rendszer egyszerűen azon határokön kívül működik, amelyekre felkészült.

A valós körülmények nehezebbek, mint a csapatok várják

A termék korai tesztelése általában kedvező körülmények között történik.

A képek viszonylag élesek. A felhasználói viselkedés némileg kiszámítható. A forgatókönyveket szándékosan állítják össze. Az adatfolyamok még elég kicsiek ahhoz, hogy gondosan kezelhetők legyenek.

A valós környezetek mások. A megvilágítás változik. Az eszközök viselkedése következetlen. A bemeneti adatok zajosabbak. Az emberi viselkedés kevésbé strukturált. A ritka körülmények a vártnál gyakrabban fordulnak elő. A változók olyan kombinációkban hatnak egymásra, amelyeket senki sem tesztelt kifejezetten.

Ez a különbség a kontrollált tesztelés és a működési valóság között az a pont, ahol sok AI-rendszer meghibásodni kezd.

A probléma különösen jól látható a számítógépes látás termékekben, mivel a vizuális környezetek természetüknél fogva instabilak. Azok a kis változások, amelyeket az ember alig vesz észre, radikálisan befolyásolhatják a modell megbízhatóságát és az előrejelzés minőségét.

A több adat nem oldja meg automatikusan a problémát

Amikor teljesítménybeli problémák merülnek fel, az alapértelmezett válasz általában egyértelmű: gyűjtsünk több adatot.

Látszólag ez logikus. A több példa javíthatja a tanulást. A gyakorlatban azonban a valós adatállományok gyakran egyenetlenül bővülnek. A csapatok többet gyűjtenek abból, amit könnyű rögzíteni, miközben továbbra is hiányoznak a legfontosabb feltételek.

Az eredmény: méretnövekedés, de érdemi lefedettség nélkül.

Egy AI-rendszer milliókat példákat dolgozhat fel, és mégis kudarcot vallhat bizonyos környezeti feltételek mellett, mert azok alulreprezentáltak maradnak. A szervezet ezt modellezési problémának értelmezi, pedig valójában adatkörnyezeti probléma.

Ez az egyik oka annak, hogy sok AI-kezdeményezés megreked. A további erőfeszítések kisebb javulást eredményeznek, mert a rendszer egy olyan világból tanul, amely szerkezetileg továbbra is hiányos.

A bemutatók a kifinomultságot, a termelés pedig a rugalmasságot jutalmazza

Az egyik oka annak, hogy ez a probléma továbbra is fennáll, az, hogy a bemutatók és a valódi bevezetések különböző szempontok szerint optimalizálnak.

A bemutatók a zökkenőmentességet jutalmazzák. A csapatok természetesen olyan környezetet mutatnak be, ahol a rendszer jól teljesít. A cél a bizalom és a lendület.

A termelési környezetek a rugalmasságot jutalmazzák. A rendszereknek akkor is kiszámíthatóan kell viselkedniük, ha a körülmények romlanak, a felhasználók váratlanul viselkednek, vagy a bemeneti adatok inkonzisztensek lesznek.

Egy kifinomult demo elrejtheti a rendszer által használt adatokkal kapcsolatos törékeny feltételezéseket. Ezek a feltételezések gyakran láthatatlanok maradnak, amíg a méretnövekedés nem hoz magával olyan változékonyságot, amely soha nem volt része a képzésnek.

Ezért érzik magukat a szervezetek néha meglepve a bevezetés után. Szemszögükből a termék a telepítés előtt „működött”. A valóságban azonban egy gondosan korlátozott környezetben működött.

Az AI-termékek fokozatosan buknak meg, mielőtt láthatóan meghibásodnának

Az AI megbízhatósági problémáinak egyik legérdekesebb vonása, hogy gyakran lassan alakulnak ki.

Eleinte a felhasználók csak alkalmi következetlenségeket vesznek észre. A csapatok manuális ellenőrzési lépéseket vezetnek be. A bizalmi küszöbértékeket módosítják. A szélsőséges eseteket emberi beavatkozásra utalják.

Az idő múlásával a rejtett működési súrlódások növekednek. Az alkalmazottak már nem bíznak teljes mértékben az automatizálásban. Az ügyfelek kiszámíthatatlan élményekkel szembesülnek. A támogató csapatok több időt töltenek a kivételek kezelésével.

A termék technikailag még mindig működik, de a vele kapcsolatos működési terhek folyamatosan nőnek.

Ez a fokozatos bizalomvesztés sokkal gyakoribb, mint a katasztrofális meghibásodás, és általában ugyanarra az alapvető problémára vezethető vissza: a rendszer soha nem tanult egy kellően reprezentatív környezetből.

Miért válnak egyre fontosabbá a szintetikus környezetek?

Itt válnak stratégiailag hasznossá a szintetikus adatok.

Nem tekintem a szintetikus környezetet a valóság helyettesítőjének. Olyan eszköznek tekintem, amely kiegészíti azt, amit a valóság önmagában nehezen tud biztosítani. A csapatok szabályozott variációkat vezethetnek be, szimulálhatnak ritka körülményeket, és szándékosan tesztelhetnek szélsőséges eseteket, ahelyett, hogy megvárnák, amíg azok spontán módon jelentkeznek.

Ez jelentősen megváltoztatja a fejlesztési folyamatot.

Ahelyett, hogy teljes mértékben a passzív adatgyűjtésre támaszkodnának, a szervezetek aktívan alakíthatják azokat a feltételeket, amelyek mellett az AI-rendszerek tanulnak. Strukturált módon vizsgálhatják a fényviszonyok változásait, a környezeti zajokat, az objektumok közötti interakciókat és a szokatlan forgatókönyveket.

Az érték nem csupán a mesterséges realizmusban rejlik. Az érték a kontrollált lefedettségben rejlik.

A megbízhatóság a szándékos variációtól függ

Az erős AI-rendszereket nem egyszerűen nagy mennyiségű adatra képezik ki. Értelmes variációkra képezik ki őket.

Ez a különbség azért fontos, mert a valós környezetek tele vannak finom különbségekkel. A kamera szöge változik. Az időjárás befolyásolja a láthatóságot. A felhasználói viselkedés alakul. A hardver minősége változik.

Ha ezek a változatosságok hiányoznak a képzés során, a bevezetés kiszámíthatatlanná válik.

A szintetikus környezetek lehetővé teszik a csapatok számára, hogy szándékosan modellezzék ezeket a különbségeket. Ahelyett, hogy abban reménykednének, hogy a fontos feltételek természetesen megjelennek az összegyűjtött adatokban, szisztematikusan bevezethetik őket, és értékelhetik a rendszer viselkedését.

Így a robusztusság nem véletlenszerű, hanem mérhetővé válik.

Az AI-fejlesztés egyre inkább infrastrukturális diszciplínává válik

Szélesebb körű változás zajlik az iparágban.

A korai AI-fejlesztés nagyrészt a modellarchitektúrára és a kísérletezésre összpontosított. A nehéz problémák egyre inkább infrastrukturális jellegűek. Az adatminőség, a reprodukálhatóság, a környezet-ellenőrzés és a validációs folyamatok ma már ugyanolyan mértékben alakítják az eredményeket, mint az algoritmusok kiválasztása.

A szervezetek kezdik felismerni, hogy az AI-rendszerek nem csupán szoftvertermékek. Ezek tanuló rendszerek, amelyek megbízhatósága a képzés során tapasztalt környezettől függ.

Ez a felismerés megváltoztatja a csapatok adatkezelési stratégiáját.

A képzési környezeteket már nem ideiglenes eszközként kezelik, hanem operatív infrastruktúraként.

A reprodukálhatóság fontosabb, mint a legtöbb csapat gondolná

Az egyik ok, amiért a kontrollált környezetek fontosak, a reprodukálhatóság.

Amikor a teljesítmény váratlanul megváltozik, a csapatoknak meg kell érteniük, hogy miért. Ez rendkívül nehéz feladat, ha az adatkészletek ellenőrizhetetlen módon alakulnak, vagy a környezeti változásokat nem dokumentálják megfelelően.

A szintetikus környezetek megkönnyítik a kontrollált kísérletezést. A feltételek újra létrehozhatók, a paraméterek beállíthatók, és a rendszer viselkedése összehasonlítható ismétlődő forgatókönyvek alapján.

Ez csökkenti a találgatásokat, és lehetővé teszi a csapatok számára, hogy szisztematikusabban diagnosztizálják a gyenge pontokat.

A nagy léptékben működő AI-termékek esetében ez a működési átláthatóság egyre értékesebbé válik.

Miért nehéz visszanyerni a felhasználók bizalmát

A megbízhatatlan AI-rendszerek talán legnagyobb kihívása az, hogy a bizalom törékeny.

A felhasználók tolerálhatják a hagyományos szoftverekben előforduló alkalmi hibákat, mert a logika érthetőnek tűnik. Az AI-meghibásodások gyakran következetlennek és nehezen megjósolhatónak tűnnek. Ez a kiszámíthatatlanság megváltoztatja, ahogyan az emberek a termékkel interakcióba lépnek.

Amint a felhasználók megbízhatatlan viselkedésre számítanak, a termék elfogadása lelassul. Nő a kézi ellenőrzés. A bizalom csökken, még akkor is, ha a rendszer később javul.

Ezért olyan fontosak a szilárd képzési környezetek. A megbízhatóság nem csupán technikai mutató. Meghatározza, hogy az emberek érzelmileg hogyan viszonyulnak magához a termékhez.

A következő generációs AI-termékek

A sikeres AI-termékek következő generációja valószínűleg másképp fog kinézni, mint sok korai rendszer.

Nem egyszerűen nagyobb modellekre vagy több számítási kapacitásra fognak támaszkodni. Jobb ellenőrzésű tanulási környezetekre, erősebb validációs stratégiákra, valamint a variációk és a szélsőséges esetek lefedésére irányuló, átgondoltabb megközelítésekre fognak támaszkodni.

Azok a szervezetek, amelyek ezt megértik, máris átalakítják prioritásaikat. Nagyobb összegeket fektetnek be az adatinfrastruktúrába, a szimulációs folyamatokba és az ellenőrzött tesztelési környezetekbe, mert felismerik, hogy a modell minősége önmagában nem elég.

Záró gondolat

A legtöbb AI-termék nem azért bukik meg, mert a technológia nem képes a feladatra. Hanem azért, mert a betanításukhoz használt környezetek túl szűkek ahhoz képest, amivel végül szembesülnek.

Amint ez az eltérés megjelenik, a munkafolyamatok instabillá válnak, a felhasználók bizalma megrendül, és a működési költségek a háttérben csendesen emelkednek.

Azok a szervezetek, amelyek megbízhatóbb rendszereket építenek, általában azok, amelyek hajlandóak a képzési környezetet ugyanolyan komolyan venni, mint a kódot, az infrastruktúrát és a telepítési folyamatokat.

Ez a változás talán nem olyan látható, mint egy új modell megjelenése, de a gyakorlatban gyakran ez határozza meg, hogy egy AI-termék csak a bemutatókon marad-e lenyűgöző, vagy a valós világban is megbízhatóan működik-e.

Miért buknak meg az AI-termékek, ha a képzési adatok nem felelnek meg a valós világnak?

Bevezető

Az AI-rendszerek öröklik a képzési környezetük korlátait

A valós körülmények nehezebbek, mint a csapatok várják

A több adat nem oldja meg automatikusan a problémát

A bemutatók a kifinomultságot, a termelés pedig a rugalmasságot jutalmazza

Az AI-termékek fokozatosan buknak meg, mielőtt láthatóan meghibásodnának

Miért válnak egyre fontosabbá a szintetikus környezetek?

A megbízhatóság a szándékos variációtól függ

Az AI-fejlesztés egyre inkább infrastrukturális diszciplínává válik

A reprodukálhatóság fontosabb, mint a legtöbb csapat gondolná

Miért nehéz visszanyerni a felhasználók bizalmát

A következő generációs AI-termékek

Záró gondolat

Felix Rose-Collins

Ranktracker's CEO/CMO & Co-founder

Miért buknak meg az AI-termékek, ha a képzési adatok nem felelnek meg a valós világnak?

Bevezető

Az AI-rendszerek öröklik a képzési környezetük korlátait

A valós körülmények nehezebbek, mint a csapatok várják

A több adat nem oldja meg automatikusan a problémát

A bemutatók a kifinomultságot, a termelés pedig a rugalmasságot jutalmazza

Az AI-termékek fokozatosan buknak meg, mielőtt láthatóan meghibásodnának

Miért válnak egyre fontosabbá a szintetikus környezetek?

A megbízhatóság a szándékos variációtól függ

Az AI-fejlesztés egyre inkább infrastrukturális diszciplínává válik

A reprodukálhatóság fontosabb, mint a legtöbb csapat gondolná

Miért nehéz visszanyerni a felhasználók bizalmát

A következő generációs AI-termékek

Záró gondolat

Felix Rose-Collins

Ranktracker's CEO/CMO & Co-founder

Kezdje el használni a Ranktracker-t... Ingyen!