Jistě jste už mnohokrát slyšeli debaty o příchodu obecné umělé inteligence, neboli AGI (Artificial General Intelligence). S tímto termínem se v diskusích šermuje už dlouho, ale shoda na jeho významu není příliš široká. Podívejme se proto na několik přístupů k tomu, co vlastně AGI znamená.
Testovací AGI
Za znamení příchodu obecné inteligence byl po desetiletí považován Turingův test. V něm si člověk dopisuje s někým, o kom neví, jestli je lidskou bytostí, nebo AI. Pokud člověk nebude schopen pouze na základě tohoto dopisování určit, jestli jeho partner je člověk, nebo AI, AI testem prošla.Turingovým testem se prohnaly AI už před řadou měsíců. Je symptomatické, že dosažení tohoto milníku žádné zvláštní pozdvižení nevyvolalo (AI překonává jeden milník za druhým). A ještě symptomatičtější je, že aby AI v Turingově testu uspěly, bývají instruované, aby hrály hloupého. A neukazovaly např. kolika jazyky umí mluvit, že umí psát bez chyb a nemusí u toho klít.Objevují se další jednotlivé testy, které na cestě k AGI představují asi důležité zastávky. Společnost Epoch AI například vyvinula ve spolupráci se špičkovými matematiky sadu extrémně náročných matematických úloh, tzv. FrontierMath. I v nich se AI modely nepřekvapivě velmi rychle zlepšují. Podobným procesem prochází i jiný test s dosti ponurým názvem Humanity’s Last Exam, ve kterém AI musí odpovídat na dosti obtížné otázky v širokém spektru oborů.Trochu jiným typem testu je ARC-AGI. Tento test se zaměřuje na schopnosti modelů naučit se na několika málo příkladech nový vzorec, a tento nový vzorec aplikovat na další příklady (AI neviděly tyto vzorce v trénovacích datech). Schopnost modelů učit se „on the fly“ je překvapivě malá, byť i ona se zlepšuje.
Ekonomická AGI
Před několika týdny přišla OpenAI s novým benchmarkem GDPval. Smyslem tohoto benchmarku je zjišťovat, jak dobře AI vykoná reálné pracovní úkoly, které v ekonomice řeší zkušení experti.Jelikož je OpenAI opravdu bohatá firma, může si dovolit testovat modely tak, že najme skutečné seniorní právníky, manažery ve zdravotnictví, finanční analytiky apod. a nechá je navrhnout a následně i vypracovat reálné pracovní úkoly. Nejsou to přitom žádná snadná zadání. Lidé se 14 lety zkušeností v oboru potřebují na každou z těchto úloh v průměru 7 hodin (a na některé úkoly i několik týdnů).Tyto dosti komplexní úkoly vypracuje zároveň i AI. Následně OpenAI najme jiné zkušené právníky, manažery či analytiky a nechá je slepě vyhodnotit, jestli úkol zvládla lépe splnit AI, či jejich seniorní kolega z masa a krve.Zatímco před rokem byly AI výrazně horší než skuteční experti (AI byly lepší než experti jen v 10 % případů), aktuální modely už jsou s experty dost srovnatelné (ve 44 % procentech byla AI lepší a v dalších 4 % s experty remizovala). Úlohy přitom zvládnou řešit 100x rychleji.
Jako člověk
Jinak jde na porovnání s člověkem před pár dny zveřejněná metodika, za kterou stojí známý výzkumník Dan Hendrycks. Ten definuje AGI jako AI, která dokáže šíří i úrovní kognitivních schopností vyrovnat nebo předčit kvalitně vzdělaného dospělého člověka.Aby šíři i úroveň schopností mohl Hendrycks měřit, vyšel ze široce a dlouhodobě využívaného rozdělení kognitivních schopností do 10 oblastí (Cattell-Horn-Carroll teorie). Po určité adaptaci těchto oblastí pro potřeby testování AI pak zkoumá např. obecné znalosti, adaptivní učení, dlouhodobou paměť, vizuální a sluchové zpracování nebo rychlost reakcí.Výsledkem tohoto širokého zkoumání je jakýsi profil AGI. U každé konkrétní AI tak můžeme vidět, které kognitivní schopnosti dospělého vzdělaného člověka už má, které ne, a v jaké míře. Celkové skóre u GPT-4 bylo 27 %, GPT-5 už dosahuje 58 %.Současné nejlepší AI modely vynikají a v mnohém překonávají i vzdělaného dospělého např. ve schopnosti číst a psát, matematických schopnostech či obecných vědomostech. Co naopak AI stále výrazně chybí, je dlouhodobá paměť, a současné nespecializované AI jsou také výrazně slabší než lidi ve zpracování vizuálních podnětů.
Při charakterizaci schopností AI se vžilo sousloví „jagged frontier“. Schopnosti AI jsou zubaté. Někde vynikají a předčí i špičkové lidské experty. Jinde jsou zase trochu nepochopitelně chybující a slabé.Dan Hendrycks přirovnává celkové schopnosti AI k síle motoru. „Umělá mysl, stejně jako motor, je nakonec omezena svou nejslabší součástí.“ To by tváří tvář „zubatým“ schopnostem AI mohlo být uklidňující. Dokavaď neumožníme AI například dlouhodobou paměť, nebude skutečně schopná a my nad ní budeme mít vždy vrch.K získání vrchu nad lidmi ale bohužel nemusí vést totožný profil kognitivních schopností, jaký má člověk. Při pohledu na usoplenou dvounohou opici si lev jistě může říkat: Tahle malá hromádka slaboučkých svalů že by mě mohla ohrozit? To by musela mít alespoň pořádné zuby, vidět ve tmě, a mít tlustou kůži! Sice má větší mozek, ale bez schopnosti trávit kůži antilopy nic nezmůže! Neuplyne zase tak dlouho a lev může o své nadřazenosti spekulovat leda tak z nového výběhu v ZOO.