„Schopnosti AI stagnují! Divoké hypování narazilo a zdravý skepticismus vítězí!“ Podobných výroků jsem za poslední měsíc a půl po uvedení GPT-5 četl a slyšel celou řadu.
Rozdíl ve schopnostech GPT-3 (2020) a GPT-4 (2023) byl obrovský. A všichni se na tom shodli. V klíčových testech překonával GPT-4 svého staršího bratříčka o 40–70 %.Rozdíl mezi GPT-4 (2023) a GPT-5 (srpen 2025) je také obrovský. Ale nikoho to moc nezajímá a hlasitě se mluví o zanedbatelném zlepšení GPT-5. V klíčových benchmarcích GPT-5 sice překonává svého staršího bratra o 50–80 %, ale žádné velké wow po uvedení GPT-5 nenastalo.Na „vině“ je pravděpodobně skutečnost, že zatímco mezi GPT-3 a GPT-4 nevyšlo mnoho mezi-modelů (pochopitelně vyšel GPT-3.5, který udělal díru do světa, ale jinak nic moc jiného), mezi původním GPT-4 a mnohem lepším GPT-5 vyšlo velké množství mezi-modelů. Skok mezi GPT-4 a GPT-5 je sice obrovský, ale kdo by si pamatoval na to, jak „špatný“ byl GPT-4? GPT-5 tak pocitově spíše srovnáváme s o3, DeepResearch, Claudem-4 apod., tj. s modely jen pár měsíců starými, vůči nimž GPT-5 opravdu není zase o tolik schopnější. Tato perspektiva nám pak zastírá, že skok mezi GPT-4 a GPT-5 je opravdu obrovský a zcela srovnatelný s pocitově brutálním skokem mezi GPT-3 a GPT-4.Nebudu zdržovat mnoha čísly, ale jedno si neodpustím. Společnost METR měří, jak dlouhé softwarově-inženýrské úlohy zvládne AI samostatně řešit. GPT-4 zvládala řešit úlohy trvající lidem cca 5 minut. GPT-5 zvládá řešit úlohy trvající lidem 2 hodiny a 17 minut. Posun je to obrovský a předčil dosavadní trend (zdvojnásobování délky úloh každých 7 měsíců)
AI se nezlepšují pouze podle testů designovaných na měření schopností AI. AI měří v poslední době své síly i s nejlepšími lidmi v různých mezinárodních olympiádách.Před pár dny tak například AI zvítězila v mezinárodní univerzitní programovací soutěži, kde porazila všechny univerzitní týmy z celého světa a dokázala jako jediná vyřešit všechny úlohy (ICPC). Zatímco před rokem měly AI problémy i s lehkými soutěžními úlohami, nyní předčí i ty nejlepší světové univerzitní týmy.Jen pár týdnů zpátky přitom AI dosáhly na zlaté medaile jak v mezinárodní matematické olympiádě, tak té programovací. Pár měsíců zpátky pak AI skončila těsně druhá v soutěži AtCoder, která není omezená na střední nebo vysoké školy, a utkávají se v ní tak nejlepší programátoři z celého světa s mnoholetými zkušenostmi z těchto soutěží.
O schopnostech AI nepřímo svědčí i dramaticky se zvyšující používání AI. Podle nedávného průzkumu v USA používá AI několikrát týdně 62 % dospělých, z toho přes 30 % několikrát denně.Šéf Anthropicu Dario Amodei včera uvedl, že velká většina kódu, na němž stojí jejich AI Claude, je již napsaná právě Claudem. A odhaduje, že podobně na tom nyní jsou i jiné podobné společnosti.Zároveň neuplyne týden, aby nebyl oznámen nějaký nový objev, který provedla AI tu ve vývoji léků, jindy v matematice či fyzice.
Zkrátka, schopnosti AI stagnují, to nemohu říct.