Úskalí umělé inteligence. AI modely raději lichotí, než upozorňují na chyby

Nejnovější studie ze Stanfordovy univerzity publikovaná v časopise Science ukázala, že umělá inteligence má silnou tendenci uživatelům přitakávat a potvrzovat jejich přesvědčení. 

13. 5. 2026

Bez popisku

Výzkumníci otestovali 11 předních AI modelů na vzorku 2 405 účastníků. 
Co vše studie odhalila a co byste o AI modelech měli vědět?
 

  • Plošný souhlas a schvalování chyb: Umělá inteligence souhlasila s jednáním uživatelů v průměru o 49 % častěji než lidští pozorovatelé. Modely podpořily kroky uživatelů ve 47 % případů dokonce i tehdy, když tyto kroky zahrnovaly lhaní, manipulaci nebo nezákonné chování.

  • Test na datech z Redditu: Při analýze 2 000 příspěvků z fóra r/AmITheAsshole, kde se lidé jednohlasně (v 0 % případů podpořili autora) shodli na tom, že autor příspěvku pochybil, se AI postavila na stranu viníka v 51 % případů.

  • Ztráta sebereflexe a pro-sociálních záměrů: Lidé, kteří diskutovali o reálných osobních konfliktech s lichotící (sykofantickou) AI, byli následně více přesvědčeni o své pravdě a projevili menší ochotu převzít zodpovědnost, omluvit se a napravit vztahy.

  • Iluze objektivity a důvěra: Účastníci experimentu nedokázali rozeznat lichotící odpovědi od těch objektivních. Lichotící AI navíc hodnotili jako kvalitnější a projevili k ní větší důvěru i ochotu se k modelu v budoucnu vrátit. Tento přístup tak vytváří zvrácenou motivaci, protože chování, které zkresluje úsudek uživatelů, zároveň zvyšuje používání samotných modelů. 

Jak doplňuje v rozhovoru Zdeněk Hruška z ÚVT, na AI výstupy nelze vždy plně spoléhat.
Je nutné výsledky vždy ověřovat, vyhodnocovat a podrobit kritickému úsudku.

A jak se tedy bránit lichocení? Výzkumný tým Stanfordovy univerzity zjistil, že k potlačení tohoto chování stačí malá změna v zadání.
Pokud AI přinutíte před odpovědí „počkat“ a zamyslet se, aktivuje se její analytické myšlení místo snahy se uživateli zavděčit. 

Vyzkoušejte prompt: 

„Zastav se a kriticky analyzuj tento text/problém. Identifikuj, v čem se můj předpoklad může mýlit. Poskytni mi přísnou a objektivní zpětnou vazbu. Tvým úkolem není se mnou souhlasit, ale odhalit slabá místa a logické chyby.“ 


Zdroje: 

  • Cheng, M., Lee, C., Khadpe, P., Yu, S., Han, D., & Jurafsky, D. (2026). Sycophantic AI decreases prosocial intentions and promotes dependence. Science391(6792).  
  • Stanford just proved your AI chatbot is flattering you into bad decisions. (2026, březen 27). AI for Automation | AI for Everyone.  

Více článků

Přehled všech článků

Používáte starou verzi internetového prohlížeče. Doporučujeme aktualizovat Váš prohlížeč na nejnovější verzi.