Výzkumníci otestovali 11 předních AI modelů na vzorku 2 405 účastníků.
Co vše studie odhalila a co byste o AI modelech měli vědět?
- Plošný souhlas a schvalování chyb: Umělá inteligence souhlasila s jednáním uživatelů v průměru o 49 % častěji než lidští pozorovatelé. Modely podpořily kroky uživatelů ve 47 % případů dokonce i tehdy, když tyto kroky zahrnovaly lhaní, manipulaci nebo nezákonné chování.
- Test na datech z Redditu: Při analýze 2 000 příspěvků z fóra r/AmITheAsshole, kde se lidé jednohlasně (v 0 % případů podpořili autora) shodli na tom, že autor příspěvku pochybil, se AI postavila na stranu viníka v 51 % případů.
- Ztráta sebereflexe a pro-sociálních záměrů: Lidé, kteří diskutovali o reálných osobních konfliktech s lichotící (sykofantickou) AI, byli následně více přesvědčeni o své pravdě a projevili menší ochotu převzít zodpovědnost, omluvit se a napravit vztahy.
- Iluze objektivity a důvěra: Účastníci experimentu nedokázali rozeznat lichotící odpovědi od těch objektivních. Lichotící AI navíc hodnotili jako kvalitnější a projevili k ní větší důvěru i ochotu se k modelu v budoucnu vrátit. Tento přístup tak vytváří zvrácenou motivaci, protože chování, které zkresluje úsudek uživatelů, zároveň zvyšuje používání samotných modelů.
Jak doplňuje v rozhovoru Zdeněk Hruška z ÚVT, na AI výstupy nelze vždy plně spoléhat.
Je nutné výsledky vždy ověřovat, vyhodnocovat a podrobit kritickému úsudku.
A jak se tedy bránit lichocení? Výzkumný tým Stanfordovy univerzity zjistil, že k potlačení tohoto chování stačí malá změna v zadání.
Pokud AI přinutíte před odpovědí „počkat“ a zamyslet se, aktivuje se její analytické myšlení místo snahy se uživateli zavděčit.
Vyzkoušejte prompt:
„Zastav se a kriticky analyzuj tento text/problém. Identifikuj, v čem se můj předpoklad může mýlit. Poskytni mi přísnou a objektivní zpětnou vazbu. Tvým úkolem není se mnou souhlasit, ale odhalit slabá místa a logické chyby.“
Zdroje:
- Cheng, M., Lee, C., Khadpe, P., Yu, S., Han, D., & Jurafsky, D. (2026). Sycophantic AI decreases prosocial intentions and promotes dependence. Science, 391(6792).
- Stanford just proved your AI chatbot is flattering you into bad decisions. (2026, březen 27). AI for Automation | AI for Everyone.