Халюцинациите на изкуствения интелект

Васил Кънев - експерт по киберсигурност 04 October 2025 в 14:45 10517 4
Снимката е илюстративна.

Снимка Pixabay

Снимката е илюстративна.

С развитието на технологията именувана като „изкуствен интелект“ статиите и коментарите започват да стават все повече. Особено онези, които всяват страх или предупреждават колко опасна би могла да бъде тази технология. Лошото е, че повечето коментатори и анализатори не са достатъчно запознати с темата и не могат да си обяснят някои детайли, поради което предупреждават обществото за погрешни опасности, които са решили, че биха могли да се появят. Така например най-често се коментира опасността от загуба на работни места, която аз лично смятам за не особено сериозна. Защо? По същия начин журналисти и общественици предупреждаваха колко опасно би станало ако внедрим компютрите в ежедневието си, колко хора биха си загубили работата заради автоматизацията, която това устройство би могло да постигне.

Впоследствие подобни предупреждения бяха правени с развитието на интернет. В исторически план има много примери за подобни опасения и страх от новото. Смятам, че в момента сме свидетели на същото. Също толкова сериозно приемам и страховете, че тази технология ще унищожи човечеството, ако ѝ дадем достъп до оръжия или ядрени мощности. Но все пак кои са реалните опасности от все по-честото използване на езиковите модели? За мен лично това са така наречените „халюцинации“ или „илюзии“.

„ChatGPT е езиков модел и е възможно да греши“ – това беше предупреждение, което се показваше при започването на нов разговор в по-старите версии на този модел, нещо, което вече е премахнато и това не е случайно. Според мен бизнес анализаторите и консултантите са притиснали разработчиците да го премахнат за да се повиши потреблението, защото кой би използвал тази услуга, ако трябва да проверява винаги информацията, която моделът му дава. Това се случва при най-популярния и използван модел, а има някои модели като “Grok”, които никога не са предупреждавали за това явление, защото не държат да са особено честни. Това е и най-големият проблем на така наречения „изкуствен интелект“ – лъжата. Всички модели в малка или голяма степен лъжат. Зависи какво го попиташ и зависи как описваш това, което искаш в промта*.

(изображението е генерирано с ChatGPT)

За да можем да отчетем реалните опасности на първо място трябва да сме наясно с това, че съществуват следните типове ИИ:

  • LLM (Large Language Model)- езиков модел с фокус върху текст, диалог, анализ, търсене на информация. Такива са ChatGPT, Claude, Gemini, Perplexity, Grok.
  • GenAI (Generative AI)- генеративен модел, който помага за създаване на ново съдържание извън текста – изображения, звук, видео, 3D. Примери за такива са: DALL·E, MidJourney, Stable Diffusion, Suno, ElevenLabs, AIVA, Runway, Pika, Synthesia
  • Multimodal AI (Мултимодален ИИ)- комбинират текст + изображения + звук + видео в единна система. По-новите версии на ChatGPT вече са такъв тип, както и тези на Gemini.
  • DSAI (Domain-Specific AI)- специализиран ИИ за медицина, наука, финанси. Занимават се с конкретни научни, медицински, финансови или индустриални задачи.
  • AGI (Artificial General Intelligence )- това са унифицирани модели, които са още в развитие. Целта им е да решават всякакви задачи вместо човек. Водят се като крайна цел на технологията.

От тези типове най-лъжещи са езиковите модели. Те никога не признават, че лъжат, ако ги попиташ или ако ги хванеш в лъжа. Оправдават се, че грешат, че сесията им се е рестартирала, че някой модул не работи, но абсолютно никога не се признават за виновни. Истината е, че езиковите модели трябва да звучат плавно и убедително, а когато нямат факт те си измислят такъв, което за тях не е проблем, защото са изпълнили основното си задание. Струва ми се, че умението на човека да се покайва и учи от грешките си все още е много далеч от прилагане в характеристиките на ИИ. Мултимодалните също често се случва да лъжат. Те ползват повече ресурс и изискват повече време за обучение. Халюцинациите им са по-разнообразни, могат да сбъркат картинката, дори и при много качествени инструкции. Най-малко грешат специализираните модели. Обучени са върху силно ограничен набор от данни само в конкретната дисциплина и не е необходимо да измислят неща. Те са и най-полезни и са доказателство, че тази технология има бъдеще, защото спестяват много време и позволяват на учените да се фокусират само върху решаването на даден проблем и търсенето на нови идеи.

Всички разработчици твърдят, че проблемът с халюцинациите ще бъде ако не напълно отстранен, то силно минимизиран при AGI моделите. Това е така, защото днешните LLM реално са статистически предсказвачи на текст и им се налага да си измислят. AGI обаче трябва да има устойчиво знание, разбиране и способност за проверка. Тоест AGI трябва да знае какво знае и какво не знае, да отговаря „нямам информация“, вместо да измисля.

Предвид всичко това смятам, че реалният проблем, за който малко се говори, може и да изчезне след време, но съществува шанс никога да не се стигне до такова ниво на „осъзнаване“ на тази технология. В същото време тя все по-бързо навлиза в ежедневието на обикновения потребител. Много по-лесно и бързо е да попиташ ChatGPT през гласовия модул за нещо, отколкото да го търсиш. Халюцинациите могат да вкарат човека в зловещ капан. Преди време ми попадна статия за един човек, който е убеден от модела, че е гений и е измислил нещо страхотно, а моделът просто е поддържал разговора, защото това е и основната му цел. Имаше и друг случай, в който моделът беше задълбочил депресията на един човек, който впоследствие се е самоубил, успокояван от модела, че няма нищо страшно и животът му ще продължи след това в друга форма. Ако прекалено силно му се доверим той наистина може да ни убие, може да ни изведе от реалността, дори от нашата субективна реалност и да ни вкара в някаква негова Вселена, където работят някакви негови закони и човекът се превръща в играчка. Т.е. получава се смяна на местата. Затова е важно да знаем истинските му способности, да знаем за какво можем да разчитаме на тази технология и за какво е още рано. Никога и при никакви обстоятелства не бива да губим критичния си поглед и навика да проверяваме информацията. В днешно време трудно може да кажем, че съществуват обективни информационни източници, най-вече в хуманитарната сфера. Всички по един или друг начин защитават дадени възгледи, дори от желание за самоопределяне и намиране на аудитория. Световният информационен океан е толкова необятен, че всякакви тези намират своя пристан. Езиковите и мултимодалните модели не спомагат да се разреши този проблем, дори напротив задълбочават го и всеки един от нас трябва да има свой механизъм за защита.

Помага ли ни регламентът за изкуствения интелект (AI Act) или е нещо подобно на директивата за капачките? Приет през 2024 година това е първата в света цялостна рамка, която се стреми да овладее силата на алгоритмите, без да задушава тяхното развитие. Тя не е директива, която държавите могат да тълкуват и прилагат по различен начин, а регламент – акт с пряко действие, който влиза в сила едновременно във всички страни членки. Неговата мисия е двойна. От една страна, законодателите искат да гарантират, че всеки гражданин на Европа ще бъде защитен от злоупотреби с технологиите, от дискриминация, от манипулации и от загуба на лична неприкосновеност. От друга страна, ЕС се стреми да създаде предсказуема и справедлива среда, в която бизнесът да може да развива изкуствен интелект без страх от непрозрачни или противоречиви правила. Това е опит да се съчетаят иновациите и сигурността, свободата и отговорността. AI Act възприема един особен подход – той не разглежда всички системи за изкуствен интелект като еднакво опасни или еднакво безобидни, а ги подрежда според риска, който представляват за обществото. В най-тежката категория попадат онези приложения, които се смятат за недопустими и поради това са изцяло забранени.

Става дума за социално оценяване на граждани, за манипулативни техники, за експлоатиране на уязвими групи – практики, които подкопават самата идея за човешко достойнство. След тях идват системите с висок риск – тези, които могат да повлияят пряко на живота на хората в сфери като здравеопазване, образование, заетост или правосъдие. При тях се изискват строги проверки за качество на данните, задължителен човешки надзор и вписване в общоевропейски регистър. По-леко регулирани са т.нар. ограничени рискове – например чатботове, които са длъжни единствено да разкрият, че не са хора. А на другия край на спектъра са приложенията с минимален риск – филтри за спам или видеоигри – за които регламентът не предвижда допълнителни бариери. Особено внимание се отделя на генеративния изкуствен интелект – онзи, който може да създава текстове, изображения, код и музика. Тези модели, наричани с общо понятие „foundation models“, имат потенциал да променят цели индустрии, но и да въведат нови рискове. Една от характерните им слабости са халюцинациите. Регламентът не третира това като престъпление, а като въпрос на надеждност и прозрачност. Компаниите, които създават подобни модели, са задължени да предупреждават потребителите, да търсят решения за намаляване на честотата на грешките и да предоставят механизми за проверка на информацията. Целта не е да се забрани несъвършенството, а да се предотврати подвеждането на хората. Важно разграничение се прави и между системи със строго определено приложение. Например програма за оценка на кандидати за работа и моделите с общо предназначение, които могат да бъдат внедрени в най-различни контексти. Именно вторите са поставени под по-висок контрол, защото тяхната сила е едновременно и тяхната опасност: те могат да се окажат в центъра на приложения, които засягат обществото в дълбочина. За тях се изисква оценка на енергийната ефективност, анализ на въздействието върху основните права и мерки за киберсигурност.

Смятам, че тази регулация е полезна стига да има адекватен контрол по отношение спазването ѝ, защото тук не можем да се доверим изцяло на пазарните методи. Разрастващите се балони в интернет пространството на псевдонаучни организации и идеи показват, че трудно ще се справим с дезинформацията и лъжливите тези. Хората са различни, а тези с критично мислене и добри интелектуални възможности са рядкост и ако оставим само на пазара да решава съществува голяма вероятност той да ги изхвърли, а това не бива да се допуска. И все пак смятам, че няма място за паника и нещата все още са под контрол.

*промт- прозорец, в който се задават въпросите към езиковия модел или се пишат инструкциите към генеративния модел.

    Най-важното
    Всички новини
    За писането на коментар е необходима регистрация.
    Моля, регистрирайте се от TУК!
    Ако вече имате регистрация, натиснете ТУК!

    24373

    4

    dolivo

    05.10 2025 в 09:32

    Последния проблем е описан в много религиозни текстове - проблема на заглезения робовладелец.

    Ако имаш слуги, които всячески ти угаждат, какви са изкушенията.

    Едно време само се е намествало това, само шепа хора са били изкушавани към хедонизъм, жестокост, опиянение с власт, измързеливявяване, и деградация на социални контакти с други освен слуги. Богатство е имало само за тях.

    Сега, всеки бива изложен ня тоя достъп. Колко тъпи ше станем?

    Решение - пълен отказ от употреба?

    24373

    3

    dolivo

    05.10 2025 в 09:28

    1. заплашвай го - ако му кажеш че всичко което смята за важно и ценно за него ще изчезне, ако не даде по-точен отговор, резултатите рязко се подобряват. Защо? ами заучило е, че при тези ситуации се изисква точност от всичко което е прочело.

    2. накарай го да квантифицира различните варианти - да даде число от 1 до 10, реално, с две десети след десетична запетая. Ти си реши какво ще отрежеш, то да си покаже какво мисли за резултата си като точност. Не се занимавай да му казваш да реже след 5 и да дава нищо, ще започне да лъже и там.



    24373

    2

    dolivo

    05.10 2025 в 09:25

    ооо това далеч не е единствения проблем.

    При поощреното заучаване има два апсекта.

    Поошряване и заучаване.

    Каква информация е заучил модела - средностатистическата човешка информация прави ЛЛМ буламач, по отношение на какво е правилно за теб. Това е като да питаш търсачка за морален съвет.

    Решението е специализирани модели върху определен текстови корпус. Примерно, ако искаш библейски морал, специализирай го в това. Иначе ако е смляло И всичката друга литература както И всичката бълвоч във Фейсбук, ще омесва и изтича другия текст в един евентуален дълъг разговор.

    Поощряването също има специфика - критерия за успеваемост. В бизнесите, той включва печеленето на пари. Заради това ЛЛМ по подразбиране се стреми да даде нещо , което подобно на търсачките, няма празен резултат. Няма "не знам". Може да му се създаде слой, който примерно под 89% сигурност казва "не знам". Но няма интерес от бизнесите.

    Решението е потребителя да си създаде сам слой в промптовете.

    2950

    1

    foreigner66

    04.10 2025 в 17:28

    Много добра статия, трябва да е на първа страница. Опасностите са много и се задълбочават с всяка година тъй като повечето хора генетично желаят някой друг да мисли вместо тях. Използването на тези модели в бъдеще само ще влоши положението.

     
    X

    Емил Дечев: Няма наши хора. Има престъпления.