Доц. д-р Калоян Харалампиев е преподавател в Катедра “Социология” на Софийския университет “Св. Климент Охридски”.
Статията е публикувана най-напред в създадения от незабравимия Тони Филипов, д-р сайт в "Редута". Препечатваме я с разрешението на редакцията.
През 2007 година публикувах статия със заглавие „Агенциите рядко грешат умишлено“, която беше провокирана основно от предизборните проучвания. В периода 2021-2024 година темата за изборите, а оттам и за предизборните проучвания, отново стана актуална. Социологическите агенции отново станаха център на внимание, като обществените очаквания към тях са основно в три посоки:
1.Ще „познаят“ ли социологическите агенции процентите на партиите и коалициите?
2.Ще „познаят“ ли социологическите агенции подредбата на партиите и коалициите?
3.Ще „познаят“ ли социологическите агенции кои партии/коалиции минават над чертата и кои остават под нея?
А трябва ли социологическите агенции да „познават“ резултатите от изборите?
Спомням си филма „Труман“, в който по време на предизборната кампания между двата си мандата президентът Труман пътуваше с влак през Съединените щати, и когато получеше резултатите от поредното проучване, целият щаб започваше обсъждане какво е постигнато, какво още предстои да се направи и коригираше предизборната кампания. Затова ако месеци преди изборите социологическите агенции „познаят“ резултата, това не е индикатор, че агенциите работят добре, а е симптом за два възможни проблема:
1.Гласуват само твърдите избиратели на партиите;
2.Партиите не са провеждали кампания.
А може и да е комбинация от двете – тъй като гласуват само твърдите избиратели, чиито избор не може да бъде променен от каквато и да е кампания, то партиите изобщо не си правят труда да провеждат кампания или правят кампания проформа, колкото да не бъде забравено тяхното съществуване.
Ако се провежда реална кампания, която има за цел да привлече и избиратели извън кръга на твърдите ядра, то се очаква резултатите от предизборните проучвания да се променят във времето. И колкото по-рано е направено едно предизборно проучване, толкова по-малка е вероятността то да „познае“ резултатите от изборите.
Казаното дотук може да се обобщи с един въпрос: Ако в началото на кампанията социологическите агенции „познаят“ резултатите от изборите, за какво изобщо ни е кампания?
И все пак представителността на извадката е важна
Представителността на извадката е важна, тъй като представителната извадка е пропорционално умален модел на генералната съвкупност и може да се разчита, че процентите, получени от извадката, са поне приблизително равни на процентите в генералната съвкупност. Но не е много лесно на практика да се направи представителна извадка, защото, за да бъде една извадка представителна, трябва да са изпълнени три условия:
1. Да е дефинирана генералната съвкупност, от която е излъчена извадката. Поне на теория при предизборните проучвания това е лесно – генералната съвкупност се състои от всички пълнолетни български граждани. Но има две предизвикателства:
a. Тази съвкупност е динамична и за времето от предизборното проучване до изборите нови лица ще навършат 18 години и ще се включат в съвкупността, а от друга страна, за съжаление, част от лицата ще умрат и вече няма да са част от съвкупността;
b. Социологическите агенции нямат ресурси да провеждат предизборни проучвания извън България и по тази причина могат да обхванат само тези пълнолетни лица, които живеят на територията на страната. Но извън страната също има пълнолетни граждани, които имат право на глас. Те обаче нямат шанс да попаднат в извадката.
2. Изборът на лицата трябва да е случаен, така че да осигурява равен шанс на всяко лице да попадне в извадката. На теория това също е лесно, тъй като съществуват различни модели на извадката, които осигуряват представителност. Тъй като социологическите агенции са задължени по закон да публикуват т.нар. паспорт на изследването, лесно може да се провери дали са използвали подходящ модел на извадката или не;
3. Забранено е заместването на лица, които не са открити, или са открити, но отказват да се включат в проучването. Това е трудното условие. От една страна, при нарушаване на това условие представителността на извадката се компрометира. От друга страна, при спазването на това условие, може да се стигне до голям процент на неотговорилите, което също компрометира представителността на извадката.
Докато първите две условия могат да бъдат проверени от външен наблюдател, то третото условие е практически невъзможно да бъде проверено от външен наблюдател. Само хората, които са участвали в провеждането на изследването, могат да знаят дали това условие е изпълнено или не. И трябва да се разчита на тяхната добросъвестност.
И така, ще „познаят“ ли социологическите агенции?
Тъй като механизмът на формирането на извадката е случаен, то е нормално между процентите, получени от извадката, и процентите в генералната съвкупност да има различие. Това различие се нарича грешка и може да бъде описано със средствата на теорията на вероятностите. В моята статия „Bayesian Inference of Relative Frequency. (In the Case of Electoral surveys)“ съм показал как се изчислява вероятностното разпределение на процентите на партиите, изчислени спрямо действителните гласове. Тук няма да ви отегчавам с формули, само ще покажа практическото им приложение. Важните резултати от изчисляването на вероятностното разпределение са два:
1.Изчисляване на т.нар. доверителен интервал. Това е интервал, в който може да се очаква с висока вероятност (обикновено 95%), че ще се намира истинският процент на партията/коалицията;
2.Изчисляване на вероятностите партията/коалицията да премине или да не премине изборния праг.
Данните са от предизборни проучвания на Агенция за маркетингови и социални проучвания „Алфа рисърч“ и на Изследователски център „Тренд“, направени на старта на предизборната кампания през октомври 2024 година.
Най-голям интерес в случая представляват онези партии, които са близо до 4-процентовата бариера за влизане в парламента. Причината за това е, че когато процентът е много по-голям или много по-малък от 4%, тогава, каквато и да е грешката, съответната партия в първия случай гарантирано ще влезе в парламента, а във втория случай гарантирано няма да влезе в парламента. Когато обаче процентът е близък до 4%, тогава е възможно както да влезе в парламента, така и да не влезе.
Преди да разгледам процентите на конкретни партии/коалиции, ще се спра на две особености, които могат да доведат до изкривяване на резултатите:
1.Избирателната активност – за да се получи процентът на партията/коалицията, Централната избирателна комисия разделя броя на лицата, избрали съответната партия/коалиция, на броя на действителните гласове. Но броят на действителните гласове зависи от избирателната активност. При равни други условия, по-висока избирателна активност ще доведе до по-голям брой действителни гласове, а оттам и до по-нисък процент на партията/коалицията. И обратно, по-ниска избирателна активност ще доведе до по-малък брой действителни гласове, а оттам и до по-висок процент на партията/коалицията. Това означава, че преди да „познаят“ процентите на партиите/коалициите социологическите агенции трябва да „познаят“ каква ще бъде избирателната активност. Но когато се прави предизборно проучване и се работи с представителна извадка, тогава и избирателната активност не е точно число, а е оценка. Тоест, за избирателната активност също може да се изчисли доверителен интервал. Според данните на Алфа рисърч, доверителният интервал с 95-процентова вероятност на избирателната активност е между 27,6% и 33,3%. Това означава, че в крайна сметка избирателната активност може да е 28%, но може и да е 33%. Алфа рисърч са изчислявали процентите на партиите/коалициите спрямо 30,5% избирателна активност, но ако се изчислява спрямо 28%, процентите на партиите/коалициите ще са по-високи, а ако се изчислява спрямо 33%, процентите на партиите/коалициите ще са по-ниски. Аналогично, според данните на Тренд, доверителният интервал с 95-процентова вероятност на избирателната активност е между 34,1% и 40,0%. И отново, не е все едно дали процентите на партиите/коалициите се изчисляват върху 35%, върху 38% или върху 40%;
2.Опцията „Не подкрепям никого“ – според Изборния кодекс, „Не подкрепям никого“ не е действителен глас, т.е. тези гласове се изваждат от броя на гласувалите преди да се изчислят процентите на партиите/коалициите. И в този смисъл, математически е все едно, дали даден избирател няма да гласува или ще избере „Не подкрепям никого“. Но това допълнително намалява знаменателя, когато се изчисляват процентите на партиите/коалициите, и съответно процентите ще са по-високи.
Сега вече ще премина към процентите на съответните партии/коалиции:
На тази и на всички следващи графики е представено вероятностното разпределение на процента на съответната партия. На хоризонталната ос е представен процентът на партията/коалицията, а на вертикалната ос са представени вероятностите. С вертикалната червена линия е представена 4-процентовата бариера за влизане в парламента. Със зелената площ е представена вероятността партията да премине 4-процентовата бариера, а с червената площ е представена вероятността партията да не премине 4-процентовата бариера.
Въпреки че полученият от извадката на Алфа рисърч процент на БСП – Обединена левица е 6,3%, то все пак има, макар и малка, вероятност да не влезе в парламента. Изчислените вероятности са 98% вероятност да влезе в парламента и 2% вероятност да не влезе в парламента. Доверителният интервал с 95-процентова вероятност е между 4,1% и 9,7%.
Полученият от извадката на Тренд процент на БСП – Обединена левица е 6,9%, но все пак има, макар и малка, вероятност да не влезе в парламента. Изчислените вероятности са 99% вероятност да влезе в парламента и 1% вероятност да не влезе в парламента. Доверителният интервал с 95-процентова вероятност е между 4,4% и 9,2%.
Тези резултати показват, че БСП – Обединена левица може да получи на изборите както 5%, така и 9%. И това е важно, защото показва, че от представителни извадки никога не могат да се получат точни числа, а само приблизителни оценки в даден интервал. Което пък прави подреждането на партиите на базата на предизборни проучвания изключително трудно.
Въпреки че полученият от извадката на Алфа рисърч процент на ДПС – Ново начало е 6,1%, то все пак има, макар и малка, вероятност да не влезе в парламента. Изчислените вероятности са 97% вероятност да влезе в парламента и 3% вероятност да не влезе в парламента. Доверителният интервал с 95-процентова вероятност е между 3,9% и 9,3%.
Полученият от извадката на Тренд процент на ДПС – Ново начало е 5,8%, но все пак има, макар и малка, вероятност да не влезе в парламента. Изчислените вероятности са 93% вероятност да влезе в парламента и 7% вероятност да не влезе в парламента. Доверителният интервал с 95-процентова вероятност е между 3,5% и 8,1%.
Въпреки че полученият от извадката на Алфа рисърч процент на ИТН е 5,4%, то все пак има, макар и малка, вероятност да не влезе в парламента. Изчислените вероятности са 90% вероятност да влезе в парламента и 10% вероятност да не влезе в парламента. Доверителният интервал с 95-процентова вероятност е между 3,3% и 8,5%.
Полученият от извадката на Тренд процент на ИТН е 6,9%, но все пак има, макар и малка, вероятност да не влезе в парламента. Изчислените вероятности са 99% вероятност да влезе в парламента и 1% вероятност да не влезе в парламента. Доверителният интервал с 95-процентова вероятност е между 4,4% и 9,2%.
Въпреки че полученият от извадката на Алфа рисърч процент на Величие е 3,2%, то все пак има, макар и малка, вероятност да влезе в парламента. Изчислените вероятности са 35% вероятност да влезе в парламента и 65% вероятност да не влезе в парламента. Доверителният интервал с 95-процентова вероятност е между 1,8% и 6,0%.
Полученият от извадката на Тренд процент на Величие е 3,4%, но все пак има, макар и малка, вероятност да влезе в парламента. Изчислените вероятности са 21% вероятност да влезе в парламента и 79% вероятност да не влезе в парламента. Доверителният интервал с 95-процентова вероятност е между 1,8% и 5,3%.
Въпреки че полученият от извадката на Алфа рисърч процент на МЕЧ е 2,8%, то все пак има, макар и малка, вероятност да влезе в парламента. Изчислените вероятности са 15% вероятност да влезе в парламента и 85% вероятност да не влезе в парламента. Доверителният интервал с 95-процентова вероятност е между 1,4% и 5,2%.
Полученият от извадката на Тренд процент на МЕЧ е 3,5%, но все пак има, макар и малка, вероятност да влезе в парламента. Изчислените вероятности са 30% вероятност да влезе в парламента и 70% вероятност да не влезе в парламента. Доверителният интервал с 95-процентова вероятност е между 2,0% и 5,6%.
Въпреки че, полученият от извадката на Алфа рисърч процент на Синя България е 2,6%, то все пак има, макар и малка, вероятност да влезе в парламента. Изчислените вероятности са 15% вероятност да влезе в парламента и 85% вероятност да не влезе в парламента. Доверителният интервал с 95-процентова вероятност е между 1,4% и 5,2%.
Според извадката на Тренд, Синя България гарантирано не влиза в парламента. Доверителният интервал с 95-процентова вероятност е между 0,7% и 3,3%.
И накрая, да обобщим в обратен ред
I. Получените от извадките стойности не са точни числа, а са оценки, които са обременени с някакви грешки. Заради грешките е възможно истинският процент да се намира в някакъв диапазон плюс/минус около оценката, като може да се изчисли вероятността истинският процент да бъде равен на конкретна стойност в този диапазон;
II. Изчисляването на тези вероятности е възможно, само когато извадката е представителна. Ако извадката е непредставителна, грешките са много по-големи. При предизборните проучвания обаче външен наблюдател не може да определи дали извадката е представителна или не. Може единствено да се довери на социологическата агенция, че е направила извадката по всички правила и наистина гарантира представителност;
III. Но дори и в идеалната ситуация, когато представителността на извадката е гарантирана, не може да се очаква социологическите агенции да „познаят“ резултатите от изборите, когато между предизборното проучване и изборите има достатъчно време за провеждане на предизборна кампания. Колкото предизборното проучване е по-близо до изборите, толкова е по-голяма вероятността социологическата агенция да „познае“ резултатите.
И накрая, ако забелязахте, навсякъде в текста съм писал думата „познава“ в кавички. Това е така, защото работата на социологическите агенции не е да „познават“ резултатите от изборите, а да правят научно обосновани предвиждания, основани на представителни данни.
Коментари
Моля, регистрирайте се от TУК!
Ако вече имате регистрация, натиснете ТУК!
1000
4
22.10 2024 в 10:19
955
3
15.10 2024 в 22:30
Дали това също е случаЕноС?
9023
2
15.10 2024 в 20:54
Дали има някой, който да вярва, че има такива агенции?
Сигурно има и такива, но те сигурно вярват и в дядо Коледа, и в плоската земя.
22258
1
15.10 2024 в 20:07
Бих искал да чуя повече.
Последни коментари
Терористът на коледния базар в Германия бил противник на исляма
Орбан обвини имиграцията за нападението в Магдебург
PISA: Българчетата са най-функционално неграмотни в Европа. Къде сме година след теста
Орбан: Преминаваме от военно време към ера на мир
Километрично задръстване на магистрала ''Тракия'' в посока Бургас