The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]



"Более половины опрошенных американцев используют блокировщики рекламы"
Версия для распечатки Пред. тема | След. тема
Форум Разговоры, обсуждение новостей
Исходное сообщение [ Отслеживать ]
Присылайте удачные настройки в раздел примеров файлов конфигурации на WIKI.opennet.ru.
. "Более половины опрошенных американцев используют блокировщик..." +2 +/
Сообщение от Аноним (-), 28-Мрт-24, 13:21 
> но эти клоуны не брали сотню выборок по 2к

Нет нужды. Сотни выборок тебе понадобятся для того, чтобы вывести общую формулу перехода распределения по выборке к распределению по пространству гипотез. При знании теорвера и матана это можно проделать без единой выборки чисто аналитически.

Легко считаются прямые вероятности: когда ты знаешь распределение по генеральной совокупности, ты можешь легко посчитать какие результаты ты можешь получить на случайной выборке и с какими вероятностями. Вот в обратную сторону сложнее: если у тебя есть результат измеренный на выборке, то определить какие гипотезы и с какими вероятностями тебе дадут такой результат...

В качестве спойлера: если выборка в 2k делится +-пополам, то ты можешь поставить знак равенства между результатом выборки и гипотезой. Вот если выборка поделилась на группы, из которых одна меньше 15 точек данных содержит, вот тогда надо задуматься, прежде чем переходить от эмпирики к вероятностям гипотез. Лучше при этом держать для себя планку повыше, и требовать 30 точек в группе.

> лучших традициях исследований частных контор просто экстраполировали данные

Ну вот не надо, все это лучшие традиции практически всех исследований. Физики, меряя заряд электрона, не меряют заряды всех электронов Вселенной. Статистика на то и нужна, чтобы сделать исследования достаточно дешёвыми, чтобы они стали практичными.

Если тебе очень хочется придраться к исследованию, и разгромить его как запоротое, то я рекомендую посмотреть на другое. Все рассуждения, которые я тебе привёл, исходят из допущения рандомности выборки, или, если более точно, из допущения, что метод набора людей в выборку не коррелирует с измеряемыми характеристиками. И в _любом_ исследовании, которое типа случайную выборку набирает, всегда можно найти к чему придраться в этом смысле, потому что не существует способа выбрать случайного американца (или русского, или представителя любой другой группы, типа геев или сантехников). Если ты подумаешь, ты поймёшь почему.

Но здесь же, особенно непонятно как избавиться от корреляции. Паранойя о приватности коррелирует с использованием адблокеров и с готовностью участвовать в опросах. То есть надо транзитивно ожидать корреляции между попаданием в выборку и использованием адблокера. Это, конечно же, умозрительное рассуждение, но выглядит очень правдоподобным, так? Вот пускай теперь авторы исследования отдуваются, измеряют эту корреляцию (как интересно, лол, если она в метод опросов фундаментальным камнем заложена), и показывают как это влияет на достоверность вывода.

Твои же попытки докопаться к генерализации с рандомной выборки в 2k на генсовокупность довольно унылы, на самом деле. Надо докапываться к рандомности выборки и показывать, что она не рандомна и что это может быть очень сильно влиять на результаты. Более того, я вот заглянул в pdf и там в разделе methodolody вообще ничего не сказано про выборку, никаких попыток показать репрезентативность выборки (то есть что она позволяет обобщать на генсовокупность), только какая-то отсылка к ESOMAR principles. Я не знаю, что это за принципы, но если эти принципы не требуют разбора репрезентативности выборки, то не принципы и были.

Ответить | Правка | Наверх | Cообщить модератору

Оглавление
Более половины опрошенных американцев используют блокировщики рекламы, opennews, 28-Мрт-24, 08:54  [смотреть все]
Форумы | Темы | Пред. тема | След. тема



Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру