kaipa | Методы Тагучи и обратная задача

Во время недавней конференции мне пришла в голову идея, которую, наверное, надо оформить в статью. Чтобы не забыть, изложу здесь ее вкратце.

В онлайн-рекламе приходится постоянно делать эксперименты, чтобы понять какая реклама и где лучше работает (более эффективна). Классический пример, что лучше, объявление А или Б. Это очень легко установить, если показать А и Б достаточное количество раз, скажем 10 тысяч. Ситуация несколько сложнее, если вариантов не два, а десять. И еще сложнее, если каждое объявление может быть параметризировонно. Предположим, что дано:

100 объявлений
2 цвета в каждом
3 размера шрифта
3 расположения картинки
3 варианта текста

Всего получается, 100*2*3*3*3 = 5 400 различных сочетаний. Если требовать 10 тысяч показов, чтобы проверить ячейку, то это 54 000 000 разных показов. Не так уж и много, в принципе. А если объявлений 10 тысяч? А если еще параметр добавить?

Если кто-то знаком с Методами Тагучи, то основная идея в приложении к дизайну экспериментов, это сократить количество экспериментов, не потеряв в качестве. То есть тестировать не все возможные сочетания параметров, а лишь некоторые. На остальные экстраполировать. Тагучи разрабатывал методы для "железа", а в железе любые эксперименты дороги.

Теперь несколько видоизменим задачу. Представим, что помимо самих вариантов объявлений, мы тестируем еще и где их лучше показывать. Для простоты возьмем:

1000 слотов
100 стран

Уже нужно 5 400 000 000 000 показов, если я с нулями не напутал. Правда, в отличие от объявлений, мы не можем выбирать, в каком слоте и стране будет показ. Это от нас не зависит. Распределение показов по слотам и странам подчиняется какому-то неравномерному распределению.

Что же делать? Как тестировать рекламу?

В некотором роде эта задача обратная тому, что делал Тагучи: у нас есть статистика экспериментов, которыми мы не в полной мере управляем, и надо понять, какие эксперименты можно считать свершившимися (то есть набравшими необходимые 10 тысяч показов). Если подходить формально, то задачу можно формализовать следующим образом.

Для начала, представим параметры как дискретные измерения многомерного куба размерности N, в ячейки которого будем помещать количество показов и эффективность (как она считается, не важно, важно, чтобы был способ "складывать" эффективность в разных ячейках). Назовем проекцией куба на параметры (x1, ... xM) куб размерности M, где значение в ячеке равно сумме значений по тем параметрам, которые не входят в (x1, ... , xM). Прошу прощения за это полуформальное определение. Надеюсь, оно понятно. Тогда задачу можно сформулировать следующим образом. Из всего многообразия возможных сочетаний параметров выбрать те, проекции на которые дают искомые 10 тысяч или больше показов в каждой (!) ячейке. Полученные таким образом кубы будут представлять собой результаты успешных экспериментов.

Можно поставить задачу и иначе. Вместо проведения эксперимента, какая комбинация лучше, измерим эффективность, где можем. Эту задачу можно интерпретировать как поиск всех возможных подкубиков, где у нас есть пресловутые 10 тысяч показов. Еще более затратная задача в смысле перебора.

Примерно этим мы занимаемся, хотя и не так формально. Хочу сделать более развернутую статью на хабре по этой теме. Стоит?

Flat | Top-Level Comments Only

From:

antilamer.livejournal.com

И еще http://berkeleydatascience.files.wordpress.com/2011/03/20110301berkeley.pdf - правда слайды не очень подробные

ushastyi.livejournal.com

Да, это по делу. Но я немного о другом. Я о том, чтобы понять по датасету, какие именно эксперименты "получились", даже если мы их специально не проводили. То есть мы одновременно с одного показа тестируем сразу много разных вариантов (в разных разрезах или проекциях). Я хочу это как-то более формально описать.

Ну, будет круто :)

S	M	T	W	T	F	S
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30

Записки на полях

Познание бесконечности требует бесконечного времени

Методы Тагучи и обратная задача

Методы Тагучи и обратная задача

no subject

no subject

no subject

Profile

April 2017

Most Popular Tags

Page Summary

Style Credit

Expand Cut Tags