Signalizacijos strategijų optimizavimas naudojant siuntėjo sukurtus eksperimentus kelių fazių bandymuose

Turinys

Nuorodų lentelė

Santrauka ir 1. Įvadas

2. Problemos formulavimas

2.1 Dvejetainio rezultato eksperimentų modelis dviejų fazių bandymuose

3 dvejetainių rezultatų eksperimentai dviejų fazių bandymuose ir 3.1 eksperimentai su atrankomis

3.2 Prielaidos ir sukeltos strategijos

3.3. II fazės eksperimentų nustatyti apribojimai

3.4 Įtikinėjimo koeficientas ir optimali signalizacijos struktūra

3.5. Palyginimas su klasikinėmis Bajeso įtikinėjimo strategijomis

4 Dvejetainio rezultato eksperimentai kelių fazių bandymuose ir 4.1 Dvejetainio rezultato eksperimentų modelis kelių fazių bandymuose

4.2 Nustatyti ir siuntėjo sukurti eksperimentai

4.3 Daugiafazis modelis ir klasikinis Bajeso įtikinėjimas bei nuorodos

4.2 Nustatyti ir siuntėjo sukurti eksperimentai

Atsižvelgiant į modelį, siuntėjas gali manipuliuoti K fazės tarpiniu įsitikinimu tik planuodamas eksperimentą K – 1 fazėje. Jei nustatomas eksperimentas K – 1 fazėje, tada tarpinis K fazės įsitikinimas yra tarpinio įsitikinimo funkcija K–1 fazė. Todėl norint išsiaiškinti, kaip šie dviejų tipų eksperimentai, nustatyti ir siuntėjo sukurti eksperimentai, turės įtakos kiekvienos konkrečios fazės tarpiniam įsitikinimui, yra raktas į optimalų sprendimą. signalizacijos strategija. Pradedame nuo to, kad jei pateikiamas užpakalinis tikėjimas lapo mazge, tada nustatomas gavėjo veiksmas – jis veiks su didžiausia užpakaline tikimybe, nebent bus lygiosios, tokiu atveju jis yra abejingas ir vadovausis siuntėjo veiksmais. rekomendacija. Todėl optimaliam signalizavimui nustatyti galime naudoti atgalinę iteraciją ir optimalumo principą. Pradedame nuo paskutinio etapo eksperimentų, kai siuntėjas gali juos sukurti.

Eksperimentai fazėje N − 1 Antrame paskutiniame etape 3.4 skyriaus rezultatai apibūdina siuntėjo sukurto eksperimento vaidmenį optimalioje signalizacijos strategijoje: pasirinkite strategiją visų įtikinėjimo santykio kreivių ribose. Tačiau jei eksperimentas nustatomas antroje paskutinėje fazėje, taikomas papildomas apribojimas tarpiniam įsitikinimui tarp antrojo paskutinio etapo ir paskutinio etapo. Tai reiškia, kad (įmanomų) strategijų rinkinys susitrauks. Laimei, įgyvendinus apribojimus, optimalios signalizacijos strategijos paieškos pagal nustatytą eksperimentą procesas yra toks pat kaip siuntėjo sukurtas eksperimentas, ty pasirenkama strategija visų įtikinėjimo santykio kreivių ribose. Todėl kiekvienoje galimoje fazės šakoje N − 1, galime nubrėžti optimalaus įtikinėjimo santykio kreivę, fiksuojančią optimalią siuntėjo signalizacijos strategiją fazėje N − 1 ir fazė N.

Ne dvejetainiai rezultatų eksperimentai Kai eksperimentų rezultatai nėra dvejetainiai, aukščiau aprašytas metodas veikia su didesniu etapų skaičiumi (jei sudėtingumas nėra problema).

Dėl bendrųjų ne dvejetainių eksperimentų žr. 6 lemos įrodymą (23), kuriame pateikiama išsami konstrukcija nuo nedvejetainių iki dvejetainių eksperimentų.