Bluesky ir AT protokolas: Naudojama decentralizuota socialinė žiniasklaida: indeksavimo infrastruktūra

Autoriai:
(1) Martin Kleppmann, Kembridžo universitetas, Kembridžas, JK ((apsaugotas el. paštu));
(2) Paulas Frazee, Bluesky Social PBC JAV;
(3) Jake'as Goldas, „Bluesky Social PBC“, JAV;
(4) Jay'us Graberis, „Bluesky Social PBC“, JAV;
(5) Danielis Holmgrenas, „Bluesky Social PBC“, JAV;
(6) Devin Ivy, Bluesky Social PBC Jungtinės Valstijos;
(7) Jeromy Johnson, Bluesky Social PBC JAV;
(8) Bryanas Newboldas, „Bluesky Social PBC“, JAV;
(9) Jazas Volpertas, „Bluesky Social PBC“, JAV.
Nuorodų lentelė
Santrauka ir 1 Įvadas
2 „Bluesky Social App“.
2.1 Moderavimo funkcijos
2.2 Vartotojo rankenos
2.3 Tinkinti tiekimai ir algoritminis pasirinkimas
3 Protokolo architektūra
3.1 Vartotojo duomenų saugyklos
3.2 Asmens duomenų serveriai (PDS)
3.3 Indeksavimo infrastruktūra
3.4 Etiketės ir tiekimo generatoriai
3.5 Vartotojo tapatybė
4 Susiję darbai
5 Išvados, padėkos ir nuorodos
3.3 Indeksavimo infrastruktūra
Žiniatinklyje svetaines tikrina ir indeksuoja paieškos varikliai, kurie teikia visame žiniatinklyje paieškos ir atradimo funkcijas, kurių vienos svetainės negali suteikti. AT protokolas yra įkvėptas šios architektūros: PDS talpinamos saugyklos yra analogiškos svetainėms, o indeksavimo infrastruktūra – paieškos sistemai. Vartotojų saugyklos yra pirminiai duomenys („tiesos šaltinis“), o indeksai yra išvedami iš saugyklų turinio.
Rašymo metu daugumą „Bluesky“ indeksavimo infrastruktūros valdo „Bluesky Social PBC“ (3 pav. pažymėta tamsesniu plotu). Tačiau įmonė neturi privilegijuotos prieigos: kadangi saugyklos yra viešos, bet kas gali jas tikrinti ir indeksuoti naudodamas tuos pačius protokolus, kuriuos naudoja mūsų sistemos. Klientų programos gali pereiti prie skaitymo iš kito indekso arba naudoti kelių indeksų derinį.
Nors mažo PDS valdymas sukurtas taip, kad būtų pigus, norint valdyti visą tinklą apimantį indeksatorių, reikia didesnių skaičiavimo išteklių. Todėl tikimės, kad mėgėjų indeksuotojų bus mažiau nei savarankiškai veikiančių PDS. Nepaisant to, „Bluesky“ augant, tikėtina, kad bus daug profesionaliai valdomų indeksuotojų įvairiems tikslams. Pavyzdžiui, įmonė, atliekanti socialinių tinklų veiklos apie prekės ženklus nuotaikų analizę, galėtų lengvai sukurti viso tinklo indeksą, kuris suteiktų įžvalgų savo klientams. Žiniatinklio paieškos sistemos gali įtraukti „Bluesky“ veiklą į savo indeksus, o archyvarai, tokie kaip Interneto archyvas, gali išsaugoti šią veiklą palikuonims.
Indeksavimo infrastruktūra, kurią valdo Bluesky Social PBC, parodyta 3 paveiksle. Ją sudaro kelios paslaugos, turinčios išorinių paslaugų integravimo taškus.
3.3.1 Relė. Pirmasis komponentas yra relė, kuri tikrina visų žinomų PDS naudotojų saugyklas ir naudoja jų sukurtus naujinimų srautus. Relė tikrina parašus ir Merkle medžio patikrinimus dėl atnaujinimų ir palaiko savo kiekvienos saugyklos kopiją. Remdamasi šia informacija, relė sukuria gaisrinę žarną: sukauptą naujinimų srautą, kuris praneša abonentams, kai įrašai pridedami arba ištrinami bet kurioje iš žinomų saugyklų.
Priešgaisrinė žarna yra viešai prieinama. Priešgaisrinės žarnos naudojimas yra lengvesnis būdas sukurti indeksą visame tinkle, palyginti su tiesioginiu šaltinio PDS prenumeravimu, nes „Relay“ atlieka tam tikrą pradinį duomenų valymą, pvz., atmeta netinkamai suformuotus naujinimus ir išfiltruoja didelės apimties šlamštą. Priešgaisrinėje žarnoje kartu su įrašais gali būti pateikti Merkle įrodymai ir parašai, leidžiantys abonentams patikrinti, ar jie yra autentiški.
Relė neinterpretuoja ir neindeksuoja saugyklose esančių įrašų, o tiesiog juos saugo ir persiunčia. Bet kuris kūrėjas, norintis sukurti naują socialinį režimą antproto viršuje, gali apibrėžti naują leksiką su naujais įrašų tipais, o šie įrašai gali būti saugomi esamose saugyklose ir kaupiami priešgaisrinėje žarnoje nereikalaujant jokių relės pakeitimų.
3.3.2 Programos rodinys. „App View“ yra paslauga, kuri sunaudoja ugnies žarną ir apdoroja įrašus, susijusius su „Bluesky“ socialine programa (įrašai com.atproto ir app.bsky leksikonuose). Pavyzdžiui, programos rodinyje skaičiuojamas kiekvieno įrašo paspaudimų „Patinka“ skaičius ir sulyginama kiekvieno įrašo atsakymų gija. Programos rodinys taip pat palaiko kiekvieno naudotojo stebėtojų rinkinį ir sukuria laiko juostą, kurioje yra kiekvieno vartotojo stebimų paskyrų įrašai. Tada ji siūlo žiniatinklio paslaugą, per kurią galima užklausti šios informacijos. Kai įraše yra nuorodų į vaizdus, programos rodinys paima tuos failus iš pradinio PDS, prireikus pakeičia jų dydį, kad sumažintų failo dydį, ir padaro juos pasiekiamus per turinio pristatymo tinklą (CDN).
Kad ši informacija būtų rodoma vartotojo kliento programoje, klientas pateikia užklausą paties vartotojo PDS, kuris tada paima reikiamus duomenis iš programos rodinio. Programų rodinys taip pat yra atsakingas už moderavimo valdiklių vykdymą: pavyzdžiui, jei vienas vartotojas užblokavo kitą, o vienoje iš vartotojų saugyklų yra įrašas apie sąveiką, kuri neturėjo būti leidžiama dėl blokavimo, tada programos rodinys nutrūksta. tą sąveiką, kad niekas jos nematytų kliento programose. Toks elgesys atitinka tai, kaip blokavimas veikia „Twitter/X“ (61), ir dėl šios priežasties blokai yra vieši „Bluesky“ įrašai: kiekvienas protokolą atitinkantis „App View“ turi žinoti, kas ką blokuoja, kad būtų užtikrintas blokavimas ( 16, 41). Jei naudotojai nepatenkinti „Bluesky Social PBC“ valdomame programos rodinyje taikomomis moderavimo taisyklėmis, trečiosios šalys visada gali naudoti alternatyvius programų rodinius, kurie indeksuoja tą pačią gaisrinę žarną ir pateikia duomenis kitu būdu.
Jei AT protokolas naudojamas ne tik mikrotinklaraščių kūrimui, bet ir kitam socialiniam režimui įgyvendinti, tai programai greičiausiai reikės atskiros programos peržiūros paslaugos, kurią gali priglobti bet kas. Tada ši paslauga gali interpretuoti ir indeksuoti įrašus vartotojų saugyklose bet kokiu būdu, kurio reikia tai programai.