CPEx blog /

Bezpečnost a segmentace dat u sázkové platformy

31. října 2022

Inspirativní rozhovor s Jaromírem Dvořáčkem o tom jak Terabito řeší bezpečnost dat a segmentaci. Například o sdílení dat mezi konkurenty.

V minulém roce Terabito začalo spolupracovat s nově vznikající sázkovou platformou působící na asijském trhu. A přestože v asijských zemích není nutné dodržovat GDPR, všimli si, že některé výzvy jsou podobné jako zažíváme my v adtechu. Rozhodli jsme se na toto téma vyzpovídat Jaromíra Dvořáčka, CEO Terabito. Datový tým Terabito pro CPEx zajišťuje platformu pro datovou analytiku a garantuje nám správnost dat. 

Během naší spolupráce jste občas zmínili podobnosti se sázkovým trhem, na kterém působíte. Popište nám prosím, co vlastně děláte.

Vytvořili jsme real-time ETL a DMP pro sázkovou platformu. Jde o byznys v reálném čase – když někdo odešle sázku, ani jedna transakce se nesmí ztratit a musí být zpracována do jedné sekundy.

V čem vidíte podobnosti s trhem, na kterém působí CPEx?

No, v zásadě se dá říct, že zmíněná sázková platforma je jako CPEx, uživatelé platformy jsou v roli publisherů. Byť je byznysová stránka odlišná, řeší se podobné výzvy: například jak sdílet segmenty uživatelů a trendy v reálném čase.

Pokud jeden publisher zpozoruje nový trend v sázení, může to být zásadní váhou pro změnu kurzů u ostatních publisherů, což pak zvyšuje marže všem účastníkům platformy. To vše probíhá v řádu minut.

Je běžné, že jeden uživatel sází u více publisherů, už proto, že ho třeba zajímají různé e-sporty. Výměna segmentů o uživatelích je proto také žhavé téma, zvlášť u publisherů konkurujících si na stejném trhu.

Jak adresujete obavy  publisherů konkurujících si pří sdílení dat?

Zajímavostí asijského trhu je, že uzavřená smlouva má velmi nízkou hodnotu a neadresuje problémy důvěry tak, jako na západních trzích. Místo pouhých příslibů na papíře jsme tak museli přijít s technologickým řešením. Každá transakce je finanční transakce, proto byla v požadavcích na datovou část projektu i odolnost na hackerské útoky, průmyslovou špionáž, lidské a programatické chyby.

Jak se povedlo přesvědčit konkurující si publishery, ať odesílají data jedné platformě?

Kryptografií. Metadata jsou při vstupu zašifrována veřejným klíčem každého publishera, obvykle do pár sekund od přijetí. Pro zobrazení dat je třeba použít privátní klíč, který není v celém systému dispozici. Privátní klíč může být vystaven pro publishera (všichni zaměstnanci publishera pak vidí všechna data publishera), nebo pro každého uživatele publishera (každý uživatel u publishera pak může vidět jinou část dat).

Jak jde vůbec technicky adresovat možnosti útoků hackerů?

Každý dobrý IT tým dělá, co může, aby bylo vše aktualizované, izolované od internetu, ti lepší i minimalizují možnosti útoku. Do této kategorie spadá například to, že přijímací edge node je jediný kousek infrastruktury vystavený do internetu. Je to naprosto minimalizovaný kus softwaru a systému, běžící na unikernelu, do systému nejde nic zapsat a pokud se cokoli změní v paměti nebo odchozím provozu, náš monitoring to ihned zahlásí. To je základní úroveň, kterou není možné vynechat.

V pokročilé úrovni uvažujete nad tím, co se stane, když přeci jen k průniku dojde. Třeba tím, že minimalizujete množství dat v každé části procesu, data se pak na každém kousku infrastruktury vyskytují maximálně 5 minut. Úložiště, které je kompletně off-line a odděleno od vnějšího světa, má sice všechna data, ale zase do nich nevidí. Případný únik z celého datasetu z uzavřené sítě pak stejně nedává smysl bez primárních šifrovacích klíčů k metadatům, které umožní dataset poskládat dohromady.

Je možné dělat nad šifrovanými daty analytiku?

Ano, to je základním požadavkem celého přístupu. Proto jsou šifrována jen metadata, aneb klíče, které datasetu dávají smysl. Globální analytika probíhá částečně před zašifrováním (typicky fraud detection), trendy a segmenty pak už pak běží v reálném čase nad neidentifikovatelnými daty. Interní analytika pro jednotlivé publishery už pak běží mimo společný data lake – tj. v izolovaných instancích, kde je doplňujeme daty z dalších zdrojů a nastavujeme modely dle potřeb.

Šel by stejný model použít i v EU při splnění pravidel GDPR?

Ano. I když se GDPR mimo EU občas nedodržuje, kompatibilita s GDPR je zpravidla už v požadavcích na návrh datové architektury. Pozorujeme také trend přesunu z user-centric segmentací do situačních content-centric segmentací. Ono to ani jinak nejde, protože poskytovatelé služeb chtějí mít možnost působit i na evropském trhu. Realita je už teď dost globalizovaná, pokud korejský streamer vyzve k sázkám, účastní se stejně uživatelé z celého světa, včetně Evropanů.

Děkuji za odpovědi. Kdyby měl někdo z čtenářů doplňující dotaz, kam může psát? Rádo se stalo. Kontakty a dotazy ideálně přes LinkedIn: https://www.linkedin.com/in/jaromirdvoracek/

Chcete vědět, kam se posouvá RTB?

Odebírejte náš newsletter!

Další články ze světa RTB

Case study: CPEx zvyšuje CTR pomocí AI audiencí

V digitální reklamě je datové cílení klíčovou součástí úspěchu. V CPExu jsme se rozhodli posunout hranice a využít umělou inteligenci a strojové učení pro dosažení ještě lepších výsledků. Ve spolupráci s Alzou jsme provedli A/B test, kde jsme porovnávali CTR původního...

pokračovat ve čtení