Fesl Jan, Katedra informatiky
01/10/2021 – 31/12/2022
Fond rozvoje CESNET, z.s.p.o.
Název CZ: Videostream Hunter
Název EN: Videostream Hunter
Řešitel: Fesl, Jan, Katedra informatiky
Realizace: 01/10/2021 – 31/12/2022
Rozpočet: 1 272 000 CZK (projekt), 415 274 CZK (Přf)
Poskytovatel: Fond rozvoje CESNET, z.s.p.o.
Abstrakt
V současné době je velké množství multimediálního obsahu (audio/video) nabízeno prostřednictvím on-line platforem, typicky na vyžádání uživatele (Video-on-Demand). Tato praktika je dnes naprosto běžná u placených služeb (např. online videopůjčovny), avšak objevuje se i u platforem pro sdílení dat (např. Ulož.to), u kterých legálnost původu dat nelze zaručit. Objevují se dokonce i platformy , u kterých lze (viz. dokument "V síti") dokonce tvrdit, že vlastní obsah bez ohledu na původ může být mimořádně závadný (např. terorismus, dětská pornografie, atd.). celou věc navíc komplikuje skutečnost, že velká většina toho provozu je v současné chvíli šifrována pomocí protokolu HTTPS, což značně znesnadňuje jeho identifikaci. Účelem projektu je hledat cesty a mechanismy pro nalezení otisku konkrétních videostreamů a tyto následně identifikovat ze síťového provozu reportovaného prostřednictvím protokolu NetFlow/IPFIX.
Cíle
- Ověření a rozvoj výše navrženého konceptu resp. hlubší rozpracování možností způsobů detekce neznámého videostreamu zachyceného sondami síťového provozu na základě jeho shody se záznamy existující v databázi konkrétních otisků již známých streamů.
- Studium aspektů ovlivňujících způsoby detekce např. vliv streamovací platformy potažmo typu používaného videopřehrávače (např. Uloz.to, Youtube, Netflix), opakovatelná použitelnost otisku videostreamu pro jeho různé kvality, možnost detekce videostreamu na základě otisku pouze ze zachycené části streamu (např. uživatel se dívá jen na malou část filmu), možnosti vzniku nejednoznačnosti otisků (je otisk při velkém množství záznamů v databázi skutečně unikátní?), volba ideální reprezentace otisku videa, obecný více-faktorový vliv nastavení sondy síťového provozu na jednoznačnost otisku video streamu.
Výstupy
- Vytvoření detekčních modelů (statistické či založené na metodách strojového učení) a zhodnotíme jejich úspěšnost s ohledem i na jejich výpočetní náročnost.
- Pro nejlepší modely realizace utility, která bude tyto modely využívat pro identifikaci konkrétních streamů.