Ez technikailag egyelőre jóval nehezebb, mint elsőre tűnik. Az egyik fő ok, hogy a jelenlegi AI rendszerek – főleg a videófeldolgozás terén – még nem elég megbízhatóak ahhoz, hogy milliméterpontos, kontextusérzékeny döntéseket hozzanak valós időben. Torzítástól mentesen, több kameranézet alapján, akár rossz fényviszonyok között is, amikor takarásban van sok lényeges pont stb.
A mai multimodális AI-modellek (amik képet is „látnak”, gondolom ezekre utalsz) már nagyon látványos válaszokat tudnak adni, de ezek gyakran csak meggyőzően hangzanak, nem ténylegesen precízek. A videófeldolgozás ráadásul nagyon erőforrásigényes, költséges és időigényes is, az 5 perces VAR „expedíciók” eltörpülnének egy AI-döntés mellett, ami végül nagyon jó eséllyel téves is lenne.
Másrészt a fociszabályok egy része valóban egzakt (pl. les, szöglet), de sok közülük szubjektív, például hogy mi számít szándékos kezezésnek, durva szabálytalanságnak, vagy hogy valaki elég súlyosan szabálytalankodott-e egy piros laphoz. Ezeket még az emberek is sokszor vitatják, egy AI esetén pedig teljes leolvadás és lutri lenne, mert a szándék, szituáció és kontextus értelmezése a jelenlegi modelleknek egyáltalán nem megy jól.
Szóval nem reális, legalábbis egyelőre. Nem élünk még annyira scifi világot.