tohle je věcí strategie dané firmy, buď mohou paběrkovat nebo zainvestovat a ovládnout trh.
Před dvěma lety měli roční náklady na zaměstnance 100M, několik stovek virtuálních serverů a několik desítek TB dat. Bayes je sice problematický, ale ve Sparku nad hadoopem běhá slušně.
Problém oboru je až moc rychlé změny a špatná data na vstupu. Nelze stáhnout data a hodit je do grafu, musí se pročistit, spojit s dalšímí sítěmi, zajistit kontinualitu výpočtu, aby časové grafy dávaly smysl atd.