V Praze se od včerejška koná dvoudenní SAP Startup Forum, první ve střední a východní Evropě. O několik dní později se mělo sejít také v Brně, ale nebyl o ně dostatečný zájem. Na úterý bylo do Prahy zapsáno asi sedmdesát účastníků, ale zdaleka ne všichni pobyli celý den. (To před třemi týdny v Berlíně byla prý účast několikanásobná.)
Náplní prvního dne konference bylo především představení programu společnosti SAP na podporu startupů, a s tím souvisící platformy SAP HANA a jejích možností. SAP podporuje startupy právě ve využívání této databázové aplikační platformy.
Na pražské Forum bylo pozváno 25 firem a dorazili zástupci dvaceti. Dvanáct jich v průběhu dne „soutěžně“ prezentovalo, ale soutěž nebyla pro konferenci stěžejní. Projekty se měly představit jako vhodný kandidát na nasazení SAP HANA.
Ve středu Forum pokračuje bootcampem pro vývojáře. Je jich na něj zapsáno osmnáct. Z bootcampu by měli odejít mimo jiné se zprovozněným vývojovým prostředím pro SAP HANA a se základní představou o vývoji pro ni.
Těchto fór se mají jen do konce roku konat po světě ještě desítky. SAP Startup Forum je vstupní branou do programu společnosti SAP na podporu startupů. Má‑li startup zájem o podporu od SAPu, bez které by si sotva mohl dovolit SAP HANA, musí se jeho zástupci zúčastnit Startup Fora, anebo alespoň virtuálního Startup Fora přes internet, aby se pracovníci SAPu mohli seznámit jak s nimi, tak s jejich řešením, a společně mohli posoudit, zda to je řešení vhodné pro SAP HANA. Není v zájmu SAPu „natlačit“ HANA každému, zejména kdyby se pak takové řešení nemělo osvědčit.
Na pražské Forum se přijeli představit například také dva zakladatelé projektu IPN (Intelligent Predictive Networks) z Vídně. Nakonec je porota vybrala jako řešení nejinovativnější. (Pomocí sběru dat z čidel chtějí předpovídat selhání určitých součástek a tak optimalizovat údržbu, například něčeho velikosti dopravního podniku velkého města.)
SAP svůj podpůrný program nazývá „Startup Focus“, a někdy o něm mluví jako o „vývojovém akcelerátoru“. Nepředstavujte si však open‑space s obecným podnikatelským mentoringem. Podporovaná firma pracuje sama za sebe, SAP jí poskytuje vývojové nástroje a platformu SAP HANA, odbornou pomoc s její implementací a později pomoc se vstupem na trh, a to zejména skrze kanály SAPu. Přitom si za to na firmě nebere podíl.
SAP tak činí prostě proto, že sám by jako velká společnost těžko hledal a objevoval nejrůznější inovativní řešení pro SAP HANA. Na své si přijde prodejem SAP HANA koncovým uživatelům těch řešení.
Program Startup Focus má celosvětově na starosti poměrně malý tým asi o třiceti lidech, s ústředím v Palo Altu, v Kalifornii. Tento tým mimo jiné slouží jako prostředník mezi startupy a zbytkem společnosti SAP. Přímé jednání s tak velkou společností by bylo pro startup úmorně obtížné a zdlouhavé.
Co je SAP HANA?
Databázová platforma navržená tak, aby umožňovala rychlou práci s velkými daty, a to zejména jejich analýzu. Mnohdy je možné docílit skoro okamžité odezvy na dotazy, které by jinak potřebovaly mnohonásobně déle (třeba i tisíckrát, desetitisíckrát nebo stotisíckrát déle), a díky tomu má vůbec smysl je implementovat.
Vznik SAP HANA umožnily klesající ceny počítačových dílů a jejich vzrůstající výkon nebo kapacita. Dnes lze mít i terabajt RAM v jediném serveru na platformě Intel.
Jednou z klíčových vlastností HANA je to, že databáze je celá v operační paměti serveru, nenačítá se průběžně z disku. (Byť jsou i pokročilé metody kešování a přediktivního načítání.) HANA přitom umožňuje servery sdružovat. SAP si postavil cluster například se 250 TB RAM a běží na něm jediná instance HANA. To je však extrém. Tak velká HANA pořád vychází hodně draho a nevyplatila by se jen tak k něčemu, rychlost, nerychlost. Pro běžné aplikace má podle Davida Sonnenscheina smysl uvažovat o Haně na 60 GB až jednom TB.
Dalším stěžejním prvkem Hany je to, že ukládá „sloupcově“, a nikoli „řádkově“. (Řádkové ukládání však podporuje také.) Například v databázové tabulce obsahující data o všech obyvatelích ČR by byla spousta řádek lidí s příjmením Novák. Ve sloupcovém uložení bude příjmení Novák uloženo ve sloupci všech českých příjmení, a to jednou. To sice prodlužuje ty operace, kdy je potřebí vytáhnout o nějakém určitém Novákovi vše (a jiné podobné operace „řádkové“), ale pro spoustu analytických úloh stačí práce s několika sloupci tabulky. Kromě toho taková databáze zabere v paměti mnohem méně místa.
Aby se však uložení sloupcového využilo k opravdu velkému zrychlení, je potřeba data správně modelovat (jinak než pro databázi řádkovou).
HANA nadto paralelizuje zpracování dotazu — při dotazech dokáže souběžně využít desítek, stovek nebo i tisíců jader.
A nakonec, HANA není jen databáze sama, je to i aplikační server, s mnohými už hotovými knihovnami a s podporou HTML5. Čím více implementujete na Haně samotné, tím více ušetříte „režii“ mezi odděleným aplikačním serverem a databází, popřípadě se můžete úplně obejít bez dalšího aplikačního serveru. Jde o to, kam až v implementaci Hany pokročíte. Přechod na Hanu je možné rozdělit do kroků a začít prostě tím, že na ni bez úprav přesunete databázi stávající, ale výkon získaný jen tím nebude tak velký.
Semantic Visions analyzují metadata na vyžádání
Zvláštním hostem pražského Fora byla firma Semantic Visions, oceněná nedávno v Orlandu. Za firmu vystoupil Julius Rusnák, její CTO. Semantic Visions vyhledávají na internetu zdroje zpráv, hodnotí je a třídí, a popřípadě zařazují do každodenního sběru, a to asi milionu článků denně. Pořizují však ještě bohatá metadata, v průměru čtrnáct položek na článek. Podstatnou součástí jejich duševního vlastnictví je roztřídění pojmů, jejich významů a souvislostí. Pracují v jedenácti jazycích včetně češtiny.
Na Hanu zatím nepřešli se všemi daty, především ne se zdrojovými, to by na ně zatím bylo příliš velké a nákladné, ale přesunuli do ní zajímavá metadata a s těmi si teď mohou „hrát“ v reálném čase a vizualizovat je na vyžádání (to shodou okolností činí přes SAP Lumira, ale podobné znázorňovací funkce má i sama Hana).
Smyslem Semantic Visions je analyzovat veřejný obsah internetu (především zpravodajství) na nejrůznější signály. Lze si například ohlídat možná ohrožení dodavatelských kanálů v určitém odvětví. A Julius připustil, že k jejim zákazníkům patří i sektor bezpečnosti a obrany…
Také ukázal, že z jejich dat by se byl dal předpovědět nedávný krátký pád ceny zlata. (Zjistili to až zpětně…) Zjišťování signálů pro algoritmické obchodování na finančních trzích označil za vnitřní výzkumný projekt Semantic Visions.
Duchovním otcem Semantic Visions a jejím současným CEO je František Vrábel. Většinovým investorem do společnosti je Jan Barta.
Na konferenci se na chvíli ukázal také Jan Řežáb za Socialbakers, aby tento projekt „soutěžně“ představil mezi ostatními dvanácti, a to ve vymezených třech minutách. Za podaný výkon se mu dostalo ocenění za nejlepší „pitch“.
Za nejlepší řešení „velkých dat“ však porota ocenila čerstvý česko-slovinský startup „Clever Maps“, tvořící analýzy nad mapovými podklady. (A neměli ten nápad pod tím názvem první.)
O podporu implementace HANA se na Foru ucházejí také například Futurelytics, vítězové Seedcampu Budapešť 2012, kteří zatím využívají Googlu. Pro ně, tak jako pro mnohé jiné, by „Startup Focus“ a nasazení Hany bylo především způsobem, jak se dostat k zákazníkům SAPu.
Například tvůrci IPN jsou přesvědčeni, že SAP HANA bude za dva roky „všude“, a proto chtějí mít řešení pro ni. Jinak by ho dokázali postavit i na jiné databází.