Hlavní navigace

eWorkshop: Návrh sociální sítě budoucnosti

 Autor: 29
Jiří Donát 3. 3. 2006

Diskuse na eWorkshopu překonala i má nejoptimističtější očekávání. Díky zapojení řady velmi aktivních členů komunity Lupy, z nichž bych ovšem na prvním místě vyzvedl tři z nich, s přezdívkami „Jan - honzzz”, Ondrej Páleš a „HK Maly”, jsme dospěli mnohem dál, než jsem původně doufal.

Díky tomu mohu naši diskusi shrnout skutečně netradičním způsobem – popisem budoucí aplikace, tedy popisem sociální sítě budoucnosti. Je zároveň krásně symbolické, že můžeme poslední část našeho eWorkshopu předat komunitě Lupy v této podobě.

Diskuse ale pochopitelně nekončí – uvítám veškeré vaše podněty, kritiky, i návrhy na zlepšení či dořešení jakýchkoliv bodů této aplikace.

Ještě jednou díky! Aplikace je vaše – a to nejen ve smyslu open-source…

Motivace

Naším cílem je navrhnout systém umožňující propojovat lidi sobě podobné, a tím zlepšit podmínky pro sdílení informací na Internetu. Jako první popsal způsob fungování systému v diskusi Jan:

„Na veřejně dostupném ‚identitním‘ serveru si zaregistruji identitu – jednoznačné a nezaměnitelné jméno, obdoba e-mailové adresy pro e-mailové služby v oblasti identitních služeb + volitelně pár údajů (jméno, e-mail, fotku atp…). Na svém počítači nainstaluji klientský program, který s identitním serverem komunikuje pomocí otevřeného protokolu itp (Identity Transfer Protocol). A vrhnu se do svých oblíbených činností na Internetu – vyhledávám články, čtu diskuse, přispívám do diskusí…
Přitom klient všude, kam přijdu/tam, kde chci, moji činnost podepisuje – do mých příspěvků v diskusi vkládá charakteristický tag, který je pro ostatní viditelný, jednoznačně (pokud možno i zapamatovatelně) mě identifikuje, dává ostatním najevo ‚nebojte se se mnou komunikovat, tady jsem otevřený‘ a zároveň funguje jako link na rozhraní identitního serveru, který agreguje informace o veškeré mé činnosti na netu (klient mu totiž posílá informace o tom, na jaké stránky chodím, do jakých diskusí přispívám a s kým se v jakém kontextu bavím)…“

Zde jsme se pak už začali lišit – ale nakonec jsme se domluvili. Mně už pak pouze připadlo formálně sepsat výsledek naší diskuse.

Vlastnosti systému

Základem implementace systému je přidání nové funkce existujícím vyhledávačům: možnost vyhledávat nejen v klíčových slovech stránek, ale zároveň i možnost omezit jakýkoliv vyhledávací dotaz na stránky vytvořené či navštěvované lidmi „námi podobnými“; tato funkcionalita bude dostupná i v oblasti nově vytvářených stránek na Internetu, které budou do systému doručovány pomocí RSS (vznikne tak analogie Google News). Bude tedy možné nechat si doručovat stránky z určitého oboru vytvořené „lidmi nám podobnými“, které nám systém automaticky nalezne.

Vyhledávací dotaz

Systém tedy bude schopen velmi obecných dotazů. Bude mi schopen nabídnout nejen mně podobné lidi, ale dokonce rovnou mně podobné lidi v určitém specifickém kontextu. Příklad – hledal bych zájemce o železniční modelářství a v rámci tohoto dotazu bych pak využil výsledky shlukové analýzy, která by mi našla mně podobné modeláře! A tento dotaz bych pak mohl ještě upřesnit na modeláře v Praze! Toto je velmi silná funkce, která navíc nevyžaduje znát dopředu dotazy, které budeme klást (zatímco v klasickém databázovém systému musím strukturovat informaci podle toho, co předpokládám, že budu hledat), a která se tedy intuitivně velmi blíží vyhledávacím schopnostem lidského mozku.

Implementace

Základem systému bude jednoznačný identifikátor uživatele, který nazvěme UPI – Unique Personal Identificator. Ten bude uživatele jednoznačně identifikovat při práci s Internetem, a to jak při práci pasivní (čtení), tak při práci aktivní (zápis, aktivní komunikace).

Klient – plugin browseru

Uživatel, který bude chtít tento systém používat, si nainstaluje do svého browseru klienta, nejlépe ve formě pluginu. K tomuto pluginu se v okamžiku, kdy bude chtít být pro systém sledovatelný, přihlásí (díky tomu bude možné systém používat z různých počítačů, včetně internetových kaváren). Plugin pak bude automaticky zajišťovat následující funkce:

  1. při „pasivní“ práci (čtení) bude plugin sledovat všechna URL, které uživatel navštíví, a umísťovat je na speciální webovou stránku, která může být umístěna kdekoliv na Internetu (například na onom zmíněném identitním serveru). Podmínkou však je, aby tato osobní stránka byla veřejně viditelná (a byla tedy prohledávatelná roboty různých vyhledávačů) a aby se její obsah řídil přesně stanovenou syntaxí.
  2. při „aktivní“ práci (zápis) bude plugin v okamžiku, kdy uživatel cokoliv uveřejní na Internetu, uživatele domluveným způsobem podepisovat přidáním jeho UPI. Takto bude za uživatele označovat veškeré jeho diskusní příspěvky, články, e-maily.

Plugin navíc bude fungovat i jako toolbar vyhledávače. Bude možné zadávat nejen klasické vyhledávací dotazy, ale také vyhledávací dotazy nového typu, s omezením na stránky, které vytvořili či četli ve velkém množství „mně blízcí uživatelé“.

Třetí funkcí pluginu bude automatická transformace UPI na zobrazovaných stránkách (článcích, příspěvcích, e-mailech) na živý link nabízející kontextové menu o daném uživateli. Místo UPI kódu se mi tedy na daném místě stránky zobrazí miniaturní fotka uživatele, na kterou bude možné kliknout a vybrat si z menu, které bude obsahovat například: základní informace o tomto uživateli, vyhledávání témat (=webových stránek) blízkých tomuto uživateli, vyhledávání témat blízkých nám společně, vyhledávání jemu blízkých uživatelů atd.

Role vyhledávačů

Další funkce pro zkvalitnění vyhledávání již budou doménou vyhledávačů. Vyhledávače se totiž budou snažit implementovat funkci „hledání mně podobných lidí“ kvalitněji než konkurence. K tomu bude zapotřebí pokud možno co nejúplnějších dat a nejlepší realizace algoritmu pro aplikaci metody shlukové analýzy na datech vzniklých prohledáváním daného UIP.

Příklady: Kvalitu dat bude možné vylepšit například těmito postupy:

Robot vyhledávače bude schopen:

  • na diskusních fórech identifikovat UPI ve stejném vlákně.

Vyhledávač bude schopen:

  • ve spolupracujících e-mailových, instant-messagingových (IM) a VoIP systémech vyhodnotit frekvenci komunikace mezi danými UPI.

Implementace funkce „najdi podobné uživatele“

Funkce hledání „podobných“ uživatelů bude realizována pomocí statistických metod shlukové analýzy.

Pro každého uživatele systém prohledá Internet na výskyt jeho UPI a přidá informace ze speciální stránky identitních serverů k získání přehledu jeho nejvíce navštěvovaných stránek (za určité období; s tím, že stránky navštívené v dávné minulosti budou mít menší váhu než stránky navštívené aktuálně. Tímto způsobem bude implementováno v diskusi zmiňované „stárnutí kontaktů“; parametrem, za jaké období se má aktivita uživatele sledovat, bude možno ovlivnit vlastnosti vyhledávání a různé vyhledávače budou jeho nastavení moci přistupovat různě – zde bude prostor pro vzájemnou konkurenční výhodu jednotlivých vyhledávačů). Z výsledků vyhledávání bude sestaven profil uživatele, který se stane vstupem pro shlukovou analýzu (přesný způsob konverze výsledku dotazu vyhledávače do vstupních dat shlukové analýzy, tedy přesný způsob reprezentace dat uživatelů, v kombinaci s konkrétně zvolenou metodou zpracování, se stane opět předmětem konkurenčního boje mezi vyhledávači; v závislosti na implementaci bude možno dosáhnout například výsledků, které jsou obzvláště dobré v určitém oboru vyhledávání. Důležité však je, aby se předmětem konkurenčního boje nestaly různé možné definice formálního zápisu UPI, to by totiž omezilo užitečnost všech vzájemně si konkurujících systémů).

Následně systém provede shlukovou analýzu a výsledky této analýzy uloží do databáze k realizaci dotazů uživatelů. Na algoritmus vytváření dat o podobných uživatelích se tedy můžeme dívat jako na vzdálenou analogii algoritmu výpočtu PageRank, tentokrát ovšem pro osoby.

Implementace systému

Pár tipů, jak začít (věřím, že vás napadne ještě řada dalších):

Aby systém nestartoval z nuly, je vhodné zvážit následující akceleraci:

  • Napojení UPI na některý již dnes masově používaný jednoznačný identifikátor, například ICQ – pak by bylo možné prohledat i historická diskusní fóra, ve kterých se lidé svým ICQ podepisují.
  • Uživatel, který by měl zájem, aby mu systém začal přinášet výsledky rychleji, by prohledal na Internetu svoje jméno a snažil by se sestavit takový vyhledávací dotaz, který jej co nejpřesněji vystihuje z pohledu dnešního obsahu Internetu. Příklad: „Jiří Donát –kulečník“ (vím, že jeden můj jmenovec hraje kulečník, a to já tedy nejsem). Optimalizovaný dotaz by zadal do vyhledávače, který by z něj vygeneroval počáteční „autorský“ profil – seznam stránek, na které uživatel přispíval.
  • Uživatel by do systému uploadoval své aktuální bookmarky či historii browseru.
  • Spolupracující e-mailové a IM systémy by byly schopny vygenerovat statistiku minulé komunikace daného uživatele.

Základními vlastnostmi námi vytvořeného systému jsou otevřenost, jednoduchost a snaha maximalizovat využití funkcí stávajícího Internetu, a to jak jeho existujícího obsahu, tak současných vyhledávačů a jejich osvědčených algoritmů. Tyto vlastnosti maximalizují šanci systému na rychlou adopci. Jsem zvědav, kde ta adopce začne. Že by se prvním serverem, který implementuje UPI, stala Lupa?

Anketa

Zapojujete se do eWorkshopu?

Našli jste v článku chybu?

8. 3. 2006 9:12

Pro testování mě napadla nejtriviálnější implementace prototypu.

Plugin by jenom ukládal/stahoval obsah stávajícího souboru bookmark.
Stačí se domluvit na nějakém prohlížeči s čitelným bookmark soubnorem (IE to asi nebude) a nemusíme pro začátek nijak měnit jeho formát.
Stačí, aby si plugin uměl :
1) při startu vyžádat informaci o UPI stránce
2) vyzvednul soubor bookmark.* z www a nahradil jím lokální (pro větší bezpečnost s přejmenováním původního)
3) vyzvednout si na ní konfigurační soubor (n…






8. 3. 2006 8:11

Ze je to sice pouzitelne na konfiguraci, ale nema to vyjadrovaci silu potrebnou pro neco slozitejsiho, jako to co chceme tady dosahnout. Hlavne jde o to, ze tam vetsinou nejde udelat libovolne hlubokou strukturu.

I kdyz treba v apache to jde. Vypada to pak uz dost jako XML (dokonce i < je <). Myslim ze jediny element ktery je mozno vnorovat neomezene je if, ale to by slo rozsirit ...

Dalsi co by slo pouzit je konfikurace alsy, ta zas pripomina CSS ...

Priklady nerozsiritelnych syntaxi: cronta…





Root.cz: Nová třída SD karet A1 s vysokým výkonem

Nová třída SD karet A1 s vysokým výkonem

120na80.cz: Popraskané rty? Některé balzámy stav zhoršují

Popraskané rty? Některé balzámy stav zhoršují

Vitalia.cz: To není kašel! Správná diagnóza zachrání život

To není kašel! Správná diagnóza zachrání život

DigiZone.cz: Mňam TV splnila slib a odešla z DVB-T

Mňam TV splnila slib a odešla z DVB-T

Podnikatel.cz: Přehledná titulka, průvodci, responzivita

Přehledná titulka, průvodci, responzivita

Měšec.cz: Air Bank zruší TOP3 garanci a zdražuje kurzy

Air Bank zruší TOP3 garanci a zdražuje kurzy

Vitalia.cz: Tesco: Chudá rodina si koupí levné polské kuře

Tesco: Chudá rodina si koupí levné polské kuře

Vitalia.cz: Manželka je bio, ale na sex moc není

Manželka je bio, ale na sex moc není

Podnikatel.cz: Přivýdělek u Airbnb nebo Uberu? Čekejte kontrolu

Přivýdělek u Airbnb nebo Uberu? Čekejte kontrolu

Měšec.cz: Zdravotní a sociální pojištění 2017: Připlatíte

Zdravotní a sociální pojištění 2017: Připlatíte

Podnikatel.cz: 3, 2, 1..EET startuje. Na co nezapomenout?

3, 2, 1..EET startuje. Na co nezapomenout?

DigiZone.cz: Digi CZ výrazně zlevnila balíček HBO

Digi CZ výrazně zlevnila balíček HBO

Vitalia.cz: Znáte „černý detox“? Ani to nezkoušejte

Znáte „černý detox“? Ani to nezkoušejte

Lupa.cz: UX přestává pro firmy být magie

UX přestává pro firmy být magie

120na80.cz: Rovnátka, která nejsou vidět

Rovnátka, která nejsou vidět

Vitalia.cz: Vláknina: Rozpustná, nebo nerozpustná?

Vláknina: Rozpustná, nebo nerozpustná?

120na80.cz: Pánové, pečujte o svoje přirození a prostatu

Pánové, pečujte o svoje přirození a prostatu

Podnikatel.cz: Pozor, pojišťovny mění čísla účtů

Pozor, pojišťovny mění čísla účtů

Podnikatel.cz: K EET. Štamgast už peníze na stole nenechá

K EET. Štamgast už peníze na stole nenechá

Lupa.cz: Google měl výpadek, nejel Gmail ani YouTube

Google měl výpadek, nejel Gmail ani YouTube