eWorkshop: Návrh sociální sítě budoucnosti

Diskuse na eWorkshopu překonala i má nejoptimističtější očekávání. Díky zapojení řady velmi aktivních členů komunity Lupy, z nichž bych ovšem na prvním místě vyzvedl tři z nich, s přezdívkami „Jan - honzzz”, Ondrej Páleš a „HK Maly”, jsme dospěli mnohem dál, než jsem původně doufal.

Díky tomu mohu naši diskusi shrnout skutečně netradičním způsobem – popisem budoucí aplikace, tedy popisem sociální sítě budoucnosti. Je zároveň krásně symbolické, že můžeme poslední část našeho eWorkshopu předat komunitě Lupy v této podobě.

Diskuse ale pochopitelně nekončí – uvítám veškeré vaše podněty, kritiky, i návrhy na zlepšení či dořešení jakýchkoliv bodů této aplikace.

Ještě jednou díky! Aplikace je vaše – a to nejen ve smyslu open-source…

Motivace

Naším cílem je navrhnout systém umožňující propojovat lidi sobě podobné, a tím zlepšit podmínky pro sdílení informací na Internetu. Jako první popsal způsob fungování systému v diskusi Jan:

„Na veřejně dostupném ‚identitním‘ serveru si zaregistruji identitu – jednoznačné a nezaměnitelné jméno, obdoba e-mailové adresy pro e-mailové služby v oblasti identitních služeb + volitelně pár údajů (jméno, e-mail, fotku atp…). Na svém počítači nainstaluji klientský program, který s identitním serverem komunikuje pomocí otevřeného protokolu itp (Identity Transfer Protocol). A vrhnu se do svých oblíbených činností na Internetu – vyhledávám články, čtu diskuse, přispívám do diskusí…
Přitom klient všude, kam přijdu/tam, kde chci, moji činnost podepisuje – do mých příspěvků v diskusi vkládá charakteristický tag, který je pro ostatní viditelný, jednoznačně (pokud možno i zapamatovatelně) mě identifikuje, dává ostatním najevo ‚nebojte se se mnou komunikovat, tady jsem otevřený‘ a zároveň funguje jako link na rozhraní identitního serveru, který agreguje informace o veškeré mé činnosti na netu (klient mu totiž posílá informace o tom, na jaké stránky chodím, do jakých diskusí přispívám a s kým se v jakém kontextu bavím)…“

Zde jsme se pak už začali lišit – ale nakonec jsme se domluvili. Mně už pak pouze připadlo formálně sepsat výsledek naší diskuse.

Vlastnosti systému

Základem implementace systému je přidání nové funkce existujícím vyhledávačům: možnost vyhledávat nejen v klíčových slovech stránek, ale zároveň i možnost omezit jakýkoliv vyhledávací dotaz na stránky vytvořené či navštěvované lidmi „námi podobnými“; tato funkcionalita bude dostupná i v oblasti nově vytvářených stránek na Internetu, které budou do systému doručovány pomocí RSS (vznikne tak analogie Google News). Bude tedy možné nechat si doručovat stránky z určitého oboru vytvořené „lidmi nám podobnými“, které nám systém automaticky nalezne.

Vyhledávací dotaz

Systém tedy bude schopen velmi obecných dotazů. Bude mi schopen nabídnout nejen mně podobné lidi, ale dokonce rovnou mně podobné lidi v určitém specifickém kontextu. Příklad – hledal bych zájemce o železniční modelářství a v rámci tohoto dotazu bych pak využil výsledky shlukové analýzy, která by mi našla mně podobné modeláře! A tento dotaz bych pak mohl ještě upřesnit na modeláře v Praze! Toto je velmi silná funkce, která navíc nevyžaduje znát dopředu dotazy, které budeme klást (zatímco v klasickém databázovém systému musím strukturovat informaci podle toho, co předpokládám, že budu hledat), a která se tedy intuitivně velmi blíží vyhledávacím schopnostem lidského mozku.

Implementace

Základem systému bude jednoznačný identifikátor uživatele, který nazvěme UPI – Unique Personal Identificator. Ten bude uživatele jednoznačně identifikovat při práci s Internetem, a to jak při práci pasivní (čtení), tak při práci aktivní (zápis, aktivní komunikace).

Klient – plugin browseru

Uživatel, který bude chtít tento systém používat, si nainstaluje do svého browseru klienta, nejlépe ve formě pluginu. K tomuto pluginu se v okamžiku, kdy bude chtít být pro systém sledovatelný, přihlásí (díky tomu bude možné systém používat z různých počítačů, včetně internetových kaváren). Plugin pak bude automaticky zajišťovat následující funkce:

  1. při „pasivní“ práci (čtení) bude plugin sledovat všechna URL, které uživatel navštíví, a umísťovat je na speciální webovou stránku, která může být umístěna kdekoliv na Internetu (například na onom zmíněném identitním serveru). Podmínkou však je, aby tato osobní stránka byla veřejně viditelná (a byla tedy prohledávatelná roboty různých vyhledávačů) a aby se její obsah řídil přesně stanovenou syntaxí.
  2. při „aktivní“ práci (zápis) bude plugin v okamžiku, kdy uživatel cokoliv uveřejní na Internetu, uživatele domluveným způsobem podepisovat přidáním jeho UPI. Takto bude za uživatele označovat veškeré jeho diskusní příspěvky, články, e-maily.

Plugin navíc bude fungovat i jako toolbar vyhledávače. Bude možné zadávat nejen klasické vyhledávací dotazy, ale také vyhledávací dotazy nového typu, s omezením na stránky, které vytvořili či četli ve velkém množství „mně blízcí uživatelé“.

Třetí funkcí pluginu bude automatická transformace UPI na zobrazovaných stránkách (článcích, příspěvcích, e-mailech) na živý link nabízející kontextové menu o daném uživateli. Místo UPI kódu se mi tedy na daném místě stránky zobrazí miniaturní fotka uživatele, na kterou bude možné kliknout a vybrat si z menu, které bude obsahovat například: základní informace o tomto uživateli, vyhledávání témat (=webových stránek) blízkých tomuto uživateli, vyhledávání témat blízkých nám společně, vyhledávání jemu blízkých uživatelů atd.

Role vyhledávačů

Další funkce pro zkvalitnění vyhledávání již budou doménou vyhledávačů. Vyhledávače se totiž budou snažit implementovat funkci „hledání mně podobných lidí“ kvalitněji než konkurence. K tomu bude zapotřebí pokud možno co nejúplnějších dat a nejlepší realizace algoritmu pro aplikaci metody shlukové analýzy na datech vzniklých prohledáváním daného UIP.

Příklady: Kvalitu dat bude možné vylepšit například těmito postupy:

Robot vyhledávače bude schopen:

  • na diskusních fórech identifikovat UPI ve stejném vlákně.

Vyhledávač bude schopen:

  • ve spolupracujících e-mailových, instant-messagingových (IM) a VoIP systémech vyhodnotit frekvenci komunikace mezi danými UPI.

Implementace funkce „najdi podobné uživatele“

Funkce hledání „podobných“ uživatelů bude realizována pomocí statistických metod shlukové analýzy.

Pro každého uživatele systém prohledá Internet na výskyt jeho UPI a přidá informace ze speciální stránky identitních serverů k získání přehledu jeho nejvíce navštěvovaných stránek (za určité období; s tím, že stránky navštívené v dávné minulosti budou mít menší váhu než stránky navštívené aktuálně. Tímto způsobem bude implementováno v diskusi zmiňované „stárnutí kontaktů“; parametrem, za jaké období se má aktivita uživatele sledovat, bude možno ovlivnit vlastnosti vyhledávání a různé vyhledávače budou jeho nastavení moci přistupovat různě – zde bude prostor pro vzájemnou konkurenční výhodu jednotlivých vyhledávačů). Z výsledků vyhledávání bude sestaven profil uživatele, který se stane vstupem pro shlukovou analýzu (přesný způsob konverze výsledku dotazu vyhledávače do vstupních dat shlukové analýzy, tedy přesný způsob reprezentace dat uživatelů, v kombinaci s konkrétně zvolenou metodou zpracování, se stane opět předmětem konkurenčního boje mezi vyhledávači; v závislosti na implementaci bude možno dosáhnout například výsledků, které jsou obzvláště dobré v určitém oboru vyhledávání. Důležité však je, aby se předmětem konkurenčního boje nestaly různé možné definice formálního zápisu UPI, to by totiž omezilo užitečnost všech vzájemně si konkurujících systémů).

Následně systém provede shlukovou analýzu a výsledky této analýzy uloží do databáze k realizaci dotazů uživatelů. Na algoritmus vytváření dat o podobných uživatelích se tedy můžeme dívat jako na vzdálenou analogii algoritmu výpočtu PageRank, tentokrát ovšem pro osoby.

Implementace systému

Pár tipů, jak začít (věřím, že vás napadne ještě řada dalších):

EBF16

Aby systém nestartoval z nuly, je vhodné zvážit následující akceleraci:

  • Napojení UPI na některý již dnes masově používaný jednoznačný identifikátor, například ICQ – pak by bylo možné prohledat i historická diskusní fóra, ve kterých se lidé svým ICQ podepisují.
  • Uživatel, který by měl zájem, aby mu systém začal přinášet výsledky rychleji, by prohledal na Internetu svoje jméno a snažil by se sestavit takový vyhledávací dotaz, který jej co nejpřesněji vystihuje z pohledu dnešního obsahu Internetu. Příklad: „Jiří Donát –kulečník“ (vím, že jeden můj jmenovec hraje kulečník, a to já tedy nejsem). Optimalizovaný dotaz by zadal do vyhledávače, který by z něj vygeneroval počáteční „autorský“ profil – seznam stránek, na které uživatel přispíval.
  • Uživatel by do systému uploadoval své aktuální bookmarky či historii browseru.
  • Spolupracující e-mailové a IM systémy by byly schopny vygenerovat statistiku minulé komunikace daného uživatele.

Základními vlastnostmi námi vytvořeného systému jsou otevřenost, jednoduchost a snaha maximalizovat využití funkcí stávajícího Internetu, a to jak jeho existujícího obsahu, tak současných vyhledávačů a jejich osvědčených algoritmů. Tyto vlastnosti maximalizují šanci systému na rychlou adopci. Jsem zvědav, kde ta adopce začne. Že by se prvním serverem, který implementuje UPI, stala Lupa?

Anketa

Zapojujete se do eWorkshopu?

80 názorů Vstoupit do diskuse
poslední názor přidán 8. 3. 2006 9:12

Školení: Právo vs. online marketing

  •  
    Jak chránit vlastní značku a obsah.
  • Jak využívat cizí díla pro svoje prezentace.
  • Na co si dát pozor při tvorbě reklamy na internetu.

Více o školení Právo vs. online marketing »