Hlavní navigace

eWorkshop: Návrh sociální sítě budoucnosti

 Autor: 29
Jiří Donát 3. 3. 2006

Diskuse na eWorkshopu překonala i má nejoptimističtější očekávání. Díky zapojení řady velmi aktivních členů komunity Lupy, z nichž bych ovšem na prvním místě vyzvedl tři z nich, s přezdívkami „Jan - honzzz”, Ondrej Páleš a „HK Maly”, jsme dospěli mnohem dál, než jsem původně doufal.

Díky tomu mohu naši diskusi shrnout skutečně netradičním způsobem – popisem budoucí aplikace, tedy popisem sociální sítě budoucnosti. Je zároveň krásně symbolické, že můžeme poslední část našeho eWorkshopu předat komunitě Lupy v této podobě.

Diskuse ale pochopitelně nekončí – uvítám veškeré vaše podněty, kritiky, i návrhy na zlepšení či dořešení jakýchkoliv bodů této aplikace.

Ještě jednou díky! Aplikace je vaše – a to nejen ve smyslu open-source…

Motivace

Naším cílem je navrhnout systém umožňující propojovat lidi sobě podobné, a tím zlepšit podmínky pro sdílení informací na Internetu. Jako první popsal způsob fungování systému v diskusi Jan:

„Na veřejně dostupném ‚identitním‘ serveru si zaregistruji identitu – jednoznačné a nezaměnitelné jméno, obdoba e-mailové adresy pro e-mailové služby v oblasti identitních služeb + volitelně pár údajů (jméno, e-mail, fotku atp…). Na svém počítači nainstaluji klientský program, který s identitním serverem komunikuje pomocí otevřeného protokolu itp (Identity Transfer Protocol). A vrhnu se do svých oblíbených činností na Internetu – vyhledávám články, čtu diskuse, přispívám do diskusí…
Přitom klient všude, kam přijdu/tam, kde chci, moji činnost podepisuje – do mých příspěvků v diskusi vkládá charakteristický tag, který je pro ostatní viditelný, jednoznačně (pokud možno i zapamatovatelně) mě identifikuje, dává ostatním najevo ‚nebojte se se mnou komunikovat, tady jsem otevřený‘ a zároveň funguje jako link na rozhraní identitního serveru, který agreguje informace o veškeré mé činnosti na netu (klient mu totiž posílá informace o tom, na jaké stránky chodím, do jakých diskusí přispívám a s kým se v jakém kontextu bavím)…“

Zde jsme se pak už začali lišit – ale nakonec jsme se domluvili. Mně už pak pouze připadlo formálně sepsat výsledek naší diskuse.

Vlastnosti systému

Základem implementace systému je přidání nové funkce existujícím vyhledávačům: možnost vyhledávat nejen v klíčových slovech stránek, ale zároveň i možnost omezit jakýkoliv vyhledávací dotaz na stránky vytvořené či navštěvované lidmi „námi podobnými“; tato funkcionalita bude dostupná i v oblasti nově vytvářených stránek na Internetu, které budou do systému doručovány pomocí RSS (vznikne tak analogie Google News). Bude tedy možné nechat si doručovat stránky z určitého oboru vytvořené „lidmi nám podobnými“, které nám systém automaticky nalezne.

Vyhledávací dotaz

Systém tedy bude schopen velmi obecných dotazů. Bude mi schopen nabídnout nejen mně podobné lidi, ale dokonce rovnou mně podobné lidi v určitém specifickém kontextu. Příklad – hledal bych zájemce o železniční modelářství a v rámci tohoto dotazu bych pak využil výsledky shlukové analýzy, která by mi našla mně podobné modeláře! A tento dotaz bych pak mohl ještě upřesnit na modeláře v Praze! Toto je velmi silná funkce, která navíc nevyžaduje znát dopředu dotazy, které budeme klást (zatímco v klasickém databázovém systému musím strukturovat informaci podle toho, co předpokládám, že budu hledat), a která se tedy intuitivně velmi blíží vyhledávacím schopnostem lidského mozku.

Implementace

Základem systému bude jednoznačný identifikátor uživatele, který nazvěme UPI – Unique Personal Identificator. Ten bude uživatele jednoznačně identifikovat při práci s Internetem, a to jak při práci pasivní (čtení), tak při práci aktivní (zápis, aktivní komunikace).

Klient – plugin browseru

Uživatel, který bude chtít tento systém používat, si nainstaluje do svého browseru klienta, nejlépe ve formě pluginu. K tomuto pluginu se v okamžiku, kdy bude chtít být pro systém sledovatelný, přihlásí (díky tomu bude možné systém používat z různých počítačů, včetně internetových kaváren). Plugin pak bude automaticky zajišťovat následující funkce:

  1. při „pasivní“ práci (čtení) bude plugin sledovat všechna URL, které uživatel navštíví, a umísťovat je na speciální webovou stránku, která může být umístěna kdekoliv na Internetu (například na onom zmíněném identitním serveru). Podmínkou však je, aby tato osobní stránka byla veřejně viditelná (a byla tedy prohledávatelná roboty různých vyhledávačů) a aby se její obsah řídil přesně stanovenou syntaxí.
  2. při „aktivní“ práci (zápis) bude plugin v okamžiku, kdy uživatel cokoliv uveřejní na Internetu, uživatele domluveným způsobem podepisovat přidáním jeho UPI. Takto bude za uživatele označovat veškeré jeho diskusní příspěvky, články, e-maily.

Plugin navíc bude fungovat i jako toolbar vyhledávače. Bude možné zadávat nejen klasické vyhledávací dotazy, ale také vyhledávací dotazy nového typu, s omezením na stránky, které vytvořili či četli ve velkém množství „mně blízcí uživatelé“.

Třetí funkcí pluginu bude automatická transformace UPI na zobrazovaných stránkách (článcích, příspěvcích, e-mailech) na živý link nabízející kontextové menu o daném uživateli. Místo UPI kódu se mi tedy na daném místě stránky zobrazí miniaturní fotka uživatele, na kterou bude možné kliknout a vybrat si z menu, které bude obsahovat například: základní informace o tomto uživateli, vyhledávání témat (=webových stránek) blízkých tomuto uživateli, vyhledávání témat blízkých nám společně, vyhledávání jemu blízkých uživatelů atd.

Role vyhledávačů

Další funkce pro zkvalitnění vyhledávání již budou doménou vyhledávačů. Vyhledávače se totiž budou snažit implementovat funkci „hledání mně podobných lidí“ kvalitněji než konkurence. K tomu bude zapotřebí pokud možno co nejúplnějších dat a nejlepší realizace algoritmu pro aplikaci metody shlukové analýzy na datech vzniklých prohledáváním daného UIP.

Příklady: Kvalitu dat bude možné vylepšit například těmito postupy:

Robot vyhledávače bude schopen:

  • na diskusních fórech identifikovat UPI ve stejném vlákně.

Vyhledávač bude schopen:

  • ve spolupracujících e-mailových, instant-messagingových (IM) a VoIP systémech vyhodnotit frekvenci komunikace mezi danými UPI.

Implementace funkce „najdi podobné uživatele“

Funkce hledání „podobných“ uživatelů bude realizována pomocí statistických metod shlukové analýzy.

Pro každého uživatele systém prohledá Internet na výskyt jeho UPI a přidá informace ze speciální stránky identitních serverů k získání přehledu jeho nejvíce navštěvovaných stránek (za určité období; s tím, že stránky navštívené v dávné minulosti budou mít menší váhu než stránky navštívené aktuálně. Tímto způsobem bude implementováno v diskusi zmiňované „stárnutí kontaktů“; parametrem, za jaké období se má aktivita uživatele sledovat, bude možno ovlivnit vlastnosti vyhledávání a různé vyhledávače budou jeho nastavení moci přistupovat různě – zde bude prostor pro vzájemnou konkurenční výhodu jednotlivých vyhledávačů). Z výsledků vyhledávání bude sestaven profil uživatele, který se stane vstupem pro shlukovou analýzu (přesný způsob konverze výsledku dotazu vyhledávače do vstupních dat shlukové analýzy, tedy přesný způsob reprezentace dat uživatelů, v kombinaci s konkrétně zvolenou metodou zpracování, se stane opět předmětem konkurenčního boje mezi vyhledávači; v závislosti na implementaci bude možno dosáhnout například výsledků, které jsou obzvláště dobré v určitém oboru vyhledávání. Důležité však je, aby se předmětem konkurenčního boje nestaly různé možné definice formálního zápisu UPI, to by totiž omezilo užitečnost všech vzájemně si konkurujících systémů).

Následně systém provede shlukovou analýzu a výsledky této analýzy uloží do databáze k realizaci dotazů uživatelů. Na algoritmus vytváření dat o podobných uživatelích se tedy můžeme dívat jako na vzdálenou analogii algoritmu výpočtu PageRank, tentokrát ovšem pro osoby.

Implementace systému

Pár tipů, jak začít (věřím, že vás napadne ještě řada dalších):

EBF16

Aby systém nestartoval z nuly, je vhodné zvážit následující akceleraci:

  • Napojení UPI na některý již dnes masově používaný jednoznačný identifikátor, například ICQ – pak by bylo možné prohledat i historická diskusní fóra, ve kterých se lidé svým ICQ podepisují.
  • Uživatel, který by měl zájem, aby mu systém začal přinášet výsledky rychleji, by prohledal na Internetu svoje jméno a snažil by se sestavit takový vyhledávací dotaz, který jej co nejpřesněji vystihuje z pohledu dnešního obsahu Internetu. Příklad: „Jiří Donát –kulečník“ (vím, že jeden můj jmenovec hraje kulečník, a to já tedy nejsem). Optimalizovaný dotaz by zadal do vyhledávače, který by z něj vygeneroval počáteční „autorský“ profil – seznam stránek, na které uživatel přispíval.
  • Uživatel by do systému uploadoval své aktuální bookmarky či historii browseru.
  • Spolupracující e-mailové a IM systémy by byly schopny vygenerovat statistiku minulé komunikace daného uživatele.

Základními vlastnostmi námi vytvořeného systému jsou otevřenost, jednoduchost a snaha maximalizovat využití funkcí stávajícího Internetu, a to jak jeho existujícího obsahu, tak současných vyhledávačů a jejich osvědčených algoritmů. Tyto vlastnosti maximalizují šanci systému na rychlou adopci. Jsem zvědav, kde ta adopce začne. Že by se prvním serverem, který implementuje UPI, stala Lupa?

Anketa

Zapojujete se do eWorkshopu?

Našli jste v článku chybu?
120na80.cz: Rodiče, pozor: jak dodat vitamín D bez rizika

Rodiče, pozor: jak dodat vitamín D bez rizika

Vitalia.cz: Antibakteriální mýdla nepomáhají, spíš škodí

Antibakteriální mýdla nepomáhají, spíš škodí

Vitalia.cz: Voda z Vltavy před a po úpravě na pitnou

Voda z Vltavy před a po úpravě na pitnou

Lupa.cz: Poučný příběh jednoho rozšíření pro Chrome

Poučný příběh jednoho rozšíření pro Chrome

Podnikatel.cz: Vrcholový řídící zaměstnanec za 75 tisíc

Vrcholový řídící zaměstnanec za 75 tisíc

Podnikatel.cz: Byla finanční manažerka, teď cvičí jógu

Byla finanční manažerka, teď cvičí jógu

Podnikatel.cz: Udělali jsme velkou chybu, napsal Čupr

Udělali jsme velkou chybu, napsal Čupr

120na80.cz: Zázrak ze smetiště: co léčí lopuch?

Zázrak ze smetiště: co léčí lopuch?

DigiZone.cz: Nova opět stahuje „milionáře“

Nova opět stahuje „milionáře“

Vitalia.cz: 7 příčin neplodnosti u žen: pravda a mýty

7 příčin neplodnosti u žen: pravda a mýty

Vitalia.cz: dTest odhalil ten nejlepší kečup

dTest odhalil ten nejlepší kečup

Vitalia.cz: Muž, který miluje příliš. Ženám neimponuje

Muž, který miluje příliš. Ženám neimponuje

DigiZone.cz: DVB-T2 ověřeno: seznam TV zveřejněn

DVB-T2 ověřeno: seznam TV zveřejněn

DigiZone.cz: Samsung EVO-S: novinka pro Skylink

Samsung EVO-S: novinka pro Skylink

DigiZone.cz: Na jaká videa se vlastně díváme

Na jaká videa se vlastně díváme

Vitalia.cz: Tipy: Kde zaručeně koupíte dobré maso

Tipy: Kde zaručeně koupíte dobré maso

Podnikatel.cz: „Lex Babiš“ Babišovi paradoxně pomůže

„Lex Babiš“ Babišovi paradoxně pomůže

DigiZone.cz: LG OLED65E6: první pohled

LG OLED65E6: první pohled

DigiZone.cz: Nejnovější špičkové TV ve videu

Nejnovější špičkové TV ve videu

Podnikatel.cz: Takhle se prodávají mražené potraviny

Takhle se prodávají mražené potraviny