Internet Info, s.r.o. Lupa Měšec Podnikatel Root Zdroják DigiZone Slunečnice Vitalia TopDrive KupDnes Navrcholu NovýTarif Dobrý web Weblogy Woko Jagg Computer.cz SK: MojeLinky

Názor k článku
eWorkshop: Návrh sociální sítě budoucnosti

Jiří Donát
Jiří Donát (neregistrovaný)
7. 3. 2006 10:29

Re: Testování

celé vlákno
V naší diskusi jsme prozatím dospěli ke dvěma různým cestám:

1) vyhledávat primárně ve fulltextu a osobní UPI-stránku uživatele použít pouze pro informaci o jeho čtenářských zvycích či pro kontrolu pravosti zapsaných UPI
2) zkonstruovat plugin tak, aby automaticky vznikala taková UPI-stránka, která je sama o sobě užitečná pro hledání lidí sobě vzájemně blízkých.

Můj názor je, že časem se možná rozšíří přístup číslo jedna, protože nabízí principielně více informací, jako kontext, ve kterém se UPI tag vyskytuje, vzdálenost ostatních UPI tagů, případně ještě i jejich vzájemné vztahy v diskusi; v prvních implementacích však bude jednodušší vyjít z přístupu číslo dvě.
Taková stránka s mojí čtenářskou i publikační historií o mně poskytuje mnoho informací sama o sobě. Informace by byla viditelná veřejně a každý vyhledávač by si ji zpracoval tak, aby ji co nejlépe využil: setřídil podle navštívených web serverů / témat; rozlišil moji novou přítomnost a starou (analogie stárnutí přátelství; když jsem někdy před dvěma lety byl na jedné stránce, a už jsem se tam nikdy nevrátil, nechť je to zapomenuto - hlasuji nohama v tom smyslu, že mě ta stránka nijak nezaujala), stanovil priority aktivní a pasivní přítomnosti atd. Pokud jde o formát této osobní UPI stránky, souhlasím s Honzou, že ve formátu nevidím konkurenční výhodu. Cokoliv jednoduchého, strojově čitelného, z čehož bude vidět, co jsem četl, co jsem napsal, a kdy (stačí den, z důvodu implementace stárnutí informace) je v první fázi OK.

Takže můj názor, kterými otázkami začít:

- Jak přizpůsobit plugin tomu, aby sbíral skutečně relevantní informace (problém návštěvy serveru versus návštěvy určitého tématu - nezapomeňme, hned "vedle" na Lupě se diskutuje o BMI). Pokud tohle vyřešíme dobře, zbavujeme se i přesto, že jsme zvolili "cestu 2" mnohem méně informace, než jsme se obávali. Plugin může chápat zdroje dostatečně granulovaně a zapsat nejen na kterou stránku jsme psali, ale na kterou její část, ba dokonce do kterého vlákna. Hrubá síla vyhledávačů pak může najít stránky uživatelů, kteří obvykle píší do stejných vláken, jako my. Tím se vracíme k syntaxi UPI-stránky. Informace v ní by měla stačit jak k závěru, že Honza často navštěvuje Lupu, tak i k závěru, která témata ho zajímají a, v rámci nich, s kým nejvíc diskutoval - jediné, co díky "přístupu 2" nezjistíme, je o čem :(. (Ale nebojme, i tady by se obezlička našla - můžete ji zkusit navrhnout?)

Vyhledávač pak UPI stránky zpracuje, setřídí podle navštívených míst a nalezne stránky sobě podobné - pomocí shlukové analýzy.
K řešení:
- Jak rychle má informace stárnout? Parametr, který se bude muset vyzkoušet.
- Jak přesně pracovat s tím, že jsme někam aktivně psali, oproti informaci, že jsme danou stránku pouze četli? Určitě je psaní příznakem vyššího zájmu než čtení. Ale kolikrát? Bude se muset vyzkoušet.

Výsledky shlukové analýzy pak bude vyhledávač využívat například tak, že stránky vytvořené nebo často navštěvované mnou blízkými lidmi získají vyšší "UPI-Rank", tedy analogii PageRank, ovšem vztaženého k mé osobě. Vyhledávání by pak bylo apriori personalizované a nepotřebovala by se jakkoliv měnit jeho syntaxe; když hledám slovo "teorie relativity", určitě nechci, aby na prvním místě vyjel Blesk, jen proto, že se v něm o tom pojmu někdo omylem zmínil, a Blesk je holt nejčtenější. Kromě toho bych ale mohl klást i specializované dotazy: lidi, kteří čtou určité stránky a určitá témata (takže bych se snadno mohl dopátrat odborníka na jakékoliv téma), stránky, které byly napsány pouze lidmi mně blízkými, dostávat blogy nebo diskusní příspěvky mně blízkých lidí, a podobně. Oblast aplikací je pak dalším obrovsky zajímavým okruhem k diskusi.