Vlákno názorů k článku
eWorkshop: Návrh sociální sítě budoucnosti
Jan - honzzz(zavinac)gmail(tecka)com (neregistrovaný)
3. 3. 2006 20:02
zranitelnosti
Sociologické myšlení hledajicí latentní funkce (dysfunkce) za těmi manifestními a taky moje vrozená rejpavost mě nutí - pokud možno před tím, než definitivně vymezíme architekturu našeho systému - zamyslet se nad možnými zranitelnostmi.
Jak zamezíme padělání tagů? Představme si situaci - nemám rád pana Donáta. Proto napíšu jednoduchý skript, který bude zcela náhodně prolézat veškeré možné diskuse a umisťovat v nich UPI pana Donáta doplňený libovolným/náhodně generovaným/vhodná klíčová slova obsahujícím textem. Vzhledem k tomu, že počet fake-UPItagů vygenerovaný robotem bude obrovský a jejich umístění náhodné, v dalším používání sítě se panu Donátovi jeho pracně budovaná socio-struktura opět ztratí v nestrukturované mase, případně v irelevantních fake-vztazích, protože robot bude fake-tagy chytře umisťovat omezeném poli třeba nějakého tématického portálu, takže panu Donátovi naváže spoustu fake-vztahů s komunitou těchto portálů.
Když se navíc robot zaměří na doménu .xxx a porno-seznamky, tak pana Donáta ještě zdiskredituje u ostatních "hledačů", kterým tím navíc znemožní využít sociální potenciál pana Donáta a znehodnotí tak síť. Co mi z toho plyne - potřebujeme najít zpusob autentizace tagů (který ovšem nevyžaduje podporu u strany "hostitele" diskuse, takže např. zde zmiňované OpenID je nepoužitelné), nebo najít způsob, jak zajistit, aby hrubá síla vyhledávačů při shlukové analýze používala osobní webový profil vytvářený zabezpečeným uploadováním dat od klientského programu majitele dadého UPI jako jakýsi nutný a jediný možný vstupní uzel/bránu k dalšímu zaindexovanému obsahu souvisejícímu s danou osobou/výskytem jejího tagu, případně masu nalezených výskytů tagů dané osoby oproti tomuto profilu kontrolovala a pak teprve považovala okolí těchto tagů za relevantní.
Falšování vztahů - jak zjištovat směr vztahů? Je něco jiného, jestli já často reaguji v diskusích na pana Donáta, nebo jestli reaguje on na mě. Opět modelová situace - pan Donát představuje pro řadu lidí jakousi internetovou autoritu, opinion leadera. Proto si vyhledám jeho profil a prolezu všechny jeho diskuse a odpovím na všechny jeho příspěvky. Tím se ve nesměrové shlukové analýze dostanu do blízkosti pana Donáta a jeho autorita bude jeho přátele směrovat na mě a na internetový obchod, který provozuji. Jak zajistit směrovost shlukové analýzy? Jak udržet relevanci a zabránit zneužití socioware např. pro komerční účely? Google a spol by to jistě mohli řešit přes složitý (problematická spolehlivost?) systém PageRank/PersonRank (ve vzájemné závislosti), přičemž kontrola "směrovosti" vztahů, nějaká technika sledování směru threadů, by to imo zajistila velmi jednoduše a snadno; ovšem (mám jen poměrně nejasnou představu, jak vlastně search engine může v principu fungovat) - může mi nějaký znalec říct, jestli je toho běžný search engine schopný?
IMO obě tyto zranitelnosti jsou jiného typu než např. nutné zlo spamu u mailů - spam znepříemňuje a znákladňuje využívání mailových služeb, ale nezasahuje přímo je, neblokuje vaše non-spam maily. Zranitelnosti, které jsem zmínil, by však imho mohly přímo zasahovat funkčnost socio-sítě jako takové.
Prosím kolegy o názor - považovali byste tohle za reálné nebezpečí? Pokud ano - jak byste to řešili? A hlavní otázka: jaké další zranitelnosti vás napadají, v jakých dalších oblastech/prvcích systému?
Jiří Donát (neregistrovaný)
3. 3. 2006 20:33
Re: zranitelnosti
Ad: padělání tagů.
Aby bylo skutečně účinné, muselo by být dost masové, systematické, a tedy i pracné. Pokud bych už někomu za takovou námahu stál, měl by jednodušší například umístit do médií pár nesmyslných spekulativních zpráv - rozhodně by se nemusel patlat s nějakým UPI (protože to, že chodím na blesk.cz nebo na xxx.cz mně ve svém důsledku zdaleka nezkompromituje tak, jako když někdo vypustí fámu, že jsem provedl to čí ono - a teď si to ověřte...).
Internet je prostě postaven na nespolehlivosti - nespolehlivé je vše, počínaje přenosem paketů až po informace, které jsou na něj umísťovány. Ale právě proto, že je na internetu tolik informací, je velmi těžké z něj udělat nevyvážené médium. A to by byla pravda i u UPI.
Aby bylo skutečně účinné, muselo by být dost masové, systematické, a tedy i pracné. Pokud bych už někomu za takovou námahu stál, měl by jednodušší například umístit do médií pár nesmyslných spekulativních zpráv - rozhodně by se nemusel patlat s nějakým UPI (protože to, že chodím na blesk.cz nebo na xxx.cz mně ve svém důsledku zdaleka nezkompromituje tak, jako když někdo vypustí fámu, že jsem provedl to čí ono - a teď si to ověřte...).
Internet je prostě postaven na nespolehlivosti - nespolehlivé je vše, počínaje přenosem paketů až po informace, které jsou na něj umísťovány. Ale právě proto, že je na internetu tolik informací, je velmi těžké z něj udělat nevyvážené médium. A to by byla pravda i u UPI.
uživatel si přál zůstat v anonymitě
4. 3. 2006 10:52
Re: zranitelnosti
Proč pracné? Stačí skript, robot. Navíc to byl modelový případ - reálnou hrozbu bych viděl ne v tom, že vás někdo bude chtít kompromitovat - to by skutečně šlo snadněji - ale prostě obecněji: tohle není nespolehlivost, tohle je jistá možnost, jak tímhle způsobem cíleně a systematicky manipulovat se sítí tak, aby manipulátor získal osobní profit nebo poškodil konkurenty; TOHLE by byl skutečný spam socioware sítí, ne to, že někdo z profilů načte mailové adresy a zaspamuje mailboxy...
Navíc si myslím, že když člověk něco navrhuje, musí být zdravě skeptický a raději předpokládat to horší, a snažit se tomu předejít. Skutečně je možné, ža tato hrozba nikdy nebude představovat reálné nebezpečí, ale pokud ano, viděl byste řešení "search engine bude nejprve ověřovat tagy v profilu a pak teprve považovat zaindexovaná data za relevantní" jako realistické? Vyžadovalo by to implementaci na straně vyhledávačů, nebo by bylo možné to využitím nějakých chytrých funkcí realizovat už dnešním google?
Jiří Donát (neregistrovaný)
4. 3. 2006 11:23
Re: zranitelnosti
Jak už jsem v diskusi uváděl, dokonce ani dnes, kdy je mnohem jednodušší se prostě podepsat mým (nebo Vaším) jménem, jsem se s tímto jevem dosud nesetkal. Navíc si myslím, že chybí motiv. V případě spamu je motivem možnost získat zákazníky; v případě sociálních sítí by útočník z takové práce nijak neprofitoval.
Samozřejmě, nelze ale vyloučit motivaci "tvůrce viru" - snahou útočníka může být prostě vymyslet něco "chytrého", co naruší systém. Ale v takovém případě by útoku tohoto typu šlo opravdu snadno zabránit. Například tou drobnou modifikací, že moje "čtenářská" stránka by obsahovala i můj "autorský" profil. V okamžiku, kdy umísťuji nějakou informaci na web a můj klient ji za mně automaticky podepisuje, klient o tom zároveň automaticky umístí informaci i na moji čtenářskou stránku, kam mám publikační přístup pouze já, ale která je veřejně přístupná. V takovém případě by robot vyhledávače, který stejně musí na mou čtenářskou stránku chodit, sesbíral i informace o mém publikačním profilu. Takže případný útočník by musel "hacknout" i moji čtenářskou stránku, a to přitom tak, aby byla konzistentní s mými příspěvky na internetu. Docela složité. Ale pokud chceme být paranoidní: i kdyby to dokázal, nebyl by problém implementovat v našem klientu funkci, která by toto narušení snadno zjistila.
Ve skutečnosti by vyhledávače nemusely provádět tento algoritmus vždy do detailu - mohly by jej například provozovat jen v podobě, kdy vyhledávač ví, kam obvykle přispívám, a zkontroluje si pouze moje UPI na serverech, kam jsem dosud nikdy nic nenapsal. Úplnou kontrolu provede až ve chvíli, kdy zjistí nějaké nesrovnalosti. Tím by byla zajištěna kvalita UPI, a přesto by to vyhledávače výrazně nezatížílo.
Samozřejmě, nelze ale vyloučit motivaci "tvůrce viru" - snahou útočníka může být prostě vymyslet něco "chytrého", co naruší systém. Ale v takovém případě by útoku tohoto typu šlo opravdu snadno zabránit. Například tou drobnou modifikací, že moje "čtenářská" stránka by obsahovala i můj "autorský" profil. V okamžiku, kdy umísťuji nějakou informaci na web a můj klient ji za mně automaticky podepisuje, klient o tom zároveň automaticky umístí informaci i na moji čtenářskou stránku, kam mám publikační přístup pouze já, ale která je veřejně přístupná. V takovém případě by robot vyhledávače, který stejně musí na mou čtenářskou stránku chodit, sesbíral i informace o mém publikačním profilu. Takže případný útočník by musel "hacknout" i moji čtenářskou stránku, a to přitom tak, aby byla konzistentní s mými příspěvky na internetu. Docela složité. Ale pokud chceme být paranoidní: i kdyby to dokázal, nebyl by problém implementovat v našem klientu funkci, která by toto narušení snadno zjistila.
Ve skutečnosti by vyhledávače nemusely provádět tento algoritmus vždy do detailu - mohly by jej například provozovat jen v podobě, kdy vyhledávač ví, kam obvykle přispívám, a zkontroluje si pouze moje UPI na serverech, kam jsem dosud nikdy nic nenapsal. Úplnou kontrolu provede až ve chvíli, kdy zjistí nějaké nesrovnalosti. Tím by byla zajištěna kvalita UPI, a přesto by to vyhledávače výrazně nezatížílo.
Jan - honzzz(zavinac)gmail(tecka)com (neregistrovaný)
4. 3. 2006 13:44
Re: zranitelnosti
Že dnes je jednoduché podepsat se Vaším jménem? Ano, ale k čemu by to dnes bylo -identifikovat se identitou někoho jiného? Jaký by to mělo dopad, kdyby za Vás někdo "navazoval vztahy" (=uměle manipuloval s kontextem obklopujícím vaše tagy)? Jistě by to mohlo mít dopad na Vás, ale na internet coby síť - na jeho strukturu - by to nemělo dopad žádný - internet jako "organizátor informací" (nikoli jako komunikační kanál) dnes prakticky nemá sociální rozměr. Ovšem v době, kdy identity a jejich vztahy budou sloužit jako obecný směrovací princip vyhledávání informací... jestli tohle nemá přímo obrovský tržní potenciál (a tím motivaci k manipulaci), tak jsem nepochopil něco zcela zásadního (což nevylučuji).
Formulujeme-li to obecně, tak dnešní internet - tak jak jej vidí ti, kdo v něm chtějí něco najít! - je strukturován slovně (klíčová slova). A celý náš workshop byl - jak jsem to chápal - o tom, jak nad chaosem internetu přidat kromě strukturující funkce založené na blízkosti slov paralelní strukturování pomocí blizkosti lidí, pomocí sociálních vztahů. Samozřejmě, pokud "naše" síť zůstane pomůckou pár lidí, nikdo nebude mít motiv se systémem manipulovat. Ale když budeme předpokládat, že by se podobný systém rozšířil (sám jste psal, že na internetu není nic příliš ztřeštěné), tak tu máme druhý rozměr internetu > nad masou informací shromážděných na netu další organizující princip - a organizace informací je tím, co umožňuje využívání informací, a dává té obrovské mase smysl a význam - sebelepší informace, kterou nemohu v té záplavě najít, je bezcenná.
Zkrátka - můj subjektivní názor je, že v s výhledem do budoucnosti je schopnost ovlivňovat strukturování informací tak, aby právě ty "moje" informace byly nejlepe viditelné a vyhledatelné ostatními, de facto jedním ze zdrojů moci a možná i tím největším zdrojem peněz vůbec.
Proto považují ochranu schopnosti našeho systému podávat relevantní informace o vztazích za naprosto klíčovou. Protože s vynořením se vztahů identit coby organzačního principu informací se vynořuje i motivace manipulovat s tímto způsobem organizace dat. Proto si chci být jistý, že problematiku v této oblasti chápu správně, a zajímá mě odpověď na otázku, zdá chápu architekturu "naší" socioware sítě správně způsobem, který jsem popsal v
tomto příspěvku, a který by zřejmě eliminoval i ten způsob ochrany, který jste navrhl - IMO je bezpečnost Vašeho profilu či čehokoli, co můžete mít pod kontrolou, irelevantní ve srovnání s masou, kterou pod konrolou nemáte - v čem se mýlím?
Je-li mé chápání situace správné, vidím jen dvě možnosti: ovlivnit způsob práce search engines a jejich vztah k profilům (kterou nemáme) nebo provádět sekundární filtrování výsledků dodaných search engine na lokální úrovni tak, že klient bude vyhledané výsledky ověřovat podle zabezpečeného profilu.
UPItag_honza
Igra (neregistrovaný)
4. 3. 2006 14:05
Re: zranitelnosti
Přenesu to na analogii. Můžete se snažit o to, aby:
1) To co říkáte nebylo měněno = bezpečnost homepage
2) Co o Vás říkají ostatní = ochrana/cenzura/... neautorizovaného použití UPItag
Tento rozdíl už dnes vyhledávače respektují.
Podrobněji v odpovědi na Váš druhý dotaz.
1) To co říkáte nebylo měněno = bezpečnost homepage
2) Co o Vás říkají ostatní = ochrana/cenzura/... neautorizovaného použití UPItag
Tento rozdíl už dnes vyhledávače respektují.
Podrobněji v odpovědi na Váš druhý dotaz.
Jan - honzzz(zavinac)gmail(tecka)com (neregistrovaný)
4. 3. 2006 16:10
Re: zranitelnosti
I tento Váš post vypovídá o rozdílnosti našich pohledů. Podle mě není důležité ani 1 ani 2, ale 3 - co já říkám o ostatních, když zanechávám svůj tag v jejich blízkosti.
Igra (neregistrovaný)
4. 3. 2006 16:45
co já říkám o ostatních, když zanechávám svůj tag v jejich blízkosti
Teď se snad začínáme chápat.
Pokud požadavku dobře rozumím, pak při fulltextovém vyhledávání by vás zajímalo UPI, které je často na stránkách na kterých se objeví vaše UPI. Potom skutečně může být používání Vašeho UPI někým jiným problém.
Protože jsem zastáncem svobody slova, tak si myslím, že naopak Vaše UPI by bylo užitečné uvádět, kdykoli se někdo baví _o_ Vás. Kromě toho přece nechcete vymýšlet technologii, která umožní panu X (Usáma, Kastro, dalailáma, papež, prezident XY, ...) zakázat Vám publikovánání informace o něm, pokud se mu nelíbí(te).
Stejného účelu jeko 3) můžete IMHO dosáhnout, pokud necháte vyhledat UPI = homepage, která obsahuje několik stejných bookmak+history jako Vaše. Důvodem je to, že pokud čtete/píšete článek, tak jej máte v history a druhá strana také. Tato cesta mi přijde mnohem spolehlivější.
Pokud přidáte klasifikaci článků/příspěvků (já ji vidím jako užitečnou). Má vyhledávač dostupnou ještě přesnější informaci pro hodnocení souladu preferncí obou UPI.
Pokud požadavku dobře rozumím, pak při fulltextovém vyhledávání by vás zajímalo UPI, které je často na stránkách na kterých se objeví vaše UPI. Potom skutečně může být používání Vašeho UPI někým jiným problém.
Protože jsem zastáncem svobody slova, tak si myslím, že naopak Vaše UPI by bylo užitečné uvádět, kdykoli se někdo baví _o_ Vás. Kromě toho přece nechcete vymýšlet technologii, která umožní panu X (Usáma, Kastro, dalailáma, papež, prezident XY, ...) zakázat Vám publikovánání informace o něm, pokud se mu nelíbí(te).
Stejného účelu jeko 3) můžete IMHO dosáhnout, pokud necháte vyhledat UPI = homepage, která obsahuje několik stejných bookmak+history jako Vaše. Důvodem je to, že pokud čtete/píšete článek, tak jej máte v history a druhá strana také. Tato cesta mi přijde mnohem spolehlivější.
Pokud přidáte klasifikaci článků/příspěvků (já ji vidím jako užitečnou). Má vyhledávač dostupnou ještě přesnější informaci pro hodnocení souladu preferncí obou UPI.
Jan - honzzz(zavinac)gmail(tecka)com (neregistrovaný)
4. 3. 2006 17:34
Re: co já říkám o ostatních, když zanechávám svůj tag v jejich blízkosti
Pokud požadavku dobře rozumím, pak při fulltextovém vyhledávání by vás zajímalo UPI, které je často na stránkách na kterých se objeví vaše UPI. Potom skutečně může být používání Vašeho UPI někým jiným problém.Ano. Plus ještě kontext klíčových slov okolo atp. Prostě využívat toho, že přímo ty stránky o které nám jde, jsou indexovány googleboty a spol., a ne budovat nějaké vlastní weby ukládající celé články. Navíc... ad diskutovaný bod 3 -
že pokud čtete/píšete článek, tak jej máte v history a druhá strana také... aha, tak tady je ten zakopaný pes. Myslel jsem, že history je jen upload historie v prohlížeči na veřejně přístupný server - prostě vámi navštívené webové adresy. Pokud chcete zaznamenávat i články, tak v tom vidím dva problémy - abyste v tom mohl prohledávat, tak na to musíte na tom vašem webu mít kapacitu, která navíc zbytečně dubluje to, co už na internetu je, a navíc - horší problém - budete tam mít jen vaše články, a ne reakce na ně, což je problém, pokud jde o určování vztahů. Ty reakce budou mít zřejmě ve svých historiích zase ti vaši spoludiskutéři, ale pak nebudou spolu na jedné stránce, vlastně třeba ani v jedné doméně - jak bude ten vyhledávač zjišťovat, že to patří k sobě a v jakém vztahu? A jakou roli v tom vlastně mají ty UPI - nestačily by prostě dvě webové stránky - pokud by to teda ten vyhledávač z nich nějak dostal - což nevím jak... Navíc pořád nechápu vaše uvádění "svobody slova" - já jsem taky zastánce svobody slova! Usáma mi nemůže zakazovat psát na Lupě - může si mě nanejvýš filtrovat pro sebe na lokálu, což je jeho právo, nebo pro své souvěrce, které má pod kontrolou, což udělá snadněji přes klíčová slova - navíc, pokud bych s tím měl problém, tak bych prostě příspěvky určené pro muslimy nepodepisoval. UPItag_honza
4. 3. 2006 18:08
Re: co já říkám o ostatních, když zanechávám svůj tag v jejich blízkosti
Tak ještě jednou a přesněji:
Historií jsem nemyslel celé články, ale jen URL na ně jak jsou ukládány v history prohlížeče.
Pokud někdo jiný četl stejný článek jako Vy, tak máte jeho URL v history oba dva. Když budete mít historii oba zpřístupněnou a dáte si požadavek "link:článek" tak se už s dnešním vyhledávacím enginem najdete (a spoustu ostatních čtenářů).
Budoucímu hledacímu enginu prozradíte ještě svoje UPI a on Vám výsledky pages(včetně homepages) seřadí i na základě toho na kolik dalších stejných stránek odkazujete.
Svoboda slova: Pokud se tedy Usámovi znelíbíte, může na "svých serverech" vypublikovat stránky s milóny Vašich UPI. Tomu opravdu nezabráníte a určitě to dostatečně zahltí vyhledávače Vaší identitou. Z tohoto důvodu jsem přesvědčen, že stavět systém předpokládající exkluzivitu použití UPI je nesmysl, protože je to předpoklad nereálný a zneužitelný k útokům.
Historií jsem nemyslel celé články, ale jen URL na ně jak jsou ukládány v history prohlížeče.
Pokud někdo jiný četl stejný článek jako Vy, tak máte jeho URL v history oba dva. Když budete mít historii oba zpřístupněnou a dáte si požadavek "link:článek" tak se už s dnešním vyhledávacím enginem najdete (a spoustu ostatních čtenářů).
Budoucímu hledacímu enginu prozradíte ještě svoje UPI a on Vám výsledky pages(včetně homepages) seřadí i na základě toho na kolik dalších stejných stránek odkazujete.
Svoboda slova: Pokud se tedy Usámovi znelíbíte, může na "svých serverech" vypublikovat stránky s milóny Vašich UPI. Tomu opravdu nezabráníte a určitě to dostatečně zahltí vyhledávače Vaší identitou. Z tohoto důvodu jsem přesvědčen, že stavět systém předpokládající exkluzivitu použití UPI je nesmysl, protože je to předpoklad nereálný a zneužitelný k útokům.
Jan - honzzz(zavinac)gmail(tecka)com (neregistrovaný)
4. 3. 2006 20:07
Re: co já říkám o ostatních, když zanechávám svůj tag v jejich blízkosti
Aha, už tomu rozumím, myslím že už se skutečně začínáme chápat. Vlastně odlišnost našich pohledů spočívá v tom, že - jak mi začíná docházet - jdeme jen ke stejnému cíli jinou cestou. Vždyť právě na tu zranitelnost, kterou zmiňujete na konci, jsem právě tím svým threadem upozorňoval a snažil se ji řešit...
Asi jsem se přesně nevyjádřil, co myslím tou exkluzivitou - přesněji rečeno nešlo v principu o exkluzivitu tagů, ale podstatou věci byl fakt, že aby vhledávač mohl hledat moje vztahy, musí rozlišit, kde jsem já byl - šlo o exkluzivitu spojovat indikátor mojí přítomnosti jen s mojí skutečnou přítomností na daném místě, ne s přítomností někoho jiného, kdo by tam umístil můj tag (kdyby někdo hledal místa kam chodím, asi by nerad našel místa, kam chodí někdo jiný, kdo umisťuje moje tagy).
Já jsem k tomu účelu hodlal použít tagy - proto musely být exkluzivní. Protože jsem si však uvědomoval nebezpečí šíření (řekněme ne-exkluzivních) tagů i tam, kde jsem nebyl, navrhoval jsem nejdřív fultextově prohledat místa výskytu tagů, a pak tyto výsledky s pomocí klienta na svém počítači profiltrovat a vyřadit ty, které se vztahují k tagům, které nejsou v profilu - tím bych oblast výsledků zúžil jen na relevantní oblasti, kde jsem skutečně "byl".
Vy defacto děláte totéž v obráceném pořadí. Oproti mému opření se o UPI tagy rozhozené po webu se opíráte o profily. Nejprve požadavkem link:článek (jehož existence mi - příznám se - unikla) na odkazy pouze z profilu zúžíte oblast prohledávání jen na - z mého pohledu - "místa výskytu skutečných tagů", což se ve vašem pohledu rovná "místa na které odkazuje váš profil" -tj. pro oba společně "místa kde jste skutečně byl" (jen to každý z nás jinak operacionalizuje), a pak ta místa prohledáte fultextem. Taky je to založeno na exkluzivitě, jen ji z UPI přenášíte na ten váš web/profil. Taky nemůžete v rámci svobody projevu každému dovolit, aby tam uploadoval svoje historie z míst, kde vy jste nikdy nebyl.
Už si rozumíme? Doufám že ano, a jestli jsem do teď neocenil chytrost vašeho řešení, tak se omlouvám.
Přiznám se, že vaše řešení se mi líbí víc - nejdřív chytře zužuje prostor prohledávání a pak teprve nasazuje hrubou sílu fultextu. Navíc by se dalo velmi dobře pracovat s tím parametrem link:xxx - daly by se vybírat různé podmnožiny atp. Jen otázka - dokáže vyhledávač pracovat s tím, že mu v rámci jednoho dotazu vymezíte oblast hledání celou řadou linků? Předpokládám že ano... A další otázka - když např. budete chtít najít lidi, kteří se zúčastnili této diskuse, tak najdete pomocí parametru link:tato_diskuse místa, odkud sem vedou linky - a tam budou jejich profily - rozumím správně? Jak zajistit, aby to byly jen linky z profilů lidí, a ne třeba linky z upoutávek atp.?
A další, technický, problém: není problém generovat historii navštívených stránek v profilu, ale jak do profilu generovat seznam linků na příspěvky do diskusí? IMO by to chtělo umět sledovat i jednotlivé příspěvky, a ne jen celé diskuse, aby bylo možné sledovat thready, které hodně vypovídají o vztazích (např naší dlouhou diskusí se vztahujeme). Jak zajistit, aby prohlížeč/UPI-plugin uploadoval adresu příspěvku a ne adresu diskuse, na kterou se po odeslání příspěvku přepne? Jak sledovat a zohledňovat při vyhledávání, kdo na koho odpovídal?
Dále - když budete v místech, která jste prošel, chtít najít spojení klíčových slov a uživatelů, kteří se tam vyskytovali, vyhledávač vám najde řadu klíčových slov přímo ve stránkách a řadu profilů, které na ty stránky vedou - ale jak to dát dohromady? Teď jsem orientačně zkoušel zadat "link:stranka klicove_slovo", ale nezda se, ze by to fungovalo - přičemž zadani "řada_linků řada_klíčů" by byla ještě problematičtější - tady by to IMO chtělo tu shlukovou analýzu. Atd atd... napadá mě ještě řada otázek, ale musím je promyslet. Tak to zatím pošlu, možná se vyjádříte, možná po mě budete chtít lepší upřesnění, možná vás napadne řada otázek k "mojí" metodě, možná mě budete chtít opravit...
Jenom technická pznámka - pro některé ze zmíněných otázek bych jako užitečné viděl definovat nějaký nezaměnitelný standardizovaný znak "tohle_je_profil", který by se umisťoval na weby/identitní servery hostující profily.
Možná by bylo dobré naše abstraktní teoretizování doplnit zkoušením a hledáním slabin. Chci se vás zeptat - mohl byste si zvolit nějaký UPItag a umísťovat jej do vašich příspěvků? Že bychom to mohli malinko otestovat, trošku kolem toho začít budovat improvizovaný systém... jste pro?
UPItag_honza
P.S. Pokud jsme si už ujasnili, o co nám jde a budete-li případně chtít přejít k prodiskutovávání dalších podrobností, navrhuji založit nový thread, už to začíná být nepřehledné.
4. 3. 2006 22:36
Dohoda
Jsem rád, že jsme se pochopili z hlediska cílů a možností realizace dotazů.
Poznámka k součané implementaci \"link:xxx\". Projděte si manuál, ale zatím ho není možné kombinovat s dalšími patametry.
Přesto očekávám, že pokud bude UPI klient dostatečně rozšířený, google a ostatní upraví algoritmy vyhledávání tak, aby tyto data interpretovaly správně a umožnili vyhledávat v kontextu UPI. Proto bych se teď nesnažil vymýšlet dílčí náhradu těchto jejich řešení.
K přechodu od teoretizování IMHO potřebujeme vymyslet formáty souborů a popracovat na specifikaci UPI pluginu.
Zatím jsem si ještě nezkusil provětrat Google, jestli něco podobného už někdo nevymyslel/nenaprogramoval. Uvítám každý relevantní odkaz.
Souhlasím s ukončením tohoto threadu. Založ nějaký s názvem vypovídajícím o tématu (rozumím ti dobře, že už míříš k \"Testování\"?).
Poznámka k součané implementaci \"link:xxx\". Projděte si manuál, ale zatím ho není možné kombinovat s dalšími patametry.
Přesto očekávám, že pokud bude UPI klient dostatečně rozšířený, google a ostatní upraví algoritmy vyhledávání tak, aby tyto data interpretovaly správně a umožnili vyhledávat v kontextu UPI. Proto bych se teď nesnažil vymýšlet dílčí náhradu těchto jejich řešení.
K přechodu od teoretizování IMHO potřebujeme vymyslet formáty souborů a popracovat na specifikaci UPI pluginu.
Zatím jsem si ještě nezkusil provětrat Google, jestli něco podobného už někdo nevymyslel/nenaprogramoval. Uvítám každý relevantní odkaz.
Souhlasím s ukončením tohoto threadu. Založ nějaký s názvem vypovídajícím o tématu (rozumím ti dobře, že už míříš k \"Testování\"?).
Jan - honzzz(zavinac)gmail(tecka)com (neregistrovaný)
4. 3. 2006 12:05
Re: zranitelnosti
Jen pro pořádek - to byl můj příspěvek.
Igra (neregistrovaný)
3. 3. 2006 20:46
Re: zranitelnosti
Padělání tagů se mi jeví jako velice reálná hrozba. Naději vidím ve spojení s autentizací. V počátečním období budou motivace a dopady útoku minimalizované (síť bude teprve v rozvoji) s rozrůstáním systému bude (snad) narůstat i akceptování autentizačního algoritmu.
Ostatní připomínky se mi jeví jako pochyby o schopnostech vyhledávačů a návrhy na jejich vylepšení. V této otázce jsem optimista, protože shromažďované údaje už teď umožňují rozumné filtrování/stanovení relevantnosti a věřím, že vyhledávače se budou průběžně vylepšovat.
Z hlediska výše uvedeného věřím v poměrně značnou odolnost systému osobní stránky + autentizace + vyhledávače.
Ostatní připomínky se mi jeví jako pochyby o schopnostech vyhledávačů a návrhy na jejich vylepšení. V této otázce jsem optimista, protože shromažďované údaje už teď umožňují rozumné filtrování/stanovení relevantnosti a věřím, že vyhledávače se budou průběžně vylepšovat.
Z hlediska výše uvedeného věřím v poměrně značnou odolnost systému osobní stránky + autentizace + vyhledávače.
3. 3. 2006 22:07
Re: zranitelnosti
Pokud si vzpomínám, tak jedním z návrhů implementace zacházení s UPI byl plug-in v browseru, přes který se bude k identitnímu serveru přihlašovat. Pokud bude při tomto přihlašování tedy použita kvalitní autentizace, je to vyřešeno. Samozřejmě je to jako se vším a 100% to nebude nikdy.
Jan - honzzz(zavinac)gmail(tecka)com (neregistrovaný)
4. 3. 2006 12:27
Re: zranitelnosti
Možná mi něco uniká, ale tohle přece není řešení. Zajistit, aby data na identitním serveru byla relativně bezpečná, to je celkem snadné. Ale pokud bude UPI tag umisťovaný do normálních diskusí, třeba tady na lupě, mít podobu nějakého čísla nebo linku, tak jak mi zabráníte, abych jednoduše neokopíroval váš tag přímo z Lupy a neumístil ho do řady diskusí na svém portálu, takže lidé, kteří vás berou jako "přítele" tam budou vyhledávači směrováni, a vám to ještě mimochodem ztíží analýzu vašich vlastních vztahů?
Přece jsme se už dříve shodli, že na identitním serveru bude jen vaše historie, adresy kde jste umístil tagy a možná bookmarky atp. - ale rozhodně tam nebude zaindexované to podstatné - celé stránky, na kterých jste zanechal tag, aby bylo možno hledat klíčová slova, tagy dalších uživatelů které se tam vyskytují atp. - přece nemůžeme budovat daší google.
Jak jsem to pochopil, tak identitní server bude fungovat jako rozcestník (můžeme se bavit i o dalších funkcích), ale pro účely vztahové analýzy (např zmňovaná shluková anaýza) bude search engine prohledávat nikoli jen váš profil (tam budou jen vaše data, a vzhledem k tomu, že nám jde o vztahy, tak tam toho ten vyhledávač moc nenajde) ale celý web, přičemž bude používat vaše tagy i tagy ostatních jako záchytné body. A v současných podmínkách search engine IMO vůbec nerozliší nějaký váš profil od ostatních webů, kde se vyskystuje váš tag - ať už ten, který jste umístil vy, nebo které umístil útočník,
Možná jsem nepochopil princip té autentizace, v tom případě mě prosím opravte stručným vysvětlením, ale jak to vidím já, tak ta podstatná data, o která nám tady jde, totiž informace o vztazích, bude search engine hledat celým webem, z něhož identity server s vaším profilem, který možná skutečně máte zabezpečený dokonale, bude nevýznamnou kapkou v moři - proto jsem navrhoval tu kontrolu nalezených tagů přes profil, ať už přímo přímo implementovanou v search engine, nebo jako dodatečné profiltrování výsledků SE pomocí lokálního klienta.
UPItag_honza
Igra (neregistrovaný)
4. 3. 2006 13:54
Re: zranitelnosti
Ve všech příspěvcích předpokládám, že rozpracováváme můj návrh "Pokročíme se standardem ?" z 3.3. 12:21. Tento návrh nevyžaduje žádný specializovaný identitní server - uživatel musí mít pouze zřízenou osobní www stránku a instalovaný web plugin, jehož specifikace diskutujeme. Pravděpodobně bude užitečné/potřebné zakomponovat i distribuovanou autentizaci např. dle příspěvku "vynalezate kolo" z 3.3. 13:48.
Pokud uvažujete o jiné implementaci, můžete ji zkusit popsat v samostatném threadu?
Ve výše uvedené implementaci je zásadní rozdíl mezi :
1) odkazy uvedenými jako zajímavé na homepage uživatelů
2) uváděním UPItagu = odkazu na uživatelovu homepage
Tento rozdíl chápou vyhledávače už dnes.
Jako primární zdroj zajímavých informací předpokládám obrácené typ analýzy :
1) vyhledávač mi pomůže najít uživatele s podobnými odkazy jako mám já - budou mě zajímat i jeho odkazy
2) nastavím si něco jako RSS čtečku na jím hodnocené stránky (stály mu za tu námahu je hodnotit)
3) ...
Krása tohoto směru analýzy je v tom, že uživatel má UPI pluginem uchovanou pro něj důležitou informaci a z jejího zpřístupnění na homepage profituje on zlepšenými výsledky vyhledávačů a komunita dostupností těchto informací všem.
Výskytu odkazů na nějakou homepage se ani dnes nelze nijak bránit a podle mě to ani nemá smysl. Na googlu si sice můžete prohlédnout už dnes, kdo na Vás odkazuje, ale nevím jak často a k jakému účelu takovou informaci potřebujete.
Jinou otázkou je využití UPI pluginu pro zavedení nějakého jednotného systému identifikace + autentizace vůči různým serverům - což lze (např. dle Open ID) také vyřešit bez oficiálních autentizačních serverů.
Jako search engine předpokládám stávající vyhledávače, které budou dávat dobré výsledky už nyní a až se systém více rozšíří rády zakomponují lepší interprataci zpřístupněných dat a případně nové typy dotazů.
Krásu vidím v tom, že tento koncept přidává do stávajícího systému Internetu jediný nový prvek - UPI plugin, který je dostatečně atraktivní pro uživatele samostatně. Současně intenzivně přispívá k nárůstu relevantního obsahu na Internetu = motivuje uživatele založit osobní stránku, jejíž významná část je automaticky plněna relevantními a pro komunitu zajímavými daty.
Pokud uvažujete o jiné implementaci, můžete ji zkusit popsat v samostatném threadu?
Ve výše uvedené implementaci je zásadní rozdíl mezi :
1) odkazy uvedenými jako zajímavé na homepage uživatelů
2) uváděním UPItagu = odkazu na uživatelovu homepage
Tento rozdíl chápou vyhledávače už dnes.
Jako primární zdroj zajímavých informací předpokládám obrácené typ analýzy :
1) vyhledávač mi pomůže najít uživatele s podobnými odkazy jako mám já - budou mě zajímat i jeho odkazy
2) nastavím si něco jako RSS čtečku na jím hodnocené stránky (stály mu za tu námahu je hodnotit)
3) ...
Krása tohoto směru analýzy je v tom, že uživatel má UPI pluginem uchovanou pro něj důležitou informaci a z jejího zpřístupnění na homepage profituje on zlepšenými výsledky vyhledávačů a komunita dostupností těchto informací všem.
Výskytu odkazů na nějakou homepage se ani dnes nelze nijak bránit a podle mě to ani nemá smysl. Na googlu si sice můžete prohlédnout už dnes, kdo na Vás odkazuje, ale nevím jak často a k jakému účelu takovou informaci potřebujete.
Jinou otázkou je využití UPI pluginu pro zavedení nějakého jednotného systému identifikace + autentizace vůči různým serverům - což lze (např. dle Open ID) také vyřešit bez oficiálních autentizačních serverů.
Jako search engine předpokládám stávající vyhledávače, které budou dávat dobré výsledky už nyní a až se systém více rozšíří rády zakomponují lepší interprataci zpřístupněných dat a případně nové typy dotazů.
Krásu vidím v tom, že tento koncept přidává do stávajícího systému Internetu jediný nový prvek - UPI plugin, který je dostatečně atraktivní pro uživatele samostatně. Současně intenzivně přispívá k nárůstu relevantního obsahu na Internetu = motivuje uživatele založit osobní stránku, jejíž významná část je automaticky plněna relevantními a pro komunitu zajímavými daty.
Jan - honzzz(zavinac)gmail(tecka)com (neregistrovaný)
4. 3. 2006 15:35
Re: zranitelnosti
Tím identity serverem jsem myslel prostě cokoli, co je přístupné i ostatním a ne jen vám na lokálu - čili třeba ty waše webové stránky - je jistě dobré upozornit na to, že serverem nemusí být nic specializovaného a běžnému uživateli nepřístupného, ale z hlediska architektury systému je to v principu totéž.
Tento příspěvek jsem mínil jako pokračování svého threadu "zranitelnost", a navazoval jsem v něm spíše na minulé diskuse a na shrnující článek, nicméně to souvisí i s vaším návrhem, který se mi v mnohém líbí (jak už jsem psal - standardizace umožňující každému soukromou implementaci na osobním webu, adresáře), nicméně imho neřeší problém, který jsem nastínil v úvodu tohoto threadu.
Podstatu problému jsem už zkusil popsat v jiných příspěvcích tohoto threadu, ovšem důležité je nezapomenout, že hlavní funkcí, kterou tu hledáme, není nějaké sdílení historie a bookmarků a jejich prohledání (některé(?) takové služby už vlastně máme - del.icio.us atd.), ale věc, ke které vám nestačí jen profil - totiž shluková analýza na výskyt tagů ve fultextu, v rámci celého netu - to rozhodně nemůžete naindexovat do profilu v rámci vaší webpage. A tím se nám vynořuje problém, jakákoli autentizace vašeho webu vám bez nějakého dopňujícího mechanismu nezajistí exkluzivitu na vaše tagy v rámci celého netu.
Podle mého názoru se poněkud lišíme v tom, co od systému očekáváme. Váš návrh vidím jako směřující k jinému cíli než moje představa "naší" aplikace - zranitelnost o které píšu, je z hlediska mých požadavků velkým rizikem, z hlediska vašich zřejmě ne. Rozdílnost v našem pohledu jsem zkusil vysvětlit v odpovědi na jiný váš post
UPItag_honza
4. 3. 2006 16:05
Re: zranitelnosti
Už jsem na Vaši odpověď odpověděl
http://www.lupa.cz/clanky/eworkshop-navrh-socialni-site-budoucnosti/nazory/142635/
Můžeme pokračovat v tom vlákně?
http://www.lupa.cz/clanky/eworkshop-navrh-socialni-site-budoucnosti/nazory/142635/
Můžeme pokračovat v tom vlákně?
5. 3. 2006 9:10
Re: zranitelnosti
Máte pravdu. Už mi to večer moc nemyslelo:-), tak jsem tento problém přehlédl.
V tom případě asi skutečně bude nutné kontrolovat tagy přes profil a Váš návrh se mi zdá velice vhodný.
V tom případě asi skutečně bude nutné kontrolovat tagy přes profil a Váš návrh se mi zdá velice vhodný.
5. 3. 2006 9:23
Re: zranitelnosti
Včera jsme o tom hodně diskutovali. Výsledek viz
http://www.lupa.cz/clanky/eworkshop-navrh-socialni-site-budoucnosti/nazory/142661/
http://www.lupa.cz/clanky/eworkshop-navrh-socialni-site-budoucnosti/nazory/142661/
Igra (neregistrovaný)
4. 3. 2006 9:43
Re: zranitelnosti - kavárny
Jako další riziko mě napadla práce na nedůvěryhodném počítači - internetová kavárna, náhodná návštěva, ...
Řešení se mi jeví v implementaci 2 režimů práce www pluginu :
1) Standardní "Home" by umožňovala plnou práci jak byla popisována (včetně updatů na homepage, přístupu na private/* a identifikace + autentizace)
2) Omezený "Pasive" umožňoval by práci bez přihlášení = zadání hesla pro přístup k homepage. V tomto režimu by nebyly výše uvedené funkčnosti dostupné, ale uživatel by normálně pracoval se zveřejněnými informacemi - i to by ho motivovalo k jejich zveřejňování.
Otázkou je, jestli by měl v této chvíli být servery identifikován pod daným UPI i bez autentizace. Na jednu stranu jde o podporu fake identit, na druhou stranu to odpovídá např. situaci na Lupě - jako nepřihlášený můžu napsat libovolnou předzdívku.
Přesto se spíše kloním k neuvádění identifikace bez provedení autentizace.
Řešení se mi jeví v implementaci 2 režimů práce www pluginu :
1) Standardní "Home" by umožňovala plnou práci jak byla popisována (včetně updatů na homepage, přístupu na private/* a identifikace + autentizace)
2) Omezený "Pasive" umožňoval by práci bez přihlášení = zadání hesla pro přístup k homepage. V tomto režimu by nebyly výše uvedené funkčnosti dostupné, ale uživatel by normálně pracoval se zveřejněnými informacemi - i to by ho motivovalo k jejich zveřejňování.
Otázkou je, jestli by měl v této chvíli být servery identifikován pod daným UPI i bez autentizace. Na jednu stranu jde o podporu fake identit, na druhou stranu to odpovídá např. situaci na Lupě - jako nepřihlášený můžu napsat libovolnou předzdívku.
Přesto se spíše kloním k neuvádění identifikace bez provedení autentizace.
Igra (neregistrovaný)
4. 3. 2006 15:04
Re: podpis
Nerozumím souvislosi podpisu s prací na nedůvěryhodném počítači.
Ať už je zvolen jakýkoli způsob autentizace k UPI = homepage, tak ho v nedůvěryhodném prostředí přece nepoužiju.
Jinak o použití certifikátů a podpisů jsem uvažoval, ale spíše pro spolehlivou autentizaci a nepopiratelnost původu/autora. Diskusi o tom očekávám v samostatném vlákně.
Zatím mi není vůbec jasný způsob interakce UPI pluginu s diskusními servery (např. Lupou).
Ať už je zvolen jakýkoli způsob autentizace k UPI = homepage, tak ho v nedůvěryhodném prostředí přece nepoužiju.
Jinak o použití certifikátů a podpisů jsem uvažoval, ale spíše pro spolehlivou autentizaci a nepopiratelnost původu/autora. Diskusi o tom očekávám v samostatném vlákně.
Zatím mi není vůbec jasný způsob interakce UPI pluginu s diskusními servery (např. Lupou).
6. 3. 2006 21:00
Re: zranitelnosti
Ano, urcit z obecne diskusni stranky smer reakci - tedy presneji, ktery prispevek reaguje na ktery - je dost tezke. Rada diskusnich serveru thready ani nepodporuje (napr lopuch/lapiduch) a neexistuje shoda mezi tim, je-li reakce pod nebo nad prispevkem, na ktery reaguje ... obavam se, ze snadne reseni neexistuje a ze zacatku by proste smer reakce byl ignorovan (ze stranky by se jen urcilo, ze mate s Donatem spolecne zajmy), zatimco pozdeji by se uplatnila nejaka podpora systemu UPI danym diskusnim serverem, v ramci ktere by vyhledavacum rekl jak to na nem chodi.