Hlavní navigace

Názory k článku Nástup časoprostorového vymezení dotazů

  • Článek je starý, nové názory již nelze přidávat.
  • 23. 5. 2003 9:19

    JV (neregistrovaný)
    Pro prostorove dotazy: "Kde do 3 km od meho bydliste je hospoda?" existuji prostorove databaze, ktere se ruznym zpusobem (pomoci obdelniku, lichobezniku) snazi aproximovat Eukleidovsky prostor. Jednotlive oblasti pak lze seskupovat do vetsich a taky vytvaret vyhledavaci stromy (R-stromy, prostorove obdoby B-stromu)
    ... Alespon neco malo, co mi utkvelo v pameti ze skoly

    Otazkou je, kdo bude takova data zadavat, resp. kde je dneska vezmeme. Ikdyz hospody by slo udelat asi automaticky: Zlute Stranky -> PSC -> Mapa CR.
  • 23. 5. 2003 10:59

    Jiří Donát (neregistrovaný)
    Ad: Otazkou je, kdo bude takova data zadavat?
    Správně položená otázka. A já bych rád naznačil, že nikdo. Všechny stránky, u kterých je prostorová či časová informace relevantní, ji totiž už dnes obsahují. Neznám aspoň ani jednu stránku hotelu či hospody, ze které by se nepoznalo, kde dotyčný podnik je. A pak je to o dotvoření logiky crawlerů, aby dokázaly časovou či prostorovou informaci identifikovat a zpracovat. Například pokud by našly něco, co vypadá jako adresa, porovnaly by ji s rejstříkem adres, který dnes už existuje, a ze kterého by se v případě shody vzaly geografické souřadnice.
    Tady je podle mého velké místo na trhu a možnost vymyslet, jak by takový algoritmus mohl vypadat. Mohl by obsahovat i kontrolní mechanismus na základě P2P schématu - pokud nějaký uživatel zjistí, že se systém totálně spletl, bude mít možnost a hlavně i motivaci takovouto chybu ohlásit a napravit. Podobný mechanismus by už byl "neprůstřelný". Výsledná databáze prostorových informací by pak byla nenahraditelným zdrojem pro nejrůznější vyhledávací služby.

    PS: Nevylučuji, že v budoucnu se ujme standard, jak označovat relevantní časovou či prostorovou informaci pro daný text přímo na dané stránce a přímo jejím tvůrcem. Ale ten se ujme právě proto, že se s touto informací začne ve vyhledávačích rutinně pracovat,právě díky zmíněným nástrojům pro "dolování" časoprostorové informace. Do té doby totiž nebudou mít tvůrci stránek motivaci takový standard používat.
  • 23. 5. 2003 12:59

    Jiří Donát (neregistrovaný)
    I tato databáze by mohla být jedním ze zdrojů geografických dat pro případný "dolovací" mechanismus. Ale asi ničím více - jde o databázi, kam si tvůrci stránek mají zaregistrovat své stránky podle zeměpisné polohy. Nejde tedy o nic více a nic méně, než o jeden z možných standardů, jak naše stránky geograficky začlenit.
    Chtělo by to však skok - dostat se k systému, který by byl používán opravdu masově a univerzálně. Těžko se najednou všichni uživatelé rozhodnou začít používat některý ze standardů hromadně. K tomu musí mít motivaci - například v silném vyhledávači, který s takovou informací úspěšně pracuje a který stránky s takovou informací zvýhodní. Ale takový vyhledávač nejprve potřebuje geograficky začlenit většinu internetového obsahu, kde to dává smysl, i bez aktivní účasti tvůrců stránek. A to je přesně služba, která zde dnes chybí.
  • 8. 7. 2003 13:31

    Jan Mach (neregistrovaný)
    Na VŠE se mimo jiné vyvíjí systém, který dokáže na WWW stránce identifikovat adresu - to je řešením, jak identifikovat polohu objektu. Další informace by se mohly hledat v metainformacích stránek - potřebné jazyky pro to určitě existují, ale nepoužívají se masově.
    Co se týká vyhledávání podle názvu hl. města či oblasti - toto řeší tezaury. Pokud se do vyhledávání dosadí tezaurus, dokázal by udělat substituci ve vyhledávání - pokud zadám Praha, bude se hledat Praha OR Prague OR "hlavní město ČR" (použití vazby asociace tezauru) ... Podobně při hledání města ve středních Čechách by mohl hledat stránku s jakýmkoliv městem stř. Čech (použití vazby nadřazený/podřízený termín tezauru). Jde jen o to vytvořit/použít takovýto tezaurus.
    Podobně by mohl vyhledávací stroj substituovat termín "včera" za včera or "12. 5. 2003" OR "2003/05/12" ...
  • 24. 5. 2003 9:36

    Pepa (neregistrovaný)
    Podle meho nazoru neni ani tak slozite analyzovat vyhledane odkazy a vytahnout z nich prakticky vse na co si uzivatel vzpomene (napr jestli je hospoda do 3 km). Jde ale o to, jak informace o uzivateli ziskat a jak je ukladat. Pokud bude mit jedna organizace verejnou ip a pod ni bude mit 300PC na neverejnych IP adresach, jen tezko mohu ukladat data podle ip adresy do DB. Pak by se stejne stalo to, ze 300 lidi by hledalo jine tema, ale to by bylo pod jednou ip adresou a tim padem by to zase nebylo prehledne. Pokud by to byly cookies, tak v soucasne dobe ma cim dal vice lidi vypnutou podporu cookies ikdyz nechapu proc. Ve sve podstate jsou totiz cookies velice bezpecne (zalezi na tom co do nich ulozite).

    Muselo by se tedy jednat asi o nejakou kombinaci udaju v DB a v cookies, ale problemem opet muze byt to, pokud pouzivate DIAL-UP pripojeni a system vam prideli IP adresu automaticky pri pripojeni na internet. Pokazde muze byt jina. A nebo pokud si smazete cookies nebo prihlasite na PC jako jiny uzivatel.

    Mozna by se techto informaci dalo i velice dobre zneuzit. Pokud bude nejaky ministr nejcasteji hledat informace o erotickych klubech a eroticke stranky a pak zada dotaz napriklad sroubovak, protoze si chce koupit sadu sroubovaku, a opet mu vybehnou pouze eroticke stranky. Pokud se nekdo dostane k jeho pc a zada vyhledat sroubovak, muze nekdo jeho vyhledavaci historie ktera by se pouzila pro hledani odkazu ve fulltextu vyuzit k jeho diskreditaci. Ale to je uz asi extrem:)
  • 26. 5. 2003 10:01

    Jiří Donát (neregistrovaný)
    Tím už narážíme na problematiku jednoho z minulých eWorkshopů. Identifikace uživatele musí být postavena na něčem jiném, než je IP adresa; totéž lze říci o identifikaci časoprostorových souřadnic objektů. Přítomnost českého penziónu na americké webhostingové službě samozřejmě neimplikuje, že je tento penzion skutečně v Americe. Nakonec přesně takhle to již delší dobu dělají P2P systémy.
    V minulosti jsme řešili dokonce i problém "chlípného ministra" - viz http://www.lupa.cz/clanek.php3?show=1011

    Pokud Vás tato problematika zajímá hlouběji, doporučuji Vám návštěvu archivu eWorkshopů (viz odkaz v levém sloupci nahoře)- i s odstupem téměř tří let stojí některé tehdy vyslovené myšlenky za přečtení...
  • 27. 5. 2003 0:05

    Pepa (neregistrovaný)
    Tady ale prece nejde o IP adresu toho hotelu. Pokud se na net pripojim pres napr Dial-Up a dostanu pridelenu IP adresu, pak s tou IP adresou vystupuji i na internetu - prijdu na fulltext a dam neco hledat - a ono se ulozi, ze tato ip adresa neco hledala. Stejne tak pokud budu mit treba pevnou linku. Jedinym problemem tedy je pokud se pri kazdem prihlaseni na DialUp priradi uzivateli jina IP adresa. Pak teda nejde o to jako je IP adresa hotelu ktereho hledam - pokud nekde hostuji jeste neznamena ze pouzivam jejich IP adresu. Jde tady pouze o to jak si ty informace o uzivateli ulozit a jeste porad nevim jak to udelat.

    Sla by udelat nejaka cilova skupina a podle toho smerovat odkazy, slo by zjistit kde ten clovek prave je a podle toho mu zobrazit odkazy co nejblize mistu odkud surfuje, ale jak si to o nem ulozit. IP adresa se zmeni, on si smaze cookies a vse je zase v haji. Nebo treba prijde do ikavarny a bude chtit najit tu firmu na kterou se dival z domu, jenze zjisti, ze na stejny dotaz ktery zadal z domu mu to vyhodi jine odkazy protoze v te kavarne s touto ip adresou a temito cookies predtim hledali neco co se tematu napr netykalo a navic kavarna je 150km od jeho bydliste. Takze to najde firmy v blizkosti kavarny. Navrhnete nekdo jak tento problem resit....DIKY:)
  • 27. 5. 2003 16:43

    Jiří Donát (neregistrovaný)
    Jak už jsem řekl: Identifikace uživatele musí být postavena na něčem jiném, než je IP adresa.
    Například ICQ to řeší uživatelským jménem a heslem...