Hlavní navigace

Vlákno názorů k článku Architektury a modely webových strojů od J.K. - Přece takhle nelze bez dalšího psát o frekvenční...

  • Článek je starý, nové názory již nelze přidávat.
  • 6. 2. 2002 14:24

    J.K. (neregistrovaný)
    Přece takhle nelze bez dalšího psát o frekvenční analýze. A aby to vypadalo pro neznalé věrohodněji, tak se tam přihodí pár matematických formulí.
    Začněme tedy matematicky. Jaké jsou předpoklady na odlišnost či rozdílnost slov? Konrétně tedy v naší češtině (ale takové jsou i jiné jazyky). Různé koncovky stejného slova - zanedbáváme, rozlišujeme, do kolika písmen atd.
    Ale já vím, jak to "teoreticky" funguje, Přimaluje se tam jeden lematizační či normalizační modul a teorie je hotová. A jak je tento modul náročný, tím se už nikdo nezabývá. Samozřejmě je pak potřeba si i položit otázku, zda celá věc by se neměla řešit úlně na jiném principu bez onoho modulu. (Ale to v přednáškách "převzatých" z angličtiny nebylo, že?)
  • 6. 2. 2002 18:21

    k.p. (neregistrovaný)
    Pane J.K.,

    je obsahem Vaseho prispevku narceni z plagiatorstvi? Pokud ano, sdelte mi prosim kontakt na Vas do meho e-mailu. Myslim, ze v takovem pripade jste presahl meze kritiky.

    Obsah Vasich matematickych pripominek prilis nechapu. Muzete mi je vysvetlit? Neni mi jasne proc do cele veci michate lemmatizaci nebo entropii textu ci corpusu.
  • 7. 2. 2002 13:37

    J.K. (neregistrovaný)
    Jaké meze kritiky myslíte? To jste vymyslel četnosti slov sám, vektorový model také - Vy jste přece měl citovat první. A to jste neudělal proč?
    Lematizaci sem pletu proto, že pojem "četnost slova v dokumentu" je pro ohebné jazyky potřeba správně nadefinovat. Hned máte možnost mi odepsat, na jakou definici se odvoláváte Vy.
    Pokud na žádnou, tak mi promiňte, že myslím a mluvím (vlastně píši).
  • 7. 2. 2002 22:02

    k.p. (neregistrovaný)
    Vazeny pane,

    musim priznat, ze jsem Vasim pristupen znacne sokovan. Pokud jste jiz zavrsil vysokoskolske studium zajiste chapete, kdy se citace uvadi a kdy nikoliv. Musim Vam pripomenout, ze jste naznacil, ze clanek je plagiat vznikly z anglickeho prekladu. Pokud na tomto trvate, je Vasi povinnosti toto dokazat. Z Vasi odpovedi zatim chapu, ze jste z duvodu, ktere nechapu, napsal neco, co neumite nyni zduvodnit.

    Osobne znam nekolik kapacit, ktere do modelovani (resp. modelu) nekomponuji lemmatizaci a dalsi faktory. Jste prvni kdo tak cini. Zrejme byste zadal, aby se na gymnaziu nejprve vysvetlil pojem kontinua, bez nehoz nema vyznam povidat o nejakych realnych oborech cisel.

    Opravdu mi neni jasne, co mohu jinak na Vasem komentari komentovat. Je mozne, ze jsem Vas nepochopil. Jste ochoten svoji vytku reformulovat tak, aby bylo jasne co vlastne kritizujete?

    Neberu Vam pravo na mysleni a mluveni, ale Vase forma sdelovani nazoru mi, prominte, pripada znacne nekomformni a nestastna.
Upozorníme vás na články, které by vám neměly uniknout (maximálně 2x týdně).