<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="cs">
	<id>http://postgres.cz/index.php?action=history&amp;feed=atom&amp;title=Diskuse%3ATSearch2</id>
	<title>Diskuse:TSearch2 - Historie editací</title>
	<link rel="self" type="application/atom+xml" href="http://postgres.cz/index.php?action=history&amp;feed=atom&amp;title=Diskuse%3ATSearch2"/>
	<link rel="alternate" type="text/html" href="http://postgres.cz/index.php?title=Diskuse:TSearch2&amp;action=history"/>
	<updated>2026-05-03T02:35:58Z</updated>
	<subtitle>Historie editací této stránky</subtitle>
	<generator>MediaWiki 1.43.3</generator>
	<entry>
		<id>http://postgres.cz/index.php?title=Diskuse:TSearch2&amp;diff=212&amp;oldid=prev</id>
		<title>85.160.85.110: /* Affix parse error */</title>
		<link rel="alternate" type="text/html" href="http://postgres.cz/index.php?title=Diskuse:TSearch2&amp;diff=212&amp;oldid=prev"/>
		<updated>2008-02-07T19:35:15Z</updated>

		<summary type="html">&lt;p&gt;&lt;span class=&quot;autocomment&quot;&gt;Affix parse error&lt;/span&gt;&lt;/p&gt;
&lt;p&gt;&lt;b&gt;Nová stránka&lt;/b&gt;&lt;/p&gt;&lt;div&gt;Hellou&lt;br /&gt;
&lt;br /&gt;
skusal som nainstalovat TSEARCH2. Nebolo to uplne bezbolestne ale darilo sa mi to pokial som nemal nadefinovat novy slovnik.&lt;br /&gt;
Skusal som ako slovensky tak cesky slovnik ale po spusteni :&lt;br /&gt;
&lt;br /&gt;
SELECT lexize(&amp;#039;ispell_slovak&amp;#039;,&amp;#039;jablko&amp;#039;); je result {jablko}&lt;br /&gt;
SELECT lexize(&amp;#039;ispell_slovak&amp;#039;, &amp;#039;jablká&amp;#039;); je result prazdny&lt;br /&gt;
SELECT lexize(&amp;#039;ispell_slovak&amp;#039;,&amp;#039;jablke&amp;#039;); je result ERROR :  Regex error in &amp;#039;[^áeoô]l$&amp;#039;: brackets [] not balanced&lt;br /&gt;
alebo :&lt;br /&gt;
SELECT to_tsvector(&amp;#039;default_slovak&amp;#039;,&amp;#039;Zobrali sme dve jablka jedno červené a jedno modré&amp;#039;);&lt;br /&gt;
result : ERROR:  Regex error in &amp;#039;[^áď»ňµ]$&amp;#039;: brackets [] not balanced&lt;br /&gt;
&lt;br /&gt;
neviete v com moze byt problem postupoval som podla tohto clanku ale aj inych zdrojov na internete&lt;br /&gt;
&lt;br /&gt;
lexize pre simple funguje vzdy ... ale zial neodstranuje diakritiku ...&lt;br /&gt;
&lt;br /&gt;
stretli ste sa niekto s tymto problemom ?&lt;br /&gt;
&lt;br /&gt;
:Rekl bych, ze mate problem s kodovanim. Ale to je tak vsechno, co mohu odhadnout. Mam pocit, ze starsi verze 8.1 nepodporovaly UTFko. Radeji se podivejte do release notes&lt;br /&gt;
&lt;br /&gt;
::Diki Mate pravdu. Nasiel som ze az 8.2 podporuje UTF formatovanie. Este ma zaujima jedna vec a to ze slovo, ktore v slovniku nenajde automaticky vypusti. Da sa nejak nastavit to aby slovo ktore nenasiel v slovniku a nie je v .stop subore tam ponechalo v takom tvare v akom ho naslo ?&lt;br /&gt;
&lt;br /&gt;
:::Když token není v daném slovníku nalezen, je výsledkem analýzy prázdný řetězec. Tato vlastnost by mohla diskvalifikovat tsearch2 v praxi - např. některá příjmení nebo názvy v žádném slovníku nenajdeme. Díky genialitě tvůrců máme ale k dispozici tzv. simple slovník, který pouze převádí velká písmena na malá, a můžeme řadit za sebe více slovníků (slovník simple zařadíme na konec).&lt;br /&gt;
&lt;br /&gt;
== Zdravim  ==&lt;br /&gt;
&lt;br /&gt;
Asi mesiac pouzivam TSearch2 modul na postgres 8.2 vsetko super funguje ale chcel by som doplnit vyhladavanie s ignoraciou dlznou a makcenou to jest :&lt;br /&gt;
&lt;br /&gt;
želva = zelva&lt;br /&gt;
lámať = lamat = lámat = lamať&lt;br /&gt;
&lt;br /&gt;
aky je idealny postup ? resp. nema postgres takuto podporu nejak implementovanu.&lt;br /&gt;
Jedina vec co ma napadla je nahradit v slovniku vsetky interpunkcne pismena za klasicke &lt;br /&gt;
á,ä -&amp;gt; a;&lt;br /&gt;
č, -&amp;gt; c;&lt;br /&gt;
atd...&lt;br /&gt;
a potom do vyhladavacej metody uz tiez dodat slovo ochudobnene ...&lt;br /&gt;
mate s tym niekto skusenosti ?&lt;br /&gt;
&lt;br /&gt;
Diki&lt;br /&gt;
&lt;br /&gt;
:Nic takového podporováno není, a není mi známo, že by v budoucnu podporováno mělo. Problém je v tom, že jakmile zlikvidujete diakritiku, tak Vám přestane chodit lexamizace. Ledaže byste měl slovníky pro ispell bez diakritiky. V podstatě je to totéž jako podpora nového jazyka.&lt;br /&gt;
&lt;br /&gt;
::Ok takze zatial je jedine riesenie zlikvidovat diakritiku v ispell slovniku a potom aj vsetky dotazy dodavat bez diarkitiky ...&lt;br /&gt;
::alebo urobit kopiu ispellu a tento okresany slovnik pouzivat ako novy jazyk na specialne query a povodny slovnik na vsetko ostatne ?&lt;br /&gt;
::totizto tvorim stranku http://www.e-doktor.sk a tento specialny search by som potreboval iba na meno lekara. Na ostatne query je diarkitika vhodna.&lt;br /&gt;
&lt;br /&gt;
:::Teoreticky by se dal použít slovník synonym, který je v 8.2, ale ani jsem to neviděl.&lt;br /&gt;
&lt;br /&gt;
:::: Dik nieco vymyslim ;)&lt;br /&gt;
&lt;br /&gt;
:::::Co ukladat jmena doktoru do databaze take bez diakritiky?&lt;br /&gt;
&lt;br /&gt;
== Affix parse error ==&lt;br /&gt;
&lt;br /&gt;
Dobry den,&lt;br /&gt;
&lt;br /&gt;
pokousim se rozchodit TSearch2 na WinXP ale pri SELECT set_curdict(&amp;#039;ispell_czech&amp;#039;); dostavam chybu Affix parse error at 20 line. SQL state: XX000&lt;br /&gt;
Na 20. radce aff souboru je &amp;quot;   .    &amp;gt; TřIA&amp;quot; a je to prvni misto kde se vyskytuje &amp;#039;ř&amp;#039;. &lt;br /&gt;
&lt;br /&gt;
Skusil jsem na prvni radku aff souboru dat SET UTF8, skusil jsem &lt;br /&gt;
SET client_encoding TO &amp;#039;UTF8&amp;#039;;&lt;br /&gt;
SELECT set_curcfg(&amp;#039;utf8_czech&amp;#039;);&lt;br /&gt;
ale nic nepomaha. Cim to muze byt a jak to odstranit?&lt;br /&gt;
:: Trochu hadam, nicmene u tsearch je zakladem, aby slovniky byly ve stejnem kodovani jako databaze. Slovniky, ktere tady koluji jsou v latin2, takze je potreba je rucne prevest na UTF8.&lt;br /&gt;
&lt;br /&gt;
::::Bohuzial toto nieje celkom pravda. PostgreSQL 8.2 ma problem s UTF-8 slovnikmi. Urcite by som neratal s tym ze staci skonvertovat slovak.aff na UTF-8 a pojde vam. Verzia 8.3 ma zas este silnejsi validator na aff subory, takze subor treba dost vydatne upravovat. Pripravujem release slovnikov UTF-8 pre slovensky jazyk. Ked budu otestovane budu stiahnutelne zo stranky Tsearch2.&lt;br /&gt;
::::::Nevzpomínám si, že bych prováděl cokoliv jiného vyjma konverze kódování - aff souborům nijak zvlášť nerozumím a fulltext pro češtinu jsem rozjel - zrada tam je, slovníky musí být vždy v UTF8 i když kódování je latin2 (to jsem tuším reportoval jako chybu, a bylo mi řečeno, že to chyba není). V každém případě mne zajímá výsledek - pokud někam umístíte slovník, přidejte sem, prosím, link. Díky Pavel&lt;/div&gt;</summary>
		<author><name>85.160.85.110</name></author>
	</entry>
</feed>