<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="cs">
	<id>http://postgres.cz/index.php?action=history&amp;feed=atom&amp;title=UTF8%2C_PostgreSQL_a_Perl_DBI</id>
	<title>UTF8, PostgreSQL a Perl DBI - Historie editací</title>
	<link rel="self" type="application/atom+xml" href="http://postgres.cz/index.php?action=history&amp;feed=atom&amp;title=UTF8%2C_PostgreSQL_a_Perl_DBI"/>
	<link rel="alternate" type="text/html" href="http://postgres.cz/index.php?title=UTF8,_PostgreSQL_a_Perl_DBI&amp;action=history"/>
	<updated>2026-06-02T19:09:51Z</updated>
	<subtitle>Historie editací této stránky</subtitle>
	<generator>MediaWiki 1.43.3</generator>
	<entry>
		<id>http://postgres.cz/index.php?title=UTF8,_PostgreSQL_a_Perl_DBI&amp;diff=546&amp;oldid=prev</id>
		<title>imported&gt;Pavel v 20. 2. 2014, 06:24</title>
		<link rel="alternate" type="text/html" href="http://postgres.cz/index.php?title=UTF8,_PostgreSQL_a_Perl_DBI&amp;diff=546&amp;oldid=prev"/>
		<updated>2014-02-20T06:24:16Z</updated>

		<summary type="html">&lt;p&gt;&lt;/p&gt;
&lt;p&gt;&lt;b&gt;Nová stránka&lt;/b&gt;&lt;/p&gt;&lt;div&gt;Implementace UTF8 je v Perlu docela komplikovaná a neočekávaně komplikovaný byl i přechod na UTF8. Problém na který jsem narazil, a kterému jsem věnoval poměrně hodně času, bylo náhodné chybné dekódování diakritiky a to i v situaci, kdy aplikace i databáze jely v UTF-8 a já jsem navíc potřeboval zpracovávat načtené řetězce v knihovnách, které braly v potaz UTF8 flag řetězců. Před třemi roky, kdy jsem psal aplikaci pro přenos čísel, tak jsem se trefil do přechodného období, kdy se redesignoval DBI ovladač Postgresu a dekódování fungovalo divně. A jak sleduji vývoj (říjen 2013), tak by se situace měla zlepšovat, nicméně v tuto chvíli jsou ještě s kódováním určité problémy (na Fedoře 20 se DBI chová úplně stejně).&lt;br /&gt;
&lt;br /&gt;
Níže popsaný postup mi funguje a nepoškozuje diakritiku:&lt;br /&gt;
&lt;br /&gt;
&amp;lt;pre&amp;gt;&lt;br /&gt;
#!/usr/bin/env perl&lt;br /&gt;
&lt;br /&gt;
#&lt;br /&gt;
# ručně vytvořte tabulku CREATE TABLE IF NOT EXISTS test_czech_tab(content varchar); TRUNCATE test_czech_tab;&lt;br /&gt;
# z konzole spusťte příkaz INSERT INTO test_czech_tab VALUES(&amp;#039;&amp;gt;JIHOMORAVSKÝ&amp;lt;&amp;#039;),(&amp;#039;&amp;gt;Špindlerův Mlýn&amp;lt;&amp;#039;);&lt;br /&gt;
#&lt;br /&gt;
&lt;br /&gt;
# use strict;&lt;br /&gt;
use warnings;&lt;br /&gt;
use DBI;&lt;br /&gt;
use Encode;&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
use Data::Dumper;&lt;br /&gt;
use utf8;&lt;br /&gt;
&lt;br /&gt;
$dbh1 = DBI-&amp;gt;connect(&amp;quot;dbi:Pg:dbname=postgres&amp;quot;,&amp;quot;pavel&amp;quot;,&amp;quot;&amp;quot;, {AutoCommit=&amp;gt;1,RaiseError=&amp;gt;1,PrintError=&amp;gt;1,pg_enable_utf8 =&amp;gt; 0});&lt;br /&gt;
$dbh1-&amp;gt;do(&amp;quot;SET application_name TO &amp;#039;czech check&amp;#039;&amp;quot;);&lt;br /&gt;
#$dbh1-&amp;gt;do(&amp;quot;set client_encoding to &amp;#039;utf8&amp;#039;&amp;quot;);&lt;br /&gt;
&lt;br /&gt;
$dbh1-&amp;gt;do(&amp;quot;INSERT INTO test_czech_tab VALUES(&amp;#039;&amp;gt;TestL&amp;lt;&amp;#039;)&amp;quot;);&lt;br /&gt;
$dbh1-&amp;gt;do(&amp;quot;INSERT INTO test_czech_tab VALUES(&amp;#039;&amp;gt;JIHOMORAVSKÝ&amp;lt;&amp;#039;),(&amp;#039;&amp;gt;Špindlerův Mlýn&amp;lt;&amp;#039;)&amp;quot;);&lt;br /&gt;
&lt;br /&gt;
my $stm1 = $dbh1-&amp;gt;prepare( &amp;lt;&amp;lt;END );&lt;br /&gt;
  SELECT count(*) FROM test_czech_tab WHERE content IN (&amp;#039;&amp;gt;JIHOMORAVSKÝ&amp;lt;&amp;#039;,&amp;#039;&amp;gt;Špindlerův Mlýn&amp;lt;&amp;#039;)&lt;br /&gt;
END&lt;br /&gt;
&lt;br /&gt;
my $stm2 = $dbh1-&amp;gt;prepare( &amp;lt;&amp;lt;END );&lt;br /&gt;
  SELECT content FROM test_czech_tab;&lt;br /&gt;
END&lt;br /&gt;
&lt;br /&gt;
$stm1-&amp;gt;execute();&lt;br /&gt;
my ($content);&lt;br /&gt;
$stm1-&amp;gt;bind_columns(\$content);&lt;br /&gt;
&lt;br /&gt;
die &amp;quot;cannot to execute query&amp;quot; if !$stm1-&amp;gt;fetch();&lt;br /&gt;
&lt;br /&gt;
die &amp;quot;unexpected result&amp;quot; if $content != 4;&lt;br /&gt;
&lt;br /&gt;
$stm2-&amp;gt;execute();&lt;br /&gt;
my ($cnt);&lt;br /&gt;
$stm2-&amp;gt;bind_columns(\$cnt);&lt;br /&gt;
&lt;br /&gt;
while ($stm2-&amp;gt;fetch()) {&lt;br /&gt;
        utf8::upgrade($cnt);&lt;br /&gt;
	print &amp;quot;$cnt\n&amp;quot;;&lt;br /&gt;
	print Encode::is_utf8($cnt) ? &amp;quot;je utf\n&amp;quot; : &amp;quot;neni utf\n&amp;quot;;&lt;br /&gt;
	print Dumper($cnt);&lt;br /&gt;
}&lt;br /&gt;
&lt;br /&gt;
printf &amp;quot;tests are ok\n&amp;quot;;&lt;br /&gt;
&amp;lt;/pre&amp;gt;&lt;br /&gt;
&lt;br /&gt;
Problém je v polofunkčním pg_enable_utf8 =&amp;gt; 1. Pokud se vyhodí, tak výše uvedený test zafunguje, ale interně nejsou řetězce načtené z databáze označené jako UTF a v některé funkce je mohou opět poškodit.&lt;br /&gt;
&lt;br /&gt;
Očekávaný výstup je:&lt;br /&gt;
&amp;lt;pre&amp;gt;&lt;br /&gt;
bash-4.1$ perl test.pl&lt;br /&gt;
&amp;gt;JIHOMORAVSKÝ&amp;lt;&lt;br /&gt;
je utf&lt;br /&gt;
$VAR1 = &amp;quot;&amp;gt;JIHOMORAVSK\x{c3}\x{9d}&amp;lt;&amp;quot;;&lt;br /&gt;
&amp;gt;Špindlerův Mlýn&amp;lt;&lt;br /&gt;
je utf&lt;br /&gt;
$VAR1 = &amp;quot;&amp;gt;\x{c5}\x{a0}pindler\x{c5}\x{af}v Ml\x{c3}\x{bd}n&amp;lt;&amp;quot;;&lt;br /&gt;
&amp;gt;TestL&amp;lt;&lt;br /&gt;
je utf&lt;br /&gt;
$VAR1 = &amp;#039;&amp;gt;TestL&amp;lt;&amp;#039;;&lt;br /&gt;
&amp;gt;JIHOMORAVSKÝ&amp;lt;&lt;br /&gt;
je utf&lt;br /&gt;
$VAR1 = &amp;quot;&amp;gt;JIHOMORAVSK\x{c3}\x{9d}&amp;lt;&amp;quot;;&lt;br /&gt;
&amp;gt;Špindlerův Mlýn&amp;lt;&lt;br /&gt;
je utf&lt;br /&gt;
$VAR1 = &amp;quot;&amp;gt;\x{c5}\x{a0}pindler\x{c5}\x{af}v Ml\x{c3}\x{bd}n&amp;lt;&amp;quot;;&lt;br /&gt;
tests are ok&lt;br /&gt;
&amp;lt;/pre&amp;gt;&lt;br /&gt;
&lt;br /&gt;
* http://blog.endpoint.com/2011/01/dbdpg-utf-8-and-postgres-clientencoding.html&lt;br /&gt;
&lt;br /&gt;
Popisovaný problém by měl být odstraněn v nové (třetí) generaci DBI driveru http://blog.endpoint.com/2014/02/dbdpg-utf-8-perl-postgresql.html&lt;/div&gt;</summary>
		<author><name>imported&gt;Pavel</name></author>
	</entry>
</feed>