View previous topic :: View next topic |
Author |
Message |
Gale
Joined: 04 Apr 2005 Posts: 120
|
Posted: 23.09.2005 23:38 Post subject: UTF 8 i MySQL |
|
|
Evo imam jedno pitanje šta me već neko vrijeme zanima.
Ako postavim u MySQL-u character set na UTF-8 kako pretvaram Hrvatske znakove prije unosa u UTF-8.
Neznam jer pitanje zvući malo zbunjujuće, ali neznam kako bih ga drugačije postavio. |
|
|
Back to top |
|
|
carr
Joined: 13 Nov 2003 Posts: 1397 Location: Karlovac
|
Posted: 24.09.2005 03:00 Post subject: |
|
|
stavis encoding stranice koja ti sluzi za upisivanje (tamo gdje ti je <form>) isto na utf-8
isto tako i stranica na kojoj ispisujes. |
_________________ Bolje biti malo lud, nego malo pametan. |
|
Back to top |
|
|
lekke
Joined: 17 Jun 2004 Posts: 860 Location: 25th floor
|
Posted: 24.09.2005 08:52 Post subject: |
|
|
Nope, Carre, nije potrebno.
PHP se sam brine za collation onako kako je baza podešena. Stranica s formularom može biti i u 1250 i u 8859-2, podaci će se ispravno zapisivati u tablicu koja ima setiran UTF encoding (iz osobnog iskustva preporučam utf_general_ci, sort HR slova nema s njim ama nikakvih problema), s napomenom da ja iz dodatne sigurnosti (čitaj: za mir u duši) taj collation forceam i na svakom character polju. |
_________________ You need more bass. |
|
Back to top |
|
|
bj__
Joined: 09 Nov 2004 Posts: 65 Location: Karlovac
|
Posted: 24.09.2005 10:59 Post subject: |
|
|
lekke wrote: | ...iz osobnog iskustva preporučam utf_general_ci, sort HR slova nema s njim ama nikakvih problema... |
jesi 100% siguran? koristim taj collation i kad sortiram nikad hr slova ne ispadnu u dobrom redoslijedu... a da ne govorim o razlici kad sortiras ASC ili DESC... |
|
|
Back to top |
|
|
carr
Joined: 13 Nov 2003 Posts: 1397 Location: Karlovac
|
Posted: 24.09.2005 12:06 Post subject: |
|
|
lekke wrote: | Nope, Carre, nije potrebno.
PHP se sam brine za collation onako kako je baza podešena. Stranica s formularom može biti i u 1250 i u 8859-2, podaci će se ispravno zapisivati u tablicu koja ima setiran UTF encoding (iz osobnog iskustva preporučam utf_general_ci, sort HR slova nema s njim ama nikakvih problema), s napomenom da ja iz dodatne sigurnosti (čitaj: za mir u duši) taj collation forceam i na svakom character polju. |
ne kuzim kakve veze ima collation s pitanjem iz ovog topica?
collation je ajmo rec skup pravila za sortiranje slova u nekom charsetu. dakle on ti kaže koji character dođe ispred kojeg itd..
sasvim druga stvar je ovo sta drug bj kaze, a to da utf_general_ci ne radi dobro za hrvatsku abecedu.
sasvim treca stvar je da ipak mislim da je dobra praksa definirati encoding stranice (iako ti kazes da se ne treba, ali moja iskustva nisu takva). |
_________________ Bolje biti malo lud, nego malo pametan. |
|
Back to top |
|
|
BS Guest
|
Posted: 24.09.2005 12:19 Post subject: |
|
|
<snip>
Last edited by BS on 31.12.2005 15:08; edited 1 time in total |
|
|
Back to top |
|
|
lekke
Joined: 17 Jun 2004 Posts: 860 Location: 25th floor
|
Posted: 24.09.2005 12:30 Post subject: |
|
|
isprika carre, nisam htio reci da ne treba definirat encoding stranice, nego da taj encoding ne treba biti UTF
Code: | When a client connects, it sends to the server the name of the character set that it wants to use. The server sets the character_set_client, character_set_results, and character_set_connection variables to that character set. |
meni se do sada uvijek php (uspjesno) brinuo za ispravno pohranjivanje hr znakova u bazi, bez obzira koji codepage sam koristio (u zadnje vrijeme primoran sam koristit samo 1250)
utf_general_ci kod mene radi bas kako treba, na cetiri razlicita projekta / i na dev i na live serverima |
_________________ You need more bass. |
|
Back to top |
|
|
bj__
Joined: 09 Nov 2004 Posts: 65 Location: Karlovac
|
Posted: 24.09.2005 13:44 Post subject: |
|
|
drago mi je da tebi radi, ali pazi sljedece.
u bazi (utf8) imam tablicu test (utf8) sa poljem slova (utf8, utf_general_ci) i u njemu imam sljedece recorde:
Id slova
1 aš
2 ađ
3 ač
4 ać
5 až
kad pokrenem query "SELECT * FROM test ORDER BY slova ASC" dobijem sljedece:
Id slova
3 ač
4 ać
1 aš
5 až
2 ađ
sto je naravno, krivo...
kad pokrenem query "SELECT * FROM test ORDER BY slova DESC" dobijem sljedece:
Id slova
2 ađ
5 až
1 aš
3 ač
4 ać
sto ne samo da je opet krivo, nego se razlikuje i od proslog rezultata (zamjenjena su mjesta č i ć...
e sad, ne znam tko je tu lud, kod mene je instaliran WAMP 1.4.4 (najnoviji dostupan)...
edit: query sam pokretao u MySQL Front-u, ali je isti rezultat i preko php-a... |
|
|
Back to top |
|
|
Sulien
Joined: 04 Jan 2004 Posts: 2905 Location: Zagreb
|
Posted: 24.09.2005 13:54 Post subject: |
|
|
utf_general_ci nije croatian_ci (kojeg još nema), hence wrong sort
treba skupit ekipu i napravit naš collation - budući da nitko neće - i objavit ga na nekom sajtu sa uputama kako se ukompajlira u MySQL (multibyte collationi se moraju ukompajlirati)
ali ja nikad nisam kužio developere koji rade frku oko sorta, ne mogu zamislit aplikaciju koja apsolutno krucijalno ovisi o tome da pravilno sorta ač i ać ... osim možda telefonskog imenika |
|
|
Back to top |
|
|
carr
Joined: 13 Nov 2003 Posts: 1397 Location: Karlovac
|
Posted: 24.09.2005 15:36 Post subject: |
|
|
Sulien wrote: | utf_general_ci nije croatian_ci (kojeg još nema), hence wrong sort |
naravno da nije, ali lekke kaze da njemu radi ispravno, onda ispada da smo mi svi kojima ne radi ludi
Sulien wrote: | treba skupit ekipu i napravit naš collation - budući da nitko neće - i objavit ga na nekom sajtu sa uputama kako se ukompajlira u MySQL (multibyte collationi se moraju ukompajlirati) |
i onda nagovorit svog hostera da gu ukompajlira.
Sulien wrote: | ali ja nikad nisam kužio developere koji rade frku oko sorta, ne mogu zamislit aplikaciju koja apsolutno krucijalno ovisi o tome da pravilno sorta ač i ać ... osim možda telefonskog imenika |
ma mislim, nista bas krucijalno ne ovisi uopce o nasim karakterima.
mozes ti pisat posvuda "ingrid anticevic marinovic" i sve ce bit dobro u vecini slucajeva
al je glupo.
a i kretenski ispada, ko da radis u prastarom clipperu jebote pa ti ž dolazi ispred svih slova... |
_________________ Bolje biti malo lud, nego malo pametan. |
|
Back to top |
|
|
|