broadway12 napisał:Witajcie,
przeszukalem forum, ale nie znalazlem odpowiedzi... pare wskazowek tak, ale problem nadal jest nierozwiazany.
Cześć. No coś słabo szukałeś, bo o konwersji systemów kodowania znaków pisałem wielokrotnie, np.
TUTAJ. Ale cóż, nie znalazłeś, bo nie wpisałeś wyrażenia "
konwersja" w pole "
szukaj". Więc pomogę Ci, ale następnym razem staraj się szukać dokładniej.
broadway12 napisał:Probowalem skonwertowac plik polish.php do utf-8, ale nie przynioslo to efektu. Krzaczki byly zastepowane przez troche inne krzaczki
Program do konwersji (Edit pad pro) twierdzi, ze plik polish.php jest kodowany (original encoding) w Windows 1252: Western European. 
Żeby przekonwertować z
ISO-8859-2 na
UTF-8 należy najpierw dokonać konwersji tekstu z
ISO-8859-2 na
Windows-1250.
Windows-1250 jest to strona kodowa której używasz na co dzień np. w
Notatniku systemowym,
Wordzie, czy chociażby wprowadzając tekst z klawiatury do postu na
Forum. Czyli z polskimi znakami diakrytycznymi, jak chociażby "
Ś, ś, ą, ź" i.t.d.
- Bo musisz wiedzieć, że ISO-8859-2 jest kojarzone ze standardem polskich znaków, ale tak w rzeczywistości to wszystkie litery z ogonkami zastąpione są innymi znakami, które mają z językiem polskim tyle wspólnego, co nic. Dopiero przeglądarka internetowa rozkodowuje tekst, i przedstawia go już z polskimi ogonkami. Dlatego nazywa się to "SYSTEM KODOWANIA ZNAKÓW". Rozumiesz?.
- ISO-8859-2 czy też UTF-8 są to systemy kodowania, które zamieniają polskie ogonki ( w przypadku ISO-8859-2 ) i również polskie nietypowe znaki, jak np. "ł, ż" ( w przypadku UTF-8 ) na ich odpowiedniki zakodowane ( po prostu zamienione ) w określonym w w/w systemach kodowania. I zamiast literki ą będziesz miał znak ±

Trochę teorii a teraz do konkretów:
- Do przekodowywania pomiędzy systemami kodowania znaków używaj jedynego, sprawdzonego programu o nazwie Gżegżółka XP. Gżegżółka to konwerter standardów kodowania polskich znaków diakrytycznych (zwanych potocznie ogonkami). Oprócz ogonków obsługuje również większość standardów kodowania stosowanych na całym świecie.
- Jak robić konwersje?. Po prostu wystarczy otworzyć np. taki plik "polish.php" za pomocą drugiego, jedynego i sprawdzonego programu ( a co, jak za komuny
) jakim jest Notatnik SP PL. Ja w tym edytorze przetłumaczyłem wiele plików jak i też edytuję kod PHP lub HTML. Nie znam lepszego. ( oczywiście to tylko moja opinia, nie zawsze jedyna i słuszna
).
- Po otwarciu pliku z kodowaniem znaków ISO-8859-2, wystarczy zaznaczyć w menu "Konwersja" => kodowanie Windows-1250". I już zamiast dziwnych znaków będziesz miał polskie literki. A musisz to zrobić dlatego, aby Gżegżółka XP poprawnie rozpoznał źródło, i system znaków jakie ma przekonwertować.
- Po tej operacji ( zawsze rób kopie oryginalnych plików ) uruchamiasz program Gżegżółka XP i pojawi Ci się jego okienko. Wrzucasz do niego metodą "przeciągnij - upuść" plik "polish.php", ale oczywiście ten w zestawie znaków Windows-1250. Na dole masz 2 pola typu "lista", rozwijalne. W lewym polu wybierasz zestaw znaków "Windows 1250(Europa Środkowa)", natomiast w prawym polu, który jest docelowym, wybierasz interesujący Cię zastaw znaków, czyli "Unicode UTF-8". Naciskasz tylko "Start". Potwierdzasz, że chcesz dokonać konwersji, i w miejscu pliku "polish.php" zakodowanym w standardzie Windows 1250 pojawi się "polish.php" w kodowaniu UTF-8. Program automatycznie wykonuje kopię oryginalnego pliku "polish.php". I po wszystkim.

Proste?. No pewnie teraz tak. Jako że rzeczywiście istnieje brak pliku językowego do
Forum FireBoard, poniżej możesz pobrać wersję w
UTF-8. Jest ona oparta na oryginalnym pliku "
polish.php" z
FireBoard w wersji
1.0.1b pobranego z
Joomla.pl. Jeśli chodzi o poprawne kodowanie w panelu administratora, to już musiałbym przygotować wersję
UTF-8 ale z całym
Forum FireBoard. A na razie nie mam na to czasu. Możesz sam sprobować, stosując powyższą metodę konwersji.

To tyle. A co do Twojego programu, "
Edit pad pro", to sam widzisz, że "kłamie", bo
Windows-1252 jest stosowane w systemach
Microsoft Windows z angielskojęzycznymi, bądź zachodnioeuropejskimi ustawieniami językowymi. I nie ma nic wspólnego z
ISO-8859-2.

Odpisz, że działa poprawnie. Powinien, bo piszesz że witryna jest kodowana w
UTF-8 ( dobry zestaw znaków, ale sam widzisz ile jest z nim problemów ). Musisz pamiętać, że po przekodowaniu pliku "
polish.php" z
ISO-8859-2 na
UTF-8, w zawsze słusznym
Notatniku SP PL nie zobaczysz polskich znaków, tylko bardzo dziwne "
krzaczki", które to w/w edytor nie potrafi wyświetlić. Zresztą jak i wiele innych edytorów. Sprawdź poprawność kodowania w
Notatniku systemowym. Tam powinieneś mieć polskie znaki. Jeśli są, oznacza to, że konwersja udała się

.
Notatnik systemowy obsługuje kodowanie
UNICODE. Szkoda że nie mają tej cechy edytory, chociażby dostępne na mojej stronie. Czekam i pozdrawiam.
Jokris.