.TH KONWERT 1 "30 Jul 1998" "Konwert" "Podręcznik użytkownika Linuxa" .SH NAZWA konwert \- interfejs do różnych konwersji kodowań znaków .SH UŻYCIE .B konwert .I FILTR .RI [ PLIK ].\|.\|.\| .RB [ \-o .I WYNIK | .BR \-O ] .SH OPIS Konwert pozwala filtrować wiele plików przez wiele filtrów. Filtruje podane .IR PLIKI , albo stdin jeśli żadnych nie określono. .PP Prosty .I FILTR jest nazwą pliku wykonywalnego z katalogu .I ~/.konwert/filters albo z ogólnosystemowego, normalnie .IR /usr/share/konwert/filters . Taki program sam filtruje stdin na stdout. .PP Reguła filtrowania może być bradziej skomplikowana: .PP .B konwert .IB FILTR1 + FILTR2 znaczy .B konwert .I FILTR1 | .B konwert .IR FILTR2 . .PP .B konwert .IB FORMAT1 \- FORMAT2\fR, o ile taki filtr nie istnieje, próbuje znaleźć wspólny .IR FORMAT3 , taki że oba filtry .IB FORMAT1 \- FORMAT3 i .IB FORMAT3 \- FORMAT1 istnieją. .PP .B konwert .IB FILTR / ARG /\fR.\|.\|.\| przekazuje filtrowi argumenty. Argumenty mogą być też podane tutaj: .IB FORMAT1 / ARG \- FORMAT2\fR. Znaczenie arguentów zależy od konkretnego filtru. .PP .B konwert .BI '( "KOMENDA ARG\fR.\|.\|.\|" )' wykonuje dane polecenie powłoki. Jest to przydatne z opcjami .B \-o albo .BR \-O . Komenda nie może zawierać łańcucha .BR )+ , który zakończy specyfikację tego filtru. .SS OPCJE .TP 10 \fB\-o\fP \fIWYNIK\fP wyjście idzie do tego pliku/katalogu zamiast na stdout .TP .B \-O każdy plik źródłowy jest zastępowany swoim tłumaczeniem .TP .B \-\-help wyświetla opis i wychodzi .TP .B \-\-version wyświetla informację o wersji i wychodzi .PP Przekierowanie wyjścia do jednego z plików źródłowych przez .B \-o albo .B > zamiast .B \-O zniszczy ten plik! Opcja .B \-O tworzy tymczasowy plik w .I /tmp i później kopiuje go z powrotem na źródło. .SH KONWERSJE KODOWAŃ ZNAKÓW Można konwertować tekst między dowolnymi dwoma zestawami znaków, na przykład .B konwert .BR cp437\-iso2 . .PP Znaki niedostępne w docelowym zestawie będą zastąpione przybliżeniami dostępnymi znakami. Przybliżenia nie muszą być pojedynczymi znakami. .PP Filtry obsługują teraz następujące zestawy znaków: .TP .B ascii siedmiobitowe ASCII .TP 16 .B utf8\fR = \fPunicode Unikod (Unicode) w UTF-8 .TP 7 .PD 0 .B iso1\fR = \fPisolatin1 ISO-8859-1 albo ISO Latin 1 (zachodnioeuropejskie) .TP .B iso2\fR = \fPisolatin2 ISO-8859-2 albo ISO Latin 2 (środkowoeuropejskie) .TP .B iso3\fR = \fPisolatin3 ISO-8859-3 albo ISO Latin 3 (Esperanto) .TP .B iso4\fR = \fPisolatin4 ISO-8859-4 albo ISO Latin 4 (bałtyckie) .TP .B iso5\fR = \fPisolatincyr ISO-8859-5 (cyrylica) .TP .B iso6\fR = \fPisolatinarabic ISO-8859-6 (arabskie) .TP .B iso7\fR = \fPisolatingreek ISO-8859-7 (greckie) .TP .B iso8\fR = \fPisolatinhebrew ISO-8859-8 (hebrajskie) .TP .B iso9\fR = \fPisolatin5\fR = \fPisolatintur ISO-8859-9 albo ISO Latin 5 (tureckie) .TP .B iso10\fR = \fPisolatin6\fR = \fPisolatinnordic ISO-8859-10 albo ISO Latin 6 (nordyckie) .TP .B iso12\fR = \fPisolatin7\fR = \fPisolatinceltic ISO-8859-12 albo ISO Latin 6 (celtyckie) - Draft .TP .B iso13\fR = \fPisolatin8\fR = \fPisolatinbaltic ISO-8859-13 albo ISO Latin 6 (bałtyckie) - Draft .TP .B iso14\fR = \fPisolatin9\fR = \fPisolatinsami ISO-8859-14 albo ISO Latin 6 (Sámi) - Draft .TP .B iso15 ISO-8859-15 - Draft .PD .TP 9 .PD 0 .B koi8r KOI8-R (rosyjskie) .TP .B koi8u KOI8-U (ukraińskie, białoruskie) .TP .B koi8uni KOI8-Uni (cyrylica) .PD .TP 30 .PD 0 .B cp1250\fR = \fPwince\fR = \fPwinlatin2 Windows CP-1250 albo Win Latin 2 (środkowoeuropejskie) .TP .B cp1251\fR = \fPwincyr Windows CP-1251 (cyrylica) .TP .B cp1252\fR = \fPwinwest\fR = \fPwinlatin1 Windows CP-1252 albo Win Latin 1 (zachodnioeuropejskie) .TP .B cp1253\fR = \fPwingr Windows CP-1253 (greckie) .TP .B cp1254\fR = \fPwintur Windows CP-1254 (tureckie) .TP .B cp1255\fR = \fPwinhebrew Windows CP-1255 (hebrajskie) .TP .B cp1256\fR = \fPwinarabic Windows CP-1256 (arabskie) .TP .B cp1257\fR = \fPwinbaltic Windows CP-1257 (bałtytckie) .TP .B cp1258\fR = \fPwinviet Windows CP-1258 (wietnamskie) .PD .TP 29 .PD 0 .B cp437\fR = \fPicmeng DOS CP-437 (angielskie) .TP .B cp737\fR = \fPdosgreek DOS CP-737 (greckie) .TP .B cp775\fR = \fPdosbaltic DOS CP-775 (bałtyckie) .TP .B cp850\fR = \fPdoswest\fR = \fPdoslatin1 DOS CP-850 aka DOS Latin 1 (zachodnioeuropejskie) .TP .B cp852\fR = \fPdosce\fR = \fPdoslatin2 DOS CP-852 aka DOS Latin 2 (środkowoeuropejskie) .TP .B cp855\fR = \fPdoscyr DOS CP-855 (cyrylica) .TP .B cp857\fR = \fPdostur DOS CP-857 (tureckie) .TP .B cp860\fR = \fPdosportugal DOS CP-860 (portugalskie) .TP .B cp861\fR = \fPdosiceland DOS CP-861 (islandzkie) .TP .B cp862\fR = \fPdoshebrew DOS CP-862 (hebrajskie) .TP .B cp863\fR = \fPdoscanadfr DOS CP-863 (kanadyjskie - francuskie) .TP .B cp864\fR = \fPdosarabic DOS CP-864 (arabskie) .TP .B cp865\fR = \fPdosnordic DOS CP-865 (nordyckie) .TP .B cp866\fR = \fPdosrussian DOS CP-866 (rosyjskie) .TP .B cp869\fR = \fPdosgreek2 DOS CP-869 (greckie 2) .TP .B cp874\fR = \fPdosthai DOS CP-874 (tajskie) .PD .TP 12 .PD 0 .B mac Macintosh Roman (zachodnioeuropejskie) .TP .B macce Macintosh Central European (wschodnioeuropejskie) .TP .B maccyr Macintosh Cyrillic (cyrylica) .TP .B macgreek Macintosh Greek (greckie) .TP .B maciceland Macintosh Icelandic (islandzkie) .TP .B mactur Macintosh Turkish (tureckie) .PD .TP 13 .PD 0 .BR csk , .TP .BR cyfromat , .TP .BR dhn , .TP .BR fidomazovia , .TP .BR iea , .TP .BR logic , .TP .BR mazovia , .TP .B microvex DOSowe zestawy znaków do polskiego .PD .TP .PD 0 .BR amigapl , .TP .BR fat , .TP 9 .B xjp Amigowe zestawy znaków do polskiego .PD .TP 11 .B kamenicky DOSowy zestaw znaków do czeskiego i sĽowackiego .TP 10 .B wingreek WinGreek (kodowanie dla starożytnej greki według windowsowego fontu) .TP 9 .PD 0 .B babelpl TeX [polish]{babel}: .I \&"a"c"e"l"n"o"s"z"r .TP .B ciachy TeX \\prefixing: .I /a/c/e/l/n/o/s/x/z .PD .TP 15 .PD 0 .B xmetodo Esperanto: .I cx gx hx jx sx ux .RI ( vx\ w ) .TP .B hmetodo Esperanto: .I ch gh hh jh sh u .TP .B antauxcxap Esperanto: .I ^c ^g ^h ^j ^s ^u .RI ( ~u ) .TP .B postcxap Esperanto: .I c^ g^ h^ j^ s^ u^ .RI ( u~ ) .TP .B apostrofoj Esperanto: .I c' g' h' j' s' u' .TP .B malapostrofoj Esperanto: .I c` g` h` j` s` u` .PD .TP .PD 0 .TP 8 .B viscii VISCII (wietnamski) .TP .B viqri Vietnamese Quoted Readable Implicit .PD .TP 9 .PD 0 .B htmldec SGMLowe/HTMLowe numery znaków (dziesiątkowo): .I Æ ě → .TP .B htmlhex SGMLowe/HTMLowe numery znaków (szesnastkowo) .I Æ ě → .TP .B htmlent SGMLowe/HTMLowe encje (nazwy znaków): .I Æ &ecaron → .TP .B html Wszystkie trzy powyżej (tylko jako format wejściowy) .PD .TP 7 .B tex TeX wraz z niektórymi rozszerzeniami LaTeXa albo AMS-TeXa. Nie ma rozróżnienia między normalnym trybem a matematycznym - prawdopodobbie będziesz musiał ręcznie podostawiać trochę znaków .IR $ . .TP 11 .PD 0 .B mnemonic Mnemoniki RFC 1345 poprzedzone przez .I & .TP .B mnemonic1 Mnemoniki RFC 1345 poprzedzone przez .I ` .PD .TP 7 \fBany/\fIJĘZYK\fR (np. \fBany/pl-iso2\fP) Ten specjalny format wejściowy rozpozna kodowanie automatycznie, na podstawie częstości znaków znalezionych w tekście. Z każdym językiem jest skojarzony zbiór możliwych kodowań używanych dla niego i średnie częstości jego liter (wyłączając litery ASCII). Użyte zostanie najlepiej pasujące kodowanie. Filtr obsługuje teraz języki .B cs (czeski), .B de (niemiecki), .B el (grecki), .B eo (Esperanto), .B es (hiszpański), .B fr (francuski), .B he (hebrajski), .B it (włoski), .B pl (polski), .B pt (portugalski), .B ru (rosyjski) i .B sv (szwedzki). .PD .TP 7 .B varpl Wymieszane polskie ISO-8859-2, CP-1250 i UTF-8. W polskich warunkach sugeruję podpięcie tego jako filtr w czytniku newsów (dla szybkości lepiej wołać bezpośrednio, a nie przez konwerta). .TP .B vareo Wymieszane różne kodowania Esperanta. .SH OPCJE KONTROLUJĄCE POWYŻSZE KONWERSJE .TP \fB/1\fP (np. \fBkonwert iso2-ascii/1\fP) Każdy niedostępny znak będzie zastąpiony przez pojedynczy przybliżający znak, a nie przez napis. Przydatne dla programu filterm albo dla preformatowanego tekstu. Ta opcja jest automatycznie włączana jeśli filtr jest używany jako wyjście filterma. .TP .B /html Zakłada, że tekst jest HTMLem. Znaki .I \&" & < > wynikłe z przybliżeń innych znaków będą prawidłowo wyeskejpowane do .I " & < .IR > . Nagłówek .I będzie poprawiony jeśli wystąpi. .TP .B /htmldec Konwertuje META jak wyżej. Niedostępne znaki będą zakodowane w &#Unikodzie;. .TP .B /htmlhex Konwertuje META jak wyżej. Niedostępne znaki będą zakodowane w szesnastkowym &#xUnikodzie;. .TP .B /tex Niedostępne znaki będą opisane w TeXu. Znaki .I # $ % & \\\\ ^ _ { | } ~ wynikłe z przybliżeń niektórych znaków będą prawidłowo wyeskejpowane do .I \\\\# \\\\$ \\\\% \\\\& $\\\\backslash$ \\\\^{} \\\\_ \\\\{ $|$ \\\\} .IR \\\\\\\\~{} . .TP .B /asciichar Rozpoznaje niektóre reprezentacje znaków w ASCII, np.\| .I (c) .\|.\|.\| 1/2 .IR >= . .TP .B /rosyjski Rosyjski tekst będzie oddany w polskiej transkrypcji fonetycznej. .PP Niektóre filtry wyjściowe mogą użyć informacji o języku do lepszego przybliżenia niedostępnych liter, np. w .B /de (niemieckim): .I \(:a \(-> .I ae zamiast .IR a . .SH INNE FILTRY .TP .B any/\fIJĘZYK\fP-test Rozpoznaje kodowanie, ale zamiast konwersji tekstu pokazuje tylko nazwę kodowania. Dodatkowa opcja .B /all pokazuje wszystkie możliwe kodowania, posortowane od lepszych do gorszych. .TP .PD 0 .B cr .TP .B lf .TP .B crlf .PD Wymusza określoną konwencję oznaczenia końców linii. .B cr = Macintosh, .B lf = Unix i Amiga, .B crlf = Windows i DOS. Konwencja wejściowa jest rozpoznawana automatycznie. .TP .B expand Rozwija tabulacje na spacje (używa programu expand z textutils). .TP .B unexpand Kompresuje spacje na początku linii do tabulacji (używa programu unexpand z textutils). .TP .B rmspacesateol Usuwa spacje i tabulacje z końców linii. .TP .PD 0 .B qp-8bit .TP .B 8bit-qp .PD Kodowanie MIME Quoted Printable: .IR =A3=F3d=BC . .TP .PD 0 .B rtf-8bit .TP .B 8bit-rtf .PD Rich Text Format: .IR \\\\\\\\'a3\\\\\\\\'f3d\\\\\\\\'9f . .TP .B txt-htmlchar Eskejpuje .I \&" & < > w SGMLowe/HTMLowe encje .I " & < .IR > . Wygodne do włączania pliku tekstowego w HTMLowych tagach
 
. .TP .B htmlchar-txt W drugą stronę. .TP .B rot13 Gb wrfg qrzbafgenpwn ebg13. .TP .PD 0 .B toupper .TP .B tolower .PD Zamienia tekst na duże / małe litery. Na razie tylko ASCII. .TP .B prn7pl Konwertuje polskie znaki na sekwencje sterujęce drukarki zgodnej z EPSON wykorzystując jedynie podstawowe znaki 7-bitowe, cofając głowicę drukarki i drukując na odpowiedniej wysokości ,.'` dające w sumie pseudo- polskie znaki. Przyjmuje opcje: .B /nlq (domyślne) optymalizowane do drukarek o lepszej rozdzielczości i .B /draft - np. dla trybu draft 9-igłówki. .SH PLIKI .TP .PD 0 .I /usr/share/konwert/filters/* .TP .I ~/.konwert/filters/* .PD .SH "ZOBACZ TEŻ" .BR trs (1), .BR filterm (1) .SH BŁĘDY Znak APPLE i zestawach mac* oraz znaki CH i ch w koi8cs nie są zachowywane przy konwersji nawet kiedy są dostępne. Również nie przestrzegają opcji /1. Powód: nie ma ich w Unikodzie. .SH COPYRIGHT Konwert jest pakietem służącym do konwersji między różnymi kodowaniami znaków. .PP Copyright (c) 1998 Marcin 'Qrczak' Kowalczyk .PP Niniejszy program jest oprogramowaniem wolnodostępnym; możesz go rozprowadzać dalej i/lub modyfikować na warunkach Powszechnej Licencji Publicznej GNU, wydanej przez Fundację Wolnodostępnego Oprogramowania - według wersji 2-giej tej Licencji lub którejś z późniejszych wersji. .PP Niniejszy program rozpowszechniany jest z nadzieją, iż będzie on użyteczny - jednak BEZ JAKIEJKOLWIEK GWARANCJI, nawet domyślnej gwarancji PRZYDATNOŚCI HANDLOWEJ albo PRZYDATNOŚCI DO OKREŚLONYCH ZASTOSOWAŃ. W celu uzyskania bliższych informacji - Powszechna Licencja Publiczna GNU. .PP Z pewnością wraz z niniejszym programem otrzymałeś też egzemplarz Powszechnej Licencji Publicznej GNU; jeśli nie - napisz do Free Software Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA 02111-1307 USA .SH AUTOR .ft CW .nf __("< Marcin Kowalczyk * qrczak@knm.org.pl http://qrczak.home.ml.org/ \\__/ GCS/M d- s+:-- a21 C+++>+++$ UL++>++++$ P+++ L++>++++$ E->++ ^^ W++ N+++ o? K? w(---) O? M- V? PS-- PE++ Y? PGP->+ t QRCZAK 5? X- R tv-- b+>++ DI D- G+ e>++++ h! r--%>++ y- .fi .ft R