Проект OpenNet: MAN perlcn (1) Команды и прикладные программы пользовательского уровня (FreeBSD и Linux)

Интерактивная система просмотра системных руководств (man-ов)

perlcn (1)

>> perlcn (1) ( Разные man: Команды и прикладные программы пользовательского уровня )

NAME

perlcn - Г╝─Д╫⌠Д╦╜Ф√┤ Perl Ф▄┤Е█≈

DESCRIPTION

Ф╛╒Х©▌Ф²╔Е┬╟ Perl Г └Е╓╘Е°╟!

Д╩▌ 5.8.0 Г┴┬Е╪─Е╖▀, Perl Е┘╥Е╓┤Д╨├Е╝▄Е√└Г └ Unicode (Г╩÷Д╦─Г═│) Ф■╞Ф▐╢, Д╧÷Х©·Е╦╕Ф■╞Ф▐╢Д╨├Х╝╦Е╓ Ф▀┴Д╦│Х╞╜ГЁ╩Д╩╔Е╓√Г └Г╪√Г═│Ф√╧Е╪▐; CJK (Д╦╜Ф≈╔И÷╘) Д╬©Ф≤╞Е┘╤Д╦╜Г └Д╦─И┐╗Д╩╫. Unicode Ф≤╞Е⌡╫И≥┘Ф─╖Г └Ф═┤Е┤├, Х╞∙Е⌡╬Ф╤╣Г⌡√Д╦√Г∙▄Д╦┼Ф┴─Ф°┴Г └Е╜≈Г╛╕: Х╔©Ф√╧Д╦√Г∙▄, Д╦°Ф√╧Д╦√Г∙▄, Д╩╔Е▐┼Д╦╓Х─┘И≈╢Г └Д╦─Е┬┤ (Е╦▄Х┘┼Ф√┤, Е▐≥Е┬╘Д╨ Ф√┤, Д╨ Ф▀┴Д╪╞Ф√┤, Е╦▄Д╪╞Ф²╔Ф√┤, Е█╟Е╨╕Ф√┤, Е█╟Е°╟Е╝┴Ф√┤, Г╜┴Г╜┴). Е╝┐Д╧÷Е╝╧Г╨ЁД╨├Е╓ Г╖█Д╫°Д╦ ГЁ╩Г╩÷Д╦▌Е╧ЁЕ▐╟ (Е╕┌ PC Е▐┼И╨╕И┤▒Е║■).

Perl Ф°╛Х╨╚Д╩╔ Unicode Х©⌡Х║▄Ф⌠█Д╫°. Х©≥Х║╗Г╓╨ Perl Е├┘И┐╗Г └Е╜≈Г╛╕Д╦╡Ф∙╟Ф█╝Е▐╞Г■╗ Unicode Х║╗Г╓╨; Perl Г └Е┤╫Е╪▐Д╦▌Г╝≈Г╛╕ (Д╬▀Е╕┌Ф╜ёХ╖└Х║╗Г╓╨Е╪▐Ф╞■Е╞╧) Д╧÷Х┐╫Е╞╧ Unicode Х©⌡Х║▄Ф⌠█Д╫°. Е°╗Х╬⌠Е┘╔Е▐┼Х╬⌠Е┤╨Ф≈╤, Д╦╨Д╨├Е╓└Г░├Д╩╔ Unicode Д╧▀Е┴█Г └Г╪√Г═│Ф√╧Е╪▐Е╜≤Ф■╬Г └Ф∙╟Ф█╝, Perl Ф▐░Д╬⌡Д╨├ Encode Х©≥Д╦╙Ф╗║Е²≈, Е▐╞Д╩╔Х╝╘Д╫═Х╫╩Ф≤⌠Е°╟Х╞╩Е▐√Е▐┼Е├≥Е┘╔Ф≈╖Ф°┴Г └Г╪√Г═│Ф∙╟Ф█╝.

Encode Е╩╤Д╪╦Ф╗║Е²≈Ф■╞Ф▐╢Д╦▀Е┬≈Г╝─Д╫⌠Д╦╜Ф√┤Г └Г╪√Г═│Ф√╧Е╪▐ ('gb2312' Х║╗Г╓╨ 'euc-cn'):

    euc-cn      Unix Е╩╤Д╪╦Е╜≈Г╛╕И⌡├, Д╧÷Е╟╠Ф≤╞Д©≈Г╖╟Г └Е⌡╫Ф═┤Г═│
    gb2312-raw  Ф°╙Г╩▐Е╓└Г░├Г └ (Д╫▌Ф╞■Г┴╧) GB2312 Е╜≈Г╛╕Х║╗
    gb12345     Ф°╙Г╩▐Е╓└Г░├Г └Д╦╜Е⌡╫Г■╗Г╧│Д╫⌠Д╦╜Ф√┤Г╪√Г═│
    iso-ir-165  GB2312 + GB6345 + GB8565 + Ф√╟Е╒·Е╜≈Г╛╕
    cp936       Е╜≈Г═│И║╣ 936, Д╧÷Е▐╞Д╩╔Г■╗ 'GBK' (Ф┴╘Е┘┘Е⌡╫Ф═┤Г═│) Ф▄┤Ф≤▌
    hz          7 Ф╞■Г┴╧И─╦Е┤╨Е╪▐ GB2312 Г╪√Г═│

Д╦╬Д╬▀Ф²╔Х╞╢, Е╟├ EUC-CN Г╪√Г═│Г └Ф║ёФ║┬Х╫╛Ф┬░ Unicode, Г╔≈И°─И■╝Е┘╔Д╦▀Е┬≈Ф▄┤Д╩╓:

    perl -Mencoding=euc-cn,STDOUT,utf8 -pe1 < file.euc-cn > file.utf8

Perl Д╧÷Е├┘И≥└Д╨├ ``piconv'', Д╦─Ф■╞Е╝▄Е┘╗Д╩╔ Perl Е├≥Ф┬░Г └Е╜≈Г╛╕Х╫╛Ф█╒Е╥╔Е┘╥Г╗▀Е╨▐, Г■╗ФЁ∙Е╕┌Д╦▀:

    piconv -f euc-cn -t utf8 < file.euc-cn > file.utf8
    piconv -f utf8 -t euc-cn < file.utf8 > file.euc-cn

Е▐╕Е╓√, Е┬╘Г■╗ encoding Ф╗║Е²≈, Д╫═Е▐╞Д╩╔Х╫╩Ф≤⌠Е├≥Е┤╨Д╩╔Е╜≈Г╛╕Д╦╨Е█∙Д╫█Г └Г╗▀Е╨▐Г═│, Е╕┌Д╦▀Ф┴─Г╓╨:

    #!/usr/bin/env perl
    # Е░╞Е┼╗ euc-cn Е╜≈Д╦╡Х╖ёФ·░; Ф═┤Е┤├Х╬⌠Е┤╨Е┘╔Е▐┼Ф═┤Е┤├И■≥Х╞╞И┐╫Х╝╬Д╦╨ euc-cn Г╪√Г═│
    use encoding 'euc-cn', STDIN => 'euc-cn', STDOUT => 'euc-cn';
    print length("И╙├И╘╪");          #  2 (Е▐▄Е╪∙Е▐╥Х║╗Г╓╨Е╜≈Г╛╕)
    print length('И╙├И╘╪');          #  4 (Е█∙Е╪∙Е▐╥Х║╗Г╓╨Е╜≈Х┼┌)
    print index("Х╟├Х╟├Ф∙≥Х╞╡", "Х⌡■Е■╓"); # -1 (Д╦█Е▄┘Е░╚Ф╜╓Е╜░Е╜≈Г╛╕Д╦╡)
    print index('Х╟├Х╟├Ф∙≥Х╞╡', 'Х⌡■Е■╓'); #  1 (Д╩▌Г╛╛Д╨▄Д╦╙Е╜≈Х┼┌Е╪─Е╖▀)

Е°╗Ф°─Е░▌Д╦─Е┬≈Д╬▀Е╜░И┤▄, ``Х╟├'' Г └Г╛╛Д╨▄Д╦╙Е╜≈Х┼┌Д╦▌ ``Х╟├'' Г └Г╛╛Д╦─Д╦╙Е╜≈Х┼┌Г╩⌠Е░┬Ф┬░ EUC-CN Г═│Г └ ``Х⌡■''; ``Х╟├'' Г └Г╛╛Д╨▄Д╦╙Е╜≈Х┼┌Е┬≥Д╦▌ ``Ф∙≥'' Г └Г╛╛Д╦─Д╦╙Е╜≈Х┼┌Г╩⌠Е░┬Ф┬░ ``Е■╓''. Х©≥Х╖ёЕ├ЁД╨├Д╩╔Е┴█ EUC-CN Г═│Ф╞■Е╞╧Е╓└Г░├Д╦┼Е╦╦Х╖│Г └И≈╝И╒≤.

И╒²Е╓√Г └Д╦╜Ф√┤Г╪√Г═│

Е╕┌Ф·°И°─Х╕│Ф⌡╢Е╓ Г └Д╦╜Ф√┤Г╪√Г═│, Е▐╞Д╩╔Д╩▌ CPAN (<http://www.cpan.org/>) Д╦▀Х╫╫ Encode::HanExtra Ф╗║Е²≈. Е╝┐Г⌡╝Е┴█Ф▐░Д╬⌡Д╦▀Е┬≈Г╪√Г═│Ф√╧Е╪▐:

    gb18030     Ф┴╘Е┘┘Х©┤Г └Е⌡╫Ф═┤Г═│, Е▄┘Е░╚Г╧│Д╫⌠Д╦╜Ф√┤

Е▐╕Е╓√, Encode::HanConvert Ф╗║Е²≈Е┬≥Ф▐░Д╬⌡Д╨├Г╝─Г╧│Х╫╛Ф█╒Г■╗Г └Д╦╓Г╖█Г╪√Г═│:

    big5-simp   Big5 Г╧│Д╫⌠Д╦╜Ф√┤Д╦▌ Unicode Г╝─Д╫⌠Д╦╜Ф√┤Д╨▓Х╫╛
    gbk-trad    GBK Г╝─Д╫⌠Д╦╜Ф√┤Д╦▌ Unicode Г╧│Д╫⌠Д╦╜Ф√┤Д╨▓Х╫╛

Х▀╔Ф┐ЁЕ°╗ GBK Д╦▌ Big5 Д╧▀И≈╢Д╨▓Х╫╛, Х╞╥Е▐┌Х─┐Х╞╔Ф╗║Е²≈Е├┘И≥└Г └ b2g.pl Д╦▌ g2b.pl Д╦╓Ф■╞Г╗▀Е╨▐, Ф┬√Е°╗Г╗▀Е╨▐Е├┘Д╫©Г■╗Д╦▀Е┬≈Е├≥ФЁ∙:

    use Encode::HanConvert;
    $euc_cn = big5_to_gb($big5); # Д╩▌ Big5 Х╫╛Д╦╨ GBK
    $big5 = gb_to_big5($euc_cn); # Д╩▌ GBK Х╫╛Д╦╨ Big5

Х©⌡Д╦─Ф╜╔Г └Д©║Ф│╞

Х╞╥Е▐┌Х─┐ Perl Е├┘И≥└Г └Е╓╖И┤▐Х╞╢Ф≤▌Ф√┤Д╩╤ (Д╦█Е╧╦Е┘╗Ф≤╞Г■╗Х▀╠Ф√┤Е├≥Г └), Ф²╔Е╜╕Д╧═Ф⌡╢Е╓ Е┘ЁД╨▌ Perl Г └Г÷╔Х╞├, Д╩╔Е▐┼ Unicode Г └Д╫©Г■╗Ф√╧Е╪▐. Д╦█Х©┤, Е╓√И┐╗Г └Х╣└Ф╨░Г⌡╦Е╫⌠Д╦╟Е╞▄:

Ф▐░Д╬⌡ Perl Х╣└Ф╨░Г └Г╫▒Е²─

<http://www.perl.com/>: Perl Г └И╕√И║╣ (Г■╠Ф╛╖Х▌╠Г╓╪Е┘╛Е▐╦Г╩╢Ф┼╓)
<http://www.cpan.org/>: Perl Г╩╪Е░┬Е┘╦Х≈▐Г╫▒ (Comprehensive Perl Archive Network)
<http://lists.perl.org/>: Perl И┌╝И─▓Х╝╨Е²⌡Д╦─Х╖┬

Е╜╕Д╧═ Perl Г └Г╫▒Е²─

<http://www.oreilly.com.cn/html/perl.html>: Г╝─Д╫⌠Д╦╜Ф√┤Г┴┬Г └Ф╛╖Х▌╠Г╓╪ Perl Д╧╕Х≈┴

Perl Д╫©Г■╗Х─┘И⌡├Д╪

Unicode Г⌡╦Е┘ЁГ╫▒Е²─

<http://www.unicode.org/>: Unicode Е╜╕Ф°╞Е╜╕Д╪ (Unicode Ф═┤Е┤├Г └Е┬╤Е╝ Х─┘)
<http://www.cl.cam.ac.uk/%7Emgk25/unicode.html>: Unix/Linux Д╦┼Г └ UTF-8 Е▐┼ Unicode Г╜■Е╝╒И≈╝