..

perl 小技巧

  1. 实用函数
# 删除字符串左右空格
sub trim ($) {
    my $s = shift;
    $s =~ s/^\s+|\s+$//g;
    return $s
}
  1. perl 多线程消费 参考文档: https://metacpan.org/pod/Thread::Queue
use threads;
use Thread::Queue;

my $q = Thread::Queue->new();

sub work ($) {
    while(my $task = $q->dequeue()){
        # if $task is undef, it means the queue end
        last unless($task);
        
        # do somthing
    }
}

# enqueue
async {
    foreach(0..10) {
        $q->enqueue($_)
    }
    # Signal that there is no more work to be sent
    $q->end();
}

# create threads
foreach(0..4) {
    threads->create(\&work);
}

# wait all thread finish
foreach(threads->list()) {
    $_->join();
}
  1. 统计 ip 访问,倒序结果
my %hash;
while(<>){
    if(/(\d+\.\d+\.\d+\.\d+)/){
        my $value = $hash{$1} ? $hash{$1} : 0;
        $hash{$1} = $value + 1;
    }
}

my @keys = sort { $hash{$a} <=> $hash{$b} } keys(%hash);
foreach my $key (reverse @keys) {
    printf("%-15s%s\n",$key,$hash{$key});
}
  1. 一些实用的 Perl 内置变量

https://www.runoob.com/perl/perl-special-variables.html

$_	默认输入和模式匹配内容。
$ARG
$.	前一次读的文件句柄的当前行号
$NR
$/	输入记录分隔符,默认是新行字符。如用undef这个变量,将读到文件结尾。
$RS
$,	输出域分隔符
$OFS
$\	输出记录分隔符
$ORS
$"	该变量同 $,类似,但应用于向双引号引起的字符串(或类似的内插字符串)中内插数组和切片值的场合。默认为一个空格。
$LIST_SEPARATOR
$;	在仿真多维数组时使用的分隔符。默认为 "\034"。
$SUBSCRIPT_SEPARATOR
$^L	发送到输出通道的走纸换页符。默认为 "\f".
$FORMAT_FORMFEED
$:	The current set of characters after which a string may be broken to fill continuation fields (starting with ^) in a format. Default is "\n"".
$FORMAT_LINE_BREAK_CHARACTERS
$^A	打印前用于保存格式化数据的变量
$ACCUMULATOR
$#	打印数字时默认的数字输出格式(已废弃)。
$OFMT
$?	返回上一个外部命令的状态
$CHILD_ERROR
$!	这个变量的数字值是errno的值,字符串值是对应的系统错误字符串
$OS_ERROR or $ERRNO
$@	命令eval的错误消息.如果为空,则表示上一次eval命令执行成功
$EVAL_ERROR
$$	运行当前Perl脚本程序的进程号
$PROCESS_ID or $PID
$<	当前进程的实际用户号
$REAL_USER_ID or $UID
$>	当前进程的有效用户号
$EFFECTIVE_USER_ID or $EUID
$(	当前进程的实际组用户号
$REAL_GROUP_ID or $GID
$)	当前进程的有效组用户号
$EFFECTIVE_GROUP_ID or $EGID
$0	包含正在执行的脚本的文件名
$PROGRAM_NAME
$[	数组的数组第一个元素的下标,默认是 0。
$]	Perl的版本号
$PERL_VERSION
$^D	调试标志的值
$DEBUGGING
$^E	在非UNIX环境中的操作系统扩展错误信息
$EXTENDED_OS_ERROR
$^F	最大的文件捆述符数值
$SYSTEM_FD_MAX
$^H	由编译器激活的语法检查状态
$^I	内置控制编辑器的值
$INPLACE_EDIT
$^M	备用内存池的大小
$^O	操作系统名
$OSNAME
$^P	指定当前调试值的内部变量
$PERLDB
$^T	从新世纪开始算起,脚步本以秒计算的开始运行的时间
$BASETIME
$^W	警告开关的当前值
$WARNING
$^X	Perl二进制可执行代码的名字
$EXECUTABLE_NAME
$ARGV	从默认的文件句柄中读取时的当前文件名
全局数组特殊变量
@ARGV	传给脚本的命令行参数列表
@INC	在导入模块时需要搜索的目录列表
@F	命令行的数组输入
全局哈希特殊变量
%INC

散列表%INC包含所有用do或require语句包含的文件.关键字是文件名,值是这个文件的路径
%ENV

包含当前环境变量
%SIG

信号列表及其处理方式
全局特殊文件句柄
ARGV

遍历数组变量@ARGV中的所有文件名的特殊文件句柄
STDERR

标准错误输出句柄
STDIN

标准输入句柄
STDOUT

标准输出句柄
DATA

特殊文件句柄引用了在文件中 __END__ 标志后的任何内容包含脚本内容。或者引用一个包含文件中__DATA__ 标志后的所有内容,只要你在同一个包有读取数据,__DATA__ 就存在。
_ (下划线)

特殊的文件句柄用于缓存文件信息(fstat、stat和lstat)。
全局特殊常量
__END__

脚本的逻辑结束,忽略后面的文本。
__FILE__

当前文件名
__LINE__

当前行号
__PACKAGE__

当前包名,默认的包名是main。
正则表达式特殊变量
$n

包含上次模式匹配的第n个子串
$&

前一次成功模式匹配的字符串
$MATCH

$`

前次匹配成功的子串之前的内容
$PREMATCH

$'

前次匹配成功的子串之后的内容
$POSTMATCH

$+

与上个正则表达式搜索格式匹配的最后一个括号。例如:

/Version: (.*)|Revision: (.*)/ && ($rev = $+);
$LAST_PAREN_MATCH

文件句柄特殊变量
$|

如果设置为零,在每次调用函数write或print后,自动调用函数fflush,将所写内容写回文件
$OUTPUT_AUTOFLUSH

$%

当前输出页号
$FORMAT_PAGE_NUMBER

$=

当前每页长度。默认为 60。
$FORMAT_LINES_PER_PAGE

$-

当前页剩余的行数
$FORMAT_LINES_LEFT

$~

当前报表输出格式的名称。默认值是文件句柄名。
$FORMAT_NAME

$^

当前报表输出表头格式的名称。默认值是带后缀"_TOP"的文件句柄名。
$FORMAT_TOP_NAME