表示日期的方式多種多樣:
“18 Jan 1973″ ,”18/01/1973″ ,”01/18/1973″ ,”Jan 18 1973″ ,”18-01-73″ ,”18-01-1973″ ,”01/73″,其中一些格式含義不清(如”01-06-1973″是表示6月1日呢,還是表示1月6日呢?) 如果不規定日期的表示形式,是很難處理的。
想了解”18 Jan 1973″和”6 Sep 1950″之間的區別,需要把它們轉換為數字表示。Unix 內部使用紀元秒表示時間。日期和時間加起來表示之自格林威志時間1970年1月1日午夜時分(紀元)到當前時刻之間的秒數。”18 Jan 1973″ (假定為午夜時分) 的紀元秒為96163200。在該系統中,午夜表示一天的開始時刻。
讓我們生成一個日期通過Perl中提供的gmtime函數,你可以自己來驗證這點。給定一個用以表示自從紀元以來的秒數的整數,通過gmtime函數可以計算出代表相應的日期和時刻,例如:
perl -le ‘print scalar gmtime 96163200′
Thu Jan 18 00:00:00 1973
調用 gmtime() 函數,你會得到一系列值的列表,包括時,分,秒, 日期,月份,年份等等。
perl -le ‘print join(”,”, gmtime 96163200)’
0,0,0,18,0,73,4,17,0
前面3個0分別表示秒,分,時。小時是從0-23,故下午是12時往後。第4個數表示該月中的天數(本例中為18號)。第5個數表示月份,從0開始(代表1月份)。之所以從0開始,是因為月份對應著月份數組的下標:
@months = qw(Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec); $month = (gmtime 96163200)[4]; # “Jan”
年份 (本例中為73)的表示有點特殊。它並不是年份的最後兩位數字。它表示從1900年開始的年份。為什麼要這樣表示呢?這是因為 C語言就是這樣處理的。Perl試圖使得其庫和系統調用盡量接近操作系統的處理方式。
所以,如果你想輸出4位數的年份,表示如下:
$year = (gmtime 96163200)[5] + 1900;
如果你不了解這種處理方式,就會制造出Y2K問題,你也許會這樣寫:
$year = “19″ . (gmtime 96163200)[5];
# 出錯! 2000年將變為19100
對於gmtime()函數的返回值還沒有介紹完,還有4, 17, 和 0這3個數。它們分別表示一星期中的第幾天 (星期日為0),一年中的第幾天(0 表示一年中的第一天), 以及是否采用夏時制(表示不采用,正數表示采用,負數表示不可知)。
Perl中的time() 函數返回以紀元秒形式表示的當前日期和時間。如果你打算把它轉換為字符串,就可使用gmtime() 和localtime() 函數:
$now = localtime(time());
($sec, $min, $hour, $day, $mon, $year, $wday, $yday, $isdst) = localtime(time());
如果調用 localtime() 或gmtime() 時不帶參數,它將自己調用time()
$now = localtime();
($sec, $min, $hour, $day, $mon, $year, $wday, $yday, $isdst) = localtime();
常見的日期和時間操作
如果你打算計算兩個時刻之間的時間段,只需將它們轉換為相應的紀元秒,然後兩數相減即可:
$difference_in_seconds = $later_datetime -$earlIEr_datetime;
要把秒轉換為分,時,或天數,只需要分別將它們除以60, 3600 和 86400 即可:
$difference_in_minutes = $difference_in_seconds / 60;
$difference_in_hours = $difference_in_seconds / 3600;
$difference_in_day = $difference_in_seconds / 86400;
反過來做,你也可以回答如下問題:”4天後是幾號?”:
$then = time() + 86400 * 4;
print scalar localtime $then;
它給出的答案精確到秒。例如,如果4天後的紀元秒值為932836935, 你可以輸出日期的字符串如下;
Sat Jul 24 11:23:17 1999
如果你打算輸出那個日期的午夜時分 (如”Sat Jul 24 00:00:00 1999″) 使用如下模塊:$then = $then - $then % 86400; # 去掉那個日期的尾巴
類似地,你可以用四捨五入法,輸出最靠近午夜時分的日期:
$then += 43200; # add on half a day
$then = $then - $then % 86400;# truncate to the day
如果你的時區距離GMT為相差偶數個小時,這就管用了。並不是所有的時區都是很容易處理的。你所真正需要的是在你自己的時區內計算紀元秒,而不是在GMT中計算。
Perl 中的名為Time::Local的模塊,可以提供兩個函數 timelocal() 和timegm()。其返回值同 localtime() 和gmtime() 一樣。
use Time::Local;
$then = time() + 4*86400;
$then = timegm localtime $then;
# local epoch seconds
$then -= $then % 86400;
# truncate to the day
$then = timelocal gmtime $then;
# back to gmt epoch seconds
print scalar localtime $then, “\n”;
日常生活所用的日期和時間的表示
你已經級掌握了時,分,年等值的含義,也了解了紀元秒的含義。而日常生活中的日期和時間是用字符串來表示的,你怎樣才能把日常所用的日期和時間串格式轉換成紀元秒呢?
方法之一是寫出語法分析小程序,該方法靈活而快速:
use Time::Local;
@months{qw(Jan Feb Mar Apr May Jun
Jul Aug Sep Oct Nov Dec)} = (0..11);
$_ = “19 Dec 1997 15:30:02″;
/(\d\d)\s+(\w+)\s+(\d+)\s+(\d+):(\d+):(\d+)/
or dIE “Not a date”;
$mday = $1;
$mon = exists($months{$2}) ? $months{$2} : dIE “Bad month”;
$year = $3 - 1900;
($h, $m, $s) = ($4, $5, $6);
$epoch_seconds = timelocal($s,$m,$h,$mday,$mon,$year);
一個更通用些的方法,是從CPAN安裝Date::Manip 模塊。
use Date::Manip;
$epoch_seconds = UnixDate(”19 Dec 1997 15:30:02″,”s”);
注意,由於 Date::Manip是個大模塊,使用該模塊時,將會增加你的程序的啟動時間。其中一個原因是 Date::Manip將對多種不同的格式進行識別,如:
“today”
“now”
“first sunday in april 2000″
“3:15, today”
“3:15pm, first sunday in april 2000″
“2000/01/18 09:15″Date Manipulation
2036, 2037, 2038, …, 1901?!
大多數C程序把紀元秒存為有符號整數,可表示正的和負的日期,但計算機存儲器所表示的整數大小是有限的,用有限的位數來表示秒。這就是說,我們在計算紀元秒時,所表示的日期是有限制的。
確切的限度取決於你的機器所能表示的整數的位數。 Perl最多以32位的長度存儲整數。粗略地講,有一位用來表示正負號,其余31位來表示數。如果8位,你可以存儲的最大數是255,即2的8次方減1。故Perl中所存儲的32位符號數中的最大數為:
print 2**31-1, “\n”;
2147483647
這個數字對應了哪個日期呢?
print scalar(gmtime 2**31-1), “\n”;
Tue Jan 19 03:14:07 2038
在那個時刻的1秒之後會發生什麼呢?
print scalar(gmtime 2**31), “\n”;
Fri Dec 13 20:45:52 1901
啊!發生了什麼?對於32位有符號整數來說, 2**31太大了。它”翻卷過去了”,其符號位被置為負號,因而成為了所能表示的最大負數。這對應於1970年開始時刻之前的秒的最大值。
其結果說明了什麼呢?你不能存儲gmtime(2**31)之前或gmtime(2**31-1)之後的以紀元秒表示的日期。
你可千萬不要想不開,這可不是什麼大問題。如果你要用到32位有符號整數表示的紀元秒以外的時間,你只需要改變你的表示方式,你可從CPAN中找到不少日期模塊,其中的Date::Calc 和Date::Manip 很可能是功能最強的兩個模塊。
這兩個模塊使用自己的日期表示方式,以避免Y1901-Y2038 的限制。Date::Manip 使用羅馬歷法,從公元 0000 到公元9999。Date::Calc 也使用羅馬歷法,可表示的年份從1 到32767。
總結
對於在1902-2037范圍內的日期和時期表示, 把它們轉換為紀元秒,要存取這些數,你只需使用整數算術運算,gmtime() 和 localtime()函數,以及標准的Time::Local模塊。如果要對該范圍以外的日期進行計算或者要分析某特殊的日期格式,你可以使用CPAN中的Date::Manip 和Date::Calc模塊。