本文主要是以實例形式介紹了Oracle查詢中rownum與rowid的不同之處,以及以假設的方式為例,查詢條件為rownum = 2,在查詢出第一條記錄時的具體內容的介紹。
在查詢中,我們可以注意到,類似於
select xx from table where rownum < n (n>1)
這樣的查詢是有正確含義的,而
select xx from table where rownum = n
這樣的查詢只在n=1的時候成立,
select xx from table where rownum > n (n>1)
這樣的查詢只能得到一個空集。
另外
select xx from table where rownum > 0
這個查詢會返回所有的記錄。這是為什麼呢?原因就在於Oracle對rownum的處理上,rownum是在得到結果集的時候產生的,用於標記結果集中結果順序的一個字段,這個字段被稱為“偽數列”,也就是事實上不存在的一個數列。它的特點是按順序標記,而且是逐次遞加的,換句話說就是只有有rownum=1的記錄,才可能有rownum=2的記錄。
讓我們回頭來分析一下在where中使用rownum作為Oracle查詢條件的情況。在取rownum=1,或者rownum <= n (n>1)的時候,沒有問題。那麼為什麼當條件為rownum = n或者rownum >= n時明明有數據卻只能得到一個空集呢?假設我們的查詢條件為rownum = 2,那麼在查詢出的第一條記錄的時候,Oracle標記此條記錄rownum為1,結果發現和rownum=2的條件不符,於是結果集為空。
假如有一條查詢語句為
select xx,yy from table where zz > 20 and rownum < 10
那麼在執行的時候,是先按照zz>20的條件查詢出一個結果集,然後按照rownum取出前10條返回?還是在按照zz>20的條件先查詢,然後有一個記錄就標記一個rownum,到rownum<10的時候就停止查詢?個人感覺應該是後者,也就是在執行語句的時候,不是做full scan,而是取夠數據就停止查詢。
要驗證這個想法應該很簡單,找一個數據量非常大的表進行Oracle查詢就可以了。可惜目前我沒有這樣的表,有條件的讀者可以自己測試一下。
我們可以看出,直接使用rownum是要受到限制的。但是很容易遇到這樣的需求“查出符合條件的第xx條到第xx條記錄”,比如頁面的分頁處理。這個時候如何構造出適合自己的結果集?
當然全取出來手工挑選也是可以的,但是前提是整個數據集的數據條數不多的情況下。假如遇到上十萬百條的數據,全部取出來的話,用戶就不用干別的事情了。這個時候用戶應該怎麼做呢?當然就是要用到我們介紹的rownum拉!rownum不是個“偽數列”麼,好說,我們現在把它弄成一個實在的字段就可以了。
具體做法就是利用子Oracle查詢,在構建臨時表的時候,把rownum也一起構造進去。比如
select xx,yy from (select xx,yy,rownum as xyz from table where zz >20) where xyz between 10 and 20
這樣就可以了。
另外使用Oracle提供的結果集處理函數minus也可以做到,例如
select xx,yy from table where zz > 20 and rownum <20 minus select xx,yy from table where zz>20 and rownum <10
但是使用minus好像比使用子查詢更加消耗資源。
和rownum相似,Oracle還提供了另外一個偽數列:rowid。不過rowid和rownum不同,一般說來每一行數據對應的rowid是固定而且唯一的,在這一行數據存入數據庫的時候就確定了。可以利用rowid來查詢記錄,而且通過rowidOracle查詢記錄是查詢速度最快的查詢方法。
對於這個我沒有試過,另外要記住一個長度在18位,而且沒有太明顯規律的字符串是一個很困難的事情,所以我個人認為利用rowid查詢記錄的實用性不是很大。此外rowid只有在表發生移動(比如表空間變化,數據導入/導出以後),才會發生變化。
rowid在記錄創建時就生成了,而且是不變的,直接指向硬件上的存儲位置,能用rowid直接訪問是最快的,但也是人力所無法做到的。rownum是個偽列,查詢的時候除非特別指定,否則不會顯示。其主要的用處是控制查詢返回的行數,比如在WHERE中加ROWNUM<5,則查詢結果如果在5行或以上時,只返回前4行。
這個應該說是oracle給出的錯誤信息不夠明確,
rowid是保留關鍵字,而你的主查詢裡面用了*,子查詢裡面有rowid,
給rowid取別名的話oracle就能正確處理了。