Java中應用正則表達式獲得網頁中一切圖片的途徑。本站提示廣大學習愛好者:(Java中應用正則表達式獲得網頁中一切圖片的途徑)文章只能為提供參考,不一定能成為您想要的結果。以下是Java中應用正則表達式獲得網頁中一切圖片的途徑正文
/** * 從HTML源碼中提取圖片途徑,最初以一個 String 類型的 List 前往,假如不包括任何圖片,則前往一個 size=0 的List * 須要留意的是,此辦法只會提取以下格局的圖片:.jpg|.bmp|.eps|.gif|.mif|.miff|.png|.tif|.tiff|.svg|.wmf|.jpe|.jpeg|.dib|.ico|.tga|.cut|.pic * @param htmlCode HTML源碼 * @return <img>標簽 src 屬性指向的圖片地址的List聚集 * @author Carl He */ public static List<String> getImageSrc(String htmlCode) { List<String> imageSrcList = new ArrayList<String>(); Pattern p = Pattern.compile("<img//b[^>]*//bsrc//b//s*=//s*('|/")?([^'/"/n/r/f>]+(//.jpg|//.bmp|//.eps|//.gif|//.mif|//.miff|//.png|//.tif|//.tiff|//.svg|//.wmf|//.jpe|//.jpeg|//.dib|//.ico|//.tga|//.cut|//.pic)//b)[^>]*>", Pattern.CASE_INSENSITIVE); Matcher m = p.matcher(htmlCode); String quote = null; String src = null; while (m.find()) { quote = m.group(1); src = (quote == null || quote.trim().length() == 0) ? m.group(2).split("//s+")[0] : m.group(2); imageSrcList.add(src); } return imageSrcList; }