程序師世界是廣大編程愛好者互助、分享、學習的平台，程序師世界有你更精彩！


設為首頁	加入收藏

首頁
編程語言: C語言|JAVA編程
 Python編程
網頁編程: ASP編程|PHP編程
 JSP編程
數據庫知識: MYSQL數據庫|SqlServer數據庫
 Oracle數據庫|DB2數據庫

程式師世界 >> 編程語言 >> JAVA編程 >> 關於JAVA >> crawler4j抓取頁面應用jsoup解析html時的處理辦法

crawler4j抓取頁面應用jsoup解析html時的處理辦法

編輯：關於JAVA

crawler4j抓取頁面應用jsoup解析html時的處理辦法。本站提示廣大學習愛好者：（crawler4j抓取頁面應用jsoup解析html時的處理辦法）文章只能為提供參考，不一定能成為您想要的結果。以下是crawler4j抓取頁面應用jsoup解析html時的處理辦法正文

crawler4j對已有編碼的頁面抓取後果不錯，用jsoup解析，許多會jquery的法式員都可以操作。然則，crawler4j對response沒有指定編碼的頁面，解析成亂碼，很讓人懊惱。在找了苦悶當中，有意間發明一年月已久的博文，可以處理成績，修正 Page.load() 中的 contentData 編碼便可，這讓我心中馬上舒坦了許多，接上去的成績都引刃而解了。

public void load(HttpEntity entity) throws Exception {
contentType = null;
    Header type = entity.getContentType();
    if (type != null) {
        contentType = type.getValue();
    }

    contentEncoding = null;
    Header encoding = entity.getContentEncoding();
    if (encoding != null) {
        contentEncoding = encoding.getValue();
    }

    Charset charset = ContentType.getOrDefault(entity).getCharset();
    if (charset != null) {
        contentCharset = charset.displayName();
    }else{
    contentCharset = "utf-8";
    }

   //源碼
   //contentData = EntityUtils.toByteArray(entity);
    //修正後的代碼
    contentData = EntityUtils.toString(entity, Charset.forName("gbk")).getBytes();

}

上一頁:java應用list完成數據庫的like功效
下一頁:java打包成可履行的jar或許exe的具體步調

關於JAVA

在eclipse rcp中使用spring框架

很久就想了如何在Rcp程序中使用Spring。

設計模式之備忘錄模式詳解

定義：在不破壞封裝性的前提下，捕獲一

JSF Struts Spring Hibernate整合

JSF1.1+Struts2.1+Spring

如何在NetBeans IDE 6.0中構建Grizzly項目

本文檔假定您擁有 NetBeans IDE 的

[Eclipse]GEF入門系列（二、GEF概述）

在前面的帖子已經提到，GEF（Graphica

學Java-圖書銷售系統-POJO類

Book.javaBookStockHisto

相關文章

閱讀排行榜

Spring進修筆記1之IOC詳解盡可能應用注解和java代碼 Java列舉類enum引見 java WSDL接口webService實現方式 Java學習雜談（十一）--Spring java string類辦法深刻解析 Java中流的概念經由過程署理類完成java銜接數據庫(應用dao層操作數據)實例分享使用Velocity實現客戶端和服務器端模板 java基本進修筆記之泛型 Java 線程同步 synchronized 圖解Spring Security默認使用的過濾器

熱門圖文

關於.NET C#調用Sqlite的總結， ASP.NET實現用戶在線檢測的類源碼 php實現登錄tplink WR882N獲取IP和重啟的方法，tplinkwr882n 圖片的居中、拉伸與平鋪 - 回復我是一只想飛的小小鳥的問題某大型網絡公司應聘時的筆試題目附答案 java-spring框架下jsp腳本語言confirm腳本語言刪除數據庫中數據怎麼做？支持jsp的NTKO 在線編輯痕跡保留手寫簽名電子印章全文批注文檔控件 C語言學習教程第八章-枚舉、位運算(3)

欄目導航

JAVA編程入門知識關於JAVA J2EE J2SE J2ME JAVA綜合教程

Copyright © 程式師世界 All Rights Reserved