找回密碼 或 安全提問
 註冊
|註冊|登錄

伊莉討論區

搜索
伊莉需要你的贊助和支持儲值後自動升級用戶組認識好友、聊天,分享生活趣事
fc2三上悠亜三上cosplayoverlordsiro安卓
全知讀者開局物價silent h少女騎士強姦モテモテ與經紀人

休閒聊天興趣交流學術文化旅遊交流飲食交流家庭事務PC GAMETV GAME
熱門線上其他線上感情感性寵物交流家族門派動漫交流貼圖分享BL/GL
音樂世界影視娛樂女性頻道潮流資訊BT下載區GB下載區下載分享短片
電腦資訊數碼產品手機交流交易廣場網站事務長篇小說體育運動時事經濟
上班一族博彩娛樂

[繁]再見龍生,你好人

✡ 凡人修仙傳・123・

[繁]魔法光源股份有限

[繁]被逐出隊伍的治癒

[繁]再見龍生,你好人

[繁]魔法光源股份有限
C & C++ 語言C# 語言Visual Basic 語言PHP 語言JAVA 語言
查看: 5609|回復: 3
打印上一主題下一主題

[問題]PHP爬蟲抓中油95油價,出現中文亂碼[複製鏈接]

Rank: 1

帖子
128
積分
98 點
潛水值
3586 米
跳轉到指定樓層
樓主
發表於 2020-10-23 05:49 PM|只看該作者|倒序瀏覽
若對尊貴或贊助會員有任何疑問,歡迎向我們查詢。我們的即時通或MSN: admin@eyny.com
本帖最後由 u48326 於 2020-10-23 05:54 PM 編輯

欲由中油官網得知當日的95油價,用PHP 的 getElementById() 做法,但 id 含有中文、結果回傳值為空。
第2行測試一個無中文的 id,有抓到值,但回傳時中文顯示亂碼。
查中油首頁設定 charset=utf-8,所以我在爬蟲程式裡也加入:
header("Content-Type:text/html; charset=utf-8");卻無效果。程式如附件。有請前輩指導,謝謝!
...
瀏覽完整內容,請先 註冊登入會員
附件: 你需要登錄才可以下載或查看附件。沒有帳號?註冊
分享分享0收藏收藏0支持支持0
若新密碼無法使用,可能是數據未更新。請使用舊密碼看看。

使用道具檢舉

Rank: 6Rank: 6Rank: 6Rank: 6Rank: 6Rank: 6

帖子
155
積分
1282 點
潛水值
47965 米
頭香
發表於 2020-10-25 03:01 AM|只看該作者
你的文件有存成unicode嗎?也許這樣可以解決你的問題
所有積分大於負-100的壞孩子,將可獲得重新機會成為懲罰生,權限跟幼兒生一樣。

使用道具檢舉

Rank: 1

帖子
128
積分
98 點
潛水值
3586 米
3
發表於 2020-10-26 03:28 PM|只看該作者
若新密碼無法使用,可能是數據未更新。請使用舊密碼看看。
tryit244178 發表於 2020-10-25 03:01 AM
下載: 訪客無法瀏覽下載點,請先 註冊登入會員

你的文件有存成unicode嗎?也許這樣可以解決你的問題

程式是用 Notepad++ 編輯,預設儲存是 UTF-8 。
若在第6行增加一行:echo $html;
...
瀏覽完整內容,請先 註冊登入會員

使用道具檢舉

Rank: 1

帖子
128
積分
98 點
潛水值
3586 米
4
發表於 2020-10-26 04:06 PM|只看該作者
若新密碼無法使用,可能是數據未更新。請使用舊密碼看看。
本帖最後由 u48326 於 2020-10-26 04:09 PM 編輯

搞定了。
原來 UTF-8 的網頁在 loadHTML() 之前要加一道小手續:

$searchPage = mb_convert_encoding($html, 'HTML-ENTITIES', "UTF-8");

原程式修改後如附件。
附件: 你需要登錄才可以下載或查看附件。沒有帳號?註冊

使用道具檢舉

您需要登錄後才可以回帖 登錄 | 註冊

Powered by Discuz!

© Comsenz Inc.

重要聲明:本討論區是以即時上載留言的方式運作,對所有留言的真實性、完整性及立場等,不負任何法律責任。而一切留言之言論只代表留言者個人意見,並非本網站之立場,用戶不應信賴內容,並應自行判斷內容之真實性。於有關情形下,用戶應尋求專業意見(如涉及醫療、法律或投資等問題)。 由於本討論區受到「即時上載留言」運作方式所規限,故不能完全監察所有留言,若讀者發現有留言出現問題,請聯絡我們。有權刪除任何留言及拒絕任何人士上載留言,同時亦有不刪除留言的權利。切勿上傳和撰寫 侵犯版權(未經授權)、粗言穢語、誹謗、渲染色情暴力或人身攻擊的言論,敬請自律。本網站保留一切法律權利。
回頂部