請問 wget 或curl 怎麼抓 asp 網頁



贊助商連結


drag007
2011-01-27, 05:37 PM
向各位先進請教一下
papago 每個月更新圖資時,當要從網頁從新下載.檔案名稱會隨西元年-季-月-版號變動,所以每個月都不同
希望能直接截取網頁的連結,給wget 自動下載
我的機器是
狀況如下:

1.進下載主頁
http://www.papago.com.tw/Download/DownloadPapago.aspx
2.點旁邊的<品牌專區>
http://www.papago.com.tw/Download/DownloadProjectSoftware.aspx
3.選擇<品牌><型號> ==>[送出]
例:品牌:gosget go-668
4.按[檔案下載] 開啟下載連結
連結前:http://www.papago.com.tw/Download/DownloadVerify.aspx?Did=631&HB=N&P=1
連結後:http://www.papago.com.tw/Download/DwonlaodPage.aspx?Did=631

網頁含圖資檔下載連結
http://www.papago.com.tw/Download/DwonlaodPage.aspx?Did=631

要怎麼下載這個連結並存成檔案
試用wget 和curl 直接抓 http://www.papago.com.tw/Download/DwonlaodPage.aspx?Did=631

抓下來卻是 http://www.papago.com.tw/Download/DownloadPapago.aspx

看起來應該是頁面上的資料沒傳送給server.
請問應該怎麼下參數去抓

贊助商連結


tvirus
2011-01-27, 06:13 PM
你研究一下cURL (http://curl.haxx.se/docs/httpscripting.html)的指令
裡面有寫到POST的部份
wget (http://www.gnu.org/software/wget/manual/html_node/HTTP-Options.html)也有

Google關鍵字: curl post 或wget post

當然,你還要看得懂HTML裡的表單,是寫些啥東西

另外,變動型的,最好是會寫程式配合
因為抓下來可能只是另一個網頁內容,還是需要程式分析

啥?不會寫程式?
那就再見 ._.\~/

arthurh
2011-01-29, 09:46 AM
要分析的連結是這個吧?

http://www.papago.com.tw/Download/DownloadVerify.aspx?Did=633&HB=N&P=1
http://www.papago.com.tw/Download/DownloadVerify.aspx?Did=633&HB=N&P=1