零基礎入門網路爬蟲，開啟Python Coding之路

課程簡介課程內容關於講師常見問題

本課程包含以下內容：

課程長度約 2.9 小時

22 個課程單元

共有 1 個可下載資源

優惠價

鐵粉優惠

課程簡介

一天只有24小時，資訊量卻每分每秒在爆量增加，資料蒐集與文字工作的負擔日漸不堪負荷，該如何在有效的時間內從龐大資料中快速取得有效的資訊加以利用呢？網路爬蟲絕對是最重要的技能之一。只要選對工具與程式語言，也能讓程式零經驗、想自動化蒐集資料的你快速上手實戰，減輕工作上的負擔！

上完課掌握哪些技能

快速從網頁擷取重要資訊。
掌握HTML、CSS、Javascript等網頁基礎知識。
運用Brautifilsoup & Regular Expression解析HTML。
學會觀察網頁中get/post封包，並有能力模擬封包。

誰適合上課

想寫程式卻不知道該選擇哪種語言。
懂程式語言，卻沒有學過Python的人。
想要快速掌握資料科學實務應用的人。
想轉行、想理財節省人工擷取資訊的人。

課程主要教學如何在資料海中快、狠、準的找到對自己有效的資訊並加以利用。課程設計四大單元、二十一個小節來手把手帶你學會如何用Python撰寫爬蟲，針對網頁爬取所需資訊，透過程式有效地蒐集網路上不同的金融數據並加以分析，是資料數據時代想要投資理財或從事相關行業不可或缺的能力。

單元一、網頁基礎原理

第一單元首先介紹網頁基礎原理，帶學員直接從現有網站觀察程式碼，解析網頁構成三大要件HTML、CSS、Javacript分別扮演的角色及實際功用，分析CSV、Json常見的資料儲存格式。

單元二、Python 基礎爬蟲

第二單元開始進入網路爬蟲的世界，首先介紹伺服器與HTML的關係，於本機建置Anaconda、Jupyter的上課環境，透過網頁觀察get/post封包，並實際動手製作Python模仿get/post封包，以及如何使用Brautifilsoup & Regular Expression來解析HTML。

單元三、Python 爬蟲實務

具備網頁概念與基礎爬蟲技術之後，實務上會發現不是每個網頁都會乖乖地讓你爬取資訊。第三單元要教你如何爬取表格資料，更要帶您排除網站上的防護機制，例如閃避網頁驗證碼、大量爬取單一頁面資料、自動定時爬取資料等等，解決實務上常遇到的狀況。

單元四、儲存資料

前面單元已經學會如何爬取資料並儲存成CSV格式，第四單元則是要教大家透Pyhton內建的database SQLite將資料儲存在資料庫裏面，當未來有需要的時候就快速獲取資訊。

講師 Isaac 畢業於台大電子所，主要專長為人工智慧及資料分析，擅長處理影像辨識、金融數據等問題。他過去曾於多處擔任資料科學講師，同時，也曾在許多上市櫃公司擔任內訓講師及顧問，具有相當豐富的教學及實戰經驗。

目前為T客邦長期合作講師，開立過許多課程，如Python大數據爬蟲、金融大數據分析平台、AI人工智慧深度學習、Apache Spark大數據平台處理實務等課程。授課經驗豐富，累積學員數超過數百名，並有經營Facebook粉絲專頁-小李談數智，在社群提供更多關於人工智慧、深度學習的資訊。

經歷

AI人工智慧講師

台積電、中華電信等企業內訓AI講師

T客邦資深講師

Lab AI軟體工程師

學歷

台灣大學電子工程研究所碩士

美國伊利諾香檳分校交換學生

交通大學電子工程學系學士

著作

選擇的能力–探索人工智慧的核心