利用餘弦相似度演算法分析全台選舉投票數據,找出與知名「天玉里」投票行為最相似的地區。使用 pandas + sqlite3 建立資料庫,最終以 Gradio 製作互動式查詢工具,部署於 Hugging Face Spaces。
關鍵發現:南投縣草屯鎮中山里與天玉里相似度高達 0.999998,但天玉里實際聲量排名僅第 2482 名,驗證了「知名度與代表性不一定相關」的現象。
🔗 查看成品
| 數據清理過程
| 概念驗證
| GitHub
整合 Kaggle 三年度機器學習與資料科學問卷,結合外部薪資與 GDP 資料,分析資料從業者的技能輪廓、薪資結構與職涯趨勢。使用 pandas + sqlite3 建立資料庫,matplotlib 進行概念驗證,最終以 Plotly 製作五組互動式視覺化成果。
關鍵發現:薪資差異主要受地區影響(北美與大洋洲可達亞洲的 3–5 倍),技能數量與薪資並非線性關係,2–3 種程式語言即可勝任多數職位。
整合全球每日確診、死亡與疫苗接種數據,建立頁籤式互動儀表板。將不同格式的資料(寬表/長表)統一整併,呈現全球疫情地圖快照與各國時間序列趨勢。使用 SQLite + Pandas 處理資料,Plotly + Gradio 製作互動視覺化,部署於 Hugging Face Spaces。
功能展示:世界地圖氣泡圖(單日疫情快照)、各國時間序列折線圖(跨日趨勢比較)。
🔗 查看成品
| 數據清理過程
| 概念驗證
| GitHub
是一部經典的資料視覺化影片,透過 氣泡圖 呈現 1800 年至 2009 年間 200 個國家的「人均壽命」與「人均 GDP」變化,使用 Python(Matplotlib/Plotly)復刻這個經典視覺化案例,處理跨年份、跨國家的長表資料整併與動畫呈現。
🔗 查看成品
| 數據清理過程
| 概念驗證
| GitHub
復刻法國工程師 Charles Minard 於 1869 年繪製的經典資訊圖表,呈現拿破崙 1812 年俄羅斯戰役中軍隊規模隨路線、氣溫變化的銳減過程。使用 matplotlib 與 basemap 進行地理視覺化,並透過概念驗證逐步還原原圖呈現邏輯。
🔗 查看成品
| 數據清理過程
| 概念驗證
| GitHub