Data analysis

練習專案一:復刻兩百個國家、兩百年、四分鐘 4


成品介紹


成品介紹(Final Product Overview)

  • X 軸 gdp_per_capita (橫軸): 人均 GDP(以國際美元調整通膨),表示一個國家平均每人的收入水平。從左到右,貧窮到富裕。
  • Y 軸 life_expectancy (縱軸):人均壽命(歲),表示一個國家的健康狀況。從下到上,短命到長壽。
  • 時間軸:1800 ~ 2023 年
  • 氣泡大小:該國的人口數,人口越多氣泡越大。
  • 氣泡顏色:代表地區。
    • 紅色:非洲 (Africa)
    • 藍色:亞洲 (Asia)
    • 綠色:歐洲 (Europe)
    • 紫色:美洲 (Americas)

數據分析(Data Analysis)

  1. 全球趨勢分析
  • 觀察到隨時間推進,人均 GDP 和 人均壽命 整體都在提升。

  1. 地區與發展差異
  • 發展不均,已開發國家、開發中國家、未開發國家 之間的收入差距明顯。
  • 但也能發現例外,同地區的部分國家發展迅速,甚至超越部分已開發國家。

  1. 人均壽命提升
  • 令人意外的 平均壽命 不完全與 經濟成長 成正相關。
  • 例如,非洲部分地區 人均 GDP 並無太大成長,但 平均壽命 仍然顯著提升。
  • 整體來看,較高的 GDP 確實與較高的壽命相關,但仍有例外。

總結(Conclusion)

  1. 全球發展趨勢
  • 數據顯示,整體而言,經濟壽命 持續提升。
  • 平均壽命 似乎已到達某個瓶頸,增長速度減緩。

  1. 發展速度不均
  • 雖然全球 GDP 提升,但發展不均衡,部分國家(如中國、印度)增長極快,而部分地區(如非洲某些國家)仍然面臨經濟困境。

  1. 人均壽命持續提升
  • 打破傳統刻板印象,許多開發中國家在醫療和社會進步下,即使經濟成長有限,壽命仍顯著提高。
  • 除了經濟成長外,政府政策、醫療進步、教育普及 也是影響壽命的關鍵因素。
  • 有些國家雖然 GDP 不高,但因為公共衛生與醫療政策得當,人民壽命依然較長。


專案復原(Project Replication)

語言與模組(Languages & Modules)

  • dependencies:
    • python=3.12.8
    • pandas=2.2.3
    • matplotlib=3.9.2
    • plotly=5.24.1
    • 這邊使用conda list | findstr $module_name (windows Anaconda Prompt)

指定模組下載頻道

  • conda install numpy

    • 不指定頻道,會使用 Conda 的 默認頻道(Default Channels)。
    • 默認頻道的套件通常是由 Anaconda 官方維護,穩定性較高,但更新速度可能較慢。
  • conda install -c conda-forge numpy

    • 明確指定從 conda-forge 頻道安裝套件。

建立environment.yml

目的重現專案環境。

REM 方法 (當前目錄建立environment.yml)
conda env export > environment.yml 

如何重現

  • 安裝 Miniconda

  • 使用 environment.yml 建立新環境。

    conda env create -f environment.yml
    
  • 建立資料 gapminder_clone/

  • 使用 VScode 將資料夾新增到工作區。

  • data/ 資料夾中的四個 CSV 檔案置放於工作目錄中的 data/ 資料夾。

  • 啟動環境並執行 python create_gapminder_db.py 就能在 data/ 資料夾中建立 gapminder.db

  • 啟動環境並執行 python plot_with_px.py 產生 gapminder_clone.html



心得

  • 這次的分析確實提供了一些有用的資訊,主要是基於數據結合個人觀察與查閱的資料,以自己的口吻整理出來。例如:
    • 全球趨勢:全球 GDP 和壽命整體提升。
    • 區域對比:經濟發展不均,部分國家發展迅速,部分國家仍處於低收入狀態。
    • 打破傳統觀點:壽命提升不完全取決於 GDP,醫療、教育、政策等因素同樣影響深遠。

  • 然而,回顧這次的分析,我發現它的「實際應用價值」仍然有限。 雖然數據呈現了一些趨勢,但缺少了更深入的個人觀點,特別是在這些趨勢能如何影響決策方面,還有很大的提升空間。

  • 我認為 資料分析師的目標,不只是「我們觀察到了什麼」,而是「這些資訊如何影響決策,並帶來實際價值」。 下一步,我希望能進一步探索如何從數據中提取更具策略性的洞察,使分析結果更具行動意義。