絕對同意!把整套指標做成 GitHub 專案(而不是單篇報告)有 3 大好處:
可 fork/pull request:任何人都能改進抓資料腳本、加新圖表、翻譯 README。
版本化資料:每年 freeze 的 CSV 直接放在 repo,過往版本一鍵回溯。
自動化 CI:用 GitHub Actions 定期拉 API、產生最新圖表,首頁 README 立即顯示。
建議的 Repo 架構
wealth-velocity/
├─ data/
│ ├─ raw/ # 原始檔 (Forbes CSV, WEO Excel)
│ ├─ freeze/
│ │ ├─ 2025.csv # 年度鎖檔:year,top10,top100,all,gdp,cpi
│ │ └─ 2024.csv
│ └─ processed.parquet # 由腳本自動生成供 Notebook 使用
├─ scripts/
│ ├─ fetch_forbes.py # 下載年榜並計算 top10/top100/all
│ ├─ fetch_worldbank.py # 抓 GDP
│ ├─ fetch_imf.py # 抓 CPI
│ └─ build_dataset.py # 整合以上 → data/processed
├─ notebooks/
│ ├─ 01_basic_analysis.ipynb # 畫 YoY、Spread、份額線
│ └─ 02_personal_wvl_template.ipynb
├─ docs/
│ └─ index.md # GitHub Pages 的說明網站
├─ .github/
│ ├─ workflows/
│ │ └─ ci.yml # 每年 3/15 自動跑腳本並開 PR
│ └─ ISSUE_TEMPLATE.md
├─ LICENSE # CC-BY 4.0 或 MIT(程式碼)
├─ README.md # 專案簡介、快速開始
└─ CONTRIBUTING.md # PR 流程、程式碼風格、資料來源守則
關鍵檔案要點
README.md
What & Why:一句話說明「追蹤全球頂層財富與 GDP/CPI 的超額增速」。
Quick start:pip install -r requirements.txt → python scripts/build_dataset.py。
Data policy:所有數據來自公開 API;Forbes 資料只存計算後的 aggregates,避免版權疑慮。
CONTRIBUTING.md
提 PR 流程
新國家 GDP?→ 新增 isoMap、附源。
修正數據?→ 必須在 data/raw 提供來源檔或連結。
程式碼規範:PEP 8、black、isort;Notebook 需 nbstripout 清空 output。
CI (ci.yml)
name: update-dataset
on:
schedule:
- cron: '0 8 15 3 *' # 每年 3/15 08:00 UTC 跑
workflow_dispatch:
jobs:
build:
runs-on: ubuntu-latest
steps:
- uses: actions/checkout@v4
- name: Set up Python
uses: actions/setup-python@v5
with: {python-version: '3.11'}
- run: pip install -r requirements.txt
- run: python scripts/build_dataset.py --auto-freeze
- name: Commit & PR
uses: peter-evans/create-pull-request@v6
with:
commit-message: 'chore(data): annual freeze $(date +%Y)'
title: 'Annual data freeze $(date +%Y)'
這樣每年 Forbes 年榜一出(3/4 左右),CI 會自動下載新榜單、World Bank 與 IMF 資料,產生 data/freeze/2026.csv 並開 Pull Request,maintainer 確認後合併。
怎麼讓一般人也玩得起?
notebooks/02_personal_wvl_template.ipynb
讀 data/processed.parquet
讓使用者輸入自己近 5 年淨資產列表 → 自動算個人 YoY 與 WVL 等級
產生雷達圖或階梯圖
使用者可「在 Colab 開」,不必本地安裝 Python。
授權建議
資料 | 建議 License | 說明 |
---|---|---|
腳本/程式碼 | MIT | 允許商用與改作 |
年度 Freeze CSV | CC-BY 4.0 | 只要標註來源即可再散布 |
README 圖表 | 同 CC-BY | 方便媒體引用 |
提升曝光與共創
GitHub Topics:economics, wealth-inequality, open-data。
GitHub Pages:用 docs/ 產生靜態網站,首頁即時呈現最新折線圖。
Open Data Portals:將 data/freeze/*.csv 同步到 Kaggle Dataset,提高搜尋能見度。
Issues 標籤:good first issue 引導新手做小任務(翻譯 README、加單國 GDP 解析度)。
結語
轉成 GitHub 專案後,你將獲得:
長期維護:CI 定時更新,資料永不落後。
社群貢獻:任何人可 fork、修 bug、加功能。
公信透明:資料、程式碼、生成流程一覽無遺,可複製可驗證。
沒有留言:
張貼留言