data_agent · 更新日志 & 能力总览

HakkoAI 数据/分析工具箱(海外为主,数据源 ByteHouse 柔佛 Johor)。
本文件永久存档:能力描述 + 工作流程 + 全部更新日志(按主题归并)。
最后更新:2026-06-01

一、这是什么

HakkoAI 的数据/分析工具箱——从数据仓库拉数 → 按统一口径(canon)算指标 → 渲染报告 →

部署 Cloudflare Pages → 推送飞书。覆盖海外业务为主(ByteHouse 柔佛 Johor)。

二、数据源

用途
ByteHouse Johormindcraft / uba_production_default / atlas用户 / 订单 / 行为事件 / 广告花费 —— 业务指标主源
Cloudflare D1全渠道用户反馈池(LLM 分类后)
Stripe / Apple / Google Play API订阅 SKU 逐笔实收对账
飞书表格目标值(严口径预估)、中国手填数据

三、核心能力

DAU/MAU 严口径(DataFinder 虚拟事件)、收入(§5 mindcraft 白名单)、留存、UGC、渠道归因。

pre-commit hook 自动校验新代码 SQL 是否符合口径。

→ D1 → Doubao Seed 2.0 Pro LLM 分类(情感 / 话题 / P0–P1 优先级)→ 日报段 + 月报。

四、工作流程(以日报为例)

GitHub Actions cron(每天北京 06:00)
  → run_daily_report_v2.py     拉 ByteHouse(canon 严口径 SQL)
  → feedback_*.py              拉 6 渠道 → D1 → LLM 分类
  → render_daily_report_v2.py  渲染浅色 HTML(移动端适配)
  → deploy_daily_to_pages.py   wrangler → Cloudflare Pages
  → 飞书群推送卡片摘要 + Pages 链接

周报(周一 10:00)、月报(1 号 02:00)同构。全链路 UTC+8

发布只走 Cloudflare Pages + 飞书(页面需 @hakko.ai 邮箱过 Cloudflare Access)。

五、活跃定时任务(.github/workflows/

workflow周期(UTC)北京时间
daily_report0 22 * * *每天 06:00
weekly_report7 2 * * 1周一 10:07
monthly_report0 18 1 * *每月 1 号 02:00
sync_subscriptions30 4 * * *每天 12:30
sync_ad_spend0 3,15 * * *每天 11:00 / 23:00
feedback_pull_discord0 4 * * *每天 12:00
cf_download_monitor0 3 * * *每天 11:00
hakko-monitor*/10 * * * *每 10 分钟

六、线上产物

产物URL(需 @hakko.ai 邮箱过 CF Access)形态
日报https://hakko-daily-report.pages.dev/静态报告(Pages)
周报https://hakko-weekly-report.pages.dev/静态报告(Pages)
月报(入口)https://hakko-monthly-report.pages.dev/静态报告(Pages)
目标看板https://hakko-targets.pages.dev/静态看板(Pages)
实时看板 /livehttps://hakko-dashboard-worker.hakkoai.workers.dev/live动态 SPA(Worker + D1 + KV)
静态报告(日/周/月报、目标看板)= 定时跑批生成的 HTML,部署 Cloudflare Pages
实时看板 /live = Cloudflare Worker SPA(实时查 D1,6 个 tab:注册/活跃/付费/Cohort/ROI/订阅),
架构详见 dashboard/README.md。两类都走 @hakko.ai Cloudflare Access。

统一 UI 风格:浅色(bg #f5f6f8 / 白卡 / 橙 #ff7849),全部移动端适配。


七、更新日志(按主题归并,新 → 旧)

🎨 UI / 移动端

📅 月报(monthly_review)

(业务复盘 + 用户体验),cron 每月 1 号;canon §5/§8 严口径

📈 周报(weekly_report)

📊 日报(daily_report)

💬 反馈 agent(feedback)

💰 订阅 / 收入对账(subscriptions)

📡 实时看板(dashboard /live)

📐 口径 canon / 专题分析

🔭 运维监控


完整提交历史:git log -- data_agent/ monthly_review/(截至本次共 178 次提交)。
口径细节见 docs/kpi_canon/KPI_HAKKO_JOHOR.md;周报口径见 docs/WEEKLY_REPORT_METRICS_SPEC.md
月报自动化见 monthly_review/scripts/README_AUTOMATED.md