HakkoAI 数据/分析工具箱(海外为主,数据源 ByteHouse 柔佛 Johor)。
本文件永久存档:能力描述 + 工作流程 + 全部更新日志(按主题归并)。
最后更新:2026-06-01
HakkoAI 的数据/分析工具箱——从数据仓库拉数 → 按统一口径(canon)算指标 → 渲染报告 →
部署 Cloudflare Pages → 推送飞书。覆盖海外业务为主(ByteHouse 柔佛 Johor)。
| 源 | 用途 |
|---|---|
ByteHouse Johor(mindcraft / uba_production_default / atlas) | 用户 / 订单 / 行为事件 / 广告花费 —— 业务指标主源 |
| Cloudflare D1 | 全渠道用户反馈池(LLM 分类后) |
| Stripe / Apple / Google Play API | 订阅 SKU 逐笔实收对账 |
| 飞书表格 | 目标值(严口径预估)、中国手填数据 |
docs/kpi_canon/(KPI_HAKKO_JOHOR.md 等)是单一口径源:DAU/MAU 严口径(DataFinder 虚拟事件)、收入(§5 mindcraft 白名单)、留存、UGC、渠道归因。
有 pre-commit hook 自动校验新代码 SQL 是否符合口径。
→ D1 → Doubao Seed 2.0 Pro LLM 分类(情感 / 话题 / P0–P1 优先级)→ 日报段 + 月报。
GitHub Actions cron(每天北京 06:00) → run_daily_report_v2.py 拉 ByteHouse(canon 严口径 SQL) → feedback_*.py 拉 6 渠道 → D1 → LLM 分类 → render_daily_report_v2.py 渲染浅色 HTML(移动端适配) → deploy_daily_to_pages.py wrangler → Cloudflare Pages → 飞书群推送卡片摘要 + Pages 链接
周报(周一 10:00)、月报(1 号 02:00)同构。全链路 UTC+8;
发布只走 Cloudflare Pages + 飞书(页面需 @hakko.ai 邮箱过 Cloudflare Access)。
.github/workflows/)| workflow | 周期(UTC) | 北京时间 |
|---|---|---|
daily_report | 0 22 * * * | 每天 06:00 |
weekly_report | 7 2 * * 1 | 周一 10:07 |
monthly_report | 0 18 1 * * | 每月 1 号 02:00 |
sync_subscriptions | 30 4 * * * | 每天 12:30 |
sync_ad_spend | 0 3,15 * * * | 每天 11:00 / 23:00 |
feedback_pull_discord | 0 4 * * * | 每天 12:00 |
cf_download_monitor | 0 3 * * * | 每天 11:00 |
hakko-monitor | */10 * * * * | 每 10 分钟 |
| 产物 | URL(需 @hakko.ai 邮箱过 CF Access) | 形态 |
|---|---|---|
| 日报 | https://hakko-daily-report.pages.dev/ | 静态报告(Pages) |
| 周报 | https://hakko-weekly-report.pages.dev/ | 静态报告(Pages) |
| 月报(入口) | https://hakko-monthly-report.pages.dev/ | 静态报告(Pages) |
| 目标看板 | https://hakko-targets.pages.dev/ | 静态看板(Pages) |
| 实时看板 /live | https://hakko-dashboard-worker.hakkoai.workers.dev/live | 动态 SPA(Worker + D1 + KV) |
静态报告(日/周/月报、目标看板)= 定时跑批生成的 HTML,部署 Cloudflare Pages;
实时看板 /live = Cloudflare Worker SPA(实时查 D1,6 个 tab:注册/活跃/付费/Cohort/ROI/订阅),
架构详见dashboard/README.md。两类都走 @hakko.ai Cloudflare Access。
统一 UI 风格:浅色(bg #f5f6f8 / 白卡 / 橙 #ff7849),全部移动端适配。
78ffa3e)(业务复盘 + 用户体验),cron 每月 1 号;canon §5/§8 严口径
22b9a56)ed0a197)b2b33c9)5f3304d)814ed51);cron 避开整点防漏触发(4a4e322)be1ea5a)88afb6a)6821f6c)mindcraft.user_settings_feedback(f6f364a)fe99957);Discord 拉取走 GHA 绕 SNI 封锁(9514984)046c2ed)6394378)fcc7881)ce587ea)1d7fa2b)docs/kpi_canon/(9cfc6ef)2b0fd22)03f0dfd)986117d);v3.4.0 系列深度分析(4pillar / cohort / launch decision)4b14755)8741a7c)acb0818)完整提交历史:git log -- data_agent/ monthly_review/(截至本次共 178 次提交)。
口径细节见docs/kpi_canon/KPI_HAKKO_JOHOR.md;周报口径见docs/WEEKLY_REPORT_METRICS_SPEC.md;
月报自动化见monthly_review/scripts/README_AUTOMATED.md。