下午

  • 12:30 出宿舍,中午鸡腿饭,1点回实验室
  • GLM Pro Plan 旺仔任务 ✅ 成功送货
  • Discord 注册成功但进不了群,自动化流程卡住
  • Telegram 搞到5积分,输入失败还被扣完了,血亏
  • 来回折腾到3点,开始有点累

下午续

  • 3点后转战个人博客搭建,解决了GitHub日历不显示 + 图片更新问题
  • 4点搞定博客基础架构,后续规划:学习日志/日记/论文笔记全部托管,用 GLM API + Claude Code 自动化管理
  • 研究极客时间内容转PDF脚本,找到开源方案并成功下载课程
  • 学了 Claude Code 的 SDD 分层方法论(spec/plan/tasks/constitution),给自己的 API 项目定了大项目级别

晚上

  • 5:30 吃饭,食堂快餐(胡萝卜牛腩 + 椒盐鸡柳)
  • 7点散步,8点去好想来买了200块零食,来回溜达了1小时
  • 继续推进课题:整理项目文档 + 论文知识点梳理 + 数据解法深入理解

状态

精力 7/10,情绪 5/10

事情太多,多线程并发把注意力打散了,心态有点崩。

健康打卡

  • 早餐:❌ 没吃
  • 午餐:鸡腿饭
  • 晚餐:胡萝卜牛腩 + 椒盐鸡柳
  • 散步:✅ 1小时
  • 喝水:✅ 2000ml

今日收获

  • 极客时间PDF下载流程跑通
  • 博客GitHub日历问题解决
  • SDD方法论入脑,给API项目定了架构方向
  • FPN论文读完,串起了特征连接的进化线

今日卡点

  • cookie认证下载一直出问题
  • 昨晚微信读书忘打卡,泪目

感悟

一颗向上的心脏,不应该有一副向下的躯体。

不要精分,一段时间专注做一件事,效率自然会高。

明日计划

  • 去50所好好上班
  • 闲下来折腾小程序

今日论文 #day07

FPN《Feature Pyramid Networks for Object Detection》
CVPR 2017 | FAIR | Tsung-Yi Lin等

核心痛点

物体检测的多尺度困境——大物体需要浅层高分辨率特征,小物体需要深层强语义特征。传统方案要么只用单尺度特征(小物体看不清),要么搞图像金字塔(计算量爆炸)。

解法

既然输入金字塔太慢,那就构建特征金字塔

FPN核心是”自顶向下 + 横向连接”:

  • 自顶向下路径:从深层强语义特征开始,逐层上采样
  • 横向连接:每层融合同分辨率的底层特征(1×1卷积后相加)
  • 结果:每层都有”高分辨率 + 强语义”,大车小车都能看清

关键发现

几乎零成本的大幅提升:

  • AP从31.6→33.9(+2.3)
  • 小物体APs从13.2→17.8(+4.6)——FPN杀手锏
  • 速度反而更快:FPS从3→6.7

消融实验证明:横向连接最关键,”分辨率”和”语义”缺一不可。

读后感

从Day04 ResNet的”+x” shortcut,到Day05 DenseNet的”[x0,x1,…]”密集拼接,再到Day07 FPN的金字塔融合——深度学习的进化史,就是一部”特征连接方式”的探索史。FPN把CNN不同层的特征串成了糖葫芦,每层都能吃到最甜的那一口。这个架构后来成了目标检测的”标配”,连YOLO系列都在用。