2026年1月16日
昨日计划完成情况
- 小程序:最后两个bug收尾
- 小程序:客户测试
- 美赛:学核心内容,准备给学弟学妹讲
- 论文Day15(DINO)
- 散步 + 喝水2000ml
今日记录
上午
- 8点起床,吃了牛肉饼 + 鸡蛋饼
- 10点到公司
- 组长聊天:项目都做完了,明年计划做小目标检测,可以融入大论文!肝硬化是医学影像方向,也是视觉模型,和实验室核心论文相关性很大
- 中午和组长一起吃公司食堂四菜一汤,聊学习近况和科研方向——收获很大
下午 @ 公司
- 整合笔记本和台式机的API(anyrouter失效改用glm,切换不麻烦)
- 看了实验室最近6年的肝硬化论文(医学影像方向的视觉检测)
- 整理美赛核心内容给学弟学妹,解析了近5年美赛真题
晚上
- 在商场等andy下班,散步逛了1h
- 和andy吃凑凑自助火锅(158元/位),第一次吃,还不错
- 和y的产品头脑,andy的产品愿景很丰富,受益匪浅
- 回来路上看论文,终于把今天的论文内容看完了
状态
精力 7/10,情绪 7/10
今天和组长、andy的对话都很有收获。
习惯打卡
| 项目 | 完成情况 |
|---|---|
| 论文 | ✅ Day15 DINO |
| 运动 | ✅ 商场散步1h |
| 喝水 | ✅ 3L |
| 饮食 | 午:四菜一汤 / 晚:凑凑自助火锅 |
今日论文 #day15
DINO《DINO: DETR with Improved DeNoising Anchor Boxes》
ICLR 2023 | 港科大 & 清华 & IDEA | Hao Zhang 等
核心痛点:DN-DETR用denoising加速训练,但只学习”从噪声重建GT”,没有学习”拒绝远离GT的anchor”,导致可能输出重复框。
核心解法:Contrastive DeNoising (CDN)
对每个GT同时生成:
- Positive query(噪声 < λ₁):学习重建GT
- Negative query(λ₁ < 噪声 < λ₂):学习预测”no object”
这教会模型:离GT近的anchor输出框,离得远的输出背景。
DINO三大改进:
- Contrastive DeNoising:抑制重复框
- Mixed Query Selection:encoder特征初始化positional query
- Look Forward Twice:后层梯度回传前层,改进box refinement
关键结果:DINO-5scale(R50, 12 epochs)49.4 AP,SwinL预训练后达到63.3 AP。
感悟
人生第10000天 🎉
今天在daymaster上看到自己诞生10000天了,10000天 ≈ 27.4年。这是个人生里程碑。
和andy聊完,深有感触:还是要抓住这个AI时代。andy的产品头脑很棒,愿景也很丰富,让我对AI产品有了新的认识。
明天约了峰哥和攀哥在苏州碰面,走走停停,出去看看。
明日计划
- 小程序:最后两个bug收尾(错题保存重做、收藏)
- 小程序:客户测试
- 论文Day16(RT-DETR)
- 苏州之行:和峰哥、攀哥碰面,逛逛苏州
- 吃顿好的(火锅自助补一下)
- 散步 + 喝水2000ml
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 Leo的笔记本!
评论
ValineDisqus



