每周总结 | TzJ's Net

Weekly Summary 2026-W13

本周横跨三台设备（TzJsDesktop / tianhe / DCC）并行推进约10个项目。核心成就：gadget 的 summarize（2930行→8模块+72测试）和 research_scout（2934行→7子包）两大模块完成系统重构，并新增自然语言论文搜索 ask 命令；TokenMonitor 从 macOS 专属工具演进为跨平台多设备 SSH 费用追踪平台（含 Windows 原生 UX、悬浮球、ccusage 接入、LiteLLM 动态定价、全面安全加固，多次成功构建 MSI/NSIS 安装包）；Error Recovery Benchmark 完成 Pipeline 2 全链路设计实现与 Context Replay 架构重构（163 测试全通过）；ccplan / cchypothesis / optimize 等 Claude Code 工具链获得系统性升级。机器人研究方向完成 Pi0.5 全任务评测（揭示 Stack 96% vs PickPlace 6% 极端分化）、BOSS benchmark 工程化落地及 openvla-oft 训练脚本创建。MIHD 空间转录组完成 QueST 协议对齐与 8 编码器 benchmark 框架搭建。

Weekly Summary 2026-W12

本周横跨DCC、tianhe、TzJsDesktop三台设备，在机器人操作与空间转录组两大研究方向全面深度推进。Error Recovery Benchmark完成从采集方案设计（RBG分组329条demo预算）到架构级轨迹分段重构（InteractionSegmenter），training scenes最终达1627个（148 subtypes覆盖，+35%）；MIHD空间转录组完成跨切片Embedding对齐全链路落地并确立scGPT零样本优势（100%命中率 vs UNI2 71%）；π₀.₅完成任务完成检测头全链路训练上线（loss≈0.253）并设计Exp5-9五种conditioning策略；gadget工具链完成Research Profiler消歧架构重构、网站统一deploy staging架构建设、ECC全员升级至opus+max thinking。全周核心突破集中在「找到并解决架构级根因」：per-section PCA坐标系不可比、多物体target_object歧义、Flax NNX继承vs组合三个系统性问题均在本周得到根本性修复。

Weekly Summary 2026-W11

本周在DCC、tianhe、TzJsDesktop三台设备上并行推进六条主线：①MIHD空间转录组学发现跨样本embedding方法论根本缺陷（per-section独立处理导致特征空间不可比）并启动修复；②ErrorRecoveryBenchmark从Bug修复到13技能/29子类型全面规模化，攻克Drop技能物体不掉落难题，暴露在线配额架构局限后确立离线注入新方向；③VLA-RoboTwin/pi05从环境搭建、训练性能优化（JAX版本对齐+33%提速）到新数据变量收集、辅助任务实验全链路贯通；④gadget工具链完成MCP Server+common/共享包+统一输出目录的架构升级，research profiler突破学者主页优先学生发现；⑤CalendarPro完成7阶段全面优化，230测试全通过，token消耗降低40-60%；⑥gadget研究工具链整合引用图分析并完成7位具身AI学者深度画像。

Weekly Summary 2026-W10

本周跨DCC、天河超算、TzJsDesktop三台设备，并行推进空间转录组研究、机器人操作训练/评估、AI个人助理、论文管理工具四条主线。MIHD项目完成scGPT+UNI2全套融合实验（QFormer avg ARI=0.370，+117% vs scGPT-only）并确立zero-shot跨样本评估框架；Pi0.5 LoRA精调以整体58.9%成功率全面超越BC-RNN（0%），定量验证VLA模型优势；CalendarPro完成从被动响应到主动决策的架构跃升（321个测试全绿），同时暴露并修复BackgroundCoordinator从未启动等关键集成缺陷；gadget Research Scout从零构建到生产就绪，单日内实现两阶段LLM论文评估管线并首次产出3条研究方向建议；error_recovery_benchmark完成65个symlink全量清理和错误场景MP4可视化基础设施建设。本周最重要的工程经验是：测试通过≠系统可用（集成层必须单独验证），以及设计Agentic系统前应主动研究成熟同类项目的架构模式。

Weekly Summary 2026-W09

本周在DCC和天河两台集群上并行推进空间转录组学（MIHD）与机器人错误恢复基准（Error Recovery Benchmark）两条主线。DCC端修复了scGPT致命权重加载Bug（ARI平均提升44.4%），将MIHD benchmark扩展至Visium HD数据集，并完成约250K行代码的大规模仓库重构；天河端从头建立BC-RNN Phoenix基线训练流水线（9任务并行），发现并修复Pi0.5评估0%成功率的任务分布不匹配根因，获得M14基线评估关键结论（学习策略在错误场景下SR≈0%，证明M15 LoRA微调必要性），并成功将Pi0.5 LoRA 9任务并行微调在6×A800上稳定启动。

Weekly Summary 2026-W08

本周以 MIHD 空间转录组项目为主线，完成了 H&E Image-Only 聚类的系统性调研（确立 ARI 0.11–0.16 文献基线）、三种自监督增强方案实现（SCAN 将 ARI 从 0.251 提升至 0.303，+20.6%）及 Vision Refinement 两阶段融合框架搭建；同时在 tianhe 集群上并行推进 Error Recovery Benchmark（M14 评估基础设施验证、649 场景全量评估启动）和 Phoenix pi0.5 复现数据流水线（18.4GB MimicGen 数据集入库、训练配置就位）。全周解决了 STEGO NaN、双重归一化 bug、lerobot 版本冲突、HuggingFace 代理等多个工程阻塞，Pi0.5 OOM 与 visualize_scene.py 视频验证两项阻塞延至下周。

Weekly Summary 2026-W07

本周横跨机器人仿真、生物信息、工具链三条线推进。error_recovery_benchmark 在力注入调试上遇到深层阻塞（30N 对 OSC 控制器无可见效果），揭示了控制器抵消机制的根本性问题；MIHD 完成了增强计划的中文文档落地；ccusage 实现了 GLM 多模型计费支持并通过类型/格式检查；robobrain_pi 确认训练链路就绪。本周 AI 在重复错误（SSH 缺 cd 指令）和环境假设（proxy、pnpm）上暴露了明显的模式套用缺陷，人类在关键决策点（极端力测试、检测本地 GPU、复用现有定价文件）提供了更高效的调试思路。

Weekly Summary 2026-W06

本周（2026-02-06~07）工作集中在两条主线：一是对MIHD项目的staig_fusion与原始STAIG之间ARI性能差距（0.21→目标0.56）进行系统性根因诊断，识别并量化了五个关键实现差异，完成了严格对齐覆盖改造的代码层工作；二是对benchmark工具完成工程化升级，修复报告柱状图渲染bug、实现端到端GitHub Pages自动发布流水线与CLI交互上传功能。此外记录了一次英语托福口语练习（个人学习）。

Weekly Summary 2025-W40

本周（2025-W40）仅有10月2日一天的有效会话记录，且该会话停留在初始化阶段，用户打开了 AutoSeg-SAM2 项目的核心跟踪与分割文件后未进入实质性开发工作。整体本周无实质进展产出。