Bug Journal 2026-03-29
全天在tianhe集群和TzJsDesktop两台设备上并行推进五个项目:Error Recovery Benchmark完成Pipeline 2全链路实现(163测试通过)与E4架构重构,OpenPI评测性能提升20倍,gadget新增自然语言论文搜索ask命令,TokenMonitor从单机扩展为SSH多设备费用分析平台(含全面安全优化与多项关键Bug修复),LifeCopilot完成代码库文档化并确立与openclaw集成方向。
全天在tianhe集群和TzJsDesktop两台设备上并行推进五个项目:Error Recovery Benchmark完成Pipeline 2全链路实现(163测试通过)与E4架构重构,OpenPI评测性能提升20倍,gadget新增自然语言论文搜索ask命令,TokenMonitor从单机扩展为SSH多设备费用分析平台(含全面安全优化与多项关键Bug修复),LifeCopilot完成代码库文档化并确立与openclaw集成方向。
全天跨 tianhe 与 TzJsDesktop 两台设备、四个项目并行推进:tianhe 完成 error_recovery_benchmark 的 Context Replay 概念重构与代码修复,并修复 LIBERO/BOSS 评估环境资产缺失与零样本设计分析;TzJsDesktop 完成 cchypothesis skill 的智能双轨插桩架构整合,以及 TokenMonitor 应用的 Dashboard 抖动、Rust 编译错误、前端导入失效、窗口锚定四项递进式 Bug 修复。
统一机器人评估脚本的日志和结果保存逻辑,完整设计并实现了cchypothesis假设驱动调试技能,同时通过5轮迭代彻底修复了TokenMonitor窗口底边抖动问题。
全天跨DCC HPC、天河超算、TzJsDesktop三台设备并行推进:DCC完成MIHD-QueST cross-sample query协议对齐与8基因编码器benchmark框架搭建;天河完成Pi0.5 LoRA全任务rollout评估、BOSS环境迁移及Error Recovery Benchmark系统性重构;TzJsDesktop对ccplan skill进行多轮系统升级(Prompt Calibration、多意图分解、Feature Guard),并对TokenMonitor完成大规模功能迭代(悬浮球全生命周期、Windows原生UX、代码重构、ccusage接入)。
tianhe 服务器多用户完成 VLA/机器人研究全链路技术栈搭建(Git迁移、训练脚本、数据管道修复、OpenPI评测客户端),TzJsDesktop 完成 research_scout.py 模块化重构、TokenMonitor 跨平台适配与首个 Windows .exe 构建、optimize skill 四语言扩展,以及 Claude Code 工具链精细化配置
TzJsDesktop完成gadget summarize模块重构(2930行→8模块+72测试)、summarize skill论文式六章节升级、ccplan工具链全面修复,以及TokenMonitor从macOS专属到跨平台+ccusage MCP后端的架构规划与Phase A/E实现启动;tianhe完成BOSS基准代码库CLAUDE.md创建和LiPM训练器5个Bug定位,但受API连接故障影响上午中断约6小时。
部署5篇积压日报(force push解决远端冲突)。将扁平bugJournal重构为daily/weekly/monthly三层子目录,更新6处Python脚本路径,重建部署。清理git仓库:git rm –cached移除1839+44个误追踪文件,.gitignore改为通配符verify-public*/,CLAUDE.md新增Git Tracking Rules。通过cchelper需求分析实现sync.py bootstrap子命令(–remote参数解决自举问题)。批量生成W05-W08历史周报JSON。多次更新CLAUDE.md(sync.py命令、site_staging.py文档、SITE_OUTPUTS_DIR路径常量、build/构建产物说明)。
tianhe集群完成Error Recovery Benchmark三项核心bug修复(夹爪极性反转、wrong_object过滤逻辑、drop_with_interaction注入策略),training scenes从1209增至1627(+35%),并深度分析three_piece_assembly相位检测退化根因与48个ungenerable cases物理约束归因;TzJsDesktop批量归档W05-W12历史周报、修复gadget网站部署pipeline,并完成Hugo站点导航下拉菜单改造与统一deploy staging架构建设。
在 tianhe HPC 集群完成 error_recovery_benchmark 从参数调优到架构级轨迹分段重构的全链路修复(1222 个训练场景,threading subtypes 从 3 升至 25),同时在 TzJsDesktop 修复 gadget 基础设施关键 bug 并将 ECC 工具链全员升级至 opus + max thinking。
在DCC和tianhe两台HPC设备上同步推进四条主线:修复error recovery benchmark的drop_in_transit假阳性问题并以32 worker并行生成6任务973个训练场景(41分钟),搭建Pi0.5-base LoRA六任务合并数据集微调流水线(数据转换与norm stats完成,训练因Slurm job到期中断),修复STAIG超参数扫描不公平对比建立PCA+UNI/UNI2基准(ARI 0.47),以及开发10x Visium空间转录组scanpy分析脚本。