Bug Journal 2026-02-27

在天河 HPC 集群上完成了存储空间分析、Slurm GPU 节点申请流程梳理,并确认了 M14 基线评估结论(Pi0/BC-RNN 在错误恢复场景上几乎零成功率)

2026年2月27日 · 2 分钟

Bug Journal 2026-02-26

在超算集群上重写 BC-RNN 训练配置为 image 模式并成功启动5任务并行训练,同时扩展评估框架支持5个MimicGen任务,发现并修复 Pi0.5 0% success rate 的任务分布不匹配问题。

2026年2月26日 · 3 分钟

Bug Journal 2026-02-23

在DCC节点系统优化MIHD空间组学融合训练(3项CPU加速+架构解耦+全切片基准测试+Vision Refine对比实验),同时在天河集群完成MimicGen数据准备、修复M14三路评估的环境指纹崩溃及Pi0.5全量微调OOM问题,成功将Pi0.5 LoRA训练(Job 46553)推进至稳定运行。

2026年2月23日 · 3 分钟

Bug Journal 2026-02-22

DCC完成MIHD项目清理整顿与Vision Refinement两阶段融合实现并启动批量实验,tianhe全面推进Error Recovery Benchmark Phase II(M14评估流水线验证、Pi0.5 OOM诊断)并完成Phoenix pi0.5复现完整数据流水线搭建(9个MimicGen任务数据入库18.4GB、训练配置就位)。

2026年2月22日 · 2 分钟

Bug Journal 2026-02-20

对 MIHD 项目的 STAIG fusion 进行专项测试,发现 eval_scan_fusion.py 中存在双重归一化 bug,并在 run_benchmark.py 中引入 pipeline 级别的 embedding 缓存机制。

2026年2月20日 · 2 分钟

Bug Journal 2026-02-19

在 MIHD 项目中,系统完成了 H&E Image-Only 聚类方法文献调研(确立 ARI 0.11–0.16 基线及 Foundation Model 失效五大根因)、四份核心技术文档建立,并实现并验证了三种自监督聚类增强方案(STEGO/BYOL+GAT/SCAN),SCAN 将 image-only ARI 从 0.251 提升至 0.303(+20.6%)。

2026年2月19日 · 5 分钟

Bug Journal 2026-02-14

为机械臂错误恢复基准实现了力注入增强方案,但30N仍无法在视频中产生可见扰动,问题尚待解决

2026年2月14日 · 1 分钟

Bug Journal 2026-02-13

将 MIHD 项目增强计划文档翻译成中文并写入新文件

2026年2月13日 · 2 分钟

Bug Journal 2026-02-12

在 tianhe 设备完成 ccusage GLM 计费支持的代码实现与调试,在 DCC 设备完成 MIHD 增强计划的中文版本整理

2026年2月12日 · 3 分钟

Bug Journal 2026-02-10

跨三个项目推进:为机器人基准测试项目完善贡献者文档、整理 robobrain_pi 历史并准备 SAC 强化学习训练、启动 gadget research 模块文档更新

2026年2月10日 · 3 分钟