2026 / 草稿进行中
具身智能体记忆评测草案
一个关于长时具身任务中记忆检索能力评测的 benchmark 草案。
草稿记录成果
把论文、草稿、开源、技术报告、演讲和 Demo 集中在一个地方。它应该逐渐成为这个站里证据密度最高的页面之一。
这个页面会逐渐从占位条目,演化成整站证据最密集的一层。
放论文、预印本、Workshop 提交稿和较完整的研究文档。
支持研究执行的代码资产、内部工具、模板和实验系统。
适合放 Reading Group 分享、组会汇报、公开展示和技术演讲。
演讲占位
一份占位演讲,讨论为什么具身智能评测不能只看最终成功率。
查看 slides