首页 > 专栏 > 结构之法 算法之道 结构之法 算法之道 共 57 条资讯 OpenHLM——全身VLA下的行走-操作:sonic作为运控底层,π0.5作为VLA的初始化策略 2026-01-31 21:54:58 Q-Guided Flow——RL中基于流策略的推理时梯度引导:不直接在噪声动作上求Q的梯度,也不对整条去噪链做BPTT,而是一次Euler 积分且把Jacobian直接换成单位矩阵 2026-01-31 21:54:58 Humanoid-GPT——采用因果注意力机制的类GPT追踪器:通过扩展“数据规模、模型结构、训练多样性”,最终实现零样本动作追踪 2026-01-31 21:54:58 GR00T N1.7的简介与微调——其中的VLM是“基于Qwen3-VL”的Cosmos-Reason2,且预训练数据中包含2 万小时的 EgoScale人类视频数据(含GR00T N1.6的简介) 2026-01-31 21:54:58 τ0-WM——智元的视频-动作世界模型:组合“遥操、umi、人类第一人称视角”数据,基于未来视觉Latent预测动作,然后重新加噪去噪,若自洽取表现最好者直接执行,否则模拟推演找出最佳视觉指引重新生成 2026-01-31 21:54:58 Galaxea G0.5——升级“VLA自回归建模”范式:摒弃VLM上添加动作专家的模式,而是构建统一模型,用一套权重,在同一个自回归token序列中同时生成推理与动作(含VLA-0的详解) 2026-01-31 21:54:58 HumanEgo——从半小时人类第一视角视频中进行零样本学习的4大关键点:对人类手臂进行图像修补、将每只手和每个物体编码为一个交互中心Token、流匹配策略、稠密辅助目标 2026-01-31 21:54:58 ABot-Claw——改进OpenClaw以驱动双足机器人自主干活的三个关键点:统一具身接口、视觉多模态记忆、基于奖励模型的执行反馈模块(比如给会议室的人递杯水) 2026-01-31 21:54:58 Realtime-VLA V2——如何让vla运行的更快:从让π0实时抓取下落的钢笔到让 VLA 运行得更快、更平滑且更精确 2026-01-31 21:54:58 一文通透Qwen3-VL——在交错式MRoPE、DeepStack、文本时间戳对齐机制的基础上,先预训练,再后训练 2026-01-31 21:54:58 DeepSeek-V4——迈向百万token上下文:保留V3的MoE和多token预测机制,提出混合注意力机制(CSA/HCA)、流形约束超连接mHC(替代残差)、Muon优化器(取代AdamW) 2026-01-31 21:54:58 LWD——结合“分布式隐式价值学习与基于QAM的策略提取”的RL策略框架,先离线RL预训练,后在线RL微调 2026-01-31 21:54:58 ARM——用于长时序操作的优势奖励建模:采用三态标注策略(前进/后退/停滞),实现对相对优势的估计(含SARM详解) 2026-01-31 21:54:58 HTD——基于触觉预测的多功能人形行走-操作框架:融合视觉、本体感知、力反馈、触觉,同时预测动作、未来手部关节受力、由EMA目标编码器监督的未来触觉潜变量 2026-01-31 21:54:58 π0.7——4层prompt下的技能组合泛化能力:先高层策略基于指令历史和当前画面输出子任务指令,后世界模型基于子任务指令生成子目标图像 2026-01-31 21:54:58 ViVa——基于视频生成模型的机器人RL价值估计:比原先基于VLM的价值函数,能更好的在动态交互环境中对当前进度和未来走势下所带来的回报做估计 2026-01-31 21:54:58 MEM——解决VLA长时记忆问题的框架:基于图像记忆的高效视频编码器处理短时任务,基于文本的记忆系统解决长时任务 2026-01-31 21:54:58 BRS——斯坦福李飞飞团队推出的全身轮式人形操作框架:推出遥操作接口JoyLo与全身视觉-运动注意策略WB-VIMA 2026-01-31 21:54:58 Fast-WAM——在训练期间保留视频联合训练,但在推理时移除显式的未来生成,直接在一次前向传播中,从潜在世界表征预测动作 2026-01-31 21:54:58 HIL-DAFT——双智能体的人类在环RL框架微调的人形VLA(先离线预热后在线交互):为完成螺栓装配,主智能体负责常规操作、精细化执行体依据语音指令实行细粒度调整 2026-01-31 21:54:58 123下一页 » 相关分类 #!/slash/note #UNTAG (B)(F)uzzing on my world (Hi)story (IN)SECURE Magazine Notification (gdb) break *0x972 - 带鱼博客 BeltfishBlog - ./kwaa.dev .NET Blog .Trash /home/rook1e 00's Adventure 0kami's Blog 0x41414141 in ?? () 0x7f Blog 0xRick Owned Root ! 0xd00's blog 1 Byte 1A23 Blog 1A23 Studio 1Link.Fun 1stwebdesigner 251 2BAB 的工程博客 2ch中文网 360 CERT 360 Netlab Blog - Network Securi 38号车评中心 3o米的微博 404 Media