首页 > 专栏 > 结构之法 算法之道 结构之法 算法之道 共 57 条资讯 Ψ0——人形全身VLA:先用800h人类自视角视频数据和30h的真实机器人交互数据预训练VLM,再后训练MM-DiT,最后用AMO做下肢RL跟踪 2026-01-31 21:54:58 RLT——利用VLA引导“基于RL Token的在线RL”:VLA 提供感知理解和动作建议,而脱胎于VLA的Critic则在线调整Actor,以高精度搞定拧螺丝、充电器插入 2026-01-31 21:54:58 GigaWorld-Policy——以动作为中心的世界动作模型:为降低推理延迟,训练用视频,推理去视频(与Fast-WAM类似) 2026-01-31 21:54:58 EgoScale——第一视角的2万小时人类标注数据扩展灵巧操作的泛化能力(提出人类数据下的缩放定律):先大规模人类预训练,后人机对齐 2026-01-31 21:54:58 OmniRetarget——可与场景交互的人形全身行走-操控系统:实现26年春晚宇树攀爬、跳跃、翻滚、蹬墙翻转及箱体搬运 2026-01-31 21:54:58 DM0——面向物理AI的VLA:先VLM上混入物理数据做预训练,之后保持知识隔离的同时训练流匹配动作专家,最后做微调 2026-01-31 21:54:58 X-VLA——基于Soft Prompt的Transformer编码器练就可扩展的跨本体VLA:VLM做多模态感知,DiT-style做动作生成 2026-01-31 21:54:58 RL-100——基于真实世界RL的高性能灵巧操作:先基于人类演示做模仿学习预训练,再经验数据中离线RL,最后真机在线RL(必要时人工干预) 2026-01-31 21:54:58 RISE——组合式世界模型驱动的RL框架:基于视频扩散模型预测的未来视觉状态,和VLA估计的进度价值评估,以先离线预热后在线改进 2026-01-31 21:54:58 χ0——解决数据收集、模型训练、策略部署三者分布之间的不一致性:完成衣服的摊平、折叠、悬挂等多种任务 2026-01-31 21:54:58 可对标π∗0.6的GigaBrain-0.5M*——从基于世界模型的RL中学习的 VLA:通过联合预测的“价值和未来状态”微调动作策略 2026-01-31 21:54:58 GigaBrain-0——通过世界模型增强VLA的泛化能力,且通过RGBD输入以及具身CoT增强推理能力 2026-01-31 21:54:58 RDT2——基于UMI 数据实现零样本且跨各本体形态的泛化 2026-01-31 21:54:58 DreamZero——同时预测未来视觉状态与动作的世界动作模型:解决当下VLA如果人类不示教则理论强但具体操作不强的弊病,且提升任务泛化、本体泛化 2026-01-31 21:54:58 MetaWorld——分层世界模型:融合 VLM 的语义推理能力、预测的未来动态环境、模仿学习的先验,及基于模型RL的对动态环境的在线自适应 2026-01-31 21:54:58 HumanoidPF——让双足人形无碰撞穿越舱门的视觉-运动策略:基于人工势场APF和混合场景建模的全身RL算法 2026-01-31 21:54:58 InternVLA-A1——面向场景理解、未来状态生成、动作执行的一体化框架:融合VLM的语义理解与世界模型的未来动态预测 2026-01-31 21:54:58 FPO——流匹配策略梯度:避开复杂的对数似然计算,通过「最大化基于CFM损失计算优势加权比率」做策略优化,兼容PPO-CLIP 2026-01-31 21:54:58 VIRAL——仿真中训练但现实中视觉驱动(解决loco-mani所需训练数据大的难题):先Sim中训练教师策略,后蒸馏出基于视觉的学生策略 2026-01-31 21:54:58 一文通透DeepSeek-V3.2——核心在于DeepSeek Sparse Attention(简称DSA):让q跟最相关的k/v做注意力计算,以降低MLA的计算量 2026-01-31 21:54:58 « 上一页123下一页 » 相关分类 #!/slash/note #UNTAG (B)(F)uzzing on my world (Hi)story (IN)SECURE Magazine Notification (gdb) break *0x972 - 带鱼博客 BeltfishBlog - ./kwaa.dev .NET Blog .Trash /home/rook1e 00's Adventure 0kami's Blog 0x41414141 in ?? () 0x7f Blog 0xRick Owned Root ! 0xd00's blog 1 Byte 1A23 Blog 1A23 Studio 1Link.Fun 1stwebdesigner 251 2BAB 的工程博客 2ch中文网 360 CERT 360 Netlab Blog - Network Securi 38号车评中心 3o米的微博 404 Media