Technology Roadmap
四阶段路线图
从已落地到长期愿景的研究方向。
Stage 1
视觉大模型 · 长视频理解 · 多场景结构化输出
Stage 2
视觉世界模型 · 时序动态建模 · 行为前置预警
Stage 3
视觉具身智能 · 物理世界感知—决策—行动闭环
Stage 4
跨模态世界模型 · 可控生成 · 大规模具身仿真
研究方向
6 个核心研究领域。
Long-Video Understanding
超长视频时序建模、关键事件提取
Visual World Model
场景动态建模、行为预测、反事实推理
Vertical-Scene Adaptation
行业模型快速适配、小样本学习
Embodied Visual Foundation
边缘智能视觉底座、感知—决策接口
Cross-Domain Generalization
跨场景泛化、零样本迁移
Engineering Productization
工程化封装、低延迟推理、私有化部署