自动驾驶车辆搭载摄像头、激光雷达、毫米波雷达、超声波传感器,每日产生数TB原始数据。数据分散在车载存储、路测服务器、云端仓库,缺乏统一索引,场景检索耗时数小时,严重影响算法迭代效率。
从路测发现问题、数据回传、场景筛选、数据标注、模型训练、仿真验证到OTA升级,涉及十几个系统。各环节数据格式不统一、接口不互通,导致Corner Case从发现到修复周期长达数周。
自动驾驶需要覆盖数百万个场景,包括正常场景、危险场景、Corner Case。当前场景数据缺乏统一标签体系,重复采集严重,场景覆盖率难以量化评估,影响路测效率和安全性。
仿真平台产生大量虚拟场景数据,实车路测产生真实场景数据,两者缺乏统一管理和对比分析能力。模型在仿真环境表现良好,实车表现却不稳定,问题难以快速定位。
INFINI Labs针对自动驾驶企业的数据闭环需求提供全方位解决方案
构建统一的自动驾驶数据管理平台,汇聚车载感知数据、定位数据、规控数据、接管数据、仿真数据。支持PB级数据存储、秒级场景检索、多模态数据关联分析,实现从数据采集中枢到算法训练工厂的无缝衔接。
基于向量搜索技术,实现自然语言检索驾驶场景。输入"雨天夜间无保护左转",秒级定位相关场景片段。支持以图搜图、以场景搜场景,大幅提升Corner Case筛选效率。
建立从原始传感器数据、标注数据、训练数据集、模型版本到仿真结果的全链路血缘关系。模型效果异常时,快速追溯训练数据来源,定位问题根因。
支持车端数据实时上传、云端实时分析、结果实时下发。路测车辆发现异常场景,云端自动触发场景分析、关联历史数据、生成测试报告,实现小时级数据闭环。
自动驾驶路测车队每日产生海量数据,需要高效管理、快速检索、精准筛选。
发现Corner Case后,需要快速完成数据回传、场景分析、数据标注、模型重训、仿真验证。
仿真平台产生大量虚拟场景,需要与实车数据统一管理、对比分析、联合训练。
车辆量产后,需要持续采集真实道路数据,监控模型表现,支持OTA迭代。
通过统一数据湖、智能场景检索、车云协同分析,将Corner Case从发现到修复的周期从数周缩短到数小时,算法迭代速度大幅提升。
场景智能检索避免重复采集,数据血缘追踪优化标注策略,精准筛选高价值场景,显著减少无效路测里程和标注工作量。
全链路数据血缘追踪,模型效果异常时可快速定位训练数据来源,满足自动驾驶功能安全与合规审计要求。
基于Easysearch分布式架构,支持PB级数据、百万级车辆、高并发查询,满足从研发测试到量产运营的全生命周期需求。