华泰证券研报表示,4月11日,毫末举行第8届AI DAY,发布了纯视觉为主的DriveGPT大模型,该模型现阶段主要用于解决自动驾驶认知决策问题,可以通过输入驾驶场景数据进行多场景预测并规划最佳行径路途。目前DriveGPT已经包含4000万公里的量产车驾驶数据、1200亿参数,拥有19.6亿个30万类场景标签。DriveGPT将在今年新摩卡DHT-PHEV车型首发落地,提升HPilot高速/城市NOH安全性和流畅性。我们认为GPT大模型范式有望赋能垂直领域智能驾驶感知标注、决策推理等核心环节,加速智驾落地,同时大模型研发或推动驾驶数据和算力需求快速增长。建议关注L2级自动驾驶/AI算力产业链。
全文如下
华泰 | 电子:从DriveGPT看大模型如何赋能智能驾驶
4月11日,毫末举行第8届AI DAY,发布了纯视觉为主的DriveGPT大模型,该模型现阶段主要用于解决自动驾驶认知决策问题,可以通过输入驾驶场景数据进行多场景预测并规划最佳行径路途。目前DriveGPT已经包含4000万公里的量产车驾驶数据、1200亿参数,拥有19.6亿个30万类场景标签。DriveGPT将在今年新摩卡DHT-PHEV车型首发落地,提升HPilot高速/城市NOH安全性和流畅性。我们认为GPT大模型范式有望赋能垂直领域智能驾驶感知标注、决策推理等核心环节,加速智驾落地,同时大模型研发或推动驾驶数据和算力需求快速增长。建议关注L2级自动驾驶/AI算力产业链。
(资料图)
核心观点
DriveGPT:大模型赋能场景生成、轨迹预测、推理决策
毫末智行发布了其DriveGPT自动驾驶生成式大模型,具体逻辑:(1)感知环境离散化后作为token设计drive language;(2)输入大量驾驶场景数据,利用transformer模型生成系列决策结果;(3)RLHF:将人工挑选困难场景Clips(数据组)输入训练模型,对生成结果进行最优解排序;(4)Reward Model强化学习。DriveGPT目前可以根据历史一段时间驾驶场景序列数据,不断生成未来可能发生的多种驾驶环境并预测每种情况下车辆行驶轨迹。此外公司目前正设计利用prompt提示优化输出结果,并给DriveGPT加入思考链,使驾驶策略具备逻辑可解释性,解决transformer黑盒模式潜在问题。
机会:大模型有望解决行业数据标注准确率及成本困境
视觉识别是开发大模型的基础能力之一,识别传感器输入图像中的车道线、车辆、行人、交通灯等要素并进行数据标注才能获得大量的可用训练数据集。我们看到DriveGPT等大模型可以很好地自动识别图像以替代人工标注,据毫末会上表示,DriveGPT可以将交通场景图像的标注费用从行业平均约5元/张降至约0.5元/张,计划逐步向合作伙伴开放该服务。同时,我们认为近期Meta的CV模型SAM有望赋能自动驾驶行业,SAM无需额外训练即可自动完成分割,提升机器视觉,有利于自动驾驶可用训练集快速积累。
挑战:国内AI智能驾驶大模型应用普及仍面临数据需求和算力等挑战
(1)数据:DriveGPT目前参数量约1200亿,拥有约4,000万公里的量产车驾驶数据。参考行业龙头特斯拉2020年已有超48亿公里数据,大模型赋能下我们认为国内公司或将加快智能驾驶系统量产上车步伐,加快数据搜集回馈模型训练。(2)算力:特斯拉FSD背后拥有1.4W个GPU训练集群;毫末建设MANA OASIS中心给DriveGPT提供67亿次/秒的高性能浮点运算,2T/秒存储带宽,以及800G/秒通信带宽支持;小鹏计算中心“扶摇”提供算力达600PFLOPS.大模型、大数据驱动的智能驾驶对算力提出了更高要求,有望驱动算力基础设施需求。建议关注L2级自动驾驶/算力产业链。
(文章来源:证券时报)