首页 > 汽车早报 > 汽车早报 > 理想汽车启动端到端+视觉语言模型早鸟计划:车辆具备思考能力

理想汽车启动端到端+视觉语言模型早鸟计划:车辆具备思考能力

发布时间:2024-07-06 21:19:20来源: 15210273549

7 月 5 日消息,在今晚的理想智能驾驶夏季发布会期间,理想汽车宣布,端到端 + 视觉语言模型早鸟计划正式启动,号称可让车更智能、更像人。

IT之家汇总主要信息如下:

理想汽车称端到端模型的优势在于“高效传递”和“高效计算”两方面:端到端是一体化的模型,信息都在模型内部传递,具有更高上限,用户所能感受到的整套系统的动作、决策都“更加拟人”;一体化模型可在 GPU 里一次完成推理,且端到端延迟更低,用户可感知到“眼”“手”协调一致,车辆动作响应及时。

一体化模型可实现端到端的可训,完全数据驱动。官方表示,对于用户来说最大的感受就是 OTA 的速度越来越快

视觉语言模型方面,其整体算法架构由统一的 Transformer 模型组成,将 Prompt(提示词)文本进行 Tokenizer(分词器)编码,然后将前视 120 度和 30 度相机的图像以及导航地图信息进行视觉信息编码,通过图文对齐模块进行模态对齐,统一交给 VLM 模型进行自回归推理;VLM 输出的信息包括对环境的理解、驾驶决策和驾驶轨迹,并传递给系统 1 控制车辆。

官方表示,该系统整体设计存在三个亮点:设计了流式视频编码器,能缓存更长时序视觉信息;增加了记忆模块,缓存了多帧历史信息,可解决超长上下文推理时延问题;设计了智能驾驶 Prompt 问题库,系统 2 可以“思考”当前驾驶环境并给系统 1 合理驾驶建议,系统 1 也可在不同场景下调用不同 Prompt 问题,主动向系统 2 进行“求助”。

汽车早报更多>>

关灯玩手机致盲?侧躺刷视频眼斜?这5个“毁眼习惯”正在偷偷搞垮你的视力! 华为两款鸿蒙电脑今日开售,最低 7999 元起 千尺学堂手机摄影游学:银发族的光影探索与非遗之旅 红米K80 12GB+256GB 山峦青 活动价1107元 华为WATCH 5系列首发鸿蒙AI,接入盘古及DeepSeek双大模型 华为Pura 80系列配色首曝:主打陶瓷质感,其已注册多枚Pura相关商标 小鹏宣布与华为战略合作,新车将搭载华为HUD解决方案 首款星闪 / 鸿蒙 AI 智能手表,华为 WATCH 5 将与 Pura 80 系列手机同台发布 欧盟新规本月生效,强制手机 / 平板至少提供 5 年软件更新 降低谷歌依赖,古尔曼称三星有望将 Perplexity 接入自家浏览器、语音助手 华硕推出 NUC 15 Pro 迷你主机:Ultra 5-225H,5799 元 毕业季购机前瞻,高性能轻薄本华硕天选Air 2025首发到手7099元 高质增长夯实市场信心,联想集团获海内外多家投行及券商唱多 全球全景相机龙头! 影石创新即将登陆科创板,了解下? 小米(01810.HK)强势开局,自研芯片筑起护城河 iQOO Neo5适用套天下钢化膜仅需2.78元 耐尔金OPPO Find X6磨砂保护壳,限时特惠32.3元 向“相机凸起”宣战:三星电机创新超薄技术,Galaxy S26 系列手机有望首发 三星官方发文:三星推出 One UI 8 Beta 计划:下半年发布的Galaxy Fold 四百元的iQOO口碑之作,大底主摄,60倍变焦能否续写昔日辉煌? 2025年三星商显新品鉴赏会上海站举行:科技重构未来场景,开启空间智慧革命 华硕ROG电竞显示器销量暴增3倍!为何突然成黑马 8.8英寸LCD+天玑9400!REDMI 8.8英寸电竞小平板6月发布 小米相机1X按钮快切28mm/35mm焦段功能新增适配机型公布 魅族flyme aios 2有哪些先进功能和特点 鸿蒙代码量飙升!华为的“终极武器”能否颠覆全球OS格局? 618别踩坑!华为与荣耀手机差异大揭秘秘!想了解的点进来吧! 三星计划到2028年用玻璃中介层取代硅 实现更高性能与低制造成本 房贷利率还有下行空间吗? 住宅涨价周期来临,房价往往就是一次性跳涨