Искусственный интеллект китайских автомобилей лучше Tesla

Не так давно идея транспортных средств, которые могли бы управлять собой, казалась мечтательным, футуристическим видением транспорта. Внезапно на дороге появились автомобили с системой помощи при вождении. Но гонка за создание полностью самоуправляемых автомобилей, работающих на автономных системах вождения, действительно работоспособных и заслуживающих доверия, далека от финишной черты.

В глобальном стремлении усовершенствовать такую ​​систему ученые из Китая разработали технологию автономного вождения, основанную на крупномасштабной модели искусственного интеллекта , аналогичную технологии революционного чат-бота ChatGPT. Их работа, которая может указать на совершенно новое направление для отрасли, недавно получила награду за лучшую работу на одной из ведущих научных конференций. По мнению некоторых экспертов, эта технология может значительно превзойти системы, которые в настоящее время тестируются в транспортных средствах, включая систему полного самостоятельного вождения Tesla (FSD).

На конференции по компьютерному зрению и распознаванию образов (CVPR), организованной Институтом инженеров по электротехнике и электронике (IEEE) в Ванкувере 21 июня, призом мероприятия был удостоен совместный проект исследователей Шанхайской лаборатории искусственного интеллекта, Уханьского университета и SenseTime. за лучшую структуру. В этом году на CVPR — крупнейшее ежегодное мероприятие в области искусственного интеллекта и компьютерного восприятия — было подано 9 155 заявок. Только четверть из них были приняты, и только две работы были достойны награды за лучшую работу.

Столкнувшись с огромной конкуренцией со стороны исследований, представленных ведущими университетами и технологическими гигантами, включая Google, Стэнфорд и Корнелл, китайские ученые впервые получили эту награду. Центральным элементом исследования был новый алгоритм автономного вождения под названием Unified Autonomous Driving (UniAD), дизайн, который, согласно испытаниям, превзошел другие основные модели автономного вождения, включая FSD Tesla.

В имитационных тестах вождения с использованием данных уличных сцен, собранных в Бостоне и Сингапуре, UniAD превзошел другие автономные системы на 20–30 процентов по различным параметрам, включая отслеживание и прогнозирование других объектов. Система Unified Autonomous Driving (UniAD), разработанная группой китайских исследователей, превосходит другие модели в имитационных тестах вождения.  Что отличает UniAD от большинства других отраслевых решений, так это то, что оно впервые объединяет восприятие и принятие решений, в результате чего получается движущая система, которая следует философии, ориентированной на планирование. «Насколько нам известно, UniAD — это первая работа, в которой всесторонне исследуется совместное взаимодействие такого разнообразия задач, включая восприятие, прогнозирование и планирование в области автономного вождения», — сказал Ли Хунъян, ведущий научный сотрудник Шанхайской лаборатории искусственного интеллекта.

Современные автономные системы вождения объединяют аспекты как автомобильной промышленности, так и искусственного интеллекта, которые включают в себя ряд задач, таких как обнаружение, отслеживание и картографирование. Существующие алгоритмы автономного вождения можно условно разделить на три категории. Наиболее распространенные модульные конструкции выполняют задачи восприятия, прогнозирования и планирования по отдельности. Хотя разработка каждого модуля более гибкая, такие конструкции рискуют потерять информацию между модулями.

Более элегантный дизайн включает несколько задач в одну многозадачную структуру обучения, что более распространено в таких компаниях, как Tesla и Xpeng в Китае. Конструкция может легко брать на себя дополнительные задачи, тем самым снижая вычислительные требования, предъявляемые к встроенным микросхемам. В то же время алгоритм может свести к минимуму проблемы координации между задачами, которые могут привести к кумулятивным ошибкам.

Новейшие сквозные системы — масштабные модели ИИ — объединяют все задачи в единое целое. Сеть использует необработанные данные датчиков, такие как изображения или радар, в качестве входных данных и напрямую выводит желаемые действия вождения, такие как рулевое управление, ускорение и торможение. Некоторые ученые в области искусственного интеллекта говорят, что крупномасштабная модель искусственного интеллекта может стать идеальным решением для автономного вождения. Поскольку она основана на более прямой цепочке решений, система может значительно снизить вероятность информационных ошибок, что приведет к более высокому потенциалу производительности.

Производительность алгоритма UniAD основывалась на наборах данных реальных сценариев из nuScenes, большого общедоступного набора данных, собранных на реальных дорогах. Он послужил эталоном для многих алгоритмов восприятия и систем автономного вождения. Согласно статье, UniAD получил высшие оценки во всех тестах с использованием nuScenes. Например, точность отслеживания нескольких объектов была на 20 % выше, чем у предыдущего рекорда, а частота ошибок при прогнозировании движения и планировании снизилась на 38 и 28 % соответственно. Хотя многообещающие результаты свидетельствуют о прогрессе в технологии автономного вождения, набор данных nuScenes относительно невелик по сравнению с реальными сценариями автономного вождения. Это открывает возможность того, что между результатами тестирования UniAD и его практическим применением может быть значительный разрыв. 

У системы FSD Tesla был вялый переход к реальному использованию. Ограничения по условиям дорожных испытаний, накоплению данных и обучению алгоритмов сделали прогресс медленным и дорогостоящим. Чтобы ускорить обучение, Tesla создала виртуальное симуляционное пространство, которое включает все элементы дорожного движения и крайние случаи. Система FSD претерпела множество итераций в симуляционном обучении. По состоянию на май общее расстояние, пройденное для глобального парка Tesla, превысило 100 миллиардов миль (161 миллиард км), и добровольно предоставленные данные о поведении водителей продолжают помогать совершенствовать алгоритм FSD. Но, по словам разработчиков, более комплексная конструкция модели UniAD дает ей возможность стать технологией автономного вождения следующего поколения. «Благодаря своей полной интерпретируемости, безопасности и непрерывной итерации между несколькими модулями UniAD является наиболее многообещающей сквозной моделью для практического развертывания», — сказал Ли из Шанхайской лаборатории искусственного интеллекта.

У UniAD также может быть преимущество в цене. UniAD, основанный на вводе двумерного изображения, превзошел другие методы, основанные на входе обнаружения света и ранжирования. В результате алгоритм вождения может значительно сэкономить на аппаратных средствах, при этом повысив безопасность. Поскольку область автономного вождения быстро развивается, она остается высококонкурентной, и различные компании стремятся разработать системы, которые, как они надеются, изменят правила игры. Исследователи системы UniAD говорят, что их технология заслуживает дальнейшего изучения. «Мы надеемся, что эта работа прольет свет на целевую конструкцию автономной системы вождения и послужит отправной точкой для координации многих задач вождения»