Нова ідея Маска: Optimus може навчитися складати одяг, просто дивлячись відео
Tesla навчає гуманоїдного робота Optimus за допомогою "нових навчальних матеріалів": замість використання костюма для захоплення рухів і дистанційного керування, тепер робот тренується, переглядаючи відео.
Tesla (TSLA.O) використовує перевірену часом стратегію для навчання свого людиноподібного робота. За словами обізнаних джерел, на кінець червня цей виробник електромобілів повідомив співробітникам, що проєкт Optimus зосередиться більше на підході “чистого зору”.
Раніше Tesla використовувала костюми для захоплення руху та гарнітури віртуальної реальності для запису даних операторів-людей і дистанційного керування роботами. Тепер же компанія буде в основному тренувати роботів за допомогою відеозапису робітників, які виконують завдання, наприклад, навчаючи його піднімати предмети чи складати футболки.
За словами джерел, компанія заявила, що відмова від костюмів для захоплення руху та дистанційного керування дозволить команді швидше масштабувати збір даних.
Ця зміна знаменує собою суттєве коригування стратегії робототехніки Tesla, приводячи Optimus у відповідність із давньою переконаністю генерального директора Маска, що штучний інтелект може опановувати складні завдання лише за допомогою камер. Tesla використовує подібний підхід для навчання свого програмного забезпечення автопілота.
Ця зміна відбулася невдовзі після відставки керівника проєкту Optimus Мілана Ковача (Milan Kovac). За словами джерел, керівник AI Ашок Елусвамі (Ashok Elluswamy) вже очолив цей проєкт.
Захоплення руху та дистанційне керування є стандартною практикою в індустрії робототехніки. Наприклад, провідна компанія Boston Dynamics використовувала дистанційне керування для навчання свого робота Atlas. Під час навчання працівники одягають костюми для захоплення руху, виконують різні завдання, а дані потім завантажуються в робота. Костюми для захоплення руху також можна використовувати для дистанційного керування роботами.
Поки що невідомо, чи Tesla в майбутньому знову віддасть перевагу захопленню руху та дистанційному керуванню, чи продовжить розробку на основі відеоданих, зібраних раніше.
Старший науковий співробітник Інституту досліджень людського та машинного пізнання Роберт Гріффін (Robert Griffin) зазначає, що велика кількість даних дистанційного керування дозволяє роботам навчатися через фізичну взаємодію з навколишнім середовищем. Він стверджує, що лише на основі відеоданих роботам складно точно перенести дії з відео у реальний світ.
“Якщо ви використовуєте лише відеодані, то немає прямої фізичної взаємодії”, — каже він.
Складання футболок і піднімання предметів
Маск вперше оголосив про плани Tesla розробити людиноподібного робота під назвою Optimus у 2021 році. Мільярдер заявив, що цей робот зрештою зможе виконувати роботу на фабриках і доглядати за людьми.
Минулого року компанія наймала “операторів збору даних”. Такі посади передбачали виконання та запис основних домашніх завдань. У вакансіях зазначалося, що оператори повинні тривалий час носити костюми для захоплення руху та гарнітури віртуальної реальності.
До кінця червня проєкт все ще включав навчання Optimus за допомогою дистанційного керування та костюмів для захоплення руху. За словами джерел, працівники витрачали багато часу на вирішення проблем із одягом і самим роботом, що обмежувало обсяг даних, які команда могла зібрати.
Після зміни підходу до навчання працівники почали записувати свої дії за допомогою п’яти камер власного виробництва Tesla. За словами джерел, ці камери встановлюються на шоломі та важкому рюкзаку, які носять працівники, і знімають у різних напрямках, забезпечуючи AI-моделі точними даними про розташування в просторі.
Керівник лабораторії робототехніки Об’єднаної інженерної школи Флоридського сільськогосподарського та механічного університету і Державного університету Флориди Крістіан Хубікі (Christian Hubicki) зазначає, що ці камери з різних ракурсів можуть дозволити Tesla збирати більш детальні дані, “наприклад, про положення суглобів і пальців”, і краще орієнтувати робота. Він додає, що ці відео також можуть доповнювати дані, зібрані раніше за допомогою дистанційного керування.
Під час навчання працівники отримують конкретні інструкції, особливо щодо рухів руками, щоб дії виглядали максимально наближеними до людських. Один із співробітників зазначив, що вони можуть місяцями повторювати одне й те саме просте завдання.
Експерт із робототехніки Шеффілдського університету Джонатан Айткен (Jonathan Aitken) каже, що Tesla, ймовірно, доведеться знайти спосіб, щоб Optimus навчався виконувати різні завдання через універсальні рухи.
“У таких масштабах їм потрібен набір універсальних рухів, інакше навчання всіх завдань займе надто багато часу”, — каже Айткен.
Він додає, що Tesla, ймовірно, застосує стратегію, подібну до компанії Physical Intelligence, яка навчає роботів гнучким навичкам через велику кількість демонстрацій, щоб вони могли застосовувати їх у різних ситуаціях, а не просто механічно повторювати одне завдання.
“Дуже Tesla-підхід до розробки роботів”
Ця нова стратегія відповідає підходу Tesla до навчання програмного забезпечення автопілота. Інші компанії, що розробляють автопілот, використовують такі сенсори, як лідари та міліметрові радари, а Tesla в основному покладається на камери.
Компанія збирає дані з мільйонів автомобілів Tesla, оснащених 8-9 камерами. Маск заявляв, що запуск автопілота в Китаї став можливим після тренування AI-системи на відкритих відео з азійських вулиць.
На телефонній конференції щодо фінансових результатів у січні цього року Маск визнав, що “потреби в навчанні людиноподібного робота Optimus зрештою можуть бути щонайменше в 10 разів більшими, ніж для автомобілів.”
“Це дуже Tesla-підхід до розробки роботів. Жодна інша компанія не намагається робити це в таких масштабах”, — каже Айткен. “Їм потрібен такий же величезний обсяг даних, як і для навчання автомобілів.”
Експерт із AI та робототехніки Державного університету Орегону Алан Ферн (Alan Fern) зазначає, що навчання Optimus для Tesla навіть складніше, ніж розробка автопілота.
“Водіння — це лише одне завдання”, — каже він. Основна залежність від відеонавчання “вимагає, щоб робот і розумів, що відбувається на відео, і мав навички виконання завдань. Деякі речі можна навчитися, спостерігаючи, але для інших потрібна практика в симуляторі чи реальному світі.”
Відмова від відповідальності: зміст цієї статті відображає виключно думку автора і не представляє платформу в будь-якій якості. Ця стаття не повинна бути орієнтиром під час прийняття інвестиційних рішень.
Вас також може зацікавити
Різке падіння Bitcoin, ліквідації на 900 мільйонів: прелюдія до вересневого прокляття?

TRX стикається з корекцією, оскільки Tron побив рекорд у $600B за обсягом стейблкоїнів

ОАЕ ідентифіковано як власника $700M у Bitcoin від майнінгових операцій

Chainlink стикається з можливим падінням на 15% попри потенціал прориву
У тренді
БільшеЦіни на криптовалюти
Більше








