Otopilot, otonom sürüş sistemlerini haritaya yerleştiren ve bize arabaların neler yapabileceğini gösteren ileri bir teknolojidir. Ancak, özellikle otonom sürüş konusunda güncel değilseniz, oldukça kafa karıştırıcı bir konu olabilir.
Bir Tesla’nın nasıl sadece görmekle kalmayıp yollarda nasıl gezindiğini de merak ediyorsanız, beklediğiniz yazı bu olabilir. 19 Ağustos 2021, Yapay Zeka Direktörü Andrej Karpathy ve diğer ekip üyelerinin, Tesla'nın otomatik pilotunun sekiz kamera aracılığıyla görüntü alımından, yollardaki navigasyon sürecine kadar nasıl çalıştığını halka sunduğu ilk Tesla AI günüydü.
Peki "Tesla Autopilot" sistemi tam olarak nedir, neden herkes bu kadar heyecanlı ve bu kadar tartışmalı olan ne? İşte bu ileri teknolojinin ne olduğuna, neler yapabileceğine -ve daha da önemlisi- ve neler yapamayacağına dair özetimiz..
Tesla Autopilot Sistemi
Tesla Autopilot, otonom sürücü yardım sistemi olarak bilinen sistemdir. Basit bir ifadeyle, bir Tesla'nın etrafındaki arabaları ve yolu 'görmesine' ve kendi kendini sınırlı derecede sürmesine izin veren bir özelliktir. Sınırlı derecede diyoruz çünkü, Autopilot, ismine rağmen bir Tesla'yı tamamen otonom, kendi kendini süren bir arabaya dönüştürebileceği anlamına gelmiyor. Sistem kullanışlıdır, ancak yine de çok sınırlıdır ve her an kontrolü ele alabilmek için dikkatli bir sürücü gerektirir.
Birçok kişiye göre Tesla, sürücüsüz araba yarışına liderlik ediyor. Elon Musk'ın dediği gibi 300 "Jedi mühendis"ten oluşan bir ekip; şeritte tutma, şerit değiştirme ve hız sabitleyici gibi en karmaşık sorunların bazılarına çözüm getiriyor. Otonom araçlar, en önemli özellikleri olan şerit tespitinden yaya takibine kadar her şeyi kapsamalı ve her senaryoyu öngörmelidir. Bunun için sadece "Tesla Vision" adı verilen kameralarla yapılmış bir algılama sistemi kullanılıyor.
HydraNet Sistemleri
Tesla'nızı otopilotta sürdüğünüzde, etrafındaki şeyleri görür ve karar vermesi gerekir. Yolda nesne algılama, diğer arabalar ve insanlar, uyulması gereken trafik ışıkları ve dur işaretleri, içinde kalınması gereken şerit çizgileri bulunur. Bunlar, aracınızın anlaması gereken bazı bireysel görev örnekleridir. Bir araba hareket halinde değilken, muhtemelen bir yol ayrımındayken bile, o anda yaklaşık 100 görev vardır. Her görev için bir sinir ağı kullanmak pahalı ve verimsizdir. Tesla AI, büyük miktarda bilgiyi gerçek zamanlı olarak işler. Böylece "Computer Vision" iş akışı, tüm görevleri, bir seferde 1000×1000 görüntü çalıştırma yeteneğine sahip olan ResNet-50 adlı paylaşılan bir omurga üzerinde çalıştırır. Sinir ağlarının bu paylaşılan omurgasına HydraNet denir. Elbette, araç için AI işlemeyi gerçekleştirmek için bu tür HydraNetlerin birden fazla örneği vardır. Her bir hidranetten toplanan bilgiler, tekrarlayan görevleri çözmek için kullanılır. Örneğin, dur işaretleri ile başa çıkmak için çalışan bir görev, yayaları idare etmek için başka bir görev ve trafik ışıklarını kontrol etmek için başka bir görev olabilir. Tüm bu bireysel görevler, paylaşılan bir omurga üzerinde yürütülür. Bu HydraNet mimarisi, bu görevlerin her birinin devasa sinir ağının yalnızca birkaç bölümünü gerektirdiği metodolojisi üzerinde çalışır. Bu, ortak bir bloğunuz olduğu ve belirli ilgili görevler için belirli blokları eğittiğiniz transfer öğrenimi gibidir. HydraNet'lerin her türlü nesne üzerinde eğitilmiş omurgaları ve belirli görevlerde eğitilmiş kafaları vardır. Bu, modeli eğitmek için gereken sürenin yanı sıra çıkarım hızını da artırır.
PyTorch ile Modelin Eğitimi
Yapay sinir ağları geliştirildikten sonra modelin de eğitilmesi gerekmektedir. Tesla'nın fütüristik bilgisayarlı görme yeteneklerini etkinleştirmek için arka planda sayısız kitaplık ve araç uyguladığını biliyoruz. Böyle bir çerçeve, orijinal olarak Facebook'un AI Araştırma laboratuvarı (FAIR) tarafından geliştirilen Pytorch'tur. Tesla, derin öğrenme modelinin eğitim amaçları için PyTorch'u kullanır. Tesla'nın tam özerklik elde etmek için LIDAR veya harita kullanmadığını biliyoruz. Her şey gerçek zamanlı olarak yapılır ve tamamen kameralara ve saf bilgisayar görüşüne bağlıdır. Tesla, otomatik iş akışı planlayıcısı, model eşik kalibrasyonu, kapsamlı değerlendirme, pasif testler simülasyon testleri vb. içeren eğitim ve diğer destekleyici görevler için de Pytorch'u kullanır.
Vektör Alanı
Tesla'nın arabalarında, 8 adet kamera bulunur ve bu kameralar, aracın çevresini ve uzağı görmesini sağlar. Ne yazık ki, bu sekiz kameradan tüm bilgileri alıp doğrudan ne yapacağınızı söyleyen bir yapay zekaya gönderemezsiniz, çünkü bu bir kerede işlemek için çok fazla bilgi anlamına gelir ve bilgisayarlarımız henüz bu kadar güçlü değil. Bunu kendiniz yapmaya çalıştığınızı, etrafınızdaki her şeyi bir anda işlemek zorunda kaldığınızı hayal edin. Sinir ağları için, daha doğrusu CPU'lar ve GPU'lar gibi bilgi işlem cihazları için de durum aynı zorlukta olacaktır. Bu sorunu çözmek için Tesla, bu sekiz kameradan elde eden verileri "vektör alanı" olarak adlandırdıkları çok daha küçük bir alana aktarır. Bu alan, yol işaretleri, arabalar, insanlar, çizgiler gibi çevredeki tüm ilgili bilgileri içeren 3 boyutlu bir alandır. Bu yeni alan daha sonra arabanın yapması gereken nesne algılama, trafik ışığı görevleri, şerit tahmini gibi birçok farklı görev için kullanılır.
Fakat, kırmızı-yeşil-mavi görüntülerden oluşan 8x3 boyutlu girdi nasıl oluyor da 3 boyutlu tek bir çıktı haline nasıl geliyor? Bu 4 adımda elde ediliyor ve sekiz kameranın tümü için paralel olarak yapılıyor, bu da onu süper verimli hale getiriyor.
Bu mimariyi özetleyecek olursak, elimizde ilk olarak fotoğraf çeken sekiz kamera bulunuyor. Bilgiler, kalibre edildikten sonra onları yoğunlaştıran bir CNN'e (Convolutional Neural Networks/Evrişimli Sinir Ağları) gönderilirler. CNN, bilgileri verimli bir şekilde ayıklar ve bunu sekiz kameradan gelen bilgileri tek bir 3D gösterimde birleştirecek bir transformatör mimarisine göndermeden önce her şeyi birleştirir. Son olarak, bu 3D temsil birkaç kare üzerinden önbelleğe kaydedilecek ve daha sonra, bağlamı daha iyi anlamak ve görevleri göndermek için 3D alanın son sürümünü çıkarmak üzere tüm bu kareleri kullanacak bir RNN mimarisine (Recurrent Neural Network/Tekrarlayan Sinir Ağı) gönderilecektir. RNN, bu aşamada nihayet bireysel olarak eğitilebilir ve performans ve verimliliği en üst düzeye çıkarmak için paralel olarak çalışabilir. Mimariyi tüm teknik detaylarıyla dinlemek ve incelemek isteyenler bu videoya bakabilir.
Neden Sadece Kameralar Kullanılıyor?
İlginç bir detay, Tesla Autopilot'un tahminlerde bulunmak ve nihayetinde arabayı hedefine yönlendirmek için yalnızca ham görsel bilgileri kullanmasıdır. Tesla'ların arabanın yanlarına dağıtılmış 8 kamerası bulunuyor ancak LiDAR (Işık Tespiti ve Uzaklık Tayini) gibi başka sensörleri bulunmuyor. Elon Musk konu ile ilgili, LiDAR teknolojisinin “aptal işi” olduğunu ve gereksiz pahalı sensörler bulunduğunu belirtmişti.
Buradaki mantık, kamera tabanlı görsel sistemi daha da geliştirmek için faydalı olmasına rağmen, LiDAR teknolojisinin pahalı ve gereksiz olmasıdır. İnsanlar, radar benzeri bir teknoloji olmadan dünyada otonom olarak geziniyor, bu yüzden arabaların da yapabilmesi gerekiyor. Bazen teknolojik yolu doğadan uzaklaştırmak, tekerlekler, uçaklar, denizaltılar inanılmaz sonuçlar vermiş olsa da sadece görsel bilgilere dayalı otonom bir sistem geliştirebilecek miyiz bunu zaman gösterecek.
Hatırlatma
Autopilot hakkında hatırlanması gereken en önemli şey, firmanın web sitelerinde de ısrarla vurguladığı gibi, Tesla'nızı kendi kendini süren bir arabaya dönüştürmemesidir. Öyle görünse bile, Autopilot hala 2. Seviye otonom sürüş sistemi olarak sınıflandırılıyor ve birçok özelliği hala beta aşamasında. Sürücü girişi seçeneği olmayan tamamen otonom bir araba, “Seviye 5” sistemi olarak sınıflandırılır ve henüz bu tür arabalar satışa sunulmamıştır. Autopilot ismi, bir Tesla'nın kendi kendisini sürebileceği anlamına gelmesine rağmen, henüz tüm güveninizi verebileceğiniz kusursuz bir sistem değildir.- Tom Pritchard, What is Tesla Autopilot? Everything you need to know, https://www.tomsguide.com/reference/telsa-autopilot (10 Nisan 2022)
- Louis Bouchard, Tesla's Autopilot Explained! Tesla AI Day in 10 Minutes, https://www.louisbouchard.ai/tesla-autopilot-explained-tesla-ai-day/ (10 Nisan 2022)
- Alberto Romero, Tesla AI Day 2021 Review — Part 1: The Promise of Fully Self-Driving Cars, https://towardsdatascience.com/tesla-ai-day-2021-review-part-1-the-promise-of-fully-self-driving-cars-8e469265509b (10 Nisan 2022)
- Chris Rosamond, Tesla Autopilot explained: what is it, and is it safe?, https://www.autoexpress.co.uk/tesla/96682/tesla-autopilot-explained-what-is-it-and-is-it-safe ( 10 Nisan 2022)
- TESLA, https://www.tesla.com/en_AE/support/autopilot-and-full-self-driving-capability#capability-features (10 Nisan 2022)
- Mother Frunker, Tesla AI Day Simplified, https://driveteslacanada.ca/news/tesla-ai-day-simplified/ ( 10 Nisan 2022)
- Riona Almeida, How Tesla uses AI and CV, https://www.fireblazeaischool.in/blogs/how-tesla-uses-ai-and-cv/#Hydranet ( 10 Nisan 2022)
- Phuc Nguyen, How Tesla uses neural network at scale in production, https://phucnsp.github.io/blog/self-taught/2020/04/30/tesla-nn-in-production.html ( 10 Nisan 2022)
- Computer Vision at Tesla, https://www.thinkautonomous.ai/blog/?p=computer-vision-at-tesla#hydranets ( 10 Nisan 2022)
Dilediğiniz miktarda aylık veya tek seferlik bağış yapabilirsiniz.
Destek Ol