Otopilot, otonom sürüş sistemlerini haritaya yerleştiren ve bize arabaların neler yapabileceğini gösteren ileri bir teknolojidir. Ancak, özellikle otonom sürüş konusunda güncel değilseniz, oldukça kafa karıştırıcı bir konu olabilir.
Bir Tesla’nın nasıl sadece görmekle kalmayıp yollarda nasıl gezindiğini de merak ediyorsanız, beklediğiniz yazı bu olabilir. 19 Ağustos 2021, Yapay Zeka Direktörü Andrej Karpathy ve diğer ekip üyelerinin, Tesla'nın otomatik pilotunun sekiz kamera aracılığıyla görüntü alımından, yollardaki navigasyon sürecine kadar nasıl çalıştığını halka sunduğu ilk Tesla AI günüydü.
Peki "Tesla Autopilot" sistemi tam olarak nedir, neden herkes bu kadar heyecanlı ve bu kadar tartışmalı olan ne? İşte bu ileri teknolojinin ne olduğuna, neler yapabileceğine -ve daha da önemlisi- ve neler yapamayacağına dair özetimiz..
Tesla Autopilot Sistemi
Tesla Autopilot, otonom sürücü yardım sistemi olarak bilinen sistemdir. Basit bir ifadeyle, bir Tesla'nın etrafındaki arabaları ve yolu 'görmesine' ve kendi kendini sınırlı derecede sürmesine izin veren bir özelliktir. Sınırlı derecede diyoruz çünkü, Autopilot, ismine rağmen bir Tesla'yı tamamen otonom, kendi kendini süren bir arabaya dönüştürebileceği anlamına gelmiyor. Sistem kullanışlıdır, ancak yine de çok sınırlıdır ve her an kontrolü ele alabilmek için dikkatli bir sürücü gerektirir.
Birçok kişiye göre Tesla, sürücüsüz araba yarışına liderlik ediyor. Elon Musk'ın dediği gibi 300 "Jedi mühendis"ten oluşan bir ekip; şeritte tutma, şerit değiştirme ve hız sabitleyici gibi en karmaşık sorunların bazılarına çözüm getiriyor. Otonom araçlar, en önemli özellikleri olan şerit tespitinden yaya takibine kadar her şeyi kapsamalı ve her senaryoyu öngörmelidir. Bunun için sadece "Tesla Vision" adı verilen kameralarla yapılmış bir algılama sistemi kullanılıyor.
HydraNet Sistemleri
Tesla'nızı otopilotta sürdüğünüzde, etrafındaki şeyleri görür ve karar vermesi gerekir. Yolda nesne algılama, diğer arabalar ve insanlar, uyulması gereken trafik ışıkları ve dur işaretleri, içinde kalınması gereken şerit çizgileri bulunur. Bunlar, aracınızın anlaması gereken bazı bireysel görev örnekleridir. Bir araba hareket halinde değilken, muhtemelen bir yol ayrımındayken bile, o anda yaklaşık 100 görev vardır. Her görev için bir sinir ağı kullanmak pahalı ve verimsizdir. Tesla AI, büyük miktarda bilgiyi gerçek zamanlı olarak işler. Böylece "Computer Vision" iş akışı, tüm görevleri, bir seferde 1000×1000 görüntü çalıştırma yeteneğine sahip olan ResNet-50 adlı paylaşılan bir omurga üzerinde çalıştırır. Sinir ağlarının bu paylaşılan omurgasına HydraNet denir. Elbette, araç için AI işlemeyi gerçekleştirmek için bu tür HydraNetlerin birden fazla örneği vardır. Her bir hidranetten toplanan bilgiler, tekrarlayan görevleri çözmek için kullanılır. Örneğin, dur işaretleri ile başa çıkmak için çalışan bir görev, yayaları idare etmek için başka bir görev ve trafik ışıklarını kontrol etmek için başka bir görev olabilir. Tüm bu bireysel görevler, paylaşılan bir omurga üzerinde yürütülür. Bu HydraNet mimarisi, bu görevlerin her birinin devasa sinir ağının yalnızca birkaç bölümünü gerektirdiği metodolojisi üzerinde çalışır. Bu, ortak bir bloğunuz olduğu ve belirli ilgili görevler için belirli blokları eğittiğiniz transfer öğrenimi gibidir. HydraNet'lerin her türlü nesne üzerinde eğitilmiş omurgaları ve belirli görevlerde eğitilmiş kafaları vardır. Bu, modeli eğitmek için gereken sürenin yanı sıra çıkarım hızını da artırır.
PyTorch ile Modelin Eğitimi
Yapay sinir ağları geliştirildikten sonra modelin de eğitilmesi gerekmektedir. Tesla'nın fütüristik bilgisayarlı görme yeteneklerini etkinleştirmek için arka planda sayısız kitaplık ve araç uyguladığını biliyoruz. Böyle bir çerçeve, orijinal olarak Facebook'un AI Araştırma laboratuvarı (FAIR) tarafından geliştirilen Pytorch'tur. Tesla, derin öğrenme modelinin eğitim amaçları için PyTorch'u kullanır. Tesla'nın tam özerklik elde etmek için LIDAR veya harita kullanmadığını biliyoruz. Her şey gerçek zamanlı olarak yapılır ve tamamen kameralara ve saf bilgisayar görüşüne bağlıdır. Tesla, otomatik iş akışı planlayıcısı, model eşik kalibrasyonu, kapsamlı değerlendirme, pasif testler simülasyon testleri vb. içeren eğitim ve diğer destekleyici görevler için de Pytorch'u kullanır.
Vektör Alanı
Tesla'nın arabalarında, 8 adet kamera bulunur ve bu kameralar, aracın çevresini ve uzağı görmesini sağlar. Ne yazık ki, bu sekiz kameradan tüm bilgileri alıp doğrudan ne yapacağınızı söyleyen bir yapay zekaya gönderemezsiniz, çünkü bu bir kerede işlemek için çok fazla bilgi anlamına gelir ve bilgisayarlarımız henüz bu kadar güçlü değil. Bunu kendiniz yapmaya çalıştığınızı, etrafınızdaki her şeyi bir anda işlemek zorunda kaldığınızı hayal edin. Sinir ağları için, daha doğrusu CPU'lar ve GPU'lar gibi bilgi işlem cihazları için de durum aynı zorlukta olacaktır. Bu sorunu çözmek için Tesla, bu sekiz kameradan elde eden verileri "vektör alanı" olarak adlandırdıkları çok daha küçük bir alana aktarır. Bu alan, yol işaretleri, arabalar, insanlar, çizgiler gibi çevredeki tüm ilgili bilgileri içeren 3 boyutlu bir alandır. Bu yeni alan daha sonra arabanın yapması gereken nesne algılama, trafik ışığı görevleri, şerit tahmini gibi birçok farklı görev için kullanılır.