Mengapa Kirin 970 NPU lebih cepat dari Snapdragon 845

197

Sebagai kecerdasan artifisial  menyelinap masuk ke dalam pengalaman smartphone kami, vendor SoC telah berlomba untuk meningkatkan jaringan saraf dan kinerja pembelajaran mesin dalam chip mereka. Setiap orang memiliki pandangan berbeda tentang cara memberdayakan kasus penggunaan yang muncul ini, tetapi tren umumnya adalah menyertakan semacam perangkat keras khusus untuk mempercepat tugas pembelajaran mesin umum seperti pengenalan gambar. Namun, perbedaan perangkat keras berarti bahwa chip menawarkan berbagai tingkat kinerja.

Tahun lalu muncul bahwa Kirin 970 dari HiSilicon mengalahkan Qualcomm Snapdragon 835 dalam sejumlah tolok ukur pengenalan citra. Honor baru-baru ini menerbitkan pengujiannya sendiri yang menyatakan bahwa chip tersebut berperforma lebih baik daripada Snapdragon 845 yang lebih baru.

Kami sedikit skeptis terhadap hasil ketika sebuah perusahaan menguji chipnya sendiri, tetapi tolok ukur yang digunakan Honor (Resnet dan VGG) biasanya digunakan sebagai pengenalan gambar algoritma jaringan syaraf yang sudah dilatih sebelumnya, jadi keunggulan kinerja tidak boleh diendus di . Perusahaan mengklaim hingga peningkatan dua belas kali lipat menggunakan SDK HiAI-nya versus Snapdragon NPE. Dua hasil yang lebih populer menunjukkan peningkatan antara 20 dan 33 persen.

snapdragon 845 vs kirin 970

Terlepas dari hasil yang tepat, ini menimbulkan pertanyaan yang agak menarik tentang sifat pemrosesan jaringan saraf pada SoCs smartphone. Apa yang menyebabkan perbedaan kinerja antara dua chip dengan aplikasi pembelajaran mesin yang sama?

DSP vs NPU mendekati

Perbedaan besar antara Kirin 970 vs Snapdragon 845 adalah opsi HiSilicon mengimplementasikan Unit Pemrosesan Saraf yang dirancang khusus untuk memproses tugas-tugas pembelajaran mesin tertentu dengan cepat. Sementara itu, Qualcomm mendesain ulang desain Hexagon DSP yang sudah ada ke nomor crunch untuk tugas-tugas pembelajaran mesin, daripada menambahkan dalam silikon ekstra khusus untuk tugas-tugas ini.

Dengan Snapdragon 845, Qualcomm menawarkan kinerja hingga tiga kali lipat untuk beberapa tugas AI di atas 835. Untuk mempercepat pembelajaran mesin pada DSP-nya, Qualcomm menggunakan Hexagon Vector Extensions (HVX) yang mempercepat matematika vektor 8-bit yang biasa digunakan oleh tugas-tugas pembelajaran mesin . 845 juga menawarkan mikro-arsitektur baru yang menggandakan kinerja 8-bit dari generasi sebelumnya. Hexagon DSP milik Qualcomm adalah mesin pengolah matematika yang efisien, tetapi masih dirancang secara mendasar untuk menangani berbagai tugas matematika dan secara berangsur-angsur diperbaiki untuk meningkatkan kasus penggunaan pengenalan citra.

Kirin 970 juga menyertakan DSP (sebuah Irama Tensilica Vision P6) untuk audio, gambar kamera, dan pemrosesan lainnya. Ini kira-kira sama dengan Qualcomm Hexagon DSP, tetapi saat ini tidak terekspos melalui HiAI SDK untuk digunakan dengan aplikasi pembelajaran mesin pihak ketiga.

Snapdragon 835 DSP

The Hexagon 680 DSP dari Snapdragon 835 adalah prosesor matematika skalar multi-threaded. Ini adalah pengambilan yang berbeda dibandingkan dengan beberapa prosesor matriks massal untuk Google atau Huawei.

NPU HiSilicon sangat dioptimalkan untuk pembelajaran mesin dan pengenalan gambar, tetapi tidak ada gunanya untuk tugas DSP biasa seperti filter EQ audio. NPU adalah chip dipesan lebih dahulu dirancang bekerja sama dengan Teknologi Cambricon dan terutama dibangun di sekitar unit multiply matriks ganda.

Anda mungkin mengenali ini sebagai pendekatan yang sama dengan yang dilakukan Google dengan chip pembelajaran Cloud TPU dan mesin Piksel Inti yang sangat kuat . Huawei NPU tidak begitu besar atau kuat seperti chip server Google, memilih sejumlah kecil 3 x 3 unit matriks ganda, daripada desain 128 x 128 Google yang besar. Google juga dioptimalkan untuk matematika 8-bit sementara Huawei fokus pada titik mengambang 16-bit.

Perbedaan kinerja turun ke pilihan arsitektur antara DSP yang lebih umum dan perangkat lunak matriks berdedikasi multiply.

Kunci pengambil-alihan di sini adalah NPU Huawei dirancang untuk sekumpulan tugas yang sangat kecil, sebagian besar terkait dengan pengenalan gambar, tetapi dapat mengeras melalui angka dengan sangat cepat – diduga hingga 2.000 gambar per detik. Pendekatan Qualcomm adalah untuk mendukung operasi matematika ini menggunakan DSP yang lebih konvensional, yang lebih fleksibel dan menghemat ruang silikon, tetapi tidak akan mencapai potensi puncak yang sama. Kedua perusahaan juga besar dalam pendekatan heterogen terhadap pemrosesan yang efisien dan memiliki mesin khusus untuk mengelola tugas di seluruh CPU, GPU, DSP, dan dalam kasus Huawei NPU-nya juga, untuk efisiensi maksimum.

 

Qualcomm duduk di pagar

Jadi mengapa Qualcomm, perusahaan pengolah aplikasi seluler berperforma tinggi, menggunakan pendekatan berbeda untuk HiSilicon, Google, dan Apple untuk perangkat keras pembelajaran mesinnya? Jawaban segera mungkin adalah tidak ada perbedaan yang berarti antara pendekatan pada tahap ini.

Tentu, tolok ukur mungkin menunjukkan kemampuan yang berbeda, tetapi sebenarnya tidak ada aplikasi yang harus dimiliki untuk pembelajaran mesin di ponsel pintar sekarang. Pengenalan citra cukup bermanfaat untuk mengatur pustaka foto, mengoptimalkan kinerja kamera, dan membuka kunci ponsel dengan wajah Anda. Jika ini dapat dilakukan dengan cukup cepat pada DSP, CPU, atau GPU, tampaknya tidak ada alasan untuk mengeluarkan uang ekstra pada silikon khusus. LG bahkan melakukan deteksi adegan kamera real-time menggunakan Snapdragon 835, yang sangat mirip dengan perangkat lunak AI kamera Huawei menggunakan NPU dan DSP.

Qualcomm’s DSP secara luas digunakan oleh pihak ketiga, membuatnya lebih mudah bagi mereka untuk mulai menerapkan pembelajaran mesin pada platformnya.

Di masa depan, kita mungkin melihat perlunya perangkat keras pembelajaran mesin yang lebih kuat atau berdedikasi untuk mendukung fitur yang lebih canggih atau menghemat masa pakai baterai, tetapi pada saat ini kasus penggunaan terbatas. Huawei mungkin mengubah desain NPU sebagai persyaratan perubahan aplikasi pembelajaran mesin, yang dapat berarti sumber daya yang terbuang dan keputusan yang canggung tentang apakah akan terus mendukung perangkat keras yang ketinggalan jaman. NPU juga merupakan perangkat keras pengembang pihak ketiga yang harus memutuskan apakah akan mendukung atau tidak.

Qualcomm juga memiliki sejarah menolak ide-ide baru atau ceruk hanya untuk segera mengadopsi teknologi yang serupa setelah pasar bergerak ke arah itu. Transmisikan pikiran Anda kembali ke perusahaan yang menolak prosesor aplikasi seluler 64-bit sebagai gimmick.

Qualcomm mungkin turun rute prosesor jaringan saraf khusus di masa depan, tetapi hanya jika kasus penggunaan membuat investasi itu berharga. Arm baru-baru ini mengumumkan perangkat keras Project Trillium tentunya merupakan kandidat yang mungkin jika perusahaan tidak ingin mendesain unit khusus di rumah dari awal, tetapi kita hanya harus menunggu dan melihat.

 

Apakah itu penting?

Ketika datang ke Kirin 970 vs Snapdragon 845, NPU Kirin mungkin memiliki kelebihan, tetapi apakah itu benar-benar penting?

Tidak ada kasus penggunaan yang harus dimiliki untuk pembelajaran mesin ponsel cerdas atau “AI”. Bahkan persentase poin besar yang diperoleh atau hilang dalam beberapa tolok ukur spesifik tidak akan membuat atau menghancurkan pengalaman pengguna utama. Semua tugas pembelajaran mesin saat ini dapat dilakukan pada DSP atau bahkan CPU dan GPU biasa. NPU hanyalah roda kecil dalam sistem yang jauh lebih besar. Perangkat keras yang berdedikasi dapat memberikan keuntungan bagi masa pakai baterai dan kinerja, tetapi akan sulit bagi konsumen untuk memperhatikan perbedaan besar karena terbatasnya pemaparan mereka terhadap aplikasi.

Seiring berkembangnya pasar pembelajaran mesin dan semakin banyak aplikasi yang dihancurkan, telepon pintar dengan perangkat keras khusus mungkin akan menguntungkan – kemungkinan mereka sedikit lebih terbukti di masa depan (kecuali jika persyaratan perangkat keras berubah). Penerapan di seluruh industri tampaknya tidak terhindarkan, apa dengan MediaTek dan Qualcomm yang memamerkan kemampuan pembelajaran mesin dalam chip dengan biaya lebih rendah, tetapi tidak mungkin kecepatan NPU atau DSP di atas kapal akan menjadi faktor yang membuat atau menghancurkan dalam pembelian ponsel cerdas.

LEAVE A REPLY

Please enter your comment!
Please enter your name here