DeepSeek-R1 Menggabungkan AI dan Edge Computing untuk IoT Industri

Perkenalan

Model sulingan berukuran kecil dari DeepSeek-R1 disempurnakan menggunakan data rantai pemikiran yang dihasilkan oleh DeepSeek-R1, ditandai dengan...tag, yang mewarisi kemampuan penalaran R1. Kumpulan data yang telah disesuaikan ini secara eksplisit mencakup proses penalaran seperti dekomposisi masalah dan deduksi antara. Pembelajaran penguatan telah menyelaraskan pola perilaku model yang disuling dengan langkah-langkah penalaran yang dihasilkan oleh R1. Mekanisme distilasi ini memungkinkan model kecil untuk mempertahankan efisiensi komputasi sambil memperoleh kemampuan penalaran kompleks yang mendekati kemampuan model yang lebih besar, yang merupakan nilai aplikasi yang signifikan dalam skenario yang dibatasi sumber daya. Misalnya, versi 14B mencapai 92% dari penyelesaian kode model DeepSeek-R1 asli. Artikel ini memperkenalkan model suling DeepSeek-R1 dan aplikasi intinya dalam komputasi tepi industri, yang dirangkum dalam empat arah berikut, beserta kasus implementasi tertentu:

dc3c637c5bead8b62ed51b6d83ac0b4

Pemeliharaan Prediktif Peralatan

Implementasi Teknis

Fusi Sensor:

Integrasikan data getaran, suhu, dan arus dari PLC melalui protokol Modbus (laju pengambilan sampel 1 kHz).

Ekstraksi Fitur:

Jalankan Edge Impulse pada Jetson Orin NX untuk mengekstrak fitur deret waktu 128 dimensi.

Inferensi Model:

Terapkan model DeepSeek-R1-Distill-14B, masukkan vektor fitur untuk menghasilkan nilai probabilitas kesalahan.

Penyesuaian Dinamis:

Memicu perintah kerja pemeliharaan bila keyakinan > 85%, dan memulai proses verifikasi sekunder bila < 60%.

Kasus yang Relevan

Schneider Electric menerapkan solusi ini pada mesin pertambangan, mengurangi tingkat positif palsu hingga 63% dan biaya pemeliharaan hingga 41%.

1

Menjalankan Model DeepSeek R1 Distilled pada Komputer InHand AI Edge

Inspeksi Visual yang Ditingkatkan

Arsitektur Keluaran

Alur penyebaran yang umum:

kamera = GigE_Vision_Camera(500fps) # Kamera industri gigabit
frame = camera.capture() # Menangkap gambar
praproses = OpenCV.denoise(frame) # Denoising praproses
defect_type = DeepSeek_R1_7B.infer(preprocessed) # Klasifikasi cacat
jika jenis_cacat != 'normal':
PLC.trigger_reject() # Mekanisme penyortiran pemicu

Metrik Kinerja

Penundaan Pemrosesan:

82 md (Jetson AGX Orin)

Ketepatan:

Deteksi cacat cetakan injeksi mencapai 98,7%.

2

Implikasi DeepSeek R1: Pemenang dan pecundang dalam rantai nilai AI generatif

Optimasi Aliran Proses

Teknologi Utama

Interaksi Bahasa Alami:

Operator menjelaskan anomali peralatan melalui suara (misalnya, "Fluktuasi tekanan ekstruder ±0,3 MPa").

Penalaran Multimodal:

Model ini menghasilkan saran pengoptimalan berdasarkan data historis peralatan (misalnya, menyesuaikan kecepatan sekrup sebesar 2,5%).

Verifikasi Kembaran Digital:

Validasi simulasi parameter pada platform EdgeX Foundry.

Efek Implementasi

Pabrik kimia BASF mengadopsi skema ini, mencapai pengurangan 17% dalam konsumsi energi dan peningkatan 9% dalam tingkat kualitas produk.

3

Edge AI dan Masa Depan Bisnis: OpenAI o1 vs. DeepSeek R1 untuk Layanan Kesehatan, Otomotif, dan IIoT

Pengambilan Basis Pengetahuan Secara Instan

Desain Arsitektur

Basis Data Vektor Lokal:

Gunakan ChromaDB untuk menyimpan manual peralatan dan spesifikasi proses (dimensi penyematan 768).

Pengambilan Hibrida:

Gabungkan algoritma BM25 + kesamaan kosinus untuk kueri.

Pembuatan Hasil:

Model R1-7B meringkas dan menyempurnakan hasil pengambilan.

Kasus Umum

Insinyur Siemens mengatasi kegagalan inverter melalui pertanyaan bahasa alami, mengurangi waktu pemrosesan rata-rata hingga 58%.

Tantangan dan Solusi Penerapan

Keterbatasan Memori:

Memanfaatkan teknologi kuantisasi KV Cache, mengurangi penggunaan memori model 14B dari 32GB menjadi 9GB.

Memastikan Kinerja Real-Time:

Latensi inferensi tunggal yang stabil hingga ±15 ms melalui pengoptimalan Grafik CUDA.

Model Penyimpangan:

Pembaruan tambahan mingguan (hanya mengirimkan 2% parameter).

Lingkungan Ekstrim:

Dirancang untuk rentang suhu lebar -40°C hingga 85°C dengan tingkat perlindungan IP67.

5
微信图片_20240614024031.jpg1

Kesimpulan

Biaya penerapan saat ini telah turun menjadi $599/node (Jetson Orin NX), dengan aplikasi yang dapat diskalakan terbentuk di sektor-sektor seperti manufaktur 3C, perakitan otomotif, dan kimia energi. Optimalisasi berkelanjutan dari arsitektur MoE dan teknologi kuantisasi diharapkan dapat memungkinkan model 70B berjalan pada perangkat edge pada akhir tahun 2025.

Temukan Solusi Kabel ELV

Kabel Kontrol

Untuk BMS, BUS, Industri, Kabel Instrumentasi.

Sistem Pengkabelan Terstruktur

Jaringan & Data, Kabel Serat Optik, Kabel Patch, Modul, Pelat Depan

Ulasan Pameran & Acara 2024

16-18 April 2024 Energi Timur Tengah di Dubai

16-18 April 2024 Securika di Moskow

9 Mei 2024 ACARA PELUNCURAN PRODUK & TEKNOLOGI BARU di Shanghai

22-25 Oktober 2024 KEAMANAN CHINA di Beijing

19-20 November 2024 CONNECTED WORLD KSA


Waktu posting: 07-Feb-2025