Deepseek-R1 Menggabungkan Komputasi AI dan Edge untuk IoT Industri

Perkenalan

Model suling kecil dari Deepseek-R1 disesuaikan menggunakan data rantai-dipikirkan yang dihasilkan oleh Deepseek-R1, ditandai dengan...Tag, mewarisi kemampuan penalaran R1. Kumpulan data yang disesuaikan ini secara eksplisit mencakup proses penalaran seperti dekomposisi masalah dan pengurangan perantara. Pembelajaran penguatan telah menyelaraskan pola perilaku model suling dengan langkah -langkah penalaran yang dihasilkan oleh R1. Mekanisme distilasi ini memungkinkan model kecil untuk mempertahankan efisiensi komputasi sambil mendapatkan kemampuan penalaran yang kompleks di dekat model yang lebih besar, yang memiliki nilai aplikasi yang signifikan dalam skenario yang dibatasi sumber daya. Misalnya, versi 14B mencapai 92% dari penyelesaian kode dari model Deepseek-R1 asli. Artikel ini memperkenalkan model suling Deepseek-R1 dan aplikasi intinya dalam komputasi tepi industri, dirangkum dalam empat arah berikut, bersama dengan kasus implementasi spesifik:

DC3C637C5BEAD8B62ED51B6D83AC0B4

Pemeliharaan peralatan prediktif

Implementasi Teknis

Fusi Sensor:

Integrasi getaran, suhu, dan data saat ini dari PLC melalui protokol MODBUS (laju pengambilan sampel 1 kHz).

Ekstraksi fitur:

Run Edge Impulse pada Jetson Orin NX untuk mengekstrak fitur seri waktu 128-dimensi.

Model Inference:

Menyebarkan model Deepseek-R1-Distill-14b, memasukkan vektor fitur untuk menghasilkan nilai probabilitas kesalahan.

Penyesuaian Dinamis:

Memicu pesanan pekerjaan pemeliharaan saat kepercayaan> 85%, dan memulai proses verifikasi sekunder ketika <60%.

Kasus yang relevan

Schneider Electric menggunakan solusi ini pada mesin penambangan, mengurangi tingkat positif palsu sebesar 63% dan biaya pemeliharaan sebesar 41%.

1

Menjalankan Deepseek R1 Model Distilled di Inhand AI Edge Computers

Inspeksi visual yang ditingkatkan

Arsitektur Output

Pipa Penyebaran Khas:

kamera = gige_vision_camera (500fps) # kamera industri gigabit
frame = camera.capture () # Capture Image
Preprosesed = opencv.denoise (bingkai) # preprocessing denoising
defect_type = deepseek_r1_7b.infer (preprocessed) # klasifikasi cacat
Jika defect_type! = 'Normal':
Plc.trigger_reject () # mekanisme pemicu pemicu penyortiran

Metrik kinerja

Penundaan pemrosesan:

82 ms (Jetson Agx Orin)

Ketepatan:

Deteksi cacat cetakan injeksi mencapai 98,7%.

2

Implikasi Deepseek R1: Pemenang dan Pecundang dalam Rantai Nilai AI Generatif

Optimalisasi Aliran Proses

Teknologi Utama

Interaksi Bahasa Alami:

Operator menggambarkan anomali peralatan melalui suara (misalnya, "fluktuasi tekanan ekstruder ± 0,3 MPa").

Penalaran multimodal:

Model ini menghasilkan saran optimasi berdasarkan data historis peralatan (misalnya, menyesuaikan kecepatan sekrup sebesar 2,5%).

Verifikasi Kembar Digital:

Validasi simulasi parameter pada platform Foundry Edgex.

Efek Implementasi

Pabrik kimia BASF mengadopsi skema ini, mencapai pengurangan 17% dalam konsumsi energi dan peningkatan 9% dalam tingkat kualitas produk.

3

EDGE AI dan Masa Depan Bisnis: Openai O1 vs Deepseek R1 untuk Kesehatan, Otomotif, dan IIOT

Pengambilan basis pengetahuan instan

Desain Arsitektur

Database Vektor Lokal:

Gunakan Chromadb untuk menyimpan manual peralatan dan spesifikasi proses (Embedding Dimension 768).

Pengambilan Hibrida:

Gabungkan algoritma BM25 + kesamaan cosinus untuk kueri.

Generasi Hasil:

Model R1-7B merangkum dan memperbaiki hasil pengambilan.

Kasus khas

Insinyur Siemens menyelesaikan kegagalan inverter melalui kueri bahasa alami, mengurangi waktu pemrosesan rata -rata sebesar 58%.

Tantangan dan solusi penyebaran

Keterbatasan Memori:

Menggunakan teknologi kuantisasi cache kv, mengurangi penggunaan memori model 14B dari 32GB menjadi 9GB.

Memastikan kinerja real-time:

Latensi inferensi tunggal yang distabilkan menjadi ± 15 ms melalui optimasi grafik CUDA.

Model Drift:

Pembaruan tambahan mingguan (mengirimkan hanya 2% dari parameter).

Lingkungan ekstrem:

Dirancang untuk rentang suhu yang luas -40 ° C hingga 85 ° C dengan tingkat perlindungan IP67.

5
微信图片 _20240614024031.jpg1

Kesimpulan

Biaya penyebaran saat ini kini telah menurun menjadi $ 599/node (Jetson Orin NX), dengan aplikasi yang dapat diskalakan terbentuk di sektor -sektor seperti manufaktur 3C, perakitan otomotif, dan kimia energi. Optimalisasi terus menerus dari arsitektur MOE dan teknologi kuantisasi diharapkan memungkinkan model 70B untuk berjalan di perangkat tepi pada akhir 2025.

Temukan Solusi Kabel ELV

Kabel kontrol

Untuk BMS, bus, industri, kabel instrumentasi.

Sistem pemasangan kabel terstruktur

Jaringan & Data, Kabel Fiber-Optik, Kabel Patch, Modul, Faceplate

2024 Ulasan Pameran & Acara

Apr.16-18, 2024 Energi Timur Tengah di Dubai

Apr.16-18, 2024 Securika di Moskow

9 Mei, 2024 Acara Peluncuran Produk & Teknologi Baru di Shanghai

Okt.22nd-25th, 2024 Security China di Beijing

Nov.19-20, 2024 Connected World KSA


Waktu posting: Feb-07-2025