DeepSeek-R1 combinando a IA e a computación de borde para IoT industrial

Introdución

Os modelos destilados de pequenos tamaños de DeepSeek-R1 son axustados moi ben usando datos de cadea de pensamento xerados por DeepSeek-R1, marcados con...Etiquetas, herdando as capacidades de razoamento de R1. Estes conxuntos de datos axustados inclúen explicitamente procesos de razoamento como a descomposición de problemas e as deducións intermedias. A aprendizaxe de reforzo aliñou os patróns de comportamento do modelo destilado cos pasos de razoamento xerados por R1. Este mecanismo de destilación permite pequenos modelos manter a eficiencia computacional ao tempo que se obtén habilidades de razoamento complexas próximas ás de modelos máis grandes, o que ten un valor significativo na aplicación en escenarios restrinxidos de recursos. Por exemplo, a versión 14B consegue o 92% do código de finalización do modelo orixinal DeepSeek-R1. Este artigo introduce o modelo destilado DeepSeek-R1 e as súas aplicacións básicas na computación de bordes industriais, resumidas nas seguintes catro direccións, xunto con casos específicos de implementación:

DC3C637C5BEAD8B62ED51B6D83AC0B4

Mantemento preditivo dos equipos

Implementación técnica

Fusión do sensor:

Integra os datos de vibración, temperatura e actuais de PLCs a través do protocolo MODBUS (taxa de mostraxe 1 kHz).

Extracción de características:

Executar o impulso do bordo a Jetson Orin NX para extraer características da serie de tempo 128.

Inferencia do modelo:

Despliegue o modelo DeepSeek-R1-Distill-14B, introducindo vectores de funcións para xerar valores de probabilidade de fallo.

Axuste dinámico:

Dispare as ordes de traballo de mantemento cando a confianza> 85%e inicia un proceso de verificación secundaria cando <60%.

Caso relevante

Schneider Electric despregou esta solución en maquinaria mineira, reducindo un 41% as taxas positivas falsas e os custos de mantemento.

1

Running DeepSeek R1 Modelo destilado nos ordenadores de bordo Ai Inhand

Inspección visual mellorada

Arquitectura de saída

Pipeline de despregamento típico:

cámara = gige_vision_camera (500fps) # cámara industrial gigabit
Frame = cámara.Capture () # Capture Image
Preprocesado = OpenCV.Denoise (Frame) # Denoising Preprocessing
defect_type = DeepSeek_R1_7b.infer (preprocesado) # Clasificación de defectos
Se defect_type! = 'normal':
Plc.trigger_reject () # mecanismo de ordenación de disparo

Métricas de rendemento

Atraso de procesamento:

82 ms (Jetson Agx Orin)

Precisión:

A detección de defectos moldeados por inxección alcanza o 98,7%.

2

Implicacións de Deepseek R1: gañadores e perdedores na cadea de valor xerativa de AI

Optimización do fluxo de procesos

Tecnoloxías clave

Interacción da linguaxe natural:

Os operadores describen anomalías de equipos a través de voz (por exemplo, "flutuación da presión da extrusora ± 0,3 MPa").

Razoamento multimodal:

O modelo xera suxestións de optimización baseadas en datos históricos do equipo (por exemplo, axustando a velocidade do parafuso nun 2,5%).

Verificación do xemelgo dixital:

Validación de simulación de parámetros na plataforma de fundición EdgeX.

Efecto de implementación

A planta química de BASF adoptou este esquema, logrando unha redución do consumo de enerxía do 17% e un aumento do 9% na taxa de calidade do produto.

3

Edge AI e o futuro dos negocios: Openai O1 vs. Deepseek R1 para asistencia sanitaria, automoción e IIOT

Recuperación instantánea da base de coñecemento

Deseño de arquitectura

Base de datos vectorial local:

Use Chromadb para almacenar manuais de equipos e especificacións de proceso (Dimensión de incrustación 768).

Recuperación híbrida:

Combina o algoritmo BM25 + semellanza cosina para a consulta.

Xeración de resultados:

O modelo R1-7B resume e perfecciona os resultados de recuperación.

Caso típico

Os enxeñeiros de Siemens resolveron os fallos do inversor a través de consultas de linguaxe natural, reducindo o tempo medio de procesamento nun 58%.

Retos e solucións de despregamento

Limitacións da memoria:

Utilizou a tecnoloxía de cuantificación de caché KV, reducindo o uso da memoria do modelo 14B de 32 GB a 9 GB.

Garantir o rendemento en tempo real:

Latencia de inferencia única estabilizada a ± 15 ms mediante a optimización de gráficos CUDA.

Deriva do modelo:

Actualizacións incrementais semanais (transmitindo só o 2% dos parámetros).

Contornos extremos:

Deseñado para amplos intervalos de temperatura de -40 ° C a 85 ° C con nivel de protección IP67.

5
微信图片 _20240614024031.jpg1

Conclusión

Os custos actuais de implantación diminuíron ata 599 dólares por nodo (Jetson Orin NX), con aplicacións escalables que se forman en sectores como a fabricación de 3C, a montaxe de automóbiles e a química enerxética. Espérase que a optimización continua da tecnoloxía de arquitectura e cuantificación de MOE permita que o modelo 70B se execute en dispositivos de bordo a finais de 2025.

Atopar a solución de cable ELV

Cables de control

Para BMS, autobús, cable industrial, de instrumentación.

Sistema de cableado estruturado

Rede e datos, cable de fibra óptica, cable de parche, módulos, placa frontal

2024 Revisión de exposicións e eventos

16 de abril-18, 2024 Enerxía de Oriente Medio en Dubai

16 de abril-18, 2024 Securika en Moscova

9 de maio de 2024 Novos produtos de lanzamento de produtos e tecnoloxías en Shanghai

22 de outubro-25 de outubro, 2024 Seguridade China en Pequín

19 de novembro ao 20 de novembro de 2024 KSA conectado


Tempo de publicación: FEB-07-2025