DeepSeek-R1 Combina IA e computación perimetral para a IoT industrial

Introdución

Os modelos destilados de pequeno tamaño de DeepSeek-R1 axústanse con datos de cadea de pensamento xerados por DeepSeek-R1, marcados con...etiquetas, herdando as capacidades de razoamento de R1. Estes conxuntos de datos axustados inclúen explicitamente procesos de razoamento como a descomposición de problemas e as deducións intermedias. A aprendizaxe por reforzo aliñou os patróns de comportamento do modelo destilado cos pasos de razoamento xerados por R1. Este mecanismo de destilación permite que os modelos pequenos manteñan a eficiencia computacional ao tempo que obteñen capacidades de razoamento complexas semellantes ás dos modelos máis grandes, o que ten un valor de aplicación significativo en escenarios con recursos limitados. Por exemplo, a versión 14B consegue o 92 % da finalización de código do modelo DeepSeek-R1 orixinal. Este artigo presenta o modelo destilado DeepSeek-R1 e as súas aplicacións principais na computación industrial perimetral, resumidas nas seguintes catro direccións, xunto con casos de implementación específicos:

dc3c637c5bead8b62ed51b6d83ac0b4

Mantemento preditivo de equipos

Implementación técnica

Fusión de sensores:

Integra datos de vibración, temperatura e corrente de PLC a través do protocolo Modbus (frecuencia de mostraxe de 1 kHz).

Extracción de características:

Executa Edge Impulse en Jetson Orin NX para extraer características de series temporais de 128 dimensións.

Inferencia do modelo:

Implementa o modelo DeepSeek-R1-Distill-14B, introducindo vectores de características para xerar valores de probabilidade de fallo.

Axuste dinámico:

Activar ordes de traballo de mantemento cando a confianza sexa > 85 % e iniciar un proceso de verificación secundaria cando sexa < 60 %.

Caso relevante

Schneider Electric implementou esta solución en maquinaria mineira, reducindo as taxas de falsos positivos nun 63 % e os custos de mantemento nun 41 %.

1

Executando o modelo destilado DeepSeek R1 en ordenadores InHand AI Edge

Inspección visual mellorada

Arquitectura de saída

Canle de despregamento típica:

cámara = GigE_Vision_Camera(500 fps) # Cámara industrial Gigabit
fotograma = camera.capture() # Capturar imaxe
preprocesado = OpenCV.denoise(frame) # Preprocesamento de eliminación de ruído
tipo_defecto = DeepSeek_R1_7B.infer(preprocesado) # Clasificación de defectos
se tipo_defecto != 'normal':
PLC.trigger_reject() # Activa o mecanismo de ordenación

Métricas de rendemento

Retardo de procesamento:

82 ms (Jetson AGX Orin)

Precisión:

A detección de defectos de moldeo por inxección alcanza o 98,7 %.

2

Implicacións de DeepSeek R1: Gañadores e perdedores na cadea de valor da IA ​​xerativa

Optimización do fluxo de procesos

Tecnoloxías clave

Interacción coa linguaxe natural:

Os operadores describen anomalías do equipo por voz (por exemplo, "Flutuación da presión da extrusora ±0,3 MPa").

Razoamento multimodal:

O modelo xera suxestións de optimización baseadas nos datos históricos do equipo (por exemplo, axustar a velocidade do parafuso nun 2,5 %).

Verificación do xemelgo dixital:

Validación da simulación de parámetros na plataforma EdgeX Foundry.

Efecto da implementación

A planta química de BASF adoptou este esquema, conseguindo unha redución do 17 % no consumo de enerxía e un aumento do 9 % na taxa de calidade do produto.

3

IA perimetral e o futuro dos negocios: OpenAI o1 fronte a DeepSeek R1 para a saúde, a automoción e a Internet das cousas (IIoT)

Recuperación instantánea da base de coñecementos

Deseño de arquitectura

Base de datos de vectores locais:

Usa ChromaDB para almacenar manuais de equipos e especificacións de procesos (incrustando a dimensión 768).

Recuperación híbrida:

Combina o algoritmo BM25 + a semellanza do coseno para a consulta.

Xeración de resultados:

O modelo R1-7B resume e refina os resultados da recuperación.

Caso típico

Os enxeñeiros de Siemens resolveron as avarías dos inversores mediante consultas en linguaxe natural, o que reduciu o tempo medio de procesamento nun 58 %.

Desafíos e solucións de despregamento

Limitacións de memoria:

Utilizou a tecnoloxía de cuantización da caché KV, o que reduciu o uso de memoria do modelo 14B de 32 GB a 9 GB.

Garantir o rendemento en tempo real:

Latencia de inferencia única estabilizada a ±15 ms mediante a optimización de gráficos CUDA.

Deriva do modelo:

Actualizacións incrementais semanais (transmitindo só o 2 % dos parámetros).

Ambientes extremos:

Deseñado para un amplo rango de temperaturas de -40 °C a 85 °C con nivel de protección IP67.

5
微信图片_20240614024031.jpg1

Conclusión

Os custos actuais de despregamento diminuíron agora a 599 $/nodo (Jetson Orin NX), con aplicacións escalables formándose en sectores como a fabricación 3C, a montaxe de automóbiles e a química enerxética. Espérase que a optimización continua da arquitectura MoE e a tecnoloxía de cuantización permitan que o modelo 70B se execute en dispositivos periféricos a finais de 2025.

Atopar unha solución de cable ELV

Cables de control

Para BMS, BUS, industrial, cable de instrumentación.

Sistema de cableado estruturado

Rede e datos, cable de fibra óptica, cable de conexión, módulos, placa frontal

Revisión de exposicións e eventos de 2024

16-18 de abril de 2024. Enerxía de Oriente Medio en Dubai

16-18 de abril de 2024 Securika en Moscova

9 de maio de 2024. Evento de lanzamento de novos produtos e tecnoloxías en Shanghai.

22-25 de outubro de 2024 SECURITY CHINA en Pequín

19-20 de novembro de 2024 MUNDO CONECTADO KSA


Data de publicación: 07-02-2025