Acasă/Soluții/AI Computing/TechRaptor® Sparky 1Tb

TechRaptor® Sparky 1Tb

NOU

TechRaptor Sparky, Server AI pentru inferență avansată bazat pe Lenovo PGX, arhitectură Blackwell GB10, 20core, 128Gb RAM unificat, 1T, 2 motoare LLM (text, imagini)

Galerie Produse

Imagine produs

Specificații

Platformă	Lenovo ThinkStation PGX
Arhitectură	NVIDIA Blackwell GB10
CPU	20-core ARM (Cortex-X925 + Cortex-A725)
AI Accelerator	Integrat (Blackwell GB10 Superchip)
Performanță AI	~1 PFLOP (FP4, optimizat inferență)
Memorie	128 GB LPDDR5X unificat (shared CPU/GPU)
Stocare	1 TB NVMe SSD
Rețea	2x 1/10 GbE
Form Factor	Workstation compact / edge deployment
OS	DGX OS / Linux optimizat AI
Runtime	CUDA (Blackwell optimized)
Inference Engine	vLLM/oLLAMA/SGLANG - configurabil per speță (maxim 2)
Containerizare	Docker

Descriere Detaliată

TechRaptor® Sparky – nod AI local pentru inferență avansată

TechRaptor® Sparky este un sistem compact de procesare AI, proiectat ca nod de inferență local în cadrul ecosistemului APEX-AI, destinat instituțiilor care necesită control asupra datelor, latență redusă și integrare directă în fluxurile operaționale.

Arhitectură hardware

Sparky este construit pe platforma Lenovo ThinkStation PGX, utilizând arhitectura NVIDIA Blackwell GB10, optimizată pentru sarcini de inteligență artificială:

CPU: arhitectură ARM heterogenă, 20 nuclee (Cortex-X925 + A725)
GPU / AI accelerator: integrat în platforma GB10, optimizat pentru inferență LLM și modele multimodale
Memorie: 128 GB RAM unificat LPDDR5X, partajat între CPU și acceleratorul AI
Stocare: SSD NVMe de mare viteză (configurabil), optimizat pentru seturi de date și modele locale
Performanță AI: până la ~1 PFLOP (FP4) în sarcini de inferență optimizate

Arhitectura cu memorie unificată permite rularea simultană a modelelor de dimensiuni mari fără overhead de transfer între CPU și GPU, reducând latența și crescând eficiența energetică.

Stack software și runtime AI

Sistemul rulează un stack optimizat pentru inferență:

DGX OS / Linux optimizat AI
CUDA / runtime Blackwell
vLLM și SGLang pentru servirea modelelor la nivel API (compatibil OpenAI)
Containere Docker pentru orchestrare și izolare aplicații
Qdrant / RAG pipelines pentru integrarea datelor interne

Capabilități AI – inferență multimodală

Sparky este configurat să ruleze simultan două motoare LLM complementare:

Model text (LLM) – procesare limbaj natural, generare, analiză documente, structurare date
Model multimodal (vision-language) – interpretare imagini, OCR, documente scanate, flux video

Configurația suportă: