70 миллиард параметрлі AI-модельдерін іске қоса алатын кітап өлшеміндегі құрылғы — NVIDIA DGX Spark жұмыс үстеліндегі AI-менендік жаңа дәуірін бейнелейді.

1 Негіз
Неге жергілікті AI? Меншік үшін бизнес-негіз

2020 жылдардың басында жасанды интеллект сағатына, токенге, API шақыруына жалға алатын қызмет болды. 2026 жылға қарай парадигма өзгерді. GPT-4 класындағы интеллекті іске қосу үшін қажетті жабдық енді жұмыс үстеліңізге сыйып, пайдаланылған автомобильден арзан.

Тек бұлттық AI-ға тәуелділікті жалғастыру стратегиялық үштік мәселеге әкеледі:

  • Қызмет ақысының өсуі. Токенге API ақысы пайдаланумен сызықты өседі. Күніне 1000 келісімшартты өңдейтін заң фирмасы жылдық API шығындарында 17 700 000 ₸+ қарсыласа алады.
  • Деректердің ашықтығы. Бұлттық API-ге жіберілген әрбір сұрау желіңізден шығатын және деректер қауіпсіздігі мен құпиялылық тәуекелдеріне ұшырайтын деректер болып табылады.
  • Нөлдік немесе қымбат бейімдеу. Бұлттық модельдер жалпылама. Оларды арнайы деректерге, ішкі бизнес-процестерге немесе бизнес-ақпаратңай немесе тиімді түрде бейімдеу мүмкін емес.

Жергілікті AI-жабдықтары үшеуін де шешеді. Ол айнымалы API ақысын тұрақты капиталдық активке айналдырады, деректердің желіден шықпауын қамтамасыз етеді және бизнес деректерін бейімдеу арқылы терең бейімдеуге мүмкіндік береді.

2 Шығындарды төмендету
Квантау: Қымбат емес жабдықта үлкенірек AI-модельдерін іске қосу

Кванттау — жергілікті AI экономикасын түбегейлі өзгертетін ұғым.

Қарапайым тілмен айтқанда, кванттау AI моделінің жады аясын қысады. Стандартты модель әрбір параметрді 16-биттік қалқымалы нүкте саны (FP16) ретінде сақтайды. Кванттау оны 8-битке (Int8), 4-битке (Int4) немесе одан да төменге дейін азайтады — модельді іске қосу үшін қажетті жады көлемін айтарлықтай азайтады.

Кванттау шығару сапасында аздап төменге әкеледі — жиі қорытындылау, құжат дайындау және талдау сияқты бизнес тапсырмалары үшін сезілмейтін — жабдық құнының айтарлықтай төмендеуі үшін.

Қажетті жады: Әртүрлі дәлдік деңгейлеріндегі 70B AI моделі
FP16
Толық дәлдік
~140 GB
Int8
Жарты өлшем
~70 GB
Int4
Төрттен бір
~40 GB
FP16 — Максималды сапа, максималды құн
Int8 — Толыққа жуық сапа, құнның жартысы
Int4 — Жоғары сапа, құнның төрттен бірі
Бизнес әсері

Толық дәлдіктегі 70B моделі ~140 ГБ жадыды қажет етеді — 2 960 000 ₸+ сервер инвестициясы. Int4-ке квантталған сол модель тек ~40 ГБ қажет етеді және екі GPU-сы бар 1 500 000 ₸ пайдаланылған жұмыс станциясында іске қосыла алады.

3 Мини-компьютерлер
AI мини-компьютерлері 740 000 – 4 900 000 ₸

Әйел қолындағы HP ZGX Nano AI

2026 жылдың ең революциялық дамуы — мини-компьютер пішініндегі жоғары сыйымдылықты AI есептеу. Қатты мұқабалы кітаптан үлкен емес құрылғылар енді екі жыл бұрын сервер бөлмелерін қажет еткен AI модельдерін іске қосады.

NVIDIA GB10 Экожүйесі (DGX Spark)

Өнімділік көшбасшысы

NVIDIA logo

NVIDIA DGX Spark бұл санатты анықтады. 2026 жылы ARM Grace CPU мен Blackwell GPU-ны біріктіретін GB10 Суперчипі бүкіл экожүйені құрды. ASUS, GIGABYTE, Dell, Lenovo, HP, MSI және Supermicro барлығы GB10 негізіндегі жүйелерді шығарады, әрқайсысы әртүрлі пішіндерге, салқындату шешімдеріне және қосымша бағдарламалық қамтамасыз етуге ие.

NVIDIA GB10 Экожүйесі ASUS, GIGABYTE, Dell, Lenovo, HP, MSI және Supermicro
Бастап 1 500 000 ₸
Жады
128 ГБ
LPDDR5X Біріктірілген
Есептеу
~1 ПФЛОП
FP8 AI Өнімділігі
Желі
10 Гбит/с Ethernet + Wi-Fi 7
Кластерлеу үшін ConnectX
Қойма
4 ТБ SSD
NVMe
Кластерлеу
Ия (2 бірлік)
256 ГБ біріктірілген жады
БЖ
NVIDIA AI Enterprise
CUDA, cuDNN, TensorRT
SEO жазуы
SEO жазуы
SEO жазуы
SEO жазуы
SEO жазуы
SEO жазуы
SEO жазуы
SEO жазуы
Кластерлеу: 256 ГБ сыйымдылық

Арнайы жоғары жылдамдықты желі порты арқылы екі GB10 бірлігін қосып, жүйе ресурстарды 256 ГБ жады кеңістігіне біріктіреді. Бұл өте үлкен модельдерді — 400B+ квантталған параметрлерді — жұмыс үстеліңізде толығымен іске қосу мүмкіндігін ашады, шамамен 2 960 000 – 3 450 000 ₸ жалпы жабдық инвестициясымен.

AMD Ryzen AI Max (Strix Halo) Мини-компьютерлері

Ең төмен құн

AMD Ryzen AI Max+ Strix Halo

AMD-дің Ryzen AI Max+ Strix Halo архитектурасы бюджеттік AI мини-компьютерлердің мүлдем жаңа санатын туғызды. Өндірушілердің бір толқыны — GMKtec, Beelink, Corsair, NIMO, Bosgame, FAVM — қазір 990 000 ₸-ден төмен бағада 128 GB біріктірілген жад жүйелерін жеткізеді.

AMD Ryzen AI Max Мини-компьютерлері GMKtec EVO-X2 · Beelink · Corsair · NIMO AI · Bosgame M5 · FAVM FA-EX9
Бастап 740 000 ₸
Жады
128 ГБ
LPDDR5 Ортақ (CPU+GPU)
Есептеу
~0.2 PFLOP
Кіріктірілген RDNA 3.5 GPU
Тармақтық ені
~200 ГБ/с
Жады тармақтық ені
Қуат
~100 Вт
Үнсіз жұмыс
Кластерлеу
Жоқ
Тек автономды
ОЖ
Windows / Linux
ROCm / llama.cpp
SEO жазуы
SEO жазуы
SEO жазуы
SEO жазуы
SEO жазуы
SEO жазуы
SEO жазуы
SEO жазуы

Apple Mac Studio (M4 Ultra)

Сыйымдылық көшбасшысы

Mac Studio жергілікті AI ландшафтында бірегей орын алады. Apple-дың Біріктірілген Жады Архитектурасы (UMA) CPU мен GPU үшін қолжетімді 256 ГБ жадыды бір ғана ықшам жұмыс үстелі бірлігінде қамтамасыз етеді — кластерлеу қажет емес.

Бұл оны ең үлкен ашық бастапқы кодты модельдерді жүктей алатын жалғыз қолжетімді бір бірлік құрылғы етеді. Int4-ке квантталған 400 миллиард параметрлі модель 256 ГБ конфигурациясында жадыға толығымен сыйады.

Apple Mac Studio (M4 Ultra) Бір бірлік AI сыйымдылығының көшбасшысы
Бастап 1 970 000 ₸
Жады
256 ГБ дейін
Біріктірілген жады (UMA)
Есептеу
~0.5 ПФЛОП
Apple Neural Engine + GPU
БЖ
MLX Фреймворкі
Apple оңтайландырылған шешім
Шектеу
Тек шешім
Оқыту/бейімдеу үшін баяу

Apple Mac Studio (M5 Ultra)

Алдағы бәсекелес

2026 жылдың соңында күтілетін Apple-дың келесі буыны M5 Ultra M4-тің негізгі әлсіздігін шешетіні жайлы аңыз бар: AI модельдерін оқыту өнімділігі. TSMC-дің 2нм процесінде құрылған, ол 1.2 ТБ/с астам тармақтық енімен 512 ГБ дейін біріктірілген жады конфигурацияларын ұсынады деп күтілуде.

Apple Mac Studio (M5 Ultra) Күтілетін AI оқыту қуат көзі
Шама. 5 900 000 ₸
Жады
512 ГБ дейін
Келесі буын Біріктірілген Жады
Есептеу
~1.5+ ПФЛОП
2нм Neural Engine
БЖ
MLX 2.0+
Туынды оқыту қолдауы
Мүмкіндік
Оқыту және шешім
CUDA-альтернативасы
Жады тармақтық ені: 1.2 ТБ/с сыйымдылық

512 ГБ M5 Ultra квантталмаған (толық дәлдік) шекті модельдерді іске қоса алатын тұңғыш тұтынушы құрылғысы болар еді. 1.2+ ТБ/с жоғары жады тармақтық ені өте ұзақ контекст терезелерімен тұрақты жоғары өткізу қабілеті шешімді қажет ететін агенттік AI жұмыс ағымдарын қолдайды.

Tenstorrent

Ашық бастапқы кодты жабдық

Tenstorrent

Аңызға айналған чип архитекторы Джим Келлердің басшылығымен Tenstorrent түбегейлі басқа философияны бейнелейді: RISC-V негізінде құрылған ашық бастапқы кодты жабдық, ашық бастапқы кодты БЖ және шынжырлау арқылы модульдік масштабтау.

Tensix AI өзектері сызықты масштабтау үшін жасалған: көбірек карталарды қосқан кезде коммуникациялық үстеме шығындарымен күрескен GPU-лардан айырмашылығы, Tenstorrent чиптары тиімді түрде плиткаланған болу үшін құрылған.

Razer-мен серіктестікте Tenstorrent кез келген ноутбук немесе жұмыс үстеліне Thunderbolt арқылы қосылатын ықшам сыртқы AI жеделдеткішін шығарды — ешнәрсені ауыстырмай-ақ бар жабдықты AI жұмыс станциясына айналдырады.

Razer × Tenstorrent Ықшам AI Жеделдеткіші Сыртқы Thunderbolt AI жеделдеткіші
Бағасы Белгісіз
Пішін факторы
Сыртқы құрылғы
Thunderbolt 5 / 4 / USB4
п
Wormhole n150
Tensix өзектері · RISC-V
Масштабтау
4 бірлікке дейін
Шынжырланған
БЖ
Толығымен ашық бастапқы кодты
GitHub · TT-Metalium
SEO жазуы
SEO жазуы
SEO жазуы
SEO жазуы

AI NAS — Желіге Қосылған Қойма

Қойма + AI

NAS анықтамасы пассивті қоймадан белсенді интеллектке ауысты. Желілік қойма құрылғыларының жаңа буыны AI өңдеуді тікелей біріктіреді — жеңіл NPU негізіндегі шешімнен толық GPU-жеделдетілген LLM орнатуына дейін.

AI-қабілетті NAS бөлек AI құрылғысының қажеттілігін жояды және желілік кідіріссіз үлкен мөлшердегі деректерді тікелей өңдеуге мүмкіндік береді.

SEO жазуы
SEO жазуы
SEO жазуы
SEO жазуы

Бизнесіңізге арналған дұрыс AI мини-ПК таңдауға көмек керек пе?

Біздің инженерлер AI жабдықтарыңыздың талаптарын бағалап, толық конфигурацияланған AI жүйесін орнатады.

Тегін жабдық бағалау алу →

4 Workstations
AI-жұмыс станциялары & үстелдік компьютерлер 1 480 000 – 7 400 000 ₸

Workstation санаты дискретті PCIe графикалық карталарды және стандарттыұнара корпусын пайдаланады. Мини-ПК санатының бекітілген біріккен архитектурасынан айырмашылығы, бұл санат модульділікті ұсынады — жеке компоненттерді жаңартуға, көбірек GPU қосуға немесе технология дамыған сайын карталарды ауыстыруға болады.

NVLink көпірі бар қос RTX A6000 жұмыс станциясы шамамен 3 450 000 ₸ үшін 96 ГБ біріктірілген VRAM ұсынады.

VRAM мен жылдамдықты түсіну

AI үшін GPU таңдауды анықтайтын екі бәсекелес фактор:

📦
VRAM сыйымдылығы
Жүктей алатын модель көлемін анықтайды. Көбірек VRAM үлкенірек, қабілетті модельдерді білдіреді. Бұл сіздің интеллект шегіңіз.
Есептеу жылдамдығы
Модельдің қаншалықты тез жауап беретінін анықтайды. Жоғары есептеу әр сұрауға төмен кідірісті білдіреді. Бұл сіздің пайдаланушы тәжірибеңіз.

Тұтынушы карталары (RTX 5090 сияқты) жылдамдықты арттырады, бірақ VRAM шектеулі — әдетте 24–32 ГБ. Кәсіби карталар (RTX PRO 6000 Blackwell сияқты) VRAM-ді арттырады — картаға 96 ГБ дейін — бірақ бірлік есептеуге қарағанда қымбат.

VRAM шектейтін фактор болып табылады. Жеткіліксіз жады бар жылдам карта AI моделін мүлдем жүктей алмайды. Жеткілікті жады бар баяу карта модельді жұмыс істейді — тек жауап беру уақыты ұзағырақ.

Тұтынушы GPU-лары

КонфигурацияЖалпы VRAMҚосылуШамал. құны
2× RTX 3090 (Қолданылған)48 ГБNVLink1 500 000 ₸
2× RT48 ГБPCIe Gen 51 970 000 ₸
2× RTX 509064 ГБPCIe Gen 53 450 000 ₸

Кәсіби GPU-лар

КонфигурацияЖалпы VRAMҚосылуШамал. құны
2× RTX 6000 Ada96 ГБPCIe Gen 56 400 000 ₸
1× RTX PRO 6000 Blackwell96 ГБNVLink3 940 000 ₸
4× RTX PRO 6000 Blackwell384 ГБPCIe Gen 515 800 000 ₸

Деректер орталығы GPU-лары

КонфигурацияЖалпы VRAMҚосылуШамал. құны
1× L40S48 ГБPCIe 4.0 (пассивті салқындату)3 450 000 ₸
1× A100 PCIe80 GBPCIe 4.04 900 000 ₸
1× H200 NVL141 ГБNVLink14 800 000 ₸
4× H200 NVL5641× B200 SXMNVLink59 100 000 ₸
1× B200 SXM180 ГБNVLink 5 (1.8 ТБ/с)14 800 000 ₸
8× B200 SXM1,440 ГБNVLink 5 (1.8 ТБ/с)118 300 000 ₸

Қытай GPU-лары

Қытайдың отандық GPU экожүйесі тез жетілді. Бірнеше қытай өндірушілері қазір бәсекеге қабілетті сипаттамалармен және айтарлықтай төмен бағалармен жұмыс станциясы класындағы AI GPU-ларын ұсынады.

КонфигурацияЖалпы VRAMЖады түріШамал. құны
1× Moore Threads MTT S400048 ГБGDDR6390 000 ₸
4× Moore Threads MTT S4000192 ГБGDDR61 720 000 ₸
8× Moore Threads MTT S4000384 ГБGDDR63 200 000 ₸
1× Hygon DCU Z10032 ГБHBM21 230 000 ₸
1× Biren BR10432 ГБHBM2e1 500 000 ₸
8× Biren BR104256 ГБHBM2e11 800 000 ₸
1× Huawei Ascend Atlas 300I Duo96 ГБHBM2e590 000 ₸
8× Huawei Ascend Atlas 300I Duo768 ГБHBM2e4 900 000 ₸

Жақында

КонфигурацияЖалпы VRAMСтатусШамал. құны
RTX 5090 128 ГБ128 ГБҚытай мод. — стандартты SKU емес2 460 000 ₸
RTX Titan AI64 ГБ2027 жылы күтілуде1 500 000 ₸
SEO жазуы
SEO жазуы
SEO жазуы
SEO жазуы

Алдын ала жиналған жұмыс станциялары

Бір бөлшек беруші, бір кепілдік және сертификатталған конфигурацияны қалайтын ШКШ үшін Dell және HP сияқты әртүрлі берушілер алдын ала конфигурацияланған жүйелерді ұсынады. Бұл техникалық білімі жоқ кеңселер үшін қауіпсіз таңдау — тапсырыс беріңіз, қосыңыз және жұмысты бастаңыз.

NVIDIA DGX Station — стандартты розеткаға қосылатын сумен салқындатылатын "үстелдегі деректер орталығы".

NVIDIA DGX Station

Enterprise Apex

NVIDIA DGX Station — кеңсе ортасына деректер орталығының өнімділігін әкелетін сумен салқындатылатын, үстел маңындағы суперкомпьютер. Соңғы нұсқасы GB300 Grace Blackwell Superchip пайдаланады.

NVIDIA DGX Station GB300 Болашаққа бағдарланған Ultra
Шамал. бағасы ~98 500 000 ₸+

Blackwell Ultra нұсқасы жады тығыздығын және есептеу қуатын арттырады, нөлден бастап арнайы модельдерді оқыту немесе орында үлкен MoE (Mixture of Experts) архитектураларын іске қосу қажет ұйымдарға арналған.

Жады
~1.5 ТБ+
HBM3e (өте жылдам)
Есептеу
~20+ PFLOPS
FP8 AI Өнімділігі
Қолдану сценарийі
Арнайы оқыту
Модельді дамыту
Қуат
Стандартты розетка
Серөлмесі қажет емес
SEO жазуы
SEO жазуы
SEO жазуы
SEO жазуы
NVIDIA DGX Station A100 Қолжетімді AI жұмыс ат
Бастап ~22 200 000 ₸

ШКШ үшін "Құндылық патшасы". Алдыңғы ұрпақтың Ampere архитектурасына негізделген болса да, ол сенімді шешім шығару және икемделу үшін сала стандарты болып қала береді. Blackwell-ге арналған бюджеті жоқ AI кеңістігіне кіретін командалар үшін идеалды.

Жады
320 ГБ
4x 80ГБ A100 GPU
Есептеу
2 PFLOPS
FP16 AI өнімділігі
Бірнеше пайдаланушы
5–8 бір мезгілде
Орташа параллелизм
Қуат
Стандартты розетка
Серөлмесі қажет емес

Қымбат болғанымен, DGX Station 147 800 000 ₸+ сервер сөресін және оған қатысты салқындату инфрақұрылымын ауыстырады. Ол стандартты розеткаға қосылады. Бұл сервер бөлмесі үстеме шығындарын толық жояды.

Бизнесіңізге арналған дұрыс AI жұмыс станциясын таңдауға көмек керек пе?

Біздің инженерлер AI жабдықтарыңыздың талаптарын бағалап, толық конфигурацияланған AI жүйесін орнатады.

Тегін жабдық бағалау алу →

5 Серверлер
AI серверлері 7 400 000 – 98 500 000 ₸

Бизнесіңіз 50 немесе одан да көп қызметкерлерді бір мезгілде қызмет етуге, негіздік класстағы модельдерді толық дәлдікпен іске қосуға немесе меншікті деректер бойынша арнайы модельдерді икемдеуге қажет болғанда — сіз сервер санатына кіресіз.

Бұл жоғары жолақтықты жадысы (HBM) бар арнайы AI жеделдеткіш карталары, арнайы интерконнектер және рейкке орнатылатын немесе үстел маңындағы форм-факторлардың домені. Жабдық қымбат, бірақ пайдаланушыға шаққандағы құн масштабта айтарлықтай төмендейді.

Intel Gaudi 3

Масштабта үздік құн-сапа

Intel Gaudi 3 жеделдеткіші басынан-ақ AI оқыту және шешім шығару чипі ретінде жасалды — қайта пайдаланылған графикалық карта емес. Әр карта бөлек желі адаптерлерінің қажеттілігін жоятын кіріктірілген 400 Гб Ethernet желісімен 128 ГБ HBM2e жадысын ұсынады.

8 карталы Gaudi 3 сервері NVIDIA H100 жүйесімен салыстырғанда айтарлықтай төмен құнмен 1 ТБ жалпы AI жадысын береді. Сервер класындағы AI қажет, бірақ NVIDIA бағасын ақтай алмайтын ШКШ үшін Gaudi 3 бүгінде қол жетімді ең тартымды альтернатива болып табылады.

💾
Картаға шаққандағы жады
128 ГБ
HBM2e — бір картада DGX Spark-пен сәйкес келеді
8-карталық жалпы
1 ТБ
Ең үлкен модельдер үшін 1,024 ГБ біріктірілген жады
💰
Жүйе құны
~73 900 000 ₸
Салыстырмалы NVIDIA H100 орнатуынан 40–50% арзанырақ
SEO жазуы
SEO жазуы
SEO жазуы
SEO жазуы

Әр Gaudi 3 картасындағы кіріктірілген 400 ГбE желісі сыртқы коммутаторларсыз тікелей картадан-картаға байланысты қамтамасыз етеді — сервер архитектурасын жеңілдетеді және жүйенің жалпы құнын төмендетеді. 8 карталы сервер ондаған бір мезгілдегі пайдаланушылар үшін ең үлкен ашық бастапқы модельдерді интерактивті жылдамдықпен іске қосады.

AMD Instinct MI325X

Максималды тығыздық

AMD Instinct MI325X картасына 256 ГБ HBM3e жадысы орналастырылған — Intel Gaudi 3 екі есе, NVIDIA H100 екі есе. Intel немесе NVIDIA үшін 8 картамен салығанда, жалпы AI жадысының 1 ТБ-ға жетуі үшін тек 4 карта қажет.

💾
4-карталық жалпы жады
1 ТБ
Бірдей сыйымдылық үшін Intel карталарының жартысы
Тармақтық ені
6 ТБ/с
Картаға шаққанда — бір мезгілдегі пайдаланушыларға мүмкіндік береді
💰
Жүйе құны
~98 500 000 ₸
Қымбат, бірақ жоғары өнімділік
SEO жазуы
SEO жазуы
SEO жазуы
SEO жазуы

MI325X жүйеге шаққанда Gaudi 3-тен қымбат, бірақ жылдам және тығыз. Максималды өткізу қабілетін талап ететін жұмыс жүктемелері үшін — жүздеген пайдаланушыларға нақты уақытта шешім шығару немесе үлкен деректер жинақтарында арнайы модельдерді оқыту — жоғары инвестиция төмен кідіріс пен жеңіл инфрақұрылым арқылы өзін ақтайды.

Huawei Ascend

Толық стекті альтернатива

Huawei

Huawei AI инфрақұрылымының толық стекін қайта жасады: арнайы чиптер (Ascend 910B/C), меншікті интерконнектер (HCCS) және толық бағдарламалық фреймворк (CANN). Нәтижесінде батыс жеткізу желілерінен тәуелсіз және салыстырмалы NVIDIA H100 кластерлерінен әлдеқайда төмен құнмен жұмыс істейтін өздік жеткілікті экожүйе пайда болды.

SEO жазуы
SEO жазуы
SEO жазуы
SEO жазуы

Intel Xeon 6 (Granite Rapids)

Бюджеттік сервер

2026 жылғы тыныш революция — CPU негізіндегі AI шешім шығарудың көтерілуі. Intel Xeon 6 процессорлары стандартты DDR5 RAM-де AI жұмыс жүктемелерін қамтамасыз ететін AMX (Advanced Matrix Extensions) қамтиды — бұл GPU жадысынан айтарлықтай арзан.

Ауыстыру

Қос сокетті Xeon 6 сервері GPU жадысының құнының бір бөлігіне 1 ТБ-дан 4 ТБ-ға дейін DDR5 RAM сақтай алады. Шешім шығару жылдамдығы баяу, бірақ партиялық өңдеу үшін — жылдамдық маңызды емес, бірақ интеллект пен сыйымдылық шешуші рөл атқарады — бұл революциялық.

Мысал: ШКШ түнде 100,000 сканерленген шотты жүктейді. Xeon 6 сервері деректерді тамаша шығару үшін +400B AI моделін іске қосады. Тапсырма 10 сағатты алады, бірақ жабдық құны GPU серверінен әлдеқайда төмен.

Дұрыс AI сервер инфрақұрылымын таңдауға көмек керек пе?

Біздің инфрақұрылым командасы Intel Gaudi-ден NVIDIA DGX-ке дейінгі толық AI серверлік шешімдерді жобалайды және орнатады — бұл сіздің бизнесіңіз үшін AI мүмкіндіктерін ашу үшін тапсырыс бойынша жасалған бағдарламалық жасақтамамен біріктіріледі.

Сервер архитектурасы ұсынымын сұрау →

6 Edge AI
Edge AI & Ретрофит Қолданыстағы инфрақұрылымды жаңарту

Әр ШШК-ге арнайы AI сервері немесе мини-комажет емес. Көптегендері ноутбуктерді, жұмыс станцияларын және желілік құрылғыларды минималды қаржымен AI мүмкіндіктерімен жаңарту арқылы қолданыстағы инфрақұрылымға ақылдылық енгізе алады.

M.2 AI жеделдеткіштері: Hailo-10

Hailo-10 — SSD-лер үшін қолданылатын слотпен бірдей стандартты2 2280 модулі — кез келген қолданыстағы компьютерге арнайы AI өңдеуді қосады. Бірлік бағасы ~74 000 ₸ және қуаты 5–8Вт-ты ғана тұтына отырып, құрылғыларды ауыстырмай флоттық AI жаңартуларын қамтамасыз етеді.

📎
Пішін факторы
M.2 2280
Кез келген стандартты SSD слотына сыйып кіреді
Өнімділік
20–50 TOPS
Edge-инференция үшін оңтайландырылған
💰
Құны
~74 000 ₸
Бірлікке — флоттық жаңарту 1 500 000 ₸-ден төмен

Қолдану сценарийлері: Жергілікті кездесу транскрипциясы (Whisper), нақты уақытта субтитрлеу, дауыстық диктант, кіші модельдердің инференциясы (Phi-3 Mini). Бұл карталар үлкен LLM-дерді іске қоса алмайды, бірақ белгілі бір, үздіксіз AI тапсырмаларында үздік — дауыс деректерінің жергілікті өңделіп, бұлтқа ешқашан жіберілмейтінін қамтамасыз етеді.

Copilot+ компьютерлері (NPU ноутбуктері)

Qualcomm Snapdragon X Elite, Intel Core Ultra немесе AMD Ryzen AI чиптері бар ноутбуктер арнайы NPU-ларды қамтиды. Олар LLM-дерді іске қоса алмайды, бірақ кіші, үздіксіз AI тапсырмаларын орындайды: тікелей транскрипция, фонды бұлдыру, жергілікті Еске алу мүмкіндіктері және Microsoft Phi-3 сияқты жеңіл модельдерді іске қосу.

9 AI модельдері
Ашық бастапқы кодты AI модельдері (2026–2027)

AI моделін таңдау құрылғы талаптарын анықтайды — бірақ AI моделін кванттау тарауы көрсеткендей, кванттау шеберлік класындағы модельдерді толық дәлдікпен орнатуға қажетті құрылғы құнының бір бөлігіне жұмыс істеуге мүмкіндік береді.

Төмендегі кесте қолданыстағы және жақын арада шығатын ашық бастапқы кодты AI модельдерінің шолуын береді.

МодельӨлшеміАрхитектураЖад (FP16)Жад (INT4)
Llama 4 Behemoth288B (белсенді)MoE (~2T барлығы)~4 ТБ~1 ТБ
Llama 4 Maverick17B (белсенді)MoE (400B барлығы)~800 ГБ~200 ГБ
Llama 4 Scout17B (белсенді)MoE (109B барлығы)~220 ГБ~55 ГБ
DeepSeek V4~70B (белсенді)MoE (671B барлығы)~680 ГБ~170 ГБ
DeepSeek R137B (белсенді)MoE (671B барлығы)~140 ГБ~35 ГБ
DeepSeek V3.2~37B (белсенді)MoE (671B барлығы)~140 ГБ~35 ГБ
Kimi K2.532B (белсенді)MoE (1T барлығы)~2 ТБ~500 ГБ
Qwen 3.5397B (белсенді)MoE (A17B)~1.5 ТБ~375 ГБ
Qwen 3-Max-ThinkingҮлкенТығыз~2 ТБ~500 ГБ
Qwen 3-Coder-Next480B (A35B белсенді)MoE~960 ГБ~240 ГБ
Mistral Large 3123B (41B белсенді)MoE (675B барлығы)~246 ГБ~62 ГБ
Ministral 3 (3B, 8B, 14B)3B–14BТығыз~6–28 ГБ~2–7 ГБ
GLM-544B (белсенді)MoE (744B барлығы)~1.5 ТБ~370 ГБ
GLM-4.7 (Thinking)ҮлкенТығыз~1.5 ТБ~375 ГБ
MiMo-V2-Flash15B (белсенді)MoE (309B барлығы)~30 ГБ~8 ГБ
MiniMax M2.5~10B (белсенді)MoE (~230B барлығы)~460 ГБ~115 ГБ
Phi-5 Reasoning14BТығыз~28 ГБ~7 ГБ
Phi-414BТығыз~28 ГБ~7 ГБ
Gemma 327BТығыз~54 ГБ~14 ГБ
Pixtral 2 Large90BТығыз~180 ГБ~45 ГБ
Stable Diffusion 4~12BDiT~24 ГБ~6 ГБ
FLUX.2 Pro15BDiT~30 ГБ~8 ГБ
Open-Sora 2.030BDiT~60 ГБ~15 ГБ
Whisper V41.5BТығыз~3 ГБ~1 ГБ
Med-Llama 470BТығыз~140 ГБ~35 ГБ
Legal-BERT 202635BТығыз~70 ГБ~18 ГБ
Finance-LLM 315BТығыз~30 ГБ~8 ГБ
CodeLlama 470BТығыз~140 ГБ~35 ГБ
Molmo 280BТығыз~160 ГБ~40 ГБ
Granite 4.032B (9B белсенді)Гибридті Mamba-Transformer~64 ГБ~16 ГБ
Nemotron 38B, 70BТығыз~16–140 ГБ~4–35 ГБ
EXAONE 4.032BТығыз~64 ГБ~16 ГБ
Llama 5 Frontier~1.2T (барлығы)MoE~2.4 ТБ~600 ГБ
Llama 5 Base70B–150BТығыз~140–300 ГБ~35–75 ГБ
DeepSeek V5~600B (барлығы)MoE~1.2 ТБ~300 ГБ
Stable Diffusion 5АнықталмағанDiT
Falcon 3200BТығыз~400 ГБ~100 ГБ
Стратегиялық кеңес

Алдымен құрылғыны сатып алмаңыз. Біздің бизнес қажеттіліктеріңізге сәйкес келетін модель класын анықтаңыз, содан кейін ең қолжетімді құрылғы деңгейін анықтау үшін квантизацияны қолданыңыз.

1 500 000 ₸ және 73 900 000 ₸ инвестиция арасындағы айырмашылық жиі модель өлшемінің талаптарына және бір мезгілдегі пайдаланушылар санына байланысты болады.

AI моделдер ландшафтын қалыптастыратын тенденциялар

  • Стандарт ретінде туа мультимодальдылық. Жаңа модельдер мәтін, сурет, дыбыс және бейне бойынша бір мезгілде жаттықтырылады — оқытудан кейін қосылған бөлек мүмкіндіктер ретінде емес. Бұл бір модельдің құжаттарды талдау, суреттерді түсіну және дауыстық өзара әрекеттестікті өңдеуін білдіреді.
  • Кіші модельдердің үлкен модельдер мүмкіндіктеріне қол жеткізуі. Phi-5 (14B) және MiMo-V2-Flash архитектуралық инновациялардың шеберлік деңгейіндегі пайымдауды ноутбукте жұмыс істейтін модельдерге сығып салуы мүмкін екенін көрсетеді. "Үлкені жақсы" дәуірі аяқталуда.
  • Жалпылаудан гөрі мамандандыру. Барлығы үшін бір үлкен модель орнына, агент фреймворкі басқаратын мамандандырылған модельдер ансамбліне — кодтау моделі, пайымдау моделі, көру моделі — бет бұру тенденциясы бар. Бұл әр модель үшін құрылғы талаптарын төмендетеді және жалпы сапаны жақсартады.
  • Агенттік AI. Kimi K2.5 және Qwen 3 сияқты модельдер күрделі тапсырмаларды автономды түрде ыдырату, сыртқы құралдарды шақыру және басқа модельдермен үйлестіру үшін жасалған. Бұл агенттер ройы парадигмасы ұзақ сеанстар бойы тұрақты өткізу қабілетін талап етеді — GB10 және M5 Ultra сияқты жоғары өткізу қабілеті бар құрылғыларды артықшылықты етеді.
  • Бейне және 3D генерациясының жетілуі. Open-Sora 2 және FLUX.2 Pro жергілікті бейне генерациясының практикалық болуына белгі болады. 2027 жылға қарай жұмыс станциясы класындағы құрылғыларда жұмыс істейтін нақты уақыттағы бейне редакторларын күтуге болады.

10 Қауіпсіздік
Максималды қауіпсіздік архитектурасы

Күшті құрылғыларды сатып алу тек бірінші қадам. Сезімтал деректермен жұмыс істейтін ШШК-тер үшін қызметкерлеріңіз бен AI жүйесі арасындағы байланыс архитектурасы құрылғының өзі сияқты маңызды.

2026 жылы жергілікті AI үшін стандартты қауіпсіздік моделі — Air-Gapped API архитектурасы: AI серверін физикалық түрде интернеттен оқшаулайтын, бірақ авторизацияланған қызметкерлерге API интерфейсі арқылы қолжетімді ететін дизайн үлгісі.

Air-Gapped API архитектурасы
👤 Қызметкер Стандартты жұмыс станциясы
🔀 Брокер сервері Аутентификация + UI + Бағдарлау
🔒 AI сервері Air-gapped · Интернет жоқ
AI қоры

Бұл архитектура Сандық қор жасайды. Брокер сервері бүлінген жағдайда да, шабуылшы тек мәтіндік сұрауларды жібере алады — олар AI серверінің файлдық жүйесіне, модель салмақтарына, икемдеу деректеріне немесе сақталған құжаттарға қол жеткізе алмайды.

Тапсырыс бойынша AI шешімдері бар қауіпсіз AI орнату қажет пе?

Біздің инженерлер деректер ешқашан ғимараттан шықпайтындай етіп air-gapped AI архитектураларын жобалайды және орнатады, сонымен бірге бизнесіңізге заманауи AI мүмкіндіктерін ұсынады.

Қауіпсіз AI архитектурасын талқылау →

11 Экономика
Экономикалық шешім: Жергілікті және бұлттық

Жергілікті AI құрылғыларына көшу OpEx (операциялық шығын — айлық бұлттық API ақылары) -дан CapEx (инвестициялық шығын — балансыңызда активке айналатын бір реттік құрылғы инвестициясы) -ға ауысу болып табылады.

Келісімшарттарды талдау үшін 70B моделін іске қосатын заңдық фирманы қарастырайық:

☁️ Бұлттық API
17 700 000 ₸
жылдық (үлкен көлемде)
Күніне 1,000 келісімшарт × ~$0.01/1K токен × 365 күн. Пайдаланумен сызықты өседі. Деректер желеден шығады.
🖥️ Жергілікті құрылғы (DGX Spark)
1 774 000 ₸
бір реттік инвестиция
+ ~7 400 /ай электр энергиясы. Шексіз пайдалану. Деректер желеден ешқашан шықпайды. Баланстағы актив.

Күніне 100 сұрау (кәдімгі кіші команда жұмыс көлемі) кезінде, 1 774 000 ₸ DGX Spark бұлттық API шығындарымен салыстырғанда 2 айдан кем уақытта өзін ақтайды. Жоғары пайдалану деңгейлерінде өтелу мерзімі апталарға қысқарады.

Мына факторларды ескергенде экономикалық тиімділік одан да артады:

  • Бірдей құрылғыны бірнеше қызметкер бөліседі (DGX Spark 2–5 бір мезгілдегі пайдаланушыға қызмет көрсетеді)
  • Токенге баға жоқ — күрделі, көп қадамды пайымдау тапсырмалары қосымша төлемсіз
  • Меншікті деректермен икемдеу — көптеген бұлттық API-мен мүмкін емес, жергілікті құрылғыда тегін
  • Құрылғыны қайта сату құны — AI құрылғылары қайта сауда нарығында айтарлықтай құнды сақтайды