Un singur cip oferă 1PetaOps / sec
Groq numește arhitectura sa Tensor Streaming Processor (TSP). La doi ani în urmă, a spus că a recrutat opt dintre cele zece persoane care au dezvoltat Tensor Processing Unit (TPU) Google.
Compania a strâns 62,3 milioane USD în finanțare.
Arhitectura lui Groq este echivalentă cu un sfert de operațiuni pe secundă sau 115 operative / s și capabilă să depășească 250 de trilioane de operații în virgulă flotantă pe secundă (FLOPS).
„Companiile de top ale GPU le-au spus clienților că au sperat să poată oferi o performanță PetaOp / s în următorii ani; Groq o anunță astăzi ", spune CEO-ul Groq, Jonathan Ross," arhitectura Groq este de multiplu mai rapidă decât orice altceva disponibil pentru inferență, atât în ceea ce privește latența scăzută, cât și inferențele pe secundă. Am avut primele programe de silicon înapoi, prima pornire a zilei, programe care se derulau în prima săptămână, eșantionate partenerilor și clienților în mai puțin de șase săptămâni, iar siliconul A0 va intra în producție ”
Cu o primă mentalitate software, arhitectura TSP a lui Groq susține că realizează atât flexibilitatea calculului, cât și paralelismul masiv, fără sincronizarea generala a arhitecturilor tradiționale de procesor și procesor.
Arhitectura lui Groq poate suporta atât modele tradiționale, cât și noi modele de învățare a mașinilor și este în prezent funcțională pe site-urile clienților, atât în sistemele x86, cât și în cele non-x86.
Arhitectura este proiectată special pentru cerințele de performanță ale viziunii computerului, învățarea mașinii și alte sarcini de lucru legate de AI.
Planificarea execuției se realizează în software, eliberând bunurile imobiliare din siliciu, altfel dedicate executării instrucțiunilor dinamice.
Controlul strâns oferit de această arhitectură asigură o prelucrare deterministă, care este deosebit de valoroasă pentru aplicațiile în care siguranța și precizia sunt primordiale.
În comparație cu arhitecturile tradiționale complexe bazate pe procesoare, GPU și FPGA, cipul Groq simplifică, de asemenea, calificarea și implementarea, permițând clienților să implementeze simplu și rapid sisteme scalabile, de înaltă performanță pe watt.
