Акселератор Taalas HC1 с аппаратно реализованной моделью Llama-3.1 8B обеспечивает до 17 000 токенов/с
Taalas HC1 — это AI-акселератор с аппаратно реализованной (т.е. реализованной на уровне железа) моделью Llama-3.1 8B, обеспечивающий производительность около 17 000 токенов/с с этой моделью, что превосходит показатели датацентровых ускорителей, таких как чипы NVIDIA B200 или Cerebras. Taalas HC1 примерно в 10 раз быстрее чипа Cerebras, его производство стоит в 20 раз меньше, а потребление…
https://cnx-software.ru/2026/02/23/akselerator-taalas-hc1-s-apparatno-realizovannoj-modelyu-llama-3-1-8b-obespechivaet-do-17-000-tokenov-s/