-
【AI快讯分析】Cerebras 发布业界领先 AI 推断技术,性能超越英伟达 20 倍
【原文大意】来源:网上搜集Cerebras Systems 近日宣布推出名为 Cerebras Inference 的新型 AI 推理解决方案,声称这是全球最快的 AI 推理平台。该解决方案针对 Llama 3.1 8B 和 70B 模型分别提供每秒 1800 和 450 个 token 的处理速度,比基于英伟达 GPU 的解决方案快 20 倍。此外,Cerebras Inference 的定价极具竞争力,...