难道说算力问题也要解决了？ -- 模型/算法硬件化 -6parkbbs.com

[返回网际谈兵首页]·[所有跟帖]·[ 回复本帖 ] ·[热门原创] ·[繁體閱讀]·[版主管理]

难道说算力问题也要解决了？ -- 模型/算法硬件化

送交者: sprusr[☆★★声望品衔11★★☆] 于 2024-02-20 20:39 已读 1407 次 1 赞

sprusr的个人频道

史上最快大模型炸场!Groq一夜爆红,碾压英伟达GPU(组图)

新闻来源: 华尔街见闻于2024-02-20 18:23:29 大字阅读 提示:新闻观点不代表本网立场

6park.com

一觉醒来，AI圈又变天了。 6park.com

还没消化完Sora带来的震撼，又一家硅谷初创企业带着史上最快的大模型和自研芯片LPU霸占了热搜。 6park.com

就在昨天，AI芯片创企Groq（不是马斯克的Gork）开放了自家产品的免费试用。相比其他AI聊天机器人，Groq闪电般的响应速度迅速引爆互联网讨论。经过网友测试，Groq每秒生成速度接近500 tok/s，碾压GPT-4的40 tok/s。 6park.com

有网友震惊地说： 6park.com

它回复的速度比我眨眼还快。

不过，需要强调的是，Groq并没有研发新模型，它只是一个模型启动器，主页上运行的是开源模型Mixtral 8x7B-32k和Llama 270B-4k。 6park.com

冠绝大模型圈子的响应速度，来自驱动模型的硬件——Groq并未使用英伟达的GPU，而是自研了新型AI芯片——LPU（Language Processing Units）。 6park.com

每秒500 tokens，写论文比你眨眼还快 6park.com

LPU最突出的特点就是快。 6park.com

根据2024年一月的测试结果，由Groq LPU驱动Meta Llama 2模型，推理性能遥遥领先，是顶级云计算供应商的18倍。
6park.com

6park.com

图片来源：GIT HUB 6park.com

华尔街见闻此前文章提及，Groq LPU搭配Meta Llama 2 70B能在7分钟内就能生成与莎士比亚《哈姆雷特》相同数量的单词，比普通人的打字速度快75倍。 6park.com

如下图所示，有推特网友问了一个和营销有关的专业问题，Groq在四秒钟之内就输出了上千词的长篇大论。 6park.com

还有网友测试同时用Gemini、GPT-4和Groq完成一个代码调试问题。 6park.com

结果，Groq的输出速度比Gemini快10倍，比GPT-4快18倍。 6park.com

Groq在速度上对其他AI模型的降维打击，让网友直呼，“AI推理界的美国队长来了”。

LPU，英伟达GPU的挑战者？ 6park.com

再强调一遍，Groq没有开发新的模型，它只是用了不一样的芯片。 6park.com

根据Groq官网的介绍，LPU是一种专为AI推理所设计的芯片。驱动包括GPT等主流大模型的GPU，是一种为图形渲染而设计的并行处理器，有数百个内核，而LPU架构则与GPU使用的SIMD（单指令，多数据）不同，这种设计可以让芯片更有效地利用每个时钟周期，确保一致的延迟和吞吐量，也降低了复杂调度硬件的需求： 6park.com

Groq的LPU推理引擎不是普通的处理单元；它是一个端到端系统，专为需要大量计算和连续处理的应用（如LLM）提供最快的推理而设计。通过消除外部内存瓶颈，LPU推理引擎的性能比传统GPU高出几个数量级。 6park.com

简单来说，对用户而言，最直观的体验就是“快”。 6park.com

使用过GPT的读者一定知道，痛苦地等待大模型一个一个地吐出字符是一种怎样痛苦的体验，而LPU驱动下的大模型，基本可以做到实时响应。 6park.com

比如下图，华尔街见闻向Groq询问LPU和GPU的区别，Groq生成这个回答用时不到3秒，完全不会像GPT、Gemini那样出现显著的延迟。如果以英文提问，生成速度还会更快。

6park.com

Groq官方的介绍还显示，创新的芯片架构可以把多个张量流处理器（Tensor Streaming Processor，简称TSP）连接在一起，而不会出现GPU集群中的传统瓶颈，因此具有极高的可扩展性，简化了大规模AI模型的硬件要求。 6park.com

能效也是LPU的另一个亮点。通过减少管理多个线程的开销和避免内核的利用率不足，LPU每瓦特可以提供更多的算力。 6park.com

Groq创始人兼首席执行官Jonathan Ross在采访中，时时不忘给英伟达上眼药。 6park.com

他此前对媒体表示，在大模型推理场景，Groq LPU芯片的速度比英伟达GPU快10倍，但价格和耗电量都仅为后者的十分之一。 6park.com

实时推理是通过经过训练的AI模型运行数据的计算过程，以提供AI应用的即时结果，从而实现流畅的最终用户体验。随着AI大模型的发展，实时推理的需求激增。 6park.com

Ross认为，对于在产品中使用人工智能的公司来说，推理成本正在成为一个问题，因为随着使用这些产品的客户数量增加，运行模型的成本也在迅速增加。与英伟达GPU相比，Groq LPU集群将为大模型推理提供更高的吞吐量、更低的延迟和更低的成本。 6park.com

他还强调，Groq的芯片，由于技术路径不同，在供应方面比英伟达更充足，不会被台积电或者SK海力士等供应商卡脖子： 6park.com

GroqChip LPU的独特之处在于，它不依赖于三星或SK海力士的HBM，也不依赖于台积电将外部HBM焊接到芯片上的CoWoS封装技术。 6park.com

不过，另有一些AI专家在社交媒体上表示，Groq芯片的实际成本并不低。 6park.com

如人工智能专家贾扬清分析称，Groq综合成本相当于英伟达GPU的30多倍。 6park.com

考虑到每张Groq芯片的内存容量为230MB，实际运行模型需要572张芯片，总成本高达1144万美元。 6park.com

相比之下，8张H100的系统在性能上与Groq系统相当，但硬件成本仅为30万美元，年度电费约2.4万美元。三年总运营成本对比显示，Groq系统的运营成本远高于H100系统， 6park.com

而且，更关键的是，LPU目前仅用于推理，要训练大模型，仍然需要购买英伟达GPU。 6park.com

创始人为谷歌TPU设计者之一相信未来2年能卖出100万个LPU 6park.com

在今天互联网上一炮而红之前，Groq已经低调埋头研发7年多的时间。 6park.com

公开资料显示，Groq成立于2016年，总部位于美国加州圣塔克拉拉山景城。公司创始人Jonathan Ross是前谷歌高级工程师，是谷歌自研AI芯片TPU的设计者之一。产品主管John Barrus曾在谷歌及亚马逊担任产品高管。

6park.com

高管内唯一一位华裔面孔、副总裁Estelle Hong，在公司任职已有四年，此前曾供职于美国军队及英特尔。 6park.com

就在去年8月，Groq也宣布了和三星的合作计划，表示其下一代芯片将在美国德克萨斯州三星芯片工厂采用4纳米工艺生产，预计量产时间为24年下半年。 6park.com

展望下一代LPU，Ross相信GroqChip的能效将提高15到20倍，可以在相同的功率范围内为设备增加更多的矩阵计算和SRAM存储器。 6park.com

在去年底的采访中，Ross表示，考虑到GPU的短缺和高昂的成本，他相信Groq未来的发展潜力： 6park.com

在12个月内，我们可以部署10万个LPU，在24个月内，我们可以部署100万个LPU。 6park.com

网编：睿文

鲜花(1)

鸡蛋(1)

28 条

喜欢sprusr朋友的这个贴子的话，

请点这里投票，“赞”助支持！

[举报反馈]·[ sprusr的个人频道 ]·[-->>参与评论回复]·[用户前期主贴]·[手机扫描浏览分享]·[返回网际谈兵首页]

帖子内容是网友自行贴上分享，如果您认为其中内容违规或者侵犯了您的权益，请与我们联系，我们核实后会第一时间删除。

所有跟帖: ( 主贴楼主有权删除不文明回复，拉黑不受欢迎的用户 )

jeffrey1985 给 sprusr 点“赞”支持3银元奖励！！ (无内容) - jeffrey1985 (0 bytes) 02/20/24

打开微信，扫一扫[Scan QR Code]
进入内容页点击屏幕右上分享按钮

楼主本栏目热帖推荐：

tiktok现在如果表态说如果不能扭转国会法案，将在选举前夕选择下架。 04/27/24
说实话，老轮虽然三观不正，识小不识大，但在丑国应对学生运动上的见 04/27/24
俺觉得可以借势推进从西方引进人才的计划。 04/27/24
中国光伏和电车企业其实可以强强联合，携手发展。 04/18/24
这个史料价值挺高。遥想当年，感慨系之。 04/17/24
对藏南的处理方法体现了中西方思维的差异。 04/15/24
某种程度上台独和以色列类似，通过入侵丑国大脑控制丑国，服务自己的利益。 04/14/24
俺觉得西方视中国为眼中钉却又离不开中国的原因是这个 04/14/24
以色列打伊朗估计是这个目的 04/14/24
从沙利文被毛子打断肋骨变沙利六可以看出，当初如果给佩罗西一点颜色 04/11/24
为什么有习马会，意义是什么？ 04/10/24
以色列会不会用大杀器？ 04/08/24

>>>>查看更多楼主社区动态...

[ 留园条例 ] [ 广告服务 ] [ 联系我们 ] [ 个人帐户 ] [ 版主申请 ] [ Contact us ]