(原标题:推理芯片,英伟达迎来强劲敌手)
要是您但愿不错时常碰头,接待标星保藏哦~
开始:内容编译自forbes,谢谢。
要是你从事金融行业,那么商量行将进行 IPO 的 Cerebras 的新闻一谈是对于该公司的股票代码将如安在纳斯达克阐扬。
可是,要是你对科技感兴味,故事就有点不同了。事实上,要是你只热心这些公司将若何竞争,你就确实看不到大局。
许多东谈主皆知谈东谈主工智能转换的初始是若何导致用 GPU 取代 CPU 的:GPU 是一种更复杂、更专科的逻辑处罚器,适用于机器学习和关系责任。
其时,咱们除名一种极度常见的法例尺度 - 输入多数检修数据,其中频繁包括多数的集合握取数据 - 然后用它来测试系统。
扫数这些责任皆需要多数的处罚能力,而 GPU 等于为这些残害的责任负载而构建的。
咫尺,该行业似乎正在进一步发展,走向所谓的推理,这是一种不同的任务,况且硬件必须愈加专科化。
那么,什么是扩张?因为每当有东谈主初始批驳它时,你皆能看到东谈主们的眼睛皆呆呆的。一般来说,除了高度科学的语境外,咱们不可爱这类词。
嗯,不管若何,推理基本上是东谈主工智能的动态学习能力——获取及时数据并将其放入检修模子中以取得妥当逻辑的成果。
换句话说,检修有素的东谈主工智能正在展示它从检修中学习到的常识。
因此,这种作为需要一些分量级的硬件:为此,Cerebras 推出了晶圆级引擎 (WSE),对于科技深爱者来说,它的规格十分令东谈主印象潜入。(这些巨型芯片由台湾半导体制造公司坐褥,这少许并不令东谈主巧合)。
WSE:幕后
Cerebras 的 WSE-3 领有 4 万亿个晶体管和数目惊东谈主的片上内存。它领有大要 9,000 个中枢,揣摸每秒可施行 125 千万亿次浮点运算。
咱们之前曾报谈过这类纷乱的多核引擎,其硬件物理上很大——以英寸而不是厘米来掂量。
Perplexity 首席时代官丹尼斯·亚拉茨 (Denis Yarats) 在一份新闻声明中指出:“更低的延伸不错进步用户参与度。凭借 Cerebras 比传统 GPU 快 20 倍的速率上风,咱们确信用户与搜索和智能谜底引擎的互动将发生根人道周折。”
不丢丑出,这种力量将会为繁多行业的东谈主工智能发展提供矫健的能源。
东谈主工智能推理的用例
想考这个音信的一种方式是,咱们仅仅想要更快的速率和更矫健的功能来结束越来越复杂的经由。但你也不错议论一下推理在东谈主工智能进化的这一阶段将演出的扮装。换句话说,咱们正在从监督较多的学习类型转向监督较少的学习类型——从咱们 10 年前所作念的那种笃定性机器学习,转向一种新式的神经集合作为,在这种作为中,咱们更信任系统好像自行学习。
因此,Cerebras 的新挑战的故事(更无谓说另一家加入这一潮水的公司 Groq)是硬件追逐的故事。
硬件自己令东谈主印象潜入——这些新款凯迪拉克系统引东谈主防护——但咱们应该热心的是,这些居品的用途是什么,它们为何会颠覆交易样式。
Run:AI 的一位作家写谈:“跟着东谈主工智能越来越多地融入普通生涯和交易运营的各个方面,高效、准确的东谈主工智能推理的伏击性日益突显。准确的推理在医疗保健、欺骗检测和自动驾驶等明锐用例中尤为伏击。”
这些仅仅一些顶级示例:咱们尚未确切发现更深线索推理模子的一些更潜藏的用途。十年后东谈主工智能会是什么形势?它看起来仍然像是从瞎想机中出来的吗?已经事情会变得十足不同?
几年前,福布斯时代委员会成员Nir Kaldero 为咱们列出了这份名单:其中一些承认具有很强的耐久力,尽管议论其中的一些很意思。举例,云:虽然,云的选拔仍在不时,但咫尺咱们对于许多责任负载有一个竞争的主义。它是在角落、在设置上、在集合角落进行处罚。况且这也正在取得进展。
不管若何,硬件之争本色上是下一代时代系统的先兆。它们将会相等引东谈主防护。
https://www.forbes.com/sites/johnwerner/2024/11/04/nvidia-cerebras-race-to-supply-big-chips-for-ai-inference-activities/
半导体杰作公众号保举
专注半导体领域更多原创内容
热心环球半导体产业动向与趋势
*免责声明:本文由作家原创。著述内容系作家个东谈主不雅点,半导体行业不雅察转载仅为了传达一种不同的不雅点,不代表半导体行业不雅察对该不雅点赞同或赞助,要是有任何异议,接待商量半导体行业不雅察。
今天是《半导体行业不雅察》为您共享的第3938内容,接待热心。
『半导体第一垂直媒体』
及时 专科 原创 深度
公众号ID:icbank
可爱咱们的内容就点“在看”共享给小伙伴哦