Foreign Media - News Reader

Home Category

DeepSeek是如何把构建AI的价格“打下来”的

By cn.nytimes.com 0 0
Source: https://cn.nytimes.com/technology/20250213/deepseek-ai-chip-costs/

这个嘛,他们另外还有一招。

在将每个数字塞进八位存储器后,深度求索在将这些数字相乘时采取了不同的方法。在确定每个乘法问题的答案时——进行有助于决定神经网络将如何运作的关键计算——它将答案扩展到32位存储器中。换句话说,这样就保留了更多的小数,使得答案更为精确。

所以高中生都能做到这一点吗?

当然不是。深度求索的工程师在论文中表明,他们也非常擅长编写非常复杂的计算机代码,告诉GPU该做什么。他们知道如何从这些芯片中榨取更高的效率。

具备这种技能的人不多。但一个人工智能实验室只要有心成事,就能找到与深度求索所做的事情相匹配的优秀工程师。

那为什么他们没有早些做到这一点呢?

一些人工智能实验室可能已经在使用相同的技巧了,至少是其中的一部分。像OpenAI这样的公司并不总是透露他们在幕后所做的事情。

但显然还是有人对深度求索的工作感到惊讶。要做到这家初创公司所做的事情,并不简单。找到这样的突破点所需的实验,需要用到数百万甚至数十亿美元的电力。

换句话说,需要冒巨大的风险。

西雅图艾伦人工智能研究所的研究员蒂姆·德特默斯说,“你必须投入大量资金来尝试新事物——而且它们往往会以失败告终。”德特默斯从事构建高效人工智能系统的探究,之前曾在Meta担任人工智能研究员。

“这就是为什么我们看到的创新没有那么多的原因:人们害怕大量投入都打了水漂,”他补充道。

许多专家指出,深度求索的600万美元只涵盖了这家初创公司在训练系统最终版本时的费用。深度求索的工程师在论文中表示,他们在最终的训练运行之前,还在研究和实验上花费了额外的资金。但任何尖端人工智能项目都是如此。

深度求索进行了尝试,并取得了成功。现在,由于这家中国初创公司已经与其他人工智能研究人员分享了方法,它所采用的技术手段有望显著降低构建人工智能的成本。

®Foreign Media - News Reader