九游娱乐(中国)官方网站-登录入口将奖励 100 万好意思元的奖金-九游娱乐(中国)官方网站-登录入口

发布日期：2024-11-28 02:47 点击次数：160

Grok-3 解说了「黎曼猜想」了？

xAI 沟通员 Hieu Pham 周末发布的一条推文在 AI 圈掀翻山地风云，推文原话是这样说的：

Grok-3 AI 系统刚刚解说了黎曼猜想（Riemann ’ s hypothesis）。为了考证这一解说的正确性，咱们决定暂停该系统的老师。要是解说被阐明无误，咱们将不再不息其老师，因为这样的 AI 被合计过于智能，可能对东谈主类组成恫吓。

老规则，先说论断，这单纯即是玩梗良友。

然则，跟着推文的束缚发酵，如故赶快激发了超越两百万网友的见谅与沟通，甚而辐照到海表里的 AI 公论圈。

事情的泉源大提要追意象网友 Andrew Curran 更早些时代的一则「爆料」，其宣称 Grok-3 在老师经过中发生了苦难性事件。

随后，各式离奇的传言源源接续。

网友起哄说，OpenAI CEO Sam Altman 用庞杂的激光器瞄准了 xAI 的最大老师集群，导致数据严重损坏；也有东谈主煞有介事地透露有东谈主辩论落拓下一代 LLM 老师开动。

更有戏弄称，AI 似乎取得了自我毅力，并管制了黎曼猜想，但在解说代码中「挑升概略了 15 个分号」，使东谈主类无法考证。

连 Runway 首创东谈主 Crist ó bal Valenzuela 也来凑侵略：

Gen-4 刚刚荣获了包括最好影片在内的悉数奥斯卡奖项。为了深入沟通其在艺术范畴的创新恶果，咱们决定暂停对其进行的老师。要是这部电影确乎如早期评述家所言具有更正性，咱们将不会还原老师，因为这标明 AI 在艺术方面一经达到如斯高的水平，以至于可能恫吓到东谈主类的创造力。

妄语就这样越传越邪乎。

多位 xAI 沟通东谈主员也纷繁转发 Andrew Curran 推文，加入这场集体「大团建」。

比如咱们的老熟东谈主 xAI 联创 Greg Yang 率先戏弄谈，Grok-3 在老师经过中短暂殴打办公室里年长的保安。

另一位沟通东谈主员 Heinrich Kuttler 则透露：「是的，情况相称晦气！咱们自后用 nan（Not a Number，非数）把悉数颠倒的权重都替换了一遍，才还原。」

虽然，更感性的网友径直在 X 上沟通刻下版块的 Grok 对黎曼猜想的都集，果不其然， Grok 的弘扬十分「玛卡巴卡」。

最终，这场闹剧由始作俑者—— xAI 沟通员 Hieu Pham 躬行画上句号：

好的，《周六夜现场》扫尾了。至于为什么解说黎曼假定是危急的，我热烈保举马特 · 海格（@matthaig1）的精彩演义《东谈主类》。

那么问题来了，为什么这则 Grok-3 解说黎曼猜想的音尘能引起普通的见谅呢？领先是黎曼猜想自己的要紧性。

黎曼猜想（Riemann Hypothesis）是数学中一个对于素数散布的要紧猜想，由德国数学家伯恩哈德 · 黎曼于 1859 年提议，该猜想被列为克雷数学沟通所（Clay Mathematics Institute）的「千年贫乏」之一。

它触及到黎曼 ζ 函数（Riemann zeta function），这个函数界说为：

ζ ( s ) =1+12s+13s+14s+ ⋯ zeta ( s ) = 1 + frac{1}{2^s} + frac{1}{3^s} + frac{1}{4^s} + cdots ζ ( s ) =1+2s1+3s1+4s1+ ⋯

黎曼猜想的中枢内容是：悉数非泛泛的黎曼 ζ 函数零点的实部都等于 1/2。换句话说，要是 ss 是黎曼 ζ 函数的一个非泛泛零点，即 ζ ( s ) =0 ζ ( s ) =0，那么其实部必定是 ℜ ( s ) =1/2 ℜ ( s ) =1/2。

克雷数学沟通所说了，要是有东谈主偶然得手解说黎曼猜想，将奖励 100 万好意思元的奖金。但这个猜想于今莫得被解说或反驳，也被普通合计是当代数论中的一个未解之谜。

这个猜想的解说对于数论（数学的一个分支）有着潜入的影响。

面前，好多当代加密本事（比如保护网上支付、数据心事等）都依赖于素数的性质。解说黎曼猜想或将会让东谈主类更好地都集这些本事的基础，何况可能影响到改日的安全算法。

假如 Grok-3 能解说黎曼猜想，这不仅将鼓舞表面数学、物理学、密码学等范畴的大幅进展，同期将记号着 AI 在推理和管制复杂问题方面的庞杂超越。

甚而不错说，这将成为东谈主工智能超越东谈主类智能的一个记号性事件。

月之暗面首创东谈主杨植麟曾透露，数学场景是熟谙 AI 想考技艺最生机的场景。

数学是一个极其严谨的逻辑体系，而 AI 的推理技艺往往成立在严实的逻辑推导之上。

AI 管制数知识题的经过本质上是一个持续想考的历程，在这个经过中，它会束缚尝试不同想路，通过反复试错来寻找正确谜底。即便预计经过中出现失实，AI 也能通过考证和校对来修订为止。

肖似的理念也体当今 OpenAI o1 的强化学习老师上。

要是说夙昔的大模子是学习数据，o1 更像在学习想维。就像咱们解题，不仅要写出谜底，也要写出推理经过。一都题目不错死记硬背，但学会了推理，才能举一反三。

是以在本年好意思国针对优秀高中生的 AIME 检修当中，GPT-4o 仅完成了百分之十三的题目。比较之下，o1 的正确率高达 83 个百分点。

就博士水准的 GPQA Diamond 科研测评而言，GPT-4o 取得了 56.1% 的收货，而 o1 的弘扬更为出色。不仅胜过了东谈主类博士的 69.7%，更是达到了 78% 的正确率。

在国际信息学奥赛 ( IOI ) 的评测中，当每谈题允许 50 次尝试时，模子达到了 49% 的得分率，即 213 分，而当每题提交契机增至一万次时，其最终得分提高至 362 分。

拿击败围棋寰宇冠军的 AlphaGo 类比，就愈加容易都集了。

AlphaGo 即是通过强化学习老师的，先使用大批东谈主类棋谱进行监督学习，然后与我方对弈，每局对弈凭据胜负得到奖励或者处分，束缚提高棋艺，甚而掌抓东谈主类棋手想不到的活动。

o1 和 AlphaGo 有相同之处，不外 AlphaGo 只可下围棋，o1 则是一个通用的大谈话模子。

o1 学习的材料，可能是数学题库、高质地的代码等，然后 o1 被老师生成解题的想维链，并在奖励或处分的机制下，生成和优化我方的想维链，束缚提高推理的技艺。

这其实也解释了，为什么 OpenAI 强调 o1 的数学、代码技艺强，因为对错比较容易考证，强化学习机制偶然提供明确的反映，从而提高模子的性能。

虽然，更要紧的是如何将这种推理技艺拓展利用到更普通的范畴中。

是以咱们会看到不少国际网友为 Grok-3 解说黎曼猜想欣慰，「要是是这样的话，咱们果然在见证一个庞杂的冲破。」

马斯克曾屡次在公开时势渲染 Grok-3 的坚硬，他宣称 Grok-3 预测在年底前问世，并将成为「寰宇上最坚硬的 AI」。

现实上，Grok-3 是由上头提到的 AI 初创公司 xAI 设备的第三代大型谈话模子，并预测在性能上预期将超越现存的悉数 AI 大模子。

原因在于 Grok-3 老师背后依托的是面前寰宇上最大的 AI 老师集群—— Colossus。

这个集群由 10 万个液冷英伟达 H100 GPU 组成，经受单一的 RDMA 网罗互连架构。这个集群的范畴一经超越了面前寰宇上任何其他的超等预计机，而且改日还将持续膨胀 GPU 数目。

凭据 The Information 的报谈，Colossus 的出现甚而引起了 Altman 的密切见谅，后者派飞机飞越 Colossus 老师基地，试图观望其设备进展和动力供应情况。

是以说，当「最强 AI」、「千年数学贫乏」和以及长盛不衰的「AI 恫吓论」这三重元素重迭，一场无缺的「妄语风暴」就此酿成。

甚而咱们不错合计，Grok-3 解说黎曼猜想的妄语，与其说是一场闹剧，不如说是通盘 AI 行业的一面照妖镜：

其一是折射出东谈主们对 AI 的深层气派，大批本事乐不雅派笃信 AI 终将无所不行，既牵记它发展得太快会失控，又短促它发展得不够快无法杀青冲破。

其二是自 GPT-4 问世以来，尽管 AI 范畴束缚有新家具清楚，却鲜有信得过的冲破性进展。

东谈主类既是 AI 的创造者，却又成了它最惊悸的不雅众。

每一个 AI 妄语的背后，都藏着通盘行业的惊悸与期待。

加之最近闹得沸沸扬扬的 Scaling Law 发展撞墙论，比较客岁的井喷期，本年的「创新疲倦」让东谈主们对模子的小步改进强硬失去耐烦。

在这个真理真理上，Grok-3 解说黎曼猜想的妄语也成了东谈主们对改日的一次集体假想。哪怕算作普通用户，咱们也越来越期待下一个从 GPT-3.5 到 GPT-4 的质变时刻。

虽然，信得过的 AI 冲破，往往发生在悉数东谈主都不看好的时代。

但咱们都但愿这个谜底能在年底前揭开九游娱乐(中国)官方网站-登录入口。

九游娱乐(中国)官方网站-登录入口将奖励 100 万好意思元的奖金-九游娱乐(中国)官方网站-登录入口

热点资讯

相关资讯