Grok 4:这是 xAI 的新 AI,挑战 OpenAI 和 Google

最后更新: 11/07/2025
作者: 艾萨克
  • Grok 4 正式发布, IA 来自 xAI,推理和速度都有所改进
  • 它直接与 GPT-4.5 竞争, 双子座 1.5 和 Claude 4,超越关键基准
  • 提供两个版本:Grok 4 标准版和 Grok 4 Heavy,后者需付费订阅
  • 最近的争议促使过滤攻击性回应的模型发生了改变。

Grok 4人工智能xAI模型

La 人工智能 再次成为人们关注的焦点 Grok 4 发布公告,这是 xAI 开发的聊天机器人的最新演进版本,该公司由 伊隆麝香在抵达后不到半年的时间里 格洛克3,该公司已向前迈进了一步,有望成为人工智能 业内最强大、最快速、最先进的在与 OpenAI, Google 而Anthropic也变得越来越凶猛。

数百万人观看的现场演讲,以及马斯克充满期待的言论,让科技生态系统感到疑惑 这一进展究竟意味着什么 对于生成式人工智能市场来说,无论是在技术层面还是在我们与这些工具的交互方式上。

新功能和两个版本:Grok 4 和 Grok 4 Heavy

Grok 4 重型和 Grok 4 标准型号

Grok 4 的飞跃不仅限于响应速度或文本理解。 xAI 选择为其新模型配备实时推理和多模态分析的高级功能。 (它能够理解文本和图像)以及针对复杂任务优化的架构。所有这一切都归功于 xAI 位于孟菲斯的超级计算机 Colossus,它是提升训练能力和改善结果的关键。

最新颖的事情之一是 两种变体:Grok 4 Standard 和 Grok 4 Heavy。Heavy 版本引入了多智能体模型,其中不同的智能体可以同时处理同一个问题,并且 比较答案以选择最合适的解决方案。此版本主要针对专业用户和公司,可以提前体验独家改进和功能,尽管 价格明显更高,每月约300美元。

  使用 scikit-learn、TensorFlow 和 PyTorch 的简单 Python AI 示例

但是,这两个版本都可以以聊天机器人格式和通过 API 使用,这有助于它们集成到第三方应用程序和项目中。 编程 高级。对于那些正在寻找软件开发专用工具的人来说,xAI 已经推出了 Grok 4 代码,一种旨在高效编写、调试和优化代码的变体。

直面巨人:Grok 4 及其基准

Grok 4 结果与其他 AI 模型的比较

为了衡量 Grok 4 与 GPT-4.5(OpenAI)、Claude 4(Anthropic)或 Gemini 1.5(谷歌)等竞争对手相比的改进,xAI 使用了 独立测试和学术基准在“人类期末考试”中,马斯克的人工智能成功解答了约 25% 的题目,这一数字高于许多竞争对手,并且在 MMLU-Pro、GPQA Diamond 或 LiveCodeBench 等测试中, 它的成功率高达 88%,优于竞争模型。 在某些情况下。

正如预期的那样,Heavy 版本表现最佳,尤其是在高级数学、逻辑和编程测试中。然而,专家们指出 应谨慎分析这些数字 直到在现实世界中进行大规模验证,而不仅仅是在 API 或实验室级别。

Grok 4 还因其 通过社交网络实时获取信息 X与仅适用于经过训练的静态数据的模型不同,您可以将当前事件纳入您的响应中,从而更轻松地验证、分析趋势或即时查询新闻。

争议与调整:人工智能适度化的挑战

Grok 4 的争议和措施

Grok 4 的发布并非没有争议。在正式发布前几天,一些针对该型号先前版本的回应 被归类为反犹太主义或攻击性,引起了科技界和 X 用户自身的反应。xAI 被迫过滤并删除不适当的内容,并表示 该系统已重新训练以降低这些风险 并提高响应的安全性。

  DeepSeek:搜索模式与深度思考(R1)

埃隆·马斯克本人也承认,为了消除偏见和防止操纵,他进行了一些临时更新,导致模型“过于自满”。在经历了这些挫折之后,这个想法 在精确性、创造力和责任感之间找到平衡整个行业仍在密切关注这一问题 生成式人工智能.

除了争议之外,监管环境和政府压力也影响了 Grok 4 的发展。这场开发热潮的投资并不小:据估计,xAI 每月花费约1.000亿美元 在其运营中,这表明人工智能领导地位的竞争有多么激烈。

价格、准入和市场第一印象

Grok 4 现已面向 SuperGrok 或 SuperGrok Heavy 订阅用户推出,年费分别为 255 欧元和最高 2.556,99 欧元,不过 标准版有更实惠的套餐(约 30 美元/月)X Premium+ 用户也可以免费使用,这是一项战略举措,旨在从仅提供演示或试用期的竞争对手手中夺取市场份额。

第一印象表明 Grok 4 正在成为一款强大的工具 对于那些寻求写作、分析或编程任务的高级帮助的人来说,尽管它在专业或学术环境之外的日常使用中的表现还有待观察。

格罗克ia-0
相关文章:
Grok AI:您需要了解的有关埃隆·马斯克人工智能的一切