
La 人工智能 再次成为人们关注的焦点 Grok 4 发布公告,这是 xAI 开发的聊天机器人的最新演进版本,该公司由 伊隆麝香在抵达后不到半年的时间里 格洛克3,该公司已向前迈进了一步,有望成为人工智能 业内最强大、最快速、最先进的在与 OpenAI, Google 而Anthropic也变得越来越凶猛。
数百万人观看的现场演讲,以及马斯克充满期待的言论,让科技生态系统感到疑惑 这一进展究竟意味着什么 对于生成式人工智能市场来说,无论是在技术层面还是在我们与这些工具的交互方式上。
新功能和两个版本:Grok 4 和 Grok 4 Heavy

Grok 4 的飞跃不仅限于响应速度或文本理解。 xAI 选择为其新模型配备实时推理和多模态分析的高级功能。 (它能够理解文本和图像)以及针对复杂任务优化的架构。所有这一切都归功于 xAI 位于孟菲斯的超级计算机 Colossus,它是提升训练能力和改善结果的关键。
最新颖的事情之一是 两种变体:Grok 4 Standard 和 Grok 4 Heavy。Heavy 版本引入了多智能体模型,其中不同的智能体可以同时处理同一个问题,并且 比较答案以选择最合适的解决方案。此版本主要针对专业用户和公司,可以提前体验独家改进和功能,尽管 价格明显更高,每月约300美元。
但是,这两个版本都可以以聊天机器人格式和通过 API 使用,这有助于它们集成到第三方应用程序和项目中。 编程 高级。对于那些正在寻找软件开发专用工具的人来说,xAI 已经推出了 Grok 4 代码,一种旨在高效编写、调试和优化代码的变体。
直面巨人:Grok 4 及其基准

为了衡量 Grok 4 与 GPT-4.5(OpenAI)、Claude 4(Anthropic)或 Gemini 1.5(谷歌)等竞争对手相比的改进,xAI 使用了 独立测试和学术基准在“人类期末考试”中,马斯克的人工智能成功解答了约 25% 的题目,这一数字高于许多竞争对手,并且在 MMLU-Pro、GPQA Diamond 或 LiveCodeBench 等测试中, 它的成功率高达 88%,优于竞争模型。 在某些情况下。
正如预期的那样,Heavy 版本表现最佳,尤其是在高级数学、逻辑和编程测试中。然而,专家们指出 应谨慎分析这些数字 直到在现实世界中进行大规模验证,而不仅仅是在 API 或实验室级别。
Grok 4 还因其 通过社交网络实时获取信息 X与仅适用于经过训练的静态数据的模型不同,您可以将当前事件纳入您的响应中,从而更轻松地验证、分析趋势或即时查询新闻。
争议与调整:人工智能适度化的挑战

Grok 4 的发布并非没有争议。在正式发布前几天,一些针对该型号先前版本的回应 被归类为反犹太主义或攻击性,引起了科技界和 X 用户自身的反应。xAI 被迫过滤并删除不适当的内容,并表示 该系统已重新训练以降低这些风险 并提高响应的安全性。
埃隆·马斯克本人也承认,为了消除偏见和防止操纵,他进行了一些临时更新,导致模型“过于自满”。在经历了这些挫折之后,这个想法 在精确性、创造力和责任感之间找到平衡整个行业仍在密切关注这一问题 生成式人工智能.
除了争议之外,监管环境和政府压力也影响了 Grok 4 的发展。这场开发热潮的投资并不小:据估计,xAI 每月花费约1.000亿美元 在其运营中,这表明人工智能领导地位的竞争有多么激烈。
价格、准入和市场第一印象
Grok 4 现已面向 SuperGrok 或 SuperGrok Heavy 订阅用户推出,年费分别为 255 欧元和最高 2.556,99 欧元,不过 标准版有更实惠的套餐(约 30 美元/月)X Premium+ 用户也可以免费使用,这是一项战略举措,旨在从仅提供演示或试用期的竞争对手手中夺取市场份额。
第一印象表明 Grok 4 正在成为一款强大的工具 对于那些寻求写作、分析或编程任务的高级帮助的人来说,尽管它在专业或学术环境之外的日常使用中的表现还有待观察。
对字节世界和一般技术充满热情的作家。我喜欢通过写作分享我的知识,这就是我在这个博客中要做的,向您展示有关小工具、软件、硬件、技术趋势等的所有最有趣的事情。我的目标是帮助您以简单而有趣的方式畅游数字世界。