🔥 AI HOT – Everfadesの技术论坛

Grok 4.5 基于1.5T V9进入SpaceX/Tesla测试

马斯克说他们的Grok 4.5，基于他们的的 1.5T V9 基础模型并在补充训练中加入了 Cursor 数据现已在 SpaceX 和 Tesla 进入早前测试阶段早期评估显示性能接近 O…

X：小互 (@xiaohu) 模型发布/更新 4 小时前

马斯克宣布Grok 4.5基于1.5T V9基础模型，并在补充训练中加入Cursor数据，现已于SpaceX和Tesla进入私人测试。早期评估显示其性能接近甚至可能超过Opus。RL持续显著优化模型，Grok Build工具每日改进。此外，SpaceX今年将每月发布完全从零训练的新模型。

Grok 4.5 内测：性能接近或超越 Opus

I hope Elon is referring to opus 4.8. would be a welcome release if grok 4.5 outperforms opus 4.8 on…

X：Kim (@kimmonismus) 模型发布/更新 5 小时前

Grok 4.5 基于 1.5T V9 基础模型，补充训练加入 Cursor 数据，已在 SpaceX 和 Tesla 进行内测。早期评测显示性能接近甚至可能超过 Opus。RL 持续显著改进模型，Grok Build 工具链每日提升。Elon Musk 宣布今年 SpaceX 将每月发布完全从头训练的新模型。

Grok 4.5 进入 SpaceX 和 Tesla 私人测试

SPACEXAI 🔥： Grok 4.5 has entered a private beta at SpaceX &amp； Tesla and is expected to match Opus…

X：Testing Catalog (@testingcatalog) 模型发布/更新 5 小时前

Grok 4.5 基于 1.5T V9 基础模型，补充训练引入了 Cursor 数据，现已在 SpaceX 与 Tesla 进入私人测试阶段。早期评估显示其性能接近甚至超越 Opus。RL 持续显著提升模型能力，Grok Build 工具链每日改进。今年 SpaceX 将每月发布完全从头训练的新模型。

Grok 4.5 进入 SpaceX/Tesla 私有 beta

BREAKING： Elon Musk confirms Grok 4.5 is now in private beta at SpaceX and Tesla. • Early evals sho…

X：cb_doge (@cb_doge) 模型发布/更新 6 小时前

BREAKING： Elon Musk 确认 Grok 4.5 现已在 SpaceX 和 Tesla 进入私有 beta。 • 早期评估显示性能接近，甚至可能超过 Opus • 基于 xAI 的 1.5T V9 基础模型 • 训练中加入了 Cursor 数据 • Grok Build 工具每天都在改进 • 今年每月将发布从头训练的新模型 SpaceXAI 的节奏简直疯狂。

Grok 4.5 私测于 SpaceX 和 Tesla，性能接近 Opus

Grok 4.5， based on our 1.5T V9 foundation model， with Cursor data added in supplemental training， is…

X：Elon Musk (@elonmusk, xAI) 模型发布/更新 6 小时前

Grok 4.5，基于我们的1.5T V9基础模型，并在补充训练中加入Cursor数据，现已在SpaceX和Tesla进入私测。初步评估显示其性能接近，或许超越Opus。强化学习仍在持续显著改进模型，Grok Build工具链也在日益完善。所有参与者的出色工作！今年，@SpaceX 将每月发布完全从头训练的新模型。

新浪开源VibeThinker-3B：推理可压缩，事实知识不能

Sina's open model VibeThinker-3B aims to show reasoning compresses well but factual knowledge doesn't

The Decoder：AI News（RSS）模型发布/更新 9 小时前

新浪发布仅3B参数的VibeThinker-3B，在AIME26等数学编程基准上持平DeepSeek V3.2等大200-333倍的模型，LiveCodeBench超越所有20B以下模型，LeetCode竞赛解决123/128题超过GPT-5.2、Kimi K2.5等。但知识密集型GPQA-Diamond大幅落后。模型基于阿里Qwen2.5-Coder-3B，经SFT、强化学习、自蒸馏等多阶段后训练。研究提出"参数压缩-覆盖假说"：逻辑推理依赖少数可压缩模式，而广泛世界知识仍需大参数。模型已开源。

Liquid AI 发布 LFM2.5-230M 开源文本模型，支持 llama.cpp、MLX、vLLM、SGLang 和 ONNX 设备端推理

Liquid AI Ships LFM2.5-230M with llama.cpp， MLX， vLLM， SGLang， and ONNX Support for On-Device Inference

MarkTechPost（RSS）模型发布/更新 12 小时前

Liquid AI 推出 LFM2.5-230M，230M 参数开源文本模型，基于 LFM2 架构，开放权重。支持 llama.cpp、MLX、vLLM、SGLang、ONNX 推理，内存占用 293-375 MB。Galaxy S25 Ultra 上达 213 tok/s，Raspberry Pi 5 上 42 tok/s。IFEval 指令跟随得分 71.71，领先 Qwen3.5-0.8B（59.94）和 Gemma 3 1B IT（63.49）；CaseReportBench 临床数据提取得分 22.51。上下文窗口 32768 tokens，预训练于 19 万亿 tokens。专为数据提取和工具调用设计，不适用于数学推理、代码生成或创意写作。

360与Sakana AI发布对标Mythos的AI安全工具和模型

亚洲人工智能初创企业推出类似Mythos的模型

Hacker News 热门（buzzing.cc 中文翻译）模型发布/更新 17 小时前

中国网络安全公司360推出Tulongfeng和Yitianzhen两款AI安全工具，分别用于自动发现软件漏洞和自动化网络防御与事件响应，称可对标Anthropic的Mythos。日本AI初创Sakana AI推出前沿模型Fugu，声称与Anthropic的Fable 5和Mythos Preview水平相当，专为智能体设计，能通过API协调其他模型。两款产品发布于美国政府对Anthropic的Mythos和Fable 5实施出口禁令两周后，旨在为亚洲市场提供不受出口管制限制的替代方案。Sakana称Fugu采用自研"编排模型"路线，可集合多模型智能，降低对单一供应商的依赖。

Fable 5 订阅至 6 月 22 日，下周揭晓方案

Small reminder， friends： Fable 5 was technically only included in the subscription tier until June 2…

X：Kim (@kimmonismus) 模型发布/更新 18 小时前

朋友们，一个小提醒：从技术上讲，Fable 5 仅包含在订阅层中，直到 6 月 22 日。下周，我们就会知道他们为此想出了什么解决方案。