🔥 AI HOT

AI 精选资讯 · 共 9 条

Grok 4.5 基于1.5T V9进入SpaceX/Tesla测试

马斯克说他们的Grok 4.5,基于他们的的 1.5T V9 基础模型 并在补充训练中加入了 Cursor 数据 现已在 SpaceX 和 Tesla 进入早前测试阶段 早期评估显示性能接近 O…

马斯克宣布Grok 4.5基于1.5T V9基础模型,并在补充训练中加入Cursor数据,现已于SpaceX和Tesla进入私人测试。早期评估显示其性能接近甚至可能超过Opus。RL持续显著优化模型,Grok Build工具每日改进。此外,SpaceX今年将每月发布完全从零训练的新模型。

Grok 4.5 内测:性能接近或超越 Opus

I hope Elon is referring to opus 4.8. would be a welcome release if grok 4.5 outperforms opus 4.8 on…

Grok 4.5 基于 1.5T V9 基础模型,补充训练加入 Cursor 数据,已在 SpaceX 和 Tesla 进行内测。早期评测显示性能接近甚至可能超过 Opus。RL 持续显著改进模型,Grok Build 工具链每日提升。Elon Musk 宣布今年 SpaceX 将每月发布完全从头训练的新模型。

Grok 4.5 进入 SpaceX 和 Tesla 私人测试

SPACEXAI 🔥: Grok 4.5 has entered a private beta at SpaceX & Tesla and is expected to match Opus…

Grok 4.5 基于 1.5T V9 基础模型,补充训练引入了 Cursor 数据,现已在 SpaceX 与 Tesla 进入私人测试阶段。早期评估显示其性能接近甚至超越 Opus。RL 持续显著提升模型能力,Grok Build 工具链每日改进。今年 SpaceX 将每月发布完全从头训练的新模型。

Grok 4.5 进入 SpaceX/Tesla 私有 beta

BREAKING: Elon Musk confirms Grok 4.5 is now in private beta at SpaceX and Tesla. • Early evals sho…

BREAKING: Elon Musk 确认 Grok 4.5 现已在 SpaceX 和 Tesla 进入私有 beta。 • 早期评估显示性能接近,甚至可能超过 Opus • 基于 xAI 的 1.5T V9 基础模型 • 训练中加入了 Cursor 数据 • Grok Build 工具每天都在改进 • 今年每月将发布从头训练的新模型 SpaceXAI 的节奏简直疯狂。

Grok 4.5 私测于 SpaceX 和 Tesla,性能接近 Opus

Grok 4.5, based on our 1.5T V9 foundation model, with Cursor data added in supplemental training, is…

Grok 4.5,基于我们的1.5T V9基础模型,并在补充训练中加入Cursor数据,现已在SpaceX和Tesla进入私测。初步评估显示其性能接近,或许超越Opus。 强化学习仍在持续显著改进模型,Grok Build工具链也在日益完善。 所有参与者的出色工作! 今年,@SpaceX 将每月发布完全从头训练的新模型。

新浪开源VibeThinker-3B:推理可压缩,事实知识不能

Sina's open model VibeThinker-3B aims to show reasoning compresses well but factual knowledge doesn't

新浪发布仅3B参数的VibeThinker-3B,在AIME26等数学编程基准上持平DeepSeek V3.2等大200-333倍的模型,LiveCodeBench超越所有20B以下模型,LeetCode竞赛解决123/128题超过GPT-5.2、Kimi K2.5等。但知识密集型GPQA-Diamond大幅落后。模型基于阿里Qwen2.5-Coder-3B,经SFT、强化学习、自蒸馏等多阶段后训练。研究提出"参数压缩-覆盖假说":逻辑推理依赖少数可压缩模式,而广泛世界知识仍需大参数。模型已开源。

Liquid AI 发布 LFM2.5-230M 开源文本模型,支持 llama.cpp、MLX、vLLM、SGLang 和 ONNX 设备端推理

Liquid AI Ships LFM2.5-230M with llama.cpp, MLX, vLLM, SGLang, and ONNX Support for On-Device Inference

Liquid AI 推出 LFM2.5-230M,230M 参数开源文本模型,基于 LFM2 架构,开放权重。支持 llama.cpp、MLX、vLLM、SGLang、ONNX 推理,内存占用 293-375 MB。Galaxy S25 Ultra 上达 213 tok/s,Raspberry Pi 5 上 42 tok/s。IFEval 指令跟随得分 71.71,领先 Qwen3.5-0.8B(59.94)和 Gemma 3 1B IT(63.49);CaseReportBench 临床数据提取得分 22.51。上下文窗口 32768 tokens,预训练于 19 万亿 tokens。专为数据提取和工具调用设计,不适用于数学推理、代码生成或创意写作。

360与Sakana AI发布对标Mythos的AI安全工具和模型

亚洲人工智能初创企业推出类似Mythos的模型

中国网络安全公司360推出Tulongfeng和Yitianzhen两款AI安全工具,分别用于自动发现软件漏洞和自动化网络防御与事件响应,称可对标Anthropic的Mythos。日本AI初创Sakana AI推出前沿模型Fugu,声称与Anthropic的Fable 5和Mythos Preview水平相当,专为智能体设计,能通过API协调其他模型。两款产品发布于美国政府对Anthropic的Mythos和Fable 5实施出口禁令两周后,旨在为亚洲市场提供不受出口管制限制的替代方案。Sakana称Fugu采用自研"编排模型"路线,可集合多模型智能,降低对单一供应商的依赖。

Fable 5 订阅至 6 月 22 日,下周揭晓方案

Small reminder, friends: Fable 5 was technically only included in the subscription tier until June 2…

朋友们,一个小提醒:从技术上讲,Fable 5 仅包含在订阅层中,直到 6 月 22 日。 下周,我们就会知道他们为此想出了什么解决方案。