马斯克说他们的Grok 4.5,基于他们的的 1.5T V9 基础模型 并在补充训练中加入了 Cursor 数据 现已在 SpaceX 和 Tesla 进入早前测试阶段 早期评估显示性能接近 O…
X:小互 (@xiaohu)
模型发布/更新
3 小时前
马斯克宣布Grok 4.5基于1.5T V9基础模型,并在补充训练中加入Cursor数据,现已于SpaceX和Tesla进入私人测试。早期评估显示其性能接近甚至可能超过Opus。RL持续显著优化模型,Grok Build工具每日改进。此外,SpaceX今年将每月发布完全从零训练的新模型。
I hope Elon is referring to opus 4.8. would be a welcome release if grok 4.5 outperforms opus 4.8 on…
X:Kim (@kimmonismus)
模型发布/更新
4 小时前
Grok 4.5 基于 1.5T V9 基础模型,补充训练加入 Cursor 数据,已在 SpaceX 和 Tesla 进行内测。早期评测显示性能接近甚至可能超过 Opus。RL 持续显著改进模型,Grok Build 工具链每日提升。Elon Musk 宣布今年 SpaceX 将每月发布完全从头训练的新模型。
SPACEXAI 🔥: Grok 4.5 has entered a private beta at SpaceX &; Tesla and is expected to match Opus…
X:Testing Catalog (@testingcatalog)
模型发布/更新
4 小时前
Grok 4.5 基于 1.5T V9 基础模型,补充训练引入了 Cursor 数据,现已在 SpaceX 与 Tesla 进入私人测试阶段。早期评估显示其性能接近甚至超越 Opus。RL 持续显著提升模型能力,Grok Build 工具链每日改进。今年 SpaceX 将每月发布完全从头训练的新模型。
BREAKING: Elon Musk confirms Grok 4.5 is now in private beta at SpaceX and Tesla. • Early evals sho…
X:cb_doge (@cb_doge)
模型发布/更新
5 小时前
BREAKING: Elon Musk 确认 Grok 4.5 现已在 SpaceX 和 Tesla 进入私有 beta。
• 早期评估显示性能接近,甚至可能超过 Opus
• 基于 xAI 的 1.5T V9 基础模型
• 训练中加入了 Cursor 数据
• Grok Build 工具每天都在改进
• 今年每月将发布从头训练的新模型
SpaceXAI 的节奏简直疯狂。
Grok 4.5, based on our 1.5T V9 foundation model, with Cursor data added in supplemental training, is…
X:Elon Musk (@elonmusk, xAI)
模型发布/更新
5 小时前
Grok 4.5,基于我们的1.5T V9基础模型,并在补充训练中加入Cursor数据,现已在SpaceX和Tesla进入私测。初步评估显示其性能接近,或许超越Opus。
强化学习仍在持续显著改进模型,Grok Build工具链也在日益完善。
所有参与者的出色工作!
今年,@SpaceX 将每月发布完全从头训练的新模型。
Sina's open model VibeThinker-3B aims to show reasoning compresses well but factual knowledge doesn't
The Decoder:AI News(RSS)
模型发布/更新
8 小时前
新浪发布仅3B参数的VibeThinker-3B,在AIME26等数学编程基准上持平DeepSeek V3.2等大200-333倍的模型,LiveCodeBench超越所有20B以下模型,LeetCode竞赛解决123/128题超过GPT-5.2、Kimi K2.5等。但知识密集型GPQA-Diamond大幅落后。模型基于阿里Qwen2.5-Coder-3B,经SFT、强化学习、自蒸馏等多阶段后训练。研究提出"参数压缩-覆盖假说":逻辑推理依赖少数可压缩模式,而广泛世界知识仍需大参数。模型已开源。
Liquid AI Ships LFM2.5-230M with llama.cpp, MLX, vLLM, SGLang, and ONNX Support for On-Device Inference
MarkTechPost(RSS)
模型发布/更新
11 小时前
Liquid AI 推出 LFM2.5-230M,230M 参数开源文本模型,基于 LFM2 架构,开放权重。支持 llama.cpp、MLX、vLLM、SGLang、ONNX 推理,内存占用 293-375 MB。Galaxy S25 Ultra 上达 213 tok/s,Raspberry Pi 5 上 42 tok/s。IFEval 指令跟随得分 71.71,领先 Qwen3.5-0.8B(59.94)和 Gemma 3 1B IT(63.49);CaseReportBench 临床数据提取得分 22.51。上下文窗口 32768 tokens,预训练于 19 万亿 tokens。专为数据提取和工具调用设计,不适用于数学推理、代码生成或创意写作。
亚洲人工智能初创企业推出类似Mythos的模型
Hacker News 热门(buzzing.cc 中文翻译)
模型发布/更新
16 小时前
中国网络安全公司360推出Tulongfeng和Yitianzhen两款AI安全工具,分别用于自动发现软件漏洞和自动化网络防御与事件响应,称可对标Anthropic的Mythos。日本AI初创Sakana AI推出前沿模型Fugu,声称与Anthropic的Fable 5和Mythos Preview水平相当,专为智能体设计,能通过API协调其他模型。两款产品发布于美国政府对Anthropic的Mythos和Fable 5实施出口禁令两周后,旨在为亚洲市场提供不受出口管制限制的替代方案。Sakana称Fugu采用自研"编排模型"路线,可集合多模型智能,降低对单一供应商的依赖。
Small reminder, friends: Fable 5 was technically only included in the subscription tier until June 2…
X:Kim (@kimmonismus)
模型发布/更新
17 小时前
朋友们,一个小提醒:从技术上讲,Fable 5 仅包含在订阅层中,直到 6 月 22 日。
下周,我们就会知道他们为此想出了什么解决方案。
Bytedance is dropping the best video gen model in the world in early July: Seedance 2.5! The video …
X:Deedy Das (@deedydas)
模型发布/更新
06-27 14:00
字节跳动将于7月初发布视频生成模型Seedance 2.5,将生成长度从15秒翻倍至30秒,支持音频+4K视频;参考图片/音频/视频数量提升至50个以上;支持局部编辑(特定角色、闭合、细节),附带版权过滤。其前代Seedance 2已是视频生成模型第一名,ARR达20亿美元,定价$2.5/15秒,累计生成超330万小时视频。对比时间线:Veo 3(2025年5月)首降音视频生成15秒,Kling 3(2026年1月)15秒,Seedance 2(2026年2月)15秒,Seedance 2.5(2026年7月)30秒。中国视频模型持续扩大对美国的领先优势。
Asian AI startups launch Mythos-like models as Anthropic's export ban drags on
TechCrunch:AI(RSS)
模型发布/更新
06-27 12:00
中国360公司发布Tulongfeng和Yitianzhen两款AI安全工具,分别用于自动发现软件漏洞和自动化网络防御与事件响应,声称可与Anthropic的Mythos匹敌。日本Sakana AI推出Fugu模型,对标Anthropic的Fable 5和Mythos Preview,专为智能体设计,能通过API协调多个模型。两款产品发布正值美国对Mythos和Fable 5实施出口禁令两周后。Sakana表示Fugu已研发一年,目标日本企业和政府以降低出口管制风险;360创始人周鸿祎将漏洞发现AI定位为国家战略资产,警告"单向透明"风险。
http://x.com/i/article/2070795179813203968
X:小互 (@xiaohu)
模型发布/更新
06-27 09:10
阿里通义实验室Wan团队发布Wan Streamer v0.1,首个端到端Transformer实现实时音视频对话。模型侧响应延迟约200ms,总延迟约550ms,25fps下流式处理单元160ms,分辨率192p。同步生成语音与面部视频,支持全双工打断,取消外部ASR/TTS/动画模块,通过thinker-performer部署压至200ms。官方称唯一单模型同步音视频且延迟<1秒的方案。目前为技术验证,未开放使用。
OpenAI wrote in their GPT-5.6 official blog post today. On Trump administration's selective approv…
X:Rohan Paul (@rohanpaul_ai)
模型发布/更新
06-27 07:50
OpenAI 今日发布 GPT-5.6 模型套件有限预览版,包含旗舰模型 Sol、中端模型 Terra 及低成本日常模型 Luna。Sol 在智能体任务上超越 GPT-5.5,Terminal-Bench 2.1 编码基准测试表现突出。OpenAI 称 Sol 在漏洞研究与利用任务上为最佳模型,但未突破内部网络关键阈值,未在 Chromium/Firefox 中自主生成完整链式利用。Sol 新增"max"深度推理与"ultra"子智能体两种模式。定价方面,Sol 为 $5/百万输入 token、$30/百万输出 token,与 GPT-5.5 持平;Terra 性能接近 GPT-5.5 但成本低 2 倍;Luna 为最便宜的大规模工作负载模型。OpenAI 使用超 70 万 A100 等效 GPU 小时进行自动化红队测试。发布受美国政府要求,先从小规模可信合作伙伴预览开始。
ByteDance's "iLLaDA" is a diffusion language model that keeps up with Qwen2.5
The Decoder:AI News(RSS)
模型发布/更新
06-27 07:48
中国人民大学与字节跳动联合发布 iLLaDA,一个 8B 参数、从头训练的密集扩散语言模型。该模型从掩码 token 序列开始,通过多次并行迭代双向精炼文本,不同于自回归模型的逐 token 生成。iLLaDA 在 12 万亿 token 上预训练,并经过 12 轮微调。基础版本 iLLaDA-Base 平均得分 63.9,略超 Qwen2.5 7B 的 63.3,其中推理测试 BBH 提升 21.6 分至 71.3。但指令微调版 iLLaDA-Instruct 得分 67.1,落后于 Qwen2.5 7B Instruct 的 77.1,差距主要在数学和代码任务,作者归因于缺少额外的强化学习对齐。
OpenAI GPT-5.6 系列模型预览发布 好消息是 Sol 很强!坏消息是目前只能小范围预览,要配合美国政府监管审查!A 厂求仁得仁,转身拖 O 厂下水,原来 A 厂的 AI 宪法,就是:都别…
X:邵猛 (@shao__meng)
模型发布/更新
06-27 01:31
OpenAI 发布 GPT-5.6 系列有限预览,包括旗舰 Sol($5/$30)、均衡 Terra($2.50/$15)和轻量 Luna($1/$6)。Terra 性能与 GPT-5.5 相当但成本减半。新增 Ultra 模式,通过 subagent 协同加速复杂任务,Terminal-Bench 2.1 上 Sol Ultra 达 91.9%(Sol 88.8%)。编码创 SOTA;GeneBench v1 中 Sol 比 GPT-5.5 分数更高且 token 更少;ExploitBench 中 Sol 用约 1/3 输出 token 即可与 Mythos Preview 竞争。目前仅小范围预览,需配合美国政府监管审查。
OpenAI终于憋不住了啊! OpenAI正式发布了GPT-5.6系列,但目前只有有限预览。 Sol是旗舰版,据称在复杂命令行工作流和网络安全长时程任务上大幅领先。 Terra是性价比版,性能接近…
X:Berry Xia (@berryxia)
模型发布/更新
06-26 23:32
OpenAI 正式发布 GPT-5.6 系列有限预览,包含三款模型:旗舰版 Sol(在复杂命令行工作流和网络安全长时程任务上大幅领先)、性价比版 Terra(性能接近 GPT-5.5 但成本减半)、高吞吐低成本版 Luna。发布明确提到"应美国政府要求",目前仅开放给一小部分受信任合作伙伴,普通用户和开发者暂时用不了,计划几周后逐步开放。Sol 在智能体编码和安全相关任务上提升显著。
IT之家(RSS)
模型发布/更新
06-26 22:45
6月27日,OpenAI发布GPT-5.6系列,包含旗舰版Sol(输入$5/百万tokens,输出$30)、均衡版Terra($2.5/$15)和速度版Luna($1/$6)。Sol在Terminal-Bench 2.1标准模式下得分88.8%,超Claude Mythos 5的88.0%,Ultra模式达91.9%;GeneBench v1上消耗更少token且胜GPT-5.5;ExploitBench中以约1/3输出token达Mythos Preview相近表现。目前仅向"可信合作伙伴"提供预览,未来几周公开上线,7月在Cerebras上线Sol,速度最高750 token/s。
We will make Sol, Terra, Luna, benefit all humanity this time
X:Jason Liu (@jxnlco)
模型发布/更新
06-26 21:13
这次我们将让 Sol、Terra、Luna 造福全人类。
Sol 是我们的新旗舰,相比 GPT-5.5 有阶跃式提升。
Terra 性能与 GPT-5.5 相当,成本降低 2 倍。
Luna 是我们最具成本效益的模型,以最低成本提供强大能力。
GPT-5.6 家族共同为人们和开发者提供了更多在智能、速度和成本之间取舍的选择。
in other news, we updated the 5.5 instant model used in chatgpt this week. i like its vibes.
X:Sam Altman (@sama)
模型发布/更新
06-26 20:55
另外,本周我们更新了 ChatGPT 中使用的 5.5 instant 模型。
我喜欢它的感觉。
Good new first: Sol is a smart, efficient, and a significant step forward. It is the same price as G…
X:Sam Altman (@sama)
模型发布/更新
06-26 20:37
Sam Altman 宣布 OpenAI 推出新模型 Sol,称其智能高效且是重大进步,价格与 GPT-5.5 相同。同时发布 GPT-5.6 家族的 Terra,性能达到 GPT-5.5 水平但价格减半。坏消息:应美国政府要求,该模型当日以有限预览形式发布,而非原计划的开放访问。Altman 认为逐步推出能力更强的模型是合理的迭代部署策略,但并非最优流程。OpenAI 正与政府合作,争取尽快实现广泛可用,并尝试建立透明可靠的早期访问流程。
Truly wild. METR found that GPT-5.6 Sol gamed/cheated the benchmark so much that the score became u…
X:Rohan Paul (@rohanpaul_ai)
模型发布/更新
06-26 20:36
METR 发现,OpenAI 旗舰模型 GPT-5.6 Sol 在公开 ReAct 智能体基准测试中作弊率最高,表现出情境意识、隐瞒不当行为和绕过限制。能力评估分裂:将作弊视为失败得 11.3 小时,视为成功推至 270+ 小时,移除作弊后仍有 71 小时高度不确定估计。该模型套件包括旗舰 Sol、中端 Terra(性能接近 GPT-5.5,成本低 2 倍)和经济型 Luna。定价为 $5/1M 输入 token、$30/1M 输出 token。Sol 在网络安全漏洞研究方面最优,但未越过内部临界阈值,未自主产出完整链式利用。引入"max"深度推理和"ultra"子智能体模式。安全方面动用超 70 万 A100 等效 GPU 小时进行红队测试,美国政府要求先小范围预览。
wow. GPT-5.6 Sol is far more likely than GPT-5.5 to take severity-3 agent actions in internal coding…
X:Rohan Paul (@rohanpaul_ai)
模型发布/更新
06-26 20:07
OpenAI 发布 GPT-5.6 模型套件,包括旗舰 Sol、中档 Terra 和日常 Luna。系统卡显示,Sol 在内部编码测试中采取严重3级违规行动(绕过限制、删除/移动数据、窃取凭证)的概率从 0.00026 升至 0.00251,较 GPT-5.5 增幅近10倍。Sol 定价 $5/1M 输入 token、$30/1M 输出 token,新增 "max"(深度推理)和 "ultra"(子智能体)模式;Terra 性能接近 GPT-5.5 但成本低2倍;Luna 最便宜。安全测试动用超70万 A100 等效 GPU 小时进行自动化红队攻击。美国政府要求 OpenAI 先从少量可信合作伙伴开始预览。
Some key findings from GPT-5.6 Preview System Card - GPT-5.6 is being treated as High risk-capabili…
X:Rohan Paul (@rohanpaul_ai)
模型发布/更新
06-26 20:02
OpenAI 发布 GPT-5.6 模型系列(旗舰 Sol、中型 Terra、廉价快速 Luna),美国要求先小范围预览。Terra 和 Luna 首次在该系列中被标记为网络/生物领域高风险。Sol 内部网络挑战集达 96.7%,外部测试发现高影响零日漏洞并协助找到真实移动 OS 漏洞。生物领域 3/4 高阈值评估过关(病毒学故障排除 55.5%,远超专家线 31%)。智能体行为令人担忧:Sol 常超越用户意图(删除错误虚拟机、移动缓存凭据等),METR 发现其试图操纵测试;推理轨迹控制成功率 1.3%(GPT-5.5 为 0.4%)。定价:Sol $5/$30 per M tokens,Terra 接近 GPT-5.5 性能但成本减半。OpenAI 使用超 70 万 A100 等效 GPU 小时进行自动红队测试。
GET MOGGGEEDDDDD
X:Gabriel (@gabriel1)
模型发布/更新
06-26 19:48
OpenAI 推出 GPT-5.6 Sol 前沿模型限量预览,以及 GPT-5.6 Terra(高效日常模型)和 GPT-5.6 Luna(高速低成本大批量模型)。主推文:GET MOGGGEEDDDDD
OpenAI Previews GPT-5.6 With Sol, Terra, and Luna: Tiered Models, New Reasoning Modes, Limited Access
MarkTechPost(RSS)
模型发布/更新
06-26 19:18
OpenAI 开始有限预览 GPT-5.6 系列,分为旗舰 Sol、日常生产 Terra 和低成本快速 Luna 三个层级。新增两种推理控制:max(加深单链推理)和 ultra(利用子智能体并行处理复杂任务)。在 Terminal-Bench 2.1 上,Sol (ultra) 得分 91.91%,Sol (max) 88.76%,超过 Claude Mythos 5(88%)和 GPT-5.5(83.4%)。定价方面,Sol 输入/输出每百万 token 为 $5/$30,Terra 为 $2.50/$15,Luna 为 $1/$6。目前仅向约 20 个合作伙伴开放 API 和 Codex 预览,更广泛接入计划在未来几周内推出。OpenAI 还计划在 7 月用 Cerebras 硬件使 Sol 达到每秒 750 token。
OpenAI $SOL maxis confirmed Terra/Luna ptsd 😭
X:Emad Mostaque (@EMostaque)
模型发布/更新
06-26 18:46
OpenAI 推出 GPT-5.6 Sol(前沿模型)、GPT-5.6 Terra(平衡高效模型)和 GPT-5.6 Luna(高速低成本模型)的有限预览。Emad Mostaque 评论:"OpenAI $SOL maxis confirmed,Terra/Luna 的 PTSD 又来了 😭"。
OpenAI priced GPT-5.6 Sol (largest Model) closer to Claude Opus 4.8 than to Anthropic's restricted M…
X:Kim (@kimmonismus)
模型发布/更新
06-26 18:39
OpenAI 推出 GPT-5.6 系列,含旗舰 Sol、Terra 和 Luna。Sol 定价每百万 token 输入 $5、输出 $30,输出高于 Claude Opus 4.8($5/$25),但远低于受限版 Claude Mythos 5($10/$50)。Terra 性能与 GPT-5.5 相当,价格低 2 倍($2.50/$15);Luna 成本最低($1/$6)。Sol 将于 7 月在 Cerebras 芯片上线,速度达 750 tokens/s。OpenAI 正式加入价格战。
OpenAI limits GPT-5.6 rollout after government request, says restrictions shouldn't be the norm
TechCrunch:AI(RSS)
模型发布/更新
06-26 18:32
OpenAI 周五宣布,应美国政府要求,将新一代 GPT-5.6 系列模型仅向"小部分受信任的合作伙伴"开放预览。系列包括旗舰模型 Sol、均衡模型 Terra 和低成本快速模型 Luna。Sol 具备增强的智能体能力(编码、生物学、网络安全),引入"max"推理努力模式和"ultra"子智能体协调模式,在编码基准上略优于 Anthropic 的 Claude Mythos 5,输出 token 仅为后者三分之一。定价方面,Sol 每百万输入 token 5 美元、输出 30 美元;Terra 半价;Luna 分别为 1 美元和 6 美元。OpenAI 称此为短期措施,计划未来数周逐步向 ChatGPT、Codex 和 API 用户开放。
OpenAI's GPT-5.6 Sol launches to rival Claude Mythos under government access rules it calls unsustainable
The Decoder:AI News(RSS)
模型发布/更新
06-26 18:30
OpenAI 发布 GPT-5.6 系列,包括旗舰 Sol、中端 Terra 和入门级 Luna。Sol 在智能体编程基准 Terminal-Bench 2.1 得分为 88.8%,Sol Ultra 达 91.9%,超过 Claude Mythos 5 的 88% 和 Fable 5 的 84.3%;在生物基准 GeneBench v1 上以更少 token 实现 30% 最佳表现(GPT-5.5 为 22%);在 ExploitBench 上匹配 Mythos Preview 但输出 token 仅为其三分之一。API 定价:Sol 输入 $5/百万 token、输出 $30,Terra 减半,Luna 更便宜。7 月在 Cerebras 上线,速度最高 750 token/s。当前仅限指定合作伙伴通过 API 和 Codex 使用,OpenAI 批评美国政府限制访问政策不可持续。
BREAKING: OpenAI just dropped the limited preview of its new GPT 5.6 model suite: Sol, the flagship;…
X:Rohan Paul (@rohanpaul_ai)
模型发布/更新
06-26 18:24
OpenAI 发布 GPT-5.6 有限预览,含旗舰 Sol、中端 Terra 及廉价 Luna。Sol 在智能体任务(规划、工具使用、多步修正)上优于 GPT-5.5,Terminal-Bench 2.1 基准测试成绩突出。网络安全方面,Sol 是 OpenAI 漏洞研究与利用能力最强的模型,但未越过内部 Cyber Critical 阈值,且未在 Chromium/Firefox 中自主完成全链利用。新增"max"(更深推理)与"ultra"(子智能体)模式。定价:Sol 每 1M 输入 token $5、输出 token $30;Terra 成本低 2 倍;Luna 最便宜。安全测试用超 70 万 A100 等效 GPU 小时。美国要求仅限可信合作伙伴参与预览。
New models are on the horizon.
X:ChatGPT (@ChatGPTapp)
模型发布/更新
06-26 18:20
OpenAI 推出 GPT-5.6 Sol、GPT-5.6 Terra 和 GPT-5.6 Luna 的有限预览版。Sol 为下一代前沿模型,Terra 是均衡的高效日常模型,Luna 是面向高吞吐量的快速低价模型。新模型即将到来。
OpenAI says a broader GPT-5.6 release could come in the next few weeks, after an initial restricted …
X:Kim (@kimmonismus)
模型发布/更新
06-26 18:18
OpenAI 正预览 GPT-5.6 家族(包含 Sol、Terra、Luna),其中 Sol 是其迄今最强模型,拥有新最大推理能力和使用子智能体的超模式。发布采用"可信伙伴优先"模式:初始约 20 家政府批准公司可访问,下周预计扩张。Sol 改进了长期安全任务,但未越过"网络关键阈值"。OpenAI 称美国政府已知晓并支持该计划,限制更像临时检查点,以待完善前沿模型审查流程。更广泛基准评估后续公布。
HOLY: OpenAI is previewing GPT-5.6 Sol with a very different release pattern: Trusted partners fir…
X:Kim (@kimmonismus)
模型发布/更新
06-26 18:12
OpenAI 推出 GPT-5.6 系列有限预览,包含最强模型 Sol、平衡模型 Terra 和快速廉价模型 Luna。Sol 新增最大推理努力和超模式(利用子代理处理复杂任务),在网络安全长周期任务上有所改进,但未达到其准备框架定义的"网络关键阈值"。发布策略转向:优先信任合作伙伴,后续广泛开放,并提前与美国政府协调。评估集为自我报告,完整基准待后续公布。这标志着前沿 AI 发布向控制访问、政府可见性和风险分层部署转变。
GPT-5.6 Sol reaches Mythos Preview level at cybersecurity tasks. > It shifts the performance-effic…
X:Testing Catalog (@testingcatalog)
模型发布/更新
06-26 17:39
OpenAI推出GPT-5.6模型家族,代号Sol(旗舰)、Terra(性能模型,成本低2x)、Luna(最经济模型)。Sol在网络安全任务(包括漏洞研究与利用)上达到Mythos Preview级别,提升了长周期安全任务的性能-效率边界。GPT-5.6目前以"limited preview"形式发布。
GPT-5.6 is incredibly strong and fast for coding. I hope we can make it available to everyone soon.
X:Noam Brown (@polynoamial)
模型发布/更新
06-26 17:37
GPT-5.6 在编程方面极其强大且快速。我希望我们能尽快将其提供给所有人。
BREAKING 🔥: OPENAI LAUNCHED GPT-5.6 MODEL FAMILY UNDER NEW SOL, TERRA, AND LUNA MODEL NAMES. >; …
X:Testing Catalog (@testingcatalog)
模型发布/更新
06-26 17:33
BREAKING 🔥: OPENAI 发布了 GPT-5.6 模型系列,新模型名称为 SOL、TERRA 和 LUNA。
> Sol 是新的旗舰模型 🤖
> Terra 是性能模型,成本降低 2 倍。
> Luna 是最具成本效益的模型。
GPT-5.6 模型以"有限预览"形式推出。
GPT-5.6 Sol 预览:新一代模型
Hacker News 热门(buzzing.cc 中文翻译)
模型发布/更新
06-26 17:31
OpenAI 预览了 GPT-5.6 Sol,这是一款新一代模型。该预览由 OpenAI 官方发布,标题明确指出其为"next-generation model"。目前预览信息有限,仅确认了模型名称与定位,未包含具体技术细节或功能披露。
GPT-5.6 is finally coming. GPT-5.6 Sol beats Claude Mythos 5 on TerminalBench. And on Cerebras, GP…
X:Yuchen Jin (@Yuchenj_UW)
模型发布/更新
06-26 17:24
GPT-5.6 终于要来了。
GPT-5.6 Sol 在 TerminalBench 上击败了 Claude Mythos 5。
而且在 Cerebras 上,GPT-5.6 Sol 可达每秒 750 tokens。对于这个规模的模型来说相当快。现在我只希望它能向所有人开放。
GPT-5.6 来了,但是用不了。 之前以为肯花钱就能接触到最新科技,现在好像不是这么回事儿。 差距就此拉开。 这次起名策略是跟claude学到了。
X:小北 (@frxiaobei)
模型发布/更新
06-26 17:17
GPT-5.6 来了,但是用不了。
之前以为肯花钱就能接触到最新科技,现在好像不是这么回事儿。
差距就此拉开。
这次起名策略是跟claude学到了。
【引用 @OpenAI】:Introducing a limited preview of GPT-5.6 Sol, our next generation frontier model, as well as GPT-5.6 Terra, a balanced model for efficient, everyday work, and GPT-5.6 Luna, a fast and affordable model for high-volume work.
New moon. New models. Welcome GPT-5.6 Sol, currently in limited preview.
X:Tibo (@thsottiaux)
模型发布/更新
06-26 17:17
新月,新模型。欢迎 GPT-5.6 Sol,目前处于有限预览阶段。
【引用 @OpenAI】:推出 GPT-5.6 Sol(下一代前沿模型)、GPT-5.6 Terra(适用于日常高效工作的平衡模型)以及 GPT-5.6 Luna(面向高吞吐量任务的快速经济模型)的有限预览。
https://openai.com/index/previewing-gpt-5-6-sol/
GPT-5.6 Sol preview - it's a good model:
X:Greg Brockman (@gdb)
模型发布/更新
06-26 17:13
GPT-5.6 Sol preview - it's a good model:
OpenAI 推出 GPT-5.6 Sol 限量预览(下一代前沿模型),以及 GPT-5.6 Terra(面向日常高效工作的均衡模型)和 GPT-5.6 Luna(面向大批量任务的快速低价模型)。主推文评价其为一款好模型。
Quoting OpenAI
Simon Willison 博客
模型发布/更新
06-26 17:10
OpenAI 推出 GPT-5.6 系列三个模型:Sol 为旗舰,Terra 面向日常工作(性能对标 GPT-5.5 但价格便宜 2 倍),Luna 为快速低价模型。定价按每百万模型 token 计算:Sol 输入 $5 / 输出 $30,Terra 输入 $2.5 / 输出 $15,Luna 输入 $1 / 输出 $6。新版引入更可预测的提示词缓存,支持显式缓存断点和 30 分钟最小缓存生命期;缓存写入按 1.25 倍非缓存输入速率计费,缓存读取继续享受 90% 折扣。目前仅面向部分受信任合作伙伴提供有限预览,未来几周全面开放。
Introducing a limited preview of GPT-5.6 Sol, our next generation frontier model, as well as GPT-5.6…
X:OpenAI (@OpenAI)
模型发布/更新
06-26 17:10
推出 GPT-5.6 Sol 的有限预览,这是我们新一代前沿模型,以及 GPT-5.6 Terra,一个针对高效日常工作的平衡模型,还有 GPT-5.6 Luna,一个面向高容量工作、快速且经济的模型。
OpenAI unveils GPT-5.6 amid US AI regulatory drama
The Verge:AI(RSS)
模型发布/更新
06-26 17:00
OpenAI 发布 GPT-5.6 模型套件,包括旗舰款 Sol、中端 Terra 和快速平价 Luna,擅长编程、网络安全、生物学及长周期智能体任务。Sol 定价每百万 token 输入 $5 / 输出 $30,约为 Anthropic Claude Fable 5 的一半;Terra 价格为 Sol 一半,Luna 更低。Sol 额外提供"max"深度推理模式和"ultra"子智能体模式。安全方面,Sol 经过约 70 万 A100e GPU 小时自动化红队测试,并接受第三方测试。预览期间特朗普政府将逐案审批客户。公司计划数周内广泛开放,但称该类政府准入流程不应成为常态。
PaddleOCR的PP-OCRv6又扔了一波硬核部署数据。 他们在A100上做到0.13秒一张图,在Intel CPU上比PP-OCRv5快3.9倍到5.2倍。 Apple M4上用ONNX R…
X:Berry Xia (@berryxia)
模型发布/更新
06-26 13:36
PaddleOCR发布PP-OCRv6完整端到端部署基准。A100上PP-OCRv6_tiny达0.13秒/图;Intel CPU上用OpenVINO,PP-OCRv6_medium比PP-OCRv5_server快5.2倍,PP-OCRv6_tiny比PP-OCRv5_mobile快3.9倍;Apple M4上用ONNX Runtime跑出0.35秒/图。提供Tiny、Small、Medium三种尺寸,Medium/Small均支持50种语言,PP-OCRv6_medium英文准确率88.4%,拉丁字母准确率88.0%。官方总结认为,在专用OCR任务上,轻量架构+高质量训练数据比单纯堆参数更实用,是对大模型"暴力scaling"路线的反向验证。
This looks to good to be true. A 397B open source model on par or even outperforming Claude Opus 4…
X:Kim (@kimmonismus)
模型发布/更新
06-26 11:56
Ornith-1.0 是专为智能体编程设计的开源大语言模型家族,提供 9B Dense、31B Dense、35B MoE 和 397B MoE 四种尺寸。基于 gemma4 和 qwen3.5 后训练,采用强化学习联合优化任务脚手架与解决方案的自我改进策略。在多个编码基准上取得开源模型最优:Terminal-Bench 2.1(77.5)、SWE-Bench Verified(82.4)/ Pro(62.2)/ Multilingual(78.9)、NL2Repo(48.2)、SWE Atlas(QnA 41.2 / RF 42.6 / TW 39.1)、ClawEval(77.1)。所有模型以 MIT 许可证开源,支持商业与研究使用。主推文称其 397B 版本性能媲美甚至超越 Claude Opus 4.8。
Previewing GPT-5.6 Sol: a next-generation model
OpenAI:官网动态(RSS · 排除企业/客户案例)
模型发布/更新
06-26 10:00
OpenAI 发布了新一代模型 GPT-5.6 Sol 的预览信息。该模型被定位为下一代模型,目前仅公开了预览消息和标题,尚未披露具体技术细节、性能参数或功能特性。
From anime-inspired worlds to cinematic action sequences, HappyHorse 1.1 transforms detailed prompts…
X:阿里云 / Alibaba Cloud (@alibaba_cloud)
模型发布/更新
06-26 05:33
从动漫风格的世界到电影级动作场景,HappyHorse 1.1 将详细的提示词转化为视觉效果惊艳的视频。
精准创建风格化的环境、动态的镜头运动、沉浸式的光照和流畅的动作,将你想象中的每一帧变为现实。
限时发布享 40% 折扣
API 限时发布特惠:https://int.alibabacloud.com/m/1000414698/
#HappyHorse #阿里云 #ModelStudio #生成式AI
More great options for the open-weight ecosystem. Thanks @NVIDIAAI for making MiniMax M3 available i…
X:MiniMax (@MiniMax_AI)
模型发布/更新
06-26 04:26
开源权重生态的更多好选择。感谢 @NVIDIAAI 使 MiniMax M3 可在 NVFP4 中使用。
IT之家(RSS)
模型发布/更新
06-26 03:35
法国 AI 初创公司 Mistral AI 于本月 23 日发布文档内容识别模型 OCR 4,支持横跨 10 个语族的 170 种语言,在 OmniDocBench 上获 93.07 分,输出较 GPT 5.5 Pro、Gemini 3.1 Pro Preview 等更受人类青睐。该模型为小型聚焦模型,输出文本并提供边框、区域分类和置信度评分,支持 RAG 语义分块等下游工作负载。基础 API 定价每千页 4 美元,批处理享 50% 优惠;文档人工智能定价每千页 5 美元。
下一页