LLM - 标签 - Simi Studio

GPT-6 预训练完成：18 个月、10 万张 H100、200 万 token 上下文

simi@simi.studio (Simi) — Tue, 14 Apr 2026 17:00:00 +0800

2026 年 4 月 14 日，OpenAI 官方确认 GPT-6 预训练已于 3 月 17 日完成，历时 18 个月。参数量 5-6 万亿（MoE 架构），上下文窗口 200 万 token，Greg Brockman 称其为「我们思考模型开发方式的重大改变」。

simi@simi.studio (Simi) — Mon, 30 Mar 2026 10:00:00 +0800

2026 年 3 月 30 日，阿里云发布 Qwen3.5-Omni，在 215 项音视频理解、识别、交互任务中取得 SOTA，超越 Gemini-3.1 Pro。这是国产大模型在多模态领域的重要突破。

simi@simi.studio (Simi) — Thu, 26 Mar 2026 14:00:00 +0800

LLM 跑在本地设备上，隐私不泄露，响应更快。2026 年初的 Edge AI 技术成熟了吗？哪些设备能跑？

simi@simi.studio (Simi) — Tue, 10 Mar 2026 14:30:00 +0800

GPT-4o、Gemini 2.0、Claude 3.7 都支持多模态。图片、音频、视频理解到底哪家强？这篇文章实测后给结论。

simi@simi.studio (Simi) — Thu, 05 Mar 2026 10:00:00 +0800

2026 年 3 月 5 日，OpenAI 发布 GPT-5.4，默认开启百万 token 上下文窗口，并推出「中途响应可控」功能。对需要处理长文档、代码库的开发者来说，这是实质性的体验升级。

simi@simi.studio (Simi) — Thu, 05 Mar 2026 10:00:00 +0800

OpenAI 发布 GPT-5.4。

官方对它的定位：“for professional work”——面向专业工作的最前沿模型。

simi@simi.studio (Simi) — Fri, 20 Feb 2026 10:00:00 +0800

Extended Thinking（thinking budget）是 2026 年的标配能力。但怎么用好这个能力，哪些场景值得多花 token，都是工程问题。

simi@simi.studio (Simi) — Thu, 12 Feb 2026 14:00:00 +0800

Llama 4 Scout (17B)、Phi-4、Gemma 3 都发布了。2026 年初的小模型，生产环境表现如何？这篇文章给一个客观实测。

simi@simi.studio (Simi) — Thu, 05 Feb 2026 10:00:00 +0800

Anthropic 发布 Claude Opus 4.6。

官方对它的定位是"most capable model yet"——但真正的新东西不是模型参数，是 Agent Teams。

simi@simi.studio (Simi) — Tue, 27 Jan 2026 14:00:00 +0800

用 AI 处理长文本或大代码库时，RAG 和 long context 各有优劣。这篇文章讲清楚什么时候用哪个，以及怎么结合使用。