<rss xmlns:atom="http://www.w3.org/2005/Atom" version="2.0">
    <channel>
        <title>LLM - 标签 - Simi Studio</title>
        <link>/tags/llm/</link>
        <description>LLM - 标签 - Simi Studio</description>
        <generator>Hugo -- gohugo.io</generator><language>zh-CN</language><managingEditor>simi@simi.studio (Simi)</managingEditor>
            <webMaster>simi@simi.studio (Simi)</webMaster><lastBuildDate>Tue, 14 Apr 2026 17:00:00 &#43;0800</lastBuildDate><atom:link href="/tags/llm/" rel="self" type="application/rss+xml" /><item>
    <title>GPT-6 预训练完成：18 个月、10 万张 H100、200 万 token 上下文</title>
    <link>/posts/gpt-6-pretraining-complete/</link>
    <pubDate>Tue, 14 Apr 2026 17:00:00 &#43;0800</pubDate>
    <author>simi@simi.studio (Simi)</author>
    <guid>/posts/gpt-6-pretraining-complete/</guid>
    <description><![CDATA[2026 年 4 月 14 日，OpenAI 官方确认 GPT-6 预训练已于 3 月 17 日完成，历时 18 个月。参数量 5-6 万亿（MoE 架构），上下文窗口 200 万 token，Greg Brockman 称其为「我们思考模型开发方式的重大改变」。]]></description>
</item>
<item>
    <title>Qwen3.5-Omni：阿里在 215 项音视频任务上超越了 Gemini-3.1 Pro</title>
    <link>/posts/qwen-3-5-omni-multimodal/</link>
    <pubDate>Mon, 30 Mar 2026 10:00:00 &#43;0800</pubDate>
    <author>simi@simi.studio (Simi)</author>
    <guid>/posts/qwen-3-5-omni-multimodal/</guid>
    <description><![CDATA[2026 年 3 月 30 日，阿里云发布 Qwen3.5-Omni，在 215 项音视频理解、识别、交互任务中取得 SOTA，超越 Gemini-3.1 Pro。这是国产大模型在多模态领域的重要突破。]]></description>
</item>
<item>
    <title>Edge AI 部署：让 LLM 跑在你的设备上</title>
    <link>/posts/edge-ai-deployment/</link>
    <pubDate>Thu, 26 Mar 2026 14:00:00 &#43;0800</pubDate>
    <author>simi@simi.studio (Simi)</author>
    <guid>/posts/edge-ai-deployment/</guid>
    <description><![CDATA[LLM 跑在本地设备上，隐私不泄露，响应更快。2026 年初的 Edge AI 技术成熟了吗？哪些设备能跑？]]></description>
</item>
<item>
    <title>多模态 LLM 成熟了吗：2026 年初的实测</title>
    <link>/posts/multimodal-llm-evolution/</link>
    <pubDate>Tue, 10 Mar 2026 14:30:00 &#43;0800</pubDate>
    <author>simi@simi.studio (Simi)</author>
    <guid>/posts/multimodal-llm-evolution/</guid>
    <description><![CDATA[GPT-4o、Gemini 2.0、Claude 3.7 都支持多模态。图片、音频、视频理解到底哪家强？这篇文章实测后给结论。]]></description>
</item>
<item>
    <title>GPT-5.4 的百万 token 上下文：终于不再截断</title>
    <link>/posts/gpt-5-4-million-token-context/</link>
    <pubDate>Thu, 05 Mar 2026 10:00:00 &#43;0800</pubDate>
    <author>simi@simi.studio (Simi)</author>
    <guid>/posts/gpt-5-4-million-token-context/</guid>
    <description><![CDATA[2026 年 3 月 5 日，OpenAI 发布 GPT-5.4，默认开启百万 token 上下文窗口，并推出「中途响应可控」功能。对需要处理长文档、代码库的开发者来说，这是实质性的体验升级。]]></description>
</item>
<item>
    <title>GPT-5.4：三个版本，一个问题</title>
    <link>/posts/gpt-5-4/</link>
    <pubDate>Thu, 05 Mar 2026 10:00:00 &#43;0800</pubDate>
    <author>simi@simi.studio (Simi)</author>
    <guid>/posts/gpt-5-4/</guid>
    <description><![CDATA[<p>OpenAI 发布 <a href="https://openai.com/index/introducing-gpt-5-4/" target="_blank" rel="noopener noreffer ">GPT-5.4</a>。</p>
<p>官方对它的定位：&ldquo;for professional work&rdquo;——面向专业工作的最前沿模型。</p>]]></description>
</item>
<item>
    <title>LLM Extended Thinking：让模型&#34;多想一会儿&#34;的工程实践</title>
    <link>/posts/extended-thinking-llm/</link>
    <pubDate>Fri, 20 Feb 2026 10:00:00 &#43;0800</pubDate>
    <author>simi@simi.studio (Simi)</author>
    <guid>/posts/extended-thinking-llm/</guid>
    <description><![CDATA[Extended Thinking（thinking budget）是 2026 年的标配能力。但怎么用好这个能力，哪些场景值得多花 token，都是工程问题。]]></description>
</item>
<item>
    <title>2026 年小模型在生产环境的真实表现</title>
    <link>/posts/small-models-production-2026/</link>
    <pubDate>Thu, 12 Feb 2026 14:00:00 &#43;0800</pubDate>
    <author>simi@simi.studio (Simi)</author>
    <guid>/posts/small-models-production-2026/</guid>
    <description><![CDATA[Llama 4 Scout (17B)、Phi-4、Gemma 3 都发布了。2026 年初的小模型，生产环境表现如何？这篇文章给一个客观实测。]]></description>
</item>
<item>
    <title>Claude Opus 4.6：发布了，然后重点是 Agent Teams</title>
    <link>/posts/claude-opus-4-6/</link>
    <pubDate>Thu, 05 Feb 2026 10:00:00 &#43;0800</pubDate>
    <author>simi@simi.studio (Simi)</author>
    <guid>/posts/claude-opus-4-6/</guid>
    <description><![CDATA[<p>Anthropic 发布 <a href="https://www.anthropic.com/claude/opus" target="_blank" rel="noopener noreffer ">Claude Opus 4.6</a>。</p>
<p>官方对它的定位是&quot;most capable model yet&quot;——但真正的新东西不是模型参数，是 Agent Teams。</p>]]></description>
</item>
<item>
    <title>AI Context 管理实战：RAG 不是万能的</title>
    <link>/posts/ai-context-management-guide/</link>
    <pubDate>Tue, 27 Jan 2026 14:00:00 &#43;0800</pubDate>
    <author>simi@simi.studio (Simi)</author>
    <guid>/posts/ai-context-management-guide/</guid>
    <description><![CDATA[用 AI 处理长文本或大代码库时，RAG 和 long context 各有优劣。这篇文章讲清楚什么时候用哪个，以及怎么结合使用。]]></description>
</item>
</channel>
</rss>
