OpenMAIC的三阶段流水线架构是怎样的？

2026-05-27 01:591阅读0评论SEO基础

内容介绍
文章标签
相关推荐

人工智能已经从被动的工具转变为主动的伙伴。特别是在课程内容生成领域， OpenMAIC以其独创性的三阶段流水线架构，戳到痛处了。让“从想法到课堂”的过程不再是一次性的大爆炸，而是一个有序、高效的协作。

为什么要拆分成三段？

传统的“一站式”模型往往会把需求解析、内容生成与交互动作全部塞进同一个 Prompt。这样做最大的痛点在于溢出——模型一次只能记住几千个 token，一旦出现错误，就需要重新跑完整个流程，导致算力与成本双重浪费。

OpenMAIC 的设计哲学类似于建筑工地：先画图纸，再砌墙，再说说装饰。将复杂任务拆解成可管理的小块，既能让每一步专注又能显著提升整体吞吐量，百感交集。。

第一阶段：大纲规划

这一阶段相当于给整个课程绘制骨架。系统先说说收集用户输入，然后通过 LLM 将这些碎片化的信息转化为结构化的大纲。真香！大纲通常包含场景 ID、类型、标题、关键点和预估时长等字段。

{
  "scenes": ,
      "duration": 5
    },
    ...
  ]
}

这一步的核心在于语义抽取和结构映射。通过模板化 Prompt，模型只需要输出纯 JSON，绝绝子... 不带任何解释性文字，从而保证后续解析无误。

Prompt 工程技巧

何苦呢？为了防止模型加入 Markdown 标记或额外文本，我们采用了硬性约束：

// 构造大纲 Prompt
const outlinePrompt = buildPrompt(PROMPT_IDS.OUTLINE,
  { userRequest: rawInput,
    referenceDocs: pdfTexts,
    imageList: imageIds });

这里的 buildPrompt 会把所有必需字段拼接成一段简洁明了的说明，告诉模型：“请按上述 JSON 模式返回”。这种约束方式大幅降低了后处理成本，CPU你。。

第二阶段：内容构建

有了蓝图，下一步就是填充细节——文字、图表和多媒体素材。该阶段会并行处理多个场景，以提升吞吐量；一边每个场景都携带上下文信息，比方说当前页索引、总页数以及前一页内容，以便保持逻辑连贯。

// 幻灯片内容生成示例
async function generateSlide {
  const prompt = buildSlidePrompt;
  const response = await llm.call;
  return parseJSON;
}

这里面还有一个关键技术点：**流式输出**。当模型逐段完成章节时它会即时推送 JSON 对象到前端，人间清醒。而不是等全部完成才一次性返回。这种“打字机”式体验，让教师可以实时看到进度并及时调整需求。

SSE 与增量解析

SSE 的实现非常轻量：服务器端通过

标签：流水线

为什么要拆分成三段？

第一阶段：大纲规划

{
  "scenes": ,
      "duration": 5
    },
    ...
  ]
}

这一步的核心在于语义抽取和结构映射。通过模板化 Prompt，模型只需要输出纯 JSON，绝绝子... 不带任何解释性文字，从而保证后续解析无误。

Prompt 工程技巧

何苦呢？为了防止模型加入 Markdown 标记或额外文本，我们采用了硬性约束：

// 构造大纲 Prompt
const outlinePrompt = buildPrompt(PROMPT_IDS.OUTLINE,
  { userRequest: rawInput,
    referenceDocs: pdfTexts,
    imageList: imageIds });

第二阶段：内容构建

// 幻灯片内容生成示例
async function generateSlide {
  const prompt = buildSlidePrompt;
  const response = await llm.call;
  return parseJSON;
}

SSE 与增量解析

SSE 的实现非常轻量：服务器端通过

标签：流水线

为什么要拆分成三段？

第一阶段：大纲规划

Prompt 工程技巧

第二阶段：内容构建

SSE 与增量解析

相关推荐

为什么要拆分成三段？

第一阶段：大纲规划

Prompt 工程技巧

第二阶段：内容构建

SSE 与增量解析

相关推荐