阿里通义WebShaper AI系统如何合成高质量训练数据?
- 内容介绍
- 文章标签
- 相关推荐
本文共计1264个文字,预计阅读时间需要6分钟。
相关章节内容如下:
WebShaper是什么
webshaper 是由阿里巴巴通义实验室研发的前沿 ai 训练数据合成系统,致力于为 ai 智能体(agent)的训练提供高精度、可扩展的数据支持。该系统创新性地引入了基于集合论的“知识投影”(knowledge projection, kp)机制,通过交集、并集与递归等操作,构建结构化的问题框架,精确调控推理路径和任务难度。webshaper 的核心组件 expander 智能体能够以简单的“种子问题”为起点,自主生成复杂的多步推理任务,实现 ai 自主“出题”。结合监督微调(sft)与 grpo 强化学习的训练策略,webshaper 显著提升了模型在复杂信息检索与推理任务中的表现。
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 多模态理解力帮你轻松跨越从0到1的创作门槛☜☜☜
WebShaper的主要功能- 形式化建模:WebShaper 首创基于集合论的信息搜寻(IS)任务形式化方法,提出“知识投影”(KP)概念。每个 KP 表示一个包含特定实体的集合,通过交集、并集和递归等集合操作,将复杂任务拆解为可计算的结构,从而精准控制推理逻辑和任务层级。
- 智能体扩展机制:系统引入 Expander 智能体,实现从简单问题到复杂推理任务的自动演化。
本文共计1264个文字,预计阅读时间需要6分钟。
相关章节内容如下:
WebShaper是什么
webshaper 是由阿里巴巴通义实验室研发的前沿 ai 训练数据合成系统,致力于为 ai 智能体(agent)的训练提供高精度、可扩展的数据支持。该系统创新性地引入了基于集合论的“知识投影”(knowledge projection, kp)机制,通过交集、并集与递归等操作,构建结构化的问题框架,精确调控推理路径和任务难度。webshaper 的核心组件 expander 智能体能够以简单的“种子问题”为起点,自主生成复杂的多步推理任务,实现 ai 自主“出题”。结合监督微调(sft)与 grpo 强化学习的训练策略,webshaper 显著提升了模型在复杂信息检索与推理任务中的表现。
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 多模态理解力帮你轻松跨越从0到1的创作门槛☜☜☜
WebShaper的主要功能- 形式化建模:WebShaper 首创基于集合论的信息搜寻(IS)任务形式化方法,提出“知识投影”(KP)概念。每个 KP 表示一个包含特定实体的集合,通过交集、并集和递归等集合操作,将复杂任务拆解为可计算的结构,从而精准控制推理逻辑和任务层级。
- 智能体扩展机制:系统引入 Expander 智能体,实现从简单问题到复杂推理任务的自动演化。

