AI获取 Markdown 格式飞书文档
- 内容介绍
- 文章标签
- 相关推荐
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容:
- 我的帖子已经打上 开源推广 标签: 是
- 我的开源项目完整开源,无未开源部分: 是
- 我的开源项目已链接认可 LINUX DO 社区: 是
- 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是
- 以上选择我承诺是永久有效的,接受社区和佬友监督: 是
以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出
飞书官方的 lark-openapi-mcp MCP 在导出文档时会丢弃附件图片、文档层级、文档结构。通过 docx_v1_document_rawContent 获取纯文本内容。
这里提供一种基于 Skill + Cli 的方式解决此问题。Skill 的动态加载使用更友好,Cli 调用方式对应 Agent 友好,同时支持输出的文档包含附件图片、表格等内容。
- Github: GitHub - Byte-n/larkDocx2md · GitHub (好用 → Star,不好用 → issue ?)
- npm: https://www.npmjs.com/package/lark-docx2md
飞书官方 lark-openapi-mcp MCP
lark-openapi-mcp 是飞书官方提供的 MCP 工具。提供了读取文档的能力。
Agent 的使用步骤:
# gpt-5.3-codex
› lark mcp 服务如何读取文档
• 用 Lark MCP 读取文档,常用是这 3 步:
1. 先拿到文档真实 token
如果是 wiki 链接(如 .../wiki/U7...),先调 mcp__lark__wiki_v2_space_getNode:
- 入参:token=U7...
- 返回里会有 obj_type 和 obj_token(真实文档 token)
2. 按文档类型读取正文
- 若 obj_type=docx,调用 mcp__lark__docx_v1_document_rawContent
- 入参:document_id=<obj_token>
- 返回纯文本正文(可直接落盘/处理)
3. 写入本地文件
把 raw_content 保存为 .md 或 .txt 即可。
最小调用链就是:
wiki_v2_space_getNode -> docx_v1_document_rawContent -> 写文件
补充两点:
- 你的应用/机器人必须对该文档有权限(否则会 403/无内容)。
- useUAT(用户身份)通常比租户身份更容易读到个人/团队文档。
如果你要,我可以直接给你一个“输入 wiki 链接 -> 自动输出本地 md”的固定娱乐版本。
提示词:“直接使用 lark mcp 服务读取 https://xxx.feishu.cn/wiki/xxx 文档的内容,并输出到 a.md 文件中。useUAT:false”
# gpt-5.3-codex
› 直接使用 lark mcp 服务读取 https://xxx.feishu.cn/wiki/xxx 文档的内容,并输出到 a.md 文件中。useUAT:false
• Called lark.wiki_v2_space_getNode({"params":{"token":"xxxx"},"useUAT":false})
└ { ...飞书接口响应 }
• Called lark.docx_v1_document_rawContent({"path":{"document_id":"RH2sdVIr8oHznsx8JEmcxcFBnxo"},"useUAT":false})
└ {"content": "A\n图片\n\nimage.png\n\n\n筛选字段\n\n\n字段名称\n\n是否是固定筛选项\n\n字段类型\n\n字段属性\n\n交互说明\n\n\n\n\n\n1、输入型/\n2、选项型\n3、控件型,如时间控
件、省市区控件\n\n\n字段属性如以下内容,根据实际情况输出:\n1、长度限制说明\n2、字符类型说明\n3、字段值说明\n4、搜索说明:精准搜索/模糊搜索\n\n简单地交互可以用文字描
述,复杂的交互需要输出交互图\n\n\n订单编号\n\n\n是\n\n输入型\n\n\n精确查询,支持批量\n\n\n多行文本框,支持批量查询\n1.支持回车、逗号、分号 分隔查询\n2.最大单次查询量不
超过200条数据\n列表字段\n\n\n字段名称\n\n\n\n字段说明\n\n备注\n\n订单编号\n\n\n\n\nAAA+年月日+6位自增\n(如:AAA20250322000001) \n\n1、需支持点击跳转至详情页\n\n\n产品
明细\n\n\n\nT+年月日+6位自增\n(如:T20250322000001)\n\n\n\n配送单状态\n\n\nA\n\n1\n\n\n\n\n\nB\n\n2\n\n校验规则\n\n\n\n\n"}
─ Worked for 1m 21s ────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────
• 已完成,按你的要求直接走 Lark MCP(useUAT: false)读取该 Wiki 页面内容,并写入:
- a.md
文件位置:/Users/*/WebstormProjects/lark2md/a.md
我也已本地确认文件存在并写入成功。
a.md (raw_content) 内容如下:
fswdzmd-img2238×1586 202 KB
实际上文档的内容为:
fswdzmd-img_22558×3652 432 KB
lark-openapi-mcp 输出的文档内容是 raw_content 纯文本的内容。
Skill + Cli:larkDocx2md
larkDocx2md 支持下载 https://xxx.feishu.cn/wiki/xxx 格式的链接为本地的 Markdown 文件。支持:
- 表格等格式转换
- 附件图片下载并链接到 Markdown 文件中
- 支持
npx lark-docx2mdCli 方式调用 - 提供方便 Agent 调用的 larkDocx2md Skill
使用
Cli
npx -y lark-docx2md download <url> --app-id <APP_ID> --app-secret <APP_SECRET>
或先设置环境变量(命令行参数可省略):
export LARK_DOCX2MD_APP_ID=<APP_ID>
export LARK_DOCX2MD_APP_SECRET=<APP_SECRET>
npx -y lark-docx2md download <url>
Skill
安装 Skill:<跳过>
使用:
› 读取 https://xxx.feishu.cn/wiki/xxx 文档内容
• 我会用 lark-docx2md 技能先把这个 Feishu Wiki 链接拉取为本地 Markdown,然后直接读取并返回文档内容。先检查技能说明并执行下载命令。
• Explored
└ Read SKILL.md
────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────
• 技能说明已确认。我将按规范把链接转换到 larkDocx2mdOutput/,然后读取生成的 Markdown 内容。
• Ran npm_config_cache="/tmp/.npm-cache" npx -y larkDocx2md download --agent --output "/Users/xxx/WebstormProjects/lark2md/larkDocx2mdOutput/"
│ "https://xxx.feishu.cn/wiki/xxx"
└ Read and process the following Markdown file: /Users/xxx/WebstormProjects/lark2md/larkDocx2mdOutput/xxx.md
────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────
• 拉取成功,正在读取生成的 Markdown 文件内容。
• Explored
└ Read xxx.md
────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────
• 已读取到该文档,larkDocx2mdOutput/xxx.md
larkDocx2mdOutput/xxx.md 文档内容:
# A
## 图片

## 筛选字段
<table>
<tr>
<td>字段名称<br/></td><td>是否是固定筛选项<br/></td><td>字段类型<br/></td><td>字段属性<br/></td><td>交互说明<br/></td></tr>
<tr>
<td><br/></td><td><br/></td><td>1、输入型/<br/>2、选项型<br/>3、控件型,如时间控件、省市区控件<br/><br/></td><td>字段属性如以下内容,根据实际情况输出:<br/>1、长度限制说明<br/>2、字符类型说明<br/>3、字段值说明<br/>4、搜索说明:精准搜索/模糊搜索<br/></td><td>简单地交互可以用文字描述,复杂的交互需要输出交互图<br/><br/></td></tr>
<tr>
<td>订单编号<br/><br/></td><td>是<br/></td><td>输入型<br/><br/></td><td>精确查询,支持批量<br/><br/></td><td>多行文本框,支持批量查询<br/>1.支持回车、逗号、分号 分隔查询<br/>2.最大单次查询量不超过200条数据<br/></td></tr>
</table>
## 列表字段
<table>
<tr>
<td colspan="2">字段名称<br/></td><td>字段说明<br/></td><td>备注<br/></td></tr>
<tr>
<td colspan="2">订单编号<br/><br/></td><td>AAA+年月日+6位自增<br/>(如:AAA20250322000001) <br/></td><td>1、需支持点击跳转至详情页<br/><br/></td></tr>
<tr>
<td colspan="2">产品明细<br/></td><td>T+年月日+6位自增<br/>(如:T20250322000001)<br/></td><td><br/></td></tr>
<tr>
<td rowspan="2">配送单状态<br/><br/></td><td>A<br/></td><td>1<br/></td><td><br/></td></tr>
<tr>
<td>B<br/></td><td>2<br/></td><td>校验规则<br/><br/></td></tr>
</table>
##
##
Markdown 效果,图片、表格、表格夸行、夸列都正常展示。
fswdzmd-img_41858×2594 220 KB
实现原理
larkDocx2md 代码仓库:GitHub - Byte-n/larkDocx2md · GitHub
参考资料;
- 飞书官方文档
- 社区工具 feishu2md
飞书的文档构成如图:
fswdzmd-img_53059×1721 497 KB
每个块,都有对应的存储结构,只需要针对特定的结构转换为 Markdown 对应的结构(这里可能存在递归)
飞书提供的 API 有:
- 获取文档所有块
- 获取文档基本信息
- 获取文档纯文本内容
- 获取所有子块
- 获取块
- …
实现思路:
-
接收飞书文档链接,识别链接类型。
-
输入是 Wiki 链接,先把 Wiki 节点解析为真实文档 Token
-
先获取文档元信息(标题、标识等)、再分页拉取文档块(block)数据,直到拿到完整块树。
-
结构化转换为 Markdown
- 以块树为基础递归遍历,按块类型映射为 Markdown/HTML。
- 常规文本块(标题、段落、列表、引用、代码块、任务项等)直接转换为对应语法。
- 复杂表格(含合并单元格)使用 HTML table 表达,保证结构不丢失。
- 图片先保留资源标识占位,便于后续统一下载与替换。
-
资源下载与链接回填
- 批量下载图片资源到本地静态目录。
- 将文档中的图片占位链接替换为本地相对路径链接,形成可离线查看的 Markdown。
-
最终输出
- 生成最终 Markdown 文件。
- 在 Agent 场景下补充输出可直接读取的目标文件路径,便于后续自动处理。
调用的 API
-
Wiki 节点查询 API
- 用于把 Wiki 链接转换为真实文档对象,获取后续读取所需的文档 Token。
-
文档信息 API
- 用于获取文档基础信息(如标题与文档 ID),作为解析入口与输出命名参考。
-
文档块列表 API(分页)
- 用于拉取文档的完整块结构数据,是 Markdown 转换的核心输入。
-
媒体下载 API
- 用于下载文档中的图片资源到本地,配合 Markdown 链接改写实现本地化引用。
-
错误码与重试/中断策略
- 所有 API 调用统一校验返回状态,遇到失败即时中断并报错,避免生成不完整内容。
可优化
Markdown 的文本内容生成过程都是大量字符串操作,是否可以在转换过程中不以字符串的形式存储,而是以文档树的结构存储。
- 每个部分的转换只在特定的子树上操作。
- 最终输出就是深度优先遍历输出字符串内容即可。
- 对应部分因为 API 频率限制导致失败,方便重试重写部分数据。
- 更好的扩展性
其他问题
- 为什么表格转换为 HTML 的 Table?
大部分 Markdown 渲染器支持渲染部分 HTML 标签,这里包含 Table。其次 Markdown 的 |---| 表格方式无法实现夸列、夸行,而 HTML Table 可以。当然这里也可以用Markdown 的 |---| + 重复列、行值来解决。
--【壹】--:
巧了,刚好想要学习一下飞书的cli怎么用,收藏了!
--【贰】--:
飞书最近新出了 cli + skill 的方案:
飞书的 lark-cli 大约7天前发布的方案,理论效果完全碾压前者 openapi-lark-mcp。该方案由 Cli + Skills 组成!Skill 按模块组成。cli 工具也不仅仅是对 openapi 的包装调用,而是按功能组织,对外提供可直接使用的对ai友好的工具。读取飞书文档在 lark-doc 下,导出的文档也不是纯文本字符串,而是 Markdown 文本!。Cli 工具内部做了页面块下的直接子级块数据的转换。什么是块?
fswdzmd-img_53059×1721 497 KB
输出内容类似:
# 标题1 图
<image token="Z1FjxxxxxxxxxxxxxxxxxxxtnAc" width="1833" height="2491" align="center"/>
# 标题2 表格
<lark-table>
<lark-tr>
<lark-td>1</lark-td>
<lark-td>2</lark-td>
<lark-td>3</lark-td>
</lark-tr>
<lark-tr>
<lark-td>A</lark-td>
<lark-td>B</lark-td>
<lark-td>C</lark-td>
</lark-tr>
</lark-table>
AI 阅读到 <image token="Z1FjxxxxxxxxxxxxxxxxxxxtnAc" width="1833" height="2491" align="center"/> 则会按 lark-doc 规范,继续访问其他能力读取图片(渐进式的加载)。但这对于 AI模型 本身的能力要求较高。除了 claude / gpt 4 / glm 5 / kimi-k2.5 以下的模型可能都不会有比较好的效果。
--【叁】--:
佬真不错,mark住了,先放收藏夹,有时间再学~
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容:
- 我的帖子已经打上 开源推广 标签: 是
- 我的开源项目完整开源,无未开源部分: 是
- 我的开源项目已链接认可 LINUX DO 社区: 是
- 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是
- 以上选择我承诺是永久有效的,接受社区和佬友监督: 是
以下为项目介绍正文内容,AI生成、润色内容已使用截图方式发出
飞书官方的 lark-openapi-mcp MCP 在导出文档时会丢弃附件图片、文档层级、文档结构。通过 docx_v1_document_rawContent 获取纯文本内容。
这里提供一种基于 Skill + Cli 的方式解决此问题。Skill 的动态加载使用更友好,Cli 调用方式对应 Agent 友好,同时支持输出的文档包含附件图片、表格等内容。
- Github: GitHub - Byte-n/larkDocx2md · GitHub (好用 → Star,不好用 → issue ?)
- npm: https://www.npmjs.com/package/lark-docx2md
飞书官方 lark-openapi-mcp MCP
lark-openapi-mcp 是飞书官方提供的 MCP 工具。提供了读取文档的能力。
Agent 的使用步骤:
# gpt-5.3-codex
› lark mcp 服务如何读取文档
• 用 Lark MCP 读取文档,常用是这 3 步:
1. 先拿到文档真实 token
如果是 wiki 链接(如 .../wiki/U7...),先调 mcp__lark__wiki_v2_space_getNode:
- 入参:token=U7...
- 返回里会有 obj_type 和 obj_token(真实文档 token)
2. 按文档类型读取正文
- 若 obj_type=docx,调用 mcp__lark__docx_v1_document_rawContent
- 入参:document_id=<obj_token>
- 返回纯文本正文(可直接落盘/处理)
3. 写入本地文件
把 raw_content 保存为 .md 或 .txt 即可。
最小调用链就是:
wiki_v2_space_getNode -> docx_v1_document_rawContent -> 写文件
补充两点:
- 你的应用/机器人必须对该文档有权限(否则会 403/无内容)。
- useUAT(用户身份)通常比租户身份更容易读到个人/团队文档。
如果你要,我可以直接给你一个“输入 wiki 链接 -> 自动输出本地 md”的固定娱乐版本。
提示词:“直接使用 lark mcp 服务读取 https://xxx.feishu.cn/wiki/xxx 文档的内容,并输出到 a.md 文件中。useUAT:false”
# gpt-5.3-codex
› 直接使用 lark mcp 服务读取 https://xxx.feishu.cn/wiki/xxx 文档的内容,并输出到 a.md 文件中。useUAT:false
• Called lark.wiki_v2_space_getNode({"params":{"token":"xxxx"},"useUAT":false})
└ { ...飞书接口响应 }
• Called lark.docx_v1_document_rawContent({"path":{"document_id":"RH2sdVIr8oHznsx8JEmcxcFBnxo"},"useUAT":false})
└ {"content": "A\n图片\n\nimage.png\n\n\n筛选字段\n\n\n字段名称\n\n是否是固定筛选项\n\n字段类型\n\n字段属性\n\n交互说明\n\n\n\n\n\n1、输入型/\n2、选项型\n3、控件型,如时间控
件、省市区控件\n\n\n字段属性如以下内容,根据实际情况输出:\n1、长度限制说明\n2、字符类型说明\n3、字段值说明\n4、搜索说明:精准搜索/模糊搜索\n\n简单地交互可以用文字描
述,复杂的交互需要输出交互图\n\n\n订单编号\n\n\n是\n\n输入型\n\n\n精确查询,支持批量\n\n\n多行文本框,支持批量查询\n1.支持回车、逗号、分号 分隔查询\n2.最大单次查询量不
超过200条数据\n列表字段\n\n\n字段名称\n\n\n\n字段说明\n\n备注\n\n订单编号\n\n\n\n\nAAA+年月日+6位自增\n(如:AAA20250322000001) \n\n1、需支持点击跳转至详情页\n\n\n产品
明细\n\n\n\nT+年月日+6位自增\n(如:T20250322000001)\n\n\n\n配送单状态\n\n\nA\n\n1\n\n\n\n\n\nB\n\n2\n\n校验规则\n\n\n\n\n"}
─ Worked for 1m 21s ────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────
• 已完成,按你的要求直接走 Lark MCP(useUAT: false)读取该 Wiki 页面内容,并写入:
- a.md
文件位置:/Users/*/WebstormProjects/lark2md/a.md
我也已本地确认文件存在并写入成功。
a.md (raw_content) 内容如下:
fswdzmd-img2238×1586 202 KB
实际上文档的内容为:
fswdzmd-img_22558×3652 432 KB
lark-openapi-mcp 输出的文档内容是 raw_content 纯文本的内容。
Skill + Cli:larkDocx2md
larkDocx2md 支持下载 https://xxx.feishu.cn/wiki/xxx 格式的链接为本地的 Markdown 文件。支持:
- 表格等格式转换
- 附件图片下载并链接到 Markdown 文件中
- 支持
npx lark-docx2mdCli 方式调用 - 提供方便 Agent 调用的 larkDocx2md Skill
使用
Cli
npx -y lark-docx2md download <url> --app-id <APP_ID> --app-secret <APP_SECRET>
或先设置环境变量(命令行参数可省略):
export LARK_DOCX2MD_APP_ID=<APP_ID>
export LARK_DOCX2MD_APP_SECRET=<APP_SECRET>
npx -y lark-docx2md download <url>
Skill
安装 Skill:<跳过>
使用:
› 读取 https://xxx.feishu.cn/wiki/xxx 文档内容
• 我会用 lark-docx2md 技能先把这个 Feishu Wiki 链接拉取为本地 Markdown,然后直接读取并返回文档内容。先检查技能说明并执行下载命令。
• Explored
└ Read SKILL.md
────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────
• 技能说明已确认。我将按规范把链接转换到 larkDocx2mdOutput/,然后读取生成的 Markdown 内容。
• Ran npm_config_cache="/tmp/.npm-cache" npx -y larkDocx2md download --agent --output "/Users/xxx/WebstormProjects/lark2md/larkDocx2mdOutput/"
│ "https://xxx.feishu.cn/wiki/xxx"
└ Read and process the following Markdown file: /Users/xxx/WebstormProjects/lark2md/larkDocx2mdOutput/xxx.md
────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────
• 拉取成功,正在读取生成的 Markdown 文件内容。
• Explored
└ Read xxx.md
────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────
• 已读取到该文档,larkDocx2mdOutput/xxx.md
larkDocx2mdOutput/xxx.md 文档内容:
# A
## 图片

## 筛选字段
<table>
<tr>
<td>字段名称<br/></td><td>是否是固定筛选项<br/></td><td>字段类型<br/></td><td>字段属性<br/></td><td>交互说明<br/></td></tr>
<tr>
<td><br/></td><td><br/></td><td>1、输入型/<br/>2、选项型<br/>3、控件型,如时间控件、省市区控件<br/><br/></td><td>字段属性如以下内容,根据实际情况输出:<br/>1、长度限制说明<br/>2、字符类型说明<br/>3、字段值说明<br/>4、搜索说明:精准搜索/模糊搜索<br/></td><td>简单地交互可以用文字描述,复杂的交互需要输出交互图<br/><br/></td></tr>
<tr>
<td>订单编号<br/><br/></td><td>是<br/></td><td>输入型<br/><br/></td><td>精确查询,支持批量<br/><br/></td><td>多行文本框,支持批量查询<br/>1.支持回车、逗号、分号 分隔查询<br/>2.最大单次查询量不超过200条数据<br/></td></tr>
</table>
## 列表字段
<table>
<tr>
<td colspan="2">字段名称<br/></td><td>字段说明<br/></td><td>备注<br/></td></tr>
<tr>
<td colspan="2">订单编号<br/><br/></td><td>AAA+年月日+6位自增<br/>(如:AAA20250322000001) <br/></td><td>1、需支持点击跳转至详情页<br/><br/></td></tr>
<tr>
<td colspan="2">产品明细<br/></td><td>T+年月日+6位自增<br/>(如:T20250322000001)<br/></td><td><br/></td></tr>
<tr>
<td rowspan="2">配送单状态<br/><br/></td><td>A<br/></td><td>1<br/></td><td><br/></td></tr>
<tr>
<td>B<br/></td><td>2<br/></td><td>校验规则<br/><br/></td></tr>
</table>
##
##
Markdown 效果,图片、表格、表格夸行、夸列都正常展示。
fswdzmd-img_41858×2594 220 KB
实现原理
larkDocx2md 代码仓库:GitHub - Byte-n/larkDocx2md · GitHub
参考资料;
- 飞书官方文档
- 社区工具 feishu2md
飞书的文档构成如图:
fswdzmd-img_53059×1721 497 KB
每个块,都有对应的存储结构,只需要针对特定的结构转换为 Markdown 对应的结构(这里可能存在递归)
飞书提供的 API 有:
- 获取文档所有块
- 获取文档基本信息
- 获取文档纯文本内容
- 获取所有子块
- 获取块
- …
实现思路:
-
接收飞书文档链接,识别链接类型。
-
输入是 Wiki 链接,先把 Wiki 节点解析为真实文档 Token
-
先获取文档元信息(标题、标识等)、再分页拉取文档块(block)数据,直到拿到完整块树。
-
结构化转换为 Markdown
- 以块树为基础递归遍历,按块类型映射为 Markdown/HTML。
- 常规文本块(标题、段落、列表、引用、代码块、任务项等)直接转换为对应语法。
- 复杂表格(含合并单元格)使用 HTML table 表达,保证结构不丢失。
- 图片先保留资源标识占位,便于后续统一下载与替换。
-
资源下载与链接回填
- 批量下载图片资源到本地静态目录。
- 将文档中的图片占位链接替换为本地相对路径链接,形成可离线查看的 Markdown。
-
最终输出
- 生成最终 Markdown 文件。
- 在 Agent 场景下补充输出可直接读取的目标文件路径,便于后续自动处理。
调用的 API
-
Wiki 节点查询 API
- 用于把 Wiki 链接转换为真实文档对象,获取后续读取所需的文档 Token。
-
文档信息 API
- 用于获取文档基础信息(如标题与文档 ID),作为解析入口与输出命名参考。
-
文档块列表 API(分页)
- 用于拉取文档的完整块结构数据,是 Markdown 转换的核心输入。
-
媒体下载 API
- 用于下载文档中的图片资源到本地,配合 Markdown 链接改写实现本地化引用。
-
错误码与重试/中断策略
- 所有 API 调用统一校验返回状态,遇到失败即时中断并报错,避免生成不完整内容。
可优化
Markdown 的文本内容生成过程都是大量字符串操作,是否可以在转换过程中不以字符串的形式存储,而是以文档树的结构存储。
- 每个部分的转换只在特定的子树上操作。
- 最终输出就是深度优先遍历输出字符串内容即可。
- 对应部分因为 API 频率限制导致失败,方便重试重写部分数据。
- 更好的扩展性
其他问题
- 为什么表格转换为 HTML 的 Table?
大部分 Markdown 渲染器支持渲染部分 HTML 标签,这里包含 Table。其次 Markdown 的 |---| 表格方式无法实现夸列、夸行,而 HTML Table 可以。当然这里也可以用Markdown 的 |---| + 重复列、行值来解决。
--【壹】--:
巧了,刚好想要学习一下飞书的cli怎么用,收藏了!
--【贰】--:
飞书最近新出了 cli + skill 的方案:
飞书的 lark-cli 大约7天前发布的方案,理论效果完全碾压前者 openapi-lark-mcp。该方案由 Cli + Skills 组成!Skill 按模块组成。cli 工具也不仅仅是对 openapi 的包装调用,而是按功能组织,对外提供可直接使用的对ai友好的工具。读取飞书文档在 lark-doc 下,导出的文档也不是纯文本字符串,而是 Markdown 文本!。Cli 工具内部做了页面块下的直接子级块数据的转换。什么是块?
fswdzmd-img_53059×1721 497 KB
输出内容类似:
# 标题1 图
<image token="Z1FjxxxxxxxxxxxxxxxxxxxtnAc" width="1833" height="2491" align="center"/>
# 标题2 表格
<lark-table>
<lark-tr>
<lark-td>1</lark-td>
<lark-td>2</lark-td>
<lark-td>3</lark-td>
</lark-tr>
<lark-tr>
<lark-td>A</lark-td>
<lark-td>B</lark-td>
<lark-td>C</lark-td>
</lark-tr>
</lark-table>
AI 阅读到 <image token="Z1FjxxxxxxxxxxxxxxxxxxxtnAc" width="1833" height="2491" align="center"/> 则会按 lark-doc 规范,继续访问其他能力读取图片(渐进式的加载)。但这对于 AI模型 本身的能力要求较高。除了 claude / gpt 4 / glm 5 / kimi-k2.5 以下的模型可能都不会有比较好的效果。
--【叁】--:
佬真不错,mark住了,先放收藏夹,有时间再学~

