NodeJS如何抓取网页HTML并转换一级Markdown内容？

2026-04-06 12:281阅读0评论SEO教程

内容介绍
文章标签
相关推荐

本文共计170个文字，预计阅读时间需要1分钟。

NodeJS如何抓取网页HTML并转换一级Markdown内容？

javascript// 读取文件内容并获取第一个H1var fs=require('fs');function getFirstH1(file) { var reg=//g; var mdreg=/^# /g; if (fs.existsSync(file)) { if (reg.test(file)) { var htmf=fs.readFileSync(file, { encoding: 'utf-8' }); var h1Match=htmf.match(reg); if (h1Match) { return h1Match[0]; } } else if (mdreg.test(file)) { var mdContent=fs.readFileSync(file, { encoding: 'utf-8' }); var h1Match=mdContent.match(mdreg); if (h1Match) { return h1Match[0]; } } } return null;}

NodeJS如何抓取网页HTML并转换一级Markdown内容？

GetFirstH1.js

var fs = require('fs'); function getFirstH1(file) { var htmlreg = new RegExp(/\.html$/g); var mdreg = new RegExp(/\.md$/g); if (fs.existsSync(file)) { if (htmlreg.test(file)) { var htmf = fs.readFileSync(file, { encoding: 'utf-8' }); var H1s = htmf.match(/ /g); if (H1s !== null) { var firstH1 = H1s[0].match(/>.*?]/g, ""); return H1; } }else if(mdreg.test(file)){ var mdf = fs.readFileSync(file,{encoding:'utf-8'}); var H1s = mdf.match(/[#](.*)/g); if(H1s!==null){ var firstH1 = H1s[0].replace(/\#+/g,""); return firstH1; } } } } module.exports ={ getFirstH1 }

标签：nodejs 获取 html 和 Markdown

本文共计170个文字，预计阅读时间需要1分钟。

NodeJS如何抓取网页HTML并转换一级Markdown内容？

javascript// 读取文件内容并获取第一个H1var fs=require('fs');function getFirstH1(file) { var reg=//g; var mdreg=/^# /g; if (fs.existsSync(file)) { if (reg.test(file)) { var htmf=fs.readFileSync(file, { encoding: 'utf-8' }); var h1Match=htmf.match(reg); if (h1Match) { return h1Match[0]; } } else if (mdreg.test(file)) { var mdContent=fs.readFileSync(file, { encoding: 'utf-8' }); var h1Match=mdContent.match(mdreg); if (h1Match) { return h1Match[0]; } } } return null;}

NodeJS如何抓取网页HTML并转换一级Markdown内容？

GetFirstH1.js

var fs = require('fs'); function getFirstH1(file) { var htmlreg = new RegExp(/\.html$/g); var mdreg = new RegExp(/\.md$/g); if (fs.existsSync(file)) { if (htmlreg.test(file)) { var htmf = fs.readFileSync(file, { encoding: 'utf-8' }); var H1s = htmf.match(/ /g); if (H1s !== null) { var firstH1 = H1s[0].match(/>.*?]/g, ""); return H1; } }else if(mdreg.test(file)){ var mdf = fs.readFileSync(file,{encoding:'utf-8'}); var H1s = mdf.match(/[#](.*)/g); if(H1s!==null){ var firstH1 = H1s[0].replace(/\#+/g,""); return firstH1; } } } } module.exports ={ getFirstH1 }

标签：nodejs 获取 html 和 Markdown