NodeJS如何抓取网页HTML并转换一级Markdown内容?
- 内容介绍
- 文章标签
- 相关推荐
本文共计170个文字,预计阅读时间需要1分钟。
javascript// 读取文件内容并获取第一个H1var fs=require('fs');function getFirstH1(file) { var reg=//g; var mdreg=/^# /g; if (fs.existsSync(file)) { if (reg.test(file)) { var htmf=fs.readFileSync(file, { encoding: 'utf-8' }); var h1Match=htmf.match(reg); if (h1Match) { return h1Match[0]; } } else if (mdreg.test(file)) { var mdContent=fs.readFileSync(file, { encoding: 'utf-8' }); var h1Match=mdContent.match(mdreg); if (h1Match) { return h1Match[0]; } } } return null;}
var fs = require('fs'); function getFirstH1(file) { var htmlreg = new RegExp(/\.html$/g); var mdreg = new RegExp(/\.md$/g); if (fs.existsSync(file)) { if (htmlreg.test(file)) { var htmf = fs.readFileSync(file, { encoding: 'utf-8' }); var H1s = htmf.match(/
/g); if (H1s !== null) { var firstH1 = H1s[0].match(/>.*?]/g, ""); return H1; } }else if(mdreg.test(file)){ var mdf = fs.readFileSync(file,{encoding:'utf-8'}); var H1s = mdf.match(/[#](.*)/g); if(H1s!==null){ var firstH1 = H1s[0].replace(/\#+/g,""); return firstH1; } } } } module.exports ={ getFirstH1 }
本文共计170个文字,预计阅读时间需要1分钟。
javascript// 读取文件内容并获取第一个H1var fs=require('fs');function getFirstH1(file) { var reg=//g; var mdreg=/^# /g; if (fs.existsSync(file)) { if (reg.test(file)) { var htmf=fs.readFileSync(file, { encoding: 'utf-8' }); var h1Match=htmf.match(reg); if (h1Match) { return h1Match[0]; } } else if (mdreg.test(file)) { var mdContent=fs.readFileSync(file, { encoding: 'utf-8' }); var h1Match=mdContent.match(mdreg); if (h1Match) { return h1Match[0]; } } } return null;}
var fs = require('fs'); function getFirstH1(file) { var htmlreg = new RegExp(/\.html$/g); var mdreg = new RegExp(/\.md$/g); if (fs.existsSync(file)) { if (htmlreg.test(file)) { var htmf = fs.readFileSync(file, { encoding: 'utf-8' }); var H1s = htmf.match(/

