豌豆荚游戏排行榜上,有哪些长尾词可以吸引玩家关注?

2026-04-06 10:401阅读0评论SEO教程
  • 内容介绍
  • 文章标签
  • 相关推荐

本文共计424个文字,预计阅读时间需要2分钟。

豌豆荚游戏排行榜上,有哪些长尾词可以吸引玩家关注?

pythonimport requestsfrom bs4 import BeautifulSoup

豌豆荚游戏排行榜上,有哪些长尾词可以吸引玩家关注?

def crawl_bilibili_game_list(): url=https://www.bilibili.com/v/game?sort=hot headers={ User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3 } response=requests.get(url, headers=headers) soup=BeautifulSoup(response.text, .parser)

game_list=[] for item in soup.select('.game-item'): title=item.select_one('.title').get_text(strip=True) download_count=item.select_one('.download-count').get_text(strip=True) img_url=item.select_one('img')['data-src'] game_list.append({ 'title': title, 'download_count': download_count, 'img_url': img_url })

return game_list

if __name__==__main__: games=crawl_bilibili_game_list() for game in games: print(f游戏名称:{game['title']}) print(f下载量:{game['download_count']}) print(f图标:{game['img_url']}) print(- * 20)

看到有人问豌豆荚游戏榜单的爬虫如何写,这里特别贴一下完整的代码。
这里只爬了豌豆荚应用的名称,下载量和图标地址,有其他需求的朋友可以自己写xpath进行提取。
运行方法:复制代码到神箭手云爬虫平台上运行即可。

1.[代码][JavaScript]代码

var configs = { domains: ["apps.wandoujia.com"], scanUrls: ["apps.wandoujia.com/api/v1/apps?type=weeklytopgame&max=12&start=0"], contentUrlRegexes: ["www\\.wandoujia\\.com/apps/.*"], helperUrlRegexes: ["apps\\.wandoujia\\.com/api/v1/apps\\?type=weeklytopgame&max=12&start=\\d+"],//可留空 fields: [ { // 第一个抽取项 name: "title", selector: "//span[contains(@class,'title')]", required: true //是否不能为空 }, { // 第二个抽取项 name: "download", selector: "//i[@itemprop='interactionCount']", required: false //是否不能为空 }, { //第三个抽取项 name:"thumb", selector:"//div[contains(@class,'app-icon')]/img[@itemprop='image']/@src", } ] }; configs.onProcessHelperUrl = function(url, content, site) { var jarr = JSON.parse(content); //发现内容页 for (var i = 0, n = jarr.length; i < n; i++) { var new_url = "www.wandoujia.com/apps/"+jarr[i].packageName; site.addUrl(new_url); } var currentStart = parseInt(url.substring(url.indexOf("&start=") + 7)); var start = currentStart+12; if(start < 100){ site.addUrl("apps.wandoujia.com/api/v1/apps?type=weeklytopgame&max=12&start="+start); } return true; } var crawler = new Crawler(configs); crawler.start();

本文共计424个文字,预计阅读时间需要2分钟。

豌豆荚游戏排行榜上,有哪些长尾词可以吸引玩家关注?

pythonimport requestsfrom bs4 import BeautifulSoup

豌豆荚游戏排行榜上,有哪些长尾词可以吸引玩家关注?

def crawl_bilibili_game_list(): url=https://www.bilibili.com/v/game?sort=hot headers={ User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3 } response=requests.get(url, headers=headers) soup=BeautifulSoup(response.text, .parser)

game_list=[] for item in soup.select('.game-item'): title=item.select_one('.title').get_text(strip=True) download_count=item.select_one('.download-count').get_text(strip=True) img_url=item.select_one('img')['data-src'] game_list.append({ 'title': title, 'download_count': download_count, 'img_url': img_url })

return game_list

if __name__==__main__: games=crawl_bilibili_game_list() for game in games: print(f游戏名称:{game['title']}) print(f下载量:{game['download_count']}) print(f图标:{game['img_url']}) print(- * 20)

看到有人问豌豆荚游戏榜单的爬虫如何写,这里特别贴一下完整的代码。
这里只爬了豌豆荚应用的名称,下载量和图标地址,有其他需求的朋友可以自己写xpath进行提取。
运行方法:复制代码到神箭手云爬虫平台上运行即可。

1.[代码][JavaScript]代码

var configs = { domains: ["apps.wandoujia.com"], scanUrls: ["apps.wandoujia.com/api/v1/apps?type=weeklytopgame&max=12&start=0"], contentUrlRegexes: ["www\\.wandoujia\\.com/apps/.*"], helperUrlRegexes: ["apps\\.wandoujia\\.com/api/v1/apps\\?type=weeklytopgame&max=12&start=\\d+"],//可留空 fields: [ { // 第一个抽取项 name: "title", selector: "//span[contains(@class,'title')]", required: true //是否不能为空 }, { // 第二个抽取项 name: "download", selector: "//i[@itemprop='interactionCount']", required: false //是否不能为空 }, { //第三个抽取项 name:"thumb", selector:"//div[contains(@class,'app-icon')]/img[@itemprop='image']/@src", } ] }; configs.onProcessHelperUrl = function(url, content, site) { var jarr = JSON.parse(content); //发现内容页 for (var i = 0, n = jarr.length; i < n; i++) { var new_url = "www.wandoujia.com/apps/"+jarr[i].packageName; site.addUrl(new_url); } var currentStart = parseInt(url.substring(url.indexOf("&start=") + 7)); var start = currentStart+12; if(start < 100){ site.addUrl("apps.wandoujia.com/api/v1/apps?type=weeklytopgame&max=12&start="+start); } return true; } var crawler = new Crawler(configs); crawler.start();