如何使用Python遍历目录处理文本标签?

2026-05-21 16:431阅读0评论SEO教程
  • 内容介绍
  • 文章标签
  • 相关推荐

本文共计254个文字,预计阅读时间需要2分钟。

如何使用Python遍历目录处理文本标签?

Python处理文本标签,遍历目录,将评论转换成字符串列表,每个字符串对应一条评论。同时,将评论和标签(正面/负面)转换成labels列表。遍历目录代码如下:

pythonimport os

如何使用Python遍历目录处理文本标签?

imdb_dir='/home/ubu'labels=[]

for filename in os.listdir(imdb_dir): if filename.endswith('.txt'): with open(os.path.join(imdb_dir, filename), 'r') as file: content=file.read() reviews=content.split('\n') for review in reviews: labels.append(review + ' ' + filename.split('.')[0])


python_处理文本标签_遍历目录

我们将训练评论转换成字符串列表,每个字符串对应一条评论。你也可以将评论
标签(正面 / 负面)转换成 labels 列表
遍历目录

import os

imdb_dir = '/home/ubuntu/data/aclImdb'
train_dir = os.path.join(imdb_dir, 'train')

labels = []
texts = []

for label_type in ['neg', 'pos']:
dir_name = os.path.join(train_dir, label_type)
for fname in os.listdir(dir_name):
if fname[-4:] == '.txt':
f = open(os.path.join(dir_name, fname))
texts.append(f.read())
f.close()
if label_type == 'neg':
labels.append(0)
else:
labels.append(1)


本文共计254个文字,预计阅读时间需要2分钟。

如何使用Python遍历目录处理文本标签?

Python处理文本标签,遍历目录,将评论转换成字符串列表,每个字符串对应一条评论。同时,将评论和标签(正面/负面)转换成labels列表。遍历目录代码如下:

pythonimport os

如何使用Python遍历目录处理文本标签?

imdb_dir='/home/ubu'labels=[]

for filename in os.listdir(imdb_dir): if filename.endswith('.txt'): with open(os.path.join(imdb_dir, filename), 'r') as file: content=file.read() reviews=content.split('\n') for review in reviews: labels.append(review + ' ' + filename.split('.')[0])


python_处理文本标签_遍历目录

我们将训练评论转换成字符串列表,每个字符串对应一条评论。你也可以将评论
标签(正面 / 负面)转换成 labels 列表
遍历目录

import os

imdb_dir = '/home/ubuntu/data/aclImdb'
train_dir = os.path.join(imdb_dir, 'train')

labels = []
texts = []

for label_type in ['neg', 'pos']:
dir_name = os.path.join(train_dir, label_type)
for fname in os.listdir(dir_name):
if fname[-4:] == '.txt':
f = open(os.path.join(dir_name, fname))
texts.append(f.read())
f.close()
if label_type == 'neg':
labels.append(0)
else:
labels.append(1)