如何用正则表达式过滤长尾词中的多余字符?