如何构建一个长尾词的有限马尔可夫决策过程模型?