深度学习中的注意力机制,如何应用于长尾词的识别与处理?