1.为什么大多数生成模型使用解码结构,而不使用编码、解码结构
2.如何将4k长度扩展到8k或者更多
3.beam search ,top k

标签: none

添加新评论