笔记『论文阅读』DCP: Addressing Input Dynamism in Long-Context Training via Dynamic Context Parallelism长序列训练场景下,解决动态输入的动态序列并行。